性能数据lakehouse效率

本文涵盖了建筑的原则性能效率支柱,指的是一个系统来适应负荷变化的能力。

砖的性能效率lakehouse架构图。

性能效率原则

  1. 使用serverless服务

    Serverless服务不需要客户运作和维护云计算基础设施。这就消除了管理云基础设施的运营开销,降低交易成本,因为管理服务运行在云的规模。他们还提供立即可用性、开箱即用的安全,需要最少的配置或管理。

  2. 设计工作负载性能

    重复的工作负载,比如数据工程管道、性能不应该是一个事后的想法。数据必须:

    • 有效地读取对象的内存。

    • 有效地改变了。

    • 有效地发布消费。

    此外,大多数管道或消费模式使用一连串的系统。为了达到最好的性能,必须考虑整个链和选择最好的性能。

  3. 运行性能测试的范围发展

    每一个开发工作负载必须经过持续性能测试。代码库的测试确保任何变化不影响工作负载的性能。建立一个定期运行测试。运行测试的一部分预定事件或持续集成构建管道的一部分。

    建立性能基线和确定工作负载的电流效率和支持基础设施。测量性能对基线可以提供的改进策略,并确定应用程序是否满足业务目标。

    识别可能影响性能的瓶颈。这些瓶颈可能是由于代码错误或错误配置的服务。通常,瓶颈恶化随着负载增加。

  4. 监视性能

    确保资源和服务仍然是可以访问的,性能满足用户期望或负载需求。监视可以帮助你识别瓶颈或资源不足,优化配置和检测管道/负载错误。

下一个:性能效率的最佳实践

看到性能的最佳实践的效率