奖章lakehouse架构是什么?
图案架构描述了一系列数据层,表示数据存储在lakehouse的质量。砖建议采取多层次的方法构建一个企业数据的事实来源的产品。这种架构保证原子性、一致性、隔离性和持久性数据经过多层次的验证和转换之前存储在一个布局优化的有效分析。条款青铜(生),银(验证)黄金(丰富)描述的质量数据在每一个层。
重要的是要注意,这个图案架构不能替代其他维度建模技术。模式和表内每一层都可以采取多种形式和程度的正常化取决于数据更新的频率和性质和下游用例数据。
组织可以利用砖Lakehouse创建和维护整个公司验证数据集访问。采用一个组织的心态关注策划成功的一个关键步骤data-as-products lakehouse构建一个数据。
摄取到青铜层原始数据
铜层包含多组数据。数据摄取青铜层通常:
保持原始状态的数据源。
随着时间的推移逐步追加和生长。
可以任意组合的流和批处理事务。
保留完整的、未经加工的历史中每个数据集的一种有效的存储格式能够重现任何给定的数据系统的状态。
额外的元数据(如源文件名称或记录时间数据处理)可能被添加到数据摄取增强的可发现性,描述状态的源数据集,在下游应用程序和优化性能。