构建单一事实源意味着什么
DatabricksLakehouse消除多系统生成并同步数据拷贝的需要,方法包括统一单系统存取数据,将Lakehouse确定为唯一真象源重复数据往往产生数据筒仓,即组织内不同团队可能使用质量和新鲜度不同的相同数据版本工作
湖内控制事务和数据访问方式
三角湖交易使用日志文件存储数据文件提供表级ACID保证三角湖表的数据和日志文件并存云对象存储、读写数据时可同时发生,而无需多次查询的风险导致性能退化或企业关键工作量死锁即企业环境用户和应用可连接同一份数据拷贝驱动各种工作量,所有查看者保证在查询执行时接收最新版本数据
管理生成数据存取
UnityCatalog提供集中数据治理解决方案,让数据托管者向用户、分组和服务主体提供精密访问控制UnityCatalog管理权限使用访问控制列表提供弹性和特性配置资源某些可配置权限包括:
只读几表
表创建修改权限数据库
能力读取或修改数据
通过UnityCatalog管理存储证书获取多云资源
更多信息见Unity目录是什么.
湖屋使用视图
Databricks视图表示对湖内某处表存储数据保存查询生成表的查询写时执行, 视图时对视图运行时执行定义逻辑表示视图可提供各种源数据的最新存取量,计算仅用于按需更新结果
Unity目录可安全并与其他数据对象分享视图,允许个人和团队分享驱动全组织关键业务决策的逻辑
更多信息见Databricks湖屋内数据对象.