跳转到主内容

数据键+表

亚当康威
阿里高西
阿萨兰Tavakoli-Shiraji
雷诺德新
分享此文章

6月7日2024更新:我们很高兴分享,我们完成获取标签

坦布尔尔公司 数据管理公司 瑞安布鲁斯 丹尼尔威克斯和杰森里德bob下载地址ApacheIcebergTM和LinuxFoundationDelta湖的原创者整体上,我们将率先处理数据兼容性问题,使你不再受湖内格式约束,数据进入湖内格式博客将探讨我们准备如何与Iceberg和Delta湖社区密切合作,短期内三角湖UniForm和长远内向单开放通用互操作性标准演化期望交易结束后欢迎团队,并乐于同团队合作实现开湖联合愿景

湖屋架构兴起和格式互不兼容

湖屋架构先驱化由databricks在2020年整合传统数据仓工作量和AI单拷贝数据工作量所有数据都以开放格式使用-即不同任务、应用和引擎都可访问同一种数据湖屋架构通过数据访问民主化实现企业生产率最大化与专有数据仓库形成对比的是,只有专有SQL引擎才能读写分享数据,数据往往必须复制输出供其他应用使用,从而产生高水平供应商锁住4年后湖屋架构暴风雨抢市-74%的企业根据湖屋调查部署MIT技术评审.

bob下载地址湖屋基础为开源数据格式,可实现ACID存储数据交易bob下载地址格式大大提高数据湖数据操作的可靠性和性能,并专门设计开源引擎,如ApachesparkTM、Trino和Presto解决这些挑战,我们与Linux基金会合作创建三角湖项目bob下载地址开源项目由五百多代码提供者组成, 全球一万多家公司使用三角湖平均每日处理四+字节数据

大约同时德尔塔湖创建,瑞安和丹尼尔开发Iceberg项目Netflix并捐给Apache软件基金会bob下载地址后两个项目成为Lakehouse格式的两大开源标准不幸的是,尽管这两种格式都以Apache Parquet为基础并分享相似目标和设计,但由于独立开发而变得互不兼容

bob下载地址随着时间的推移,其他一些开源和专有引擎采用了这些格式。但他们通常只采行其中一项标准,而且多或少只采行该标准的一部分有效分片分解企业数据,损耗湖屋架构值

通向互操作性之路

公司基本需要数据互操作性实现湖屋的利益我们准备与Iceberg和Delta湖社区密切合作,使格式本身实现互操作性这是一项漫长的行程,可能需要数年时间才能在这些社区实现。正因如此我们介绍三角湖UniForm向世界去年Uniform表提供三角湖、Iceberg和Hudi互操作性支持Iceberg静态目录接口,使公司能使用分析引擎和工具,并遍历数据UnitForm系统今天可实现兼容性, 并增加原冰山团队后,我们将投入大量资金, 以大大拓展Delta湖UnitForm的雄心壮志现时常用UnitForm允许公司实现兼容性加上原创冰山团队 Databricks将大大扩展Delta湖UniForm的雄心

共享开放承诺

bob下载地址最后,Databricks和Tabular分享支持开源格式的历史bob下载地址创建两家公司是为了实现开源技术商业化,而今天Databricks是最大和最成功的独立开源公司收入并捐出1200万行代码用于开源项目bob下载地址获取突出显示我们对开放格式和开源云数据的承诺,帮助确保公司控制数据并不受专利商所有格式锁住

BOB低频彩深入了解数据键和标签联动,注册参加数据+AI峰会,6月10-13日www.neidfyre.com/dataaisummit

免费试数据键

相关职位

全部见 公司博客 员额设置