bob体育客户端下载平台的博客

使用Delta共享的前三个数据共享用例

分享这篇文章

更新:三角洲分享现在在AWS和Azure上普遍可用。

数据共享已成为推动业务价值的重要组成部分,因为各种规模的公司都希望与客户、供应商和合作伙伴安全地交换数据。bob体育外网下载根据最近的一项研究Gartner的调查在美国,促进数据共享的组织将在大多数业务价值指标上胜过同行。

现有的数据共享解决方案存在各种挑战,限制了组织内部或跨组织的数据共享,无法实现数据的真正价值。在过去的30年里,数据共享解决方案有两种形式:自主开发的解决方案或第三方商业解决方案。使用自主开发的解决方案,数据共享建立在SFTP和REST api等遗留技术上,这些技术已经变得难以管理、维护或扩展新的数据需求。或者,商业数据共享解决方案只允许您与利用同一平台的其他人共享数据,这限制了数据共享,而且成本很高。bob体育客户端下载

这些挑战促使Databricks重新思考开放数据共享的未来。在2021年数据+人工智能峰会上,我们宣布三角洲分享这是世界上第一个安全、可扩展的实时数据共享开放协议。我们在Delta Sharing背后的愿景是构建一个数据共享解决方案,简化跨组织的安全实时数据共享,独立于数据驻留或使用的平台。bob体育客户端下载借助Delta Sharing,组织可以轻松共享基于Apache Parquet和Delta Lake格式的现有大规模数据集,而无需移动数据,并允许数据团队使用所选工具灵活地查询、可视化和丰富共享数据。

共享生态系统
共享生态系统

私人预览发布后,我们看到各行各业的客户积极参与合作,开发出适合目标并向所有人开放的数据共享解决方案。客户已经使用Delta Sharing共享了pb级的数据。Delta共享合作伙伴的生态系统也在不断发展,商业和开源客户端都有内置的Delta共享连接器,例如PowerBI、Pandas和Apache Spark™,还有许多其他版本即将发布。

通过与客户的对话,我们确定了三个常见的用例:数据商业化,与外部合作伙伴和客户共享数据,以及业务线数据共享bob体育外网下载.在这篇博客文章中,我们将探索每个顶级用例,并分享我们从客户那里听到的一些见解。

用例1:数据商业化

客户的例子:一家金融数据提供商有兴趣降低其遗留数据交付渠道的运营效率低下,并使最终客户更容易无缝访问大型新数据集。

挑战

该数据提供商最近推出了新的文本数据集,这些数据集的规模很大,经常产生tb级的数据。对数据提供商来说,提供对这些大型数据集的快速和简单的访问一直是一个长期的挑战,因为数据集很难被数据接收者大量接收。使用当前的解决方案,提供者必须将数据复制到外部SFTP服务器,这有许多潜在的故障点和增加的延迟。

在接收方,由于数据的大小和规模,接收和管理这些数据并不容易。数据接收方必须设置基础设施以便接收数据,这进一步需要IT和数据库管理员的批准,导致最终消费者开始使用数据之前可能需要数周甚至更长的时间才能完成延迟。

Delta共享如何提供帮助

通过Delta Sharing,数据提供者现在可以无缝地共享大型数据集,并克服SFTP服务器的可伸缩性问题。这些大tb大小的文本数据集必须批量提取到SFTP,现在可以通过Delta Sharing实时访问。提供者现在可以简单地授予和管理对数据接收者的访问,而不是复制数据,从而降低了复杂性和延迟。随着可伸缩性的改进,数据提供者看到客户采用的显著增加,因为数据消费者可以访问实时数据,而不必定期提取数据集。

用例2:与外部合作伙伴/客户共享数据bob体育外网下载

客户的例子:大型零售商需要轻松地与合作伙伴共享产品数据(例如谷物SKU销售),而无需与合作伙伴使用相同的数据共享或云计算平台。bob体育客户端下载bob体育外网下载零售商希望基于sku创建分区数据集,以便合作伙伴能够方便地实时访问相关数据。bob体育外网下载

挑战

零售商使用本地的SFTP和api与合作伙伴共享数据,这已经变得难以管理。bob体育外网下载这个解决方案需要大量的开发资源来维护和操作。零售商考虑了其他数据共享解决方案,但这些解决方案要求他们的合作伙伴在同一个平台上,由于成本考虑和跨不同地区复制数据的运营开销,这对所有各方来说都是不可可行的。bob体育客户端下载bob体育外网下载

Delta共享如何提供帮助

对于零售商来说,Delta Sharing是一个令人兴奋的提议,它可以跨云平台有效地管理和共享数据,而不需要跨地区复制数据。bob体育客户端下载零售商发现,通过Delta Sharing可以轻松管理、创建和审计100多个合作伙伴的数据共享。bob体育外网下载对于每个合作伙伴,零售商可以轻松地创建分区并安全地共享数据,而不需要在相同的数据平台上。bob体育客户端下载除了简化共享的管理之外,Delta Sharing还最大限度地降低了成本,因为数据提供商只需要从底层云提供商那里获得数据出口成本,而不必为数据共享支付任何计算费用。

用例3:与业务部门共享内部数据

客户的例子:一家制造商希望其15个以上部门和子公司的数据科学家能够访问许可的数据,以构建预测模型。由于数据敏感性,制造商希望通过强大的治理、控制和审计功能来实现这一点。

挑战

制造商有许多数据湖部署,使得整个组织的团队很难安全有效地访问数据。在整个组织中管理所有这些数据是以定制的方式完成的,对权利和治理没有强有力的控制。此外,许多这些数据集的大小都是pb级的,这引起了对可伸缩共享这些数据的能力的担忧。如果没有适当的数据访问控制和治理,管理层对共享数据犹豫不决。因此,制造商错过了释放价值的独特机会,并为数据科学团队提供了更多独特的见解。

Delta共享如何提供帮助

通过Delta Sharing,制造商现在可以在不同的内部实体之间管理和共享数据,而无需移动数据。Delta Sharing允许制造商从单个执行点授予、跟踪和审计对共享数据的访问。由于不需要移动这些大型数据集,制造商不必担心管理不同的服务来复制数据。Delta Sharing使制造商能够以比预期更快的速度安全地共享数据,最终用户可以开始使用以前孤立的独特数据集,从而立即获得效益。制造商也很高兴利用内置的Delta共享连接器与PowerBI,这是他们选择的数据可视化工具。

从Delta Sharing开始

Delta Sharing使得与其他组织共享数据变得简单,而不管他们使用哪种数据平台。bob体育客户端下载我们很高兴能够分享第一个解决方案,它提供了一个开放和安全的解决方案,没有专有的锁定,帮助数据团队轻松地跨组织共享数据,管理隐私,安全和合规性。

要在Databricks上尝试Delta Sharing,请联系Databricks帐户主管或报名为了提前进入。对于我们的许多客户来说,在共享数据时,治理是首要考虑的问题。本机集成了Delta Sharing统一目录,使客户能够添加细粒度的治理和安全控制,使内部或外部共享数据变得简单和安全。一旦你在你的databricks帐户中启用了Unity Catalog,尝试下面的快速入门笔记本,开始在databricks上使用Delta Sharing:

  1. 创建共享并授予数据接收者访问权限
  2. 连接到共享并访问数据

要尝试开源的Deltabob下载地址 Sharing发行版,请遵循delta.io /共享

对参与Delta Sharing开源项目感兴趣?bob下载地址

我们希望得到您对Delta Sharing项目的反馈,以及对新功能的想法或贡献。按照说明加入Delta Sharing社区在这里

免费试用Databricks
看到所有bob体育客户端下载平台的博客的帖子