使用Delta共享访问与您共享的数据
本文介绍如何使用Delta Sharing访问与您共享的数据。
共享和数据接收方
Delta Sharing是安全数据共享的开放标准。Databricks用户,称为数据提供商,可以使用Delta Sharing与他们组织之外的个人或组共享数据数据接收方.
数据对数据的共享和开放共享
如何访问数据取决于您自己是否是Databricks用户,以及您的数据提供商是否配置了与您共享的数据Databricks-to-Databricks共享或公开分享.
在数据库对数据库模型中,您必须是已启用的Databricks工作区的用户统一目录.您的团队成员为数据提供者提供Databricks工作区的唯一标识符,数据提供者使用该标识符创建安全的共享连接。共享数据只需在您的工作区中访问即可。如果有必要,您的团队成员可以对该数据配置粒度访问控制。
在开放共享模式中,您可以使用任何您喜欢的工具(包括Databricks)来访问共享数据。数据提供者通过安全通道向您发送一个激活URL。您可以按照它下载一个凭据文件,该文件允许您访问与您共享的数据。
访问与您共享的数据
如何访问数据取决于您的数据提供者是使用开放共享协议还是使用databicks -to- databricks共享协议与您共享数据。看到数据对数据的共享和开放共享.
访问databicks -to- databricks模型
在数据库对数据库模型中:
的惟一标识符,数据提供程序将向您发送指示统一目录metastore与你的Databricks工作空间相关联,然后你把它发送给他们。
共享标识符是一个字符串,由metastore的云、区域和UUID (metastore的唯一标识符)组成,格式如下
<云>:<地区>:< uuid >
.例如,aws:一来:b0c978c8 - 3 - e68 - 4 -提供- 94 - af - d05c120ed1ef
.使用数据资源管理器获取共享标识符:
在Databricks工作区中,单击数据.
在左窗格中,展开三角洲分享菜单和选择与我分享.
在Providers选项卡上方,单击共享标识符复制图标。
要使用notebook或Databricks SQL查询获取共享标识符,请使用默认SQL函数
CURRENT_METASTORE
.如果你使用笔记本电脑,它必须运行在一个Unity-Catalog-capable集群在您将用于访问共享数据的工作区中。选择CURRENT_METASTORE();
数据提供者创建:
一个收件人在Databricks帐户中,以代表您和组织中将访问数据的用户。
一个分享,这是要与您共享的表和视图的表示。
您可以访问与您共享的数据。如果需要,您或团队中的人员可以为用户配置数据的粒度数据访问。
在开放共享模型中获得访问权
在开放共享模式下:
数据提供者创建:
一个收件人在Databricks帐户中,以代表您和组织中将访问数据的用户。作为该配置的一部分,将生成令牌和凭据文件。
一个分享,它表示要与您共享的表和分区。
数据提供者通过安全通道向您发送一个激活URL。您可以按照它下载一个凭据文件,该文件允许您访问与您共享的数据。
重要的
不要将激活链接分享给任何人。一个证书文件只能下载一次。如果在已下载凭据文件后再次访问激活链接,则下载证书文件按钮已禁用。
如果在使用之前丢失了激活链接,请与数据提供商联系。
将凭据文件存储在安全的位置。
不要与应该有权访问共享数据的用户组之外的任何人共享凭据文件。如果需要与组织中的其他人共享密码,Databricks建议使用密码管理器。
读取共享数据
如何读取使用Delta Sharing与您安全共享的数据取决于您是否收到了凭据文件(开放共享模型),或者您正在使用Databricks工作区,并且您向数据提供者提供了您的共享标识符(Databricks-to-Databricks模型)。
使用凭证文件读取共享数据(开放共享)
如果使用Delta Sharing开放共享协议与您共享数据,则使用下载的凭据文件对数据提供者的Databricks帐户进行身份验证并读取共享数据。访问一直持续到提供者停止与您共享数据为止。数据的更新几乎是实时的。您可以读取和复制共享数据,但不能修改源数据。
在Databricks、Apache Spark、pandas和Power BI中使用凭据文件访问和读取共享数据,请参见读取使用Delta Sharing开放共享的数据.
使用databicks -to- databricks共享方式读取共享数据
如果使用databicks -to- databricks模型与您共享数据,则访问共享数据不需要凭据文件。Databricks负责安全连接,在Databricks工作空间中自动发现共享数据。
若要了解如何在Databricks工作区中查找、读取和管理共享数据,请参见读取使用databicks -to- databricks Delta Sharing共享的数据.
审计共享数据的使用情况
如果您可以访问Databricks工作区,则可以使用Databricks审计日志来了解组织中的谁正在使用Delta Sharing访问哪些数据。看到使用增量共享(针对收件人)审计和监视数据访问.