lakehouse数据发现和协作

砖设计统一目录帮助组织减少时间洞察力让更广泛的大规模数据用户发现和分析数据。数据管理员可以安全地授权访问数据资产多样化团队的最终用户统一目录。这些用户可以使用各种各样的语言和工具,包括SQL和Python、创建衍生数据集、模型和指示板,可以跨团队共享。

管理权限范围

统一目录管理员提供了一个统一的位置分配权限目录、数据库、表和视图的用户群。特权和metastores工作区之间的共享,允许管理员设置安全权限一旦与组织同步从身份提供者和知道终端用户只能访问适当的数据在任何砖工作区他们进入。

统一目录还允许管理员定义存储凭证,一种安全的方法来存储和云存储基础设施共享权限。能给予特权在这些组织中可获得的电力用户,这样他们就可以定义外部位置对云对象存储位置,允许数据工程师为新工作负载,而不需要提供自助服务提升权限在云主机。

发现数据砖

用户可以浏览可用数据对象统一目录使用数据浏览。数据浏览器使用统一目录的权限配置管理员,以确保用户只能看到目录、数据库、表和视图,他们有权限查询。一旦用户找到感兴趣的数据,他们可以检查字段名称和类型,阅读评论表和个人领域和预览的样本数据。用户还可以审查表的完整的历史理解数据已经改变,何时以及如何和血统特性允许用户跟踪某些数据集来自上游工作和用于下游工作。

存储凭证和外部位置也显示在数据浏览器,允许每个用户完全掌握读写的权限数据可用的位置和资源。

加速时间与lakehouse生产

砖支持SQL工作负载,Python, Scala和R,允许用户多样化的技能和技术背景的利用他们的知识来推导分析见解。您可以使用支持的所有语言砖来定义的生产工作,和笔记本可以利用语言的结合。这意味着您可以促进查询SQL分析师写的最后一英里ETL投入生产数据工程代码几乎没有努力。查询和工作负载由角色定义整个组织利用相同的数据集,所以没有必要协调字段名或前一定仪表板是最新的共享代码和结果与其他团队。你可以安全地共享代码、笔记本、查询和仪表板,所有由相同的可伸缩的云基础设施和定义相同的策划的数据源。