查询数据

本文将展示如何在统一查询数据目录。

需求

  • 计算资源您使用笔记本,砖SQL编辑器,或探险家工作流来创建查询的数据必须符合统一目录安全需求。

  • 查询数据表或视图,用户必须有使用目录在父目录权限,使用模式允许在家长模式,选择允许在表或视图。

    请注意

    阅读从一个视图集群上使用单用户访问模式,用户必须拥有的选择所有引用的表和视图。

三级名称空间符号

在统一目录,一个表或视图包含在父目录和模式。你可以引用一个表或视图使用两个不同风格的符号。您可以使用使用目录使用语句指定目录和模式:

使用目录<目录- - - - - -的名字>;使用模式<模式- - - - - -的名字>;选择*<- - - - - -的名字>;
火花sql(“使用目录<目录名称>”)火花sql(“使用模式<模式名称>”)显示(火花(“<表名称>”))
图书馆(SparkR)sql(“使用目录<目录名称>”)sql(“使用模式<模式名称>”)显示(tableToDF(“<表名称>”))
火花sql(“使用目录<目录名称>”)火花sql(“使用模式<模式名称>”)显示(火花(“<表名称>”))

作为一种替代方法,您可以使用三级名称空间表示法:

选择*<目录- - - - - -的名字><模式- - - - - -的名字><- - - - - -的名字>;
显示(火花(“<目录名称>,<模式名称>。<表名称>”))
图书馆(SparkR)显示(tableToDF(“<目录名称>,<模式名称>。<表名称>”))
显示(火花(“<目录名称>,<模式名称>。<表名称>”))

使用三级名称空间简化查询数据在多个目录和模式。

您还可以使用三级名称空间在蜂巢metastore符号数据设置<目录名称>hive_metastore

探索在砖SQL表和视图

您可以快速探索表和视图,而不需要运行一个集群通过使用数据浏览

  1. 打开数据浏览,点击数据图标数据在侧边栏。

  2. 在数据浏览器,选择目录和模式以查看其表和视图。

对于蜂巢Metastore中的对象,您必须运行一个SQL仓库使用数据浏览。

选择表和视图

选择从一个表或视图从一个笔记本:

  1. 使用侧边栏切换到数据科学与工程。

  2. 把笔记本数据科学与工程或砖机器学习集群这是为统一配置的目录。

  3. 在笔记本上,创建一个查询,统一编目表和视图的引用。您可以使用三级名称空间符号轻松地选择数据在多个目录和模式,包括workspace-local蜂巢metastore。

    请注意

    阅读从一个视图从一个集群与单用户安全模式下,用户必须拥有的选择所有引用的表和视图。

选择从一个表或视图从砖SQL:

  1. 使用侧边栏切换到砖SQL。

  2. 点击SQL编辑器在侧边栏。

  3. 选择一个SQL仓库这是为统一配置的目录。

  4. 组成一个查询。将一个表或视图插入查询,选择一个目录和模式,然后单击插入的表或视图的名称。

  5. 点击运行

选择从文件

探索数据存储在外部位置从这些数据创建表之前,您可以使用数据浏览器或以下命令。

权限要求:你必须有文件允许在外部位置与云存储路径返回一个列表的数据文件位置。

下一个步骤