什么是Databricks SQL?

Databricks SQL描述了Databricks Lakehouse平台内建的企业数据仓库。bob体育客户端下载Databricks SQL的核心产品是一种优化的计算SQL仓库

Databricks提供了一组UI工具,称为SQL的角色编写和执行SQL查询可视化,指示板

SQL仓库为从许多环境(包括第三方环境)执行的SQL查询提供通用计算BI和可视化工具。Databricks SQL还提供了健壮的API

要了解Databricks SQL的最新功能,请参见Databricks SQL发布说明

Spark SQL vs. Databricks SQL

Databricks SQL是一个优化的计算环境,而Spark SQL描述了一组Apache Spark api。Databricks提供了大量的工具和技术,允许SQL开发人员进行ETL、分析和创建仪表板等工作。砖建议砖的SQL对于企业数据仓库体验。

什么是Spark SQL?

这个词火花SQL技术上适用于所有使用Spark dataframe的操作。Spark SQL在Spark 2中取代了Spark RDD API。x,为Python、Scala、R和Java引入了对SQL查询的支持和DataFrame API。

Databricks文档经常使用Spark SQL来描述SQL查询和功能。运行在Databricks上的SQL查询与开源Apache Spark的功能密切相关,并为Delta Lake和专有Databricks特性提供了一些内置扩展协议。bob下载地址属性可以查看所有可用函数并了解执行上下文之间的差异SQL参考

SQL在Databricks和开源Apache Spark上有什么不同?bob下载地址

不管执行环境如何,Databricks上的SQL与在其他地方执行的Apache Spark SQL没有太大区别。可以在Databricks上使用SQL对三种不同的计算选项执行常见查询和语句。所有这些环境都添加了许多在开源Apache Spark中不可用的命令,并预先配置为运行与Delta Lake相关的所有SQL查询。bob下载地址

在支持Unity catalog的工作空间中,会出现一些额外的关键字和命令。注意,当针对Unity Catalog目录而不是内置的Hive metastore运行时,一些SQL命令有不同的执行。

每个计算选项提供了稍微不同的语义和语法。一般来说:

  • SQL on Databricks Runtime计算最类似于开源Apache Spark中的执行。bob下载地址

  • 使用Delta Live表执行的SQL通常继承Databricks运行时的语法和语义,但为Delta Live表添加了一些专有的关键字和函数。

  • 在SQL仓库上运行的SQL最接近ANSI标准。在Databricks笔记本上运行的针对Databricks Runtime计算的SQL支持的许多特性都不能工作,包括HiveQL语法、变量声明和引用以及DButils小部件的使用。