数据集群计算类型:特征比较

Databricks提供了五种计算类型,每一种都是针对不同类型的工作负载设计的:

  • 工作计算:在可伸缩和高可靠的计算上运行数据工程和ML工作负载。强烈建议用于生产工作负载。

  • 通用计算:专为交互式数据科学和分析工作负载而设计。

  • SQL支持:在专为高并发、低延迟工作负载设计的计算机上运行BI和分析工作负载。

  • Serverless SQL: SQL Pro的所有功能,加上即时启动和自动扩展,通过优化的计算舰队管理为您的Databricks。

  • SQL经典:为BI报告、分析和可视化运行SQL查询,以便从数据湖获得及时的见解。

预览

SQL Pro计算类型已进入公共预览

此表显示每种计算类型的可用特性。

功能

工作计算

通用计算

SQL Pro/无服务器SQL

SQL经典

Managed Apache Spark: Apache Spark集群,用于在Databricks平台上运行生产作业,具有告警和重试功能。bob体育客户端下载

X

X

作业调度:生产作业,包括监视流、多步骤作业、SQL和运行库的调度器。

X

X

X

自动驾驶仪的集群:具有计算和实例存储自动伸缩、自动启动、使用spot实例、photon和集群终止的高性价比集群。

X

X

Databricks ML运行时:开箱即用的ML框架,包括Spark/Horovod集成、XGBoost、TensorFlow、PyTorch、Keras支持、实验跟踪、超参数优化、带autoML的glassbox ML、特征工程、Databricks特征存储和MLflow模型注册表。

X

X

管理MLflow:在Databricks平台上运行MLflow,通过MLflobob体育客户端下载w远程执行和托管跟踪服务器简化端到端ML生命周期。您也可以从Databricks外部运行MLflow(使用可能受到限制)。

X

X

德尔塔湖与德尔塔发动机:强大的管道,提供干净、高质量的数据,支持大规模的高性能分析。Databricks上的Delta Lake提供ACID事务、模式管理、批处理或流读写支持、数据版本控制以及Delta Engine的性能优化。

X

X

X

X

交互式集群:多用户高并发模式,持久集群分析。

X

笔记本和协作:使用Scala、Python、SQL和R笔记本,在分析师和其他同事之间实现高度协作和高效的工作,这些笔记本提供一键式可视化、交互式仪表板、数据配置文件、无代码数据探索、参数小部件、实验跟踪、修订历史和使用GitHub等Git提供程序的版本控制集成。

X

X

生态系统集成:通过JDBC/ODBC集成RStudio和一系列第三方BI工具。

X

商业智能高性能、可扩展、完全管理的Photon执行引擎,用于通过SQL仓库进行SQL查询。包括优化成本或可靠性、内置查询编辑器、查询历史、查询概要、可靠数据缓存、自动终止、内置仪表板和警报的选项。

X

X

有关按计算类型定价的信息,请参见AWS定价