数据集群计算类型:特征比较
Databricks提供了五种计算类型,每一种都是针对不同类型的工作负载设计的:
工作计算:在可伸缩和高可靠的计算上运行数据工程和ML工作负载。强烈建议用于生产工作负载。
通用计算:专为交互式数据科学和分析工作负载而设计。
SQL支持:在专为高并发、低延迟工作负载设计的计算机上运行BI和分析工作负载。
Serverless SQL: SQL Pro的所有功能,加上即时启动和自动扩展,通过优化的计算舰队管理为您的Databricks。
SQL经典:为BI报告、分析和可视化运行SQL查询,以便从数据湖获得及时的见解。
预览
SQL Pro计算类型已进入公共预览.
此表显示每种计算类型的可用特性。
功能 |
工作计算 |
通用计算 |
SQL Pro/无服务器SQL |
SQL经典 |
---|---|---|---|---|
Managed Apache Spark: Apache Spark集群,用于在Databricks平台上运行生产作业,具有告警和重试功能。bob体育客户端下载 |
X |
X |
||
作业调度:生产作业,包括监视流、多步骤作业、SQL和运行库的调度器。 |
X |
X |
X |
|
自动驾驶仪的集群:具有计算和实例存储自动伸缩、自动启动、使用spot实例、photon和集群终止的高性价比集群。 |
X |
X |
||
Databricks ML运行时:开箱即用的ML框架,包括Spark/Horovod集成、XGBoost、TensorFlow、PyTorch、Keras支持、实验跟踪、超参数优化、带autoML的glassbox ML、特征工程、Databricks特征存储和MLflow模型注册表。 |
X |
X |
||
管理MLflow:在Databricks平台上运行MLflow,通过MLflobob体育客户端下载w远程执行和托管跟踪服务器简化端到端ML生命周期。您也可以从Databricks外部运行MLflow(使用可能受到限制)。 |
X |
X |
||
德尔塔湖与德尔塔发动机:强大的管道,提供干净、高质量的数据,支持大规模的高性能分析。Databricks上的Delta Lake提供ACID事务、模式管理、批处理或流读写支持、数据版本控制以及Delta Engine的性能优化。 |
X |
X |
X |
X |
交互式集群:多用户高并发模式,持久集群分析。 |
X |
|||
笔记本和协作:使用Scala、Python、SQL和R笔记本,在分析师和其他同事之间实现高度协作和高效的工作,这些笔记本提供一键式可视化、交互式仪表板、数据配置文件、无代码数据探索、参数小部件、实验跟踪、修订历史和使用GitHub等Git提供程序的版本控制集成。 |
X |
X |
||
生态系统集成:通过JDBC/ODBC集成RStudio和一系列第三方BI工具。 |
X |
|||
商业智能高性能、可扩展、完全管理的Photon执行引擎,用于通过SQL仓库进行SQL查询。包括优化成本或可靠性、内置查询编辑器、查询历史、查询概要、可靠数据缓存、自动终止、内置仪表板和警报的选项。 |
X |
X |
有关按计算类型定价的信息,请参见AWS定价.