使用集群和池标记监视使用情况

要监视成本并准确地将Databricks的使用归因于组织的业务单元和团队(例如,用于退款),您可以标记集群和池。这些标记将两者传播到详细信息DBU使用报告和AWS EC2和AWS EBS实例进行成本分析。

带标记的对象和资源

您可以为Databricks管理的以下对象添加自定义标记:

对象

标签界面(UI)

标签接口(API)

池的用户界面在Databricks工作区中

实例池API

集群

集群的用户界面在Databricks工作区中

集群API

警告

不分配自定义标签与键的名字到集群。每个集群都有一个标记的名字由Databricks设置。如果您更改与键相关联的值的名字,该集群将不再被Databricks跟踪。因此,集群在空闲后可能不会被终止,并且将继续产生使用成本。

Databricks将以下默认标签添加到所有池和集群:

池标签键名

价值

供应商

不断“砖”

DatabricksInstancePoolCreatorId

创建池的用户的内部标识符

DatabricksInstancePoolId

数据池的内部标识符

集群标记键名

价值

供应商

不断“砖”

ClusterId

集群的内部标识符

ClusterName

集群名称

创造者

创建集群的用户名(邮箱)

在作业集群上,Databricks还应用了以下默认标记:

集群标记键名

价值

RunName

作业名

JobId

工作ID

在Databricks SQL使用的资源上,Databricks还应用了以下默认标签:

集群标记键名

价值

SqlWarehouseId

数据库SQL仓库的内部标识符

标签传播

标签传播到AWS EC2实例的方式不同,这取决于集群是否是从池创建的。

集群和池标记传播

如果从池创建集群,则其EC2实例只继承自定义和默认池标记,而不继承集群标记。因此,如果您希望从池中创建集群,请确保将所需的所有自定义集群标记分配给池。

如果集群不是从池创建的,那么它的标记将按预期传播到EC2实例。

群集和池标记都传播到DBU使用报告,无论集群是否从池中创建。

如果标记名称冲突,Databricks默认标记优先于自定义标记,池标记优先于集群标记。

限制

  • 标签键和值只能包含ISO 8859-1 (latin1)集合中的字符。包含其他字符的标签将被忽略。

  • 如果更改标记键名称或值,则这些更改仅在集群重新启动或池扩展后应用。

  • 如果集群的自定义标记与池的自定义标记冲突,则无法创建集群。