可视化

Databricks笔记本有内置的图表和可视化支持。控件时,本节中描述的可视化是可用的显示命令在笔记本单元格中以pandas或Apache Spark DataFrame的形式查看数据表结果。

有关旧Databricks可视化的信息,请参见传统的可视化

创建一个新的可视化

若要从单元格结果创建可视化,notebook单元格必须使用显示命令显示结果。点击+并选择菜单可视化.将出现可视化编辑器。

新的可视化菜单
  1. 可视化类型下拉菜单,选择类型。

    可视化编辑器
  2. 选择要显示在可视化中的数据。可用的字段取决于所选类型。

  3. 点击保存

可视化工具

如果您将鼠标悬停在可视化编辑器中的图表的右上方,将出现一个plot工具栏,您可以在其中执行选择、缩放和平移等操作。

笔记本可视化编辑器工具栏

如果你将鼠标悬停在笔记本的图表右上方,就会出现一个工具子集:

笔记本图表工具栏

创建一个新的数据概要文件

请注意

在Databricks Runtime 9.1 LTS及以上版本中可用。

数据配置文件以表格和图形格式显示Apache Spark DataFrame、pandas DataFrame或SQL表的汇总统计信息。若要从结果单元格创建数据概要文件,请单击+并选择菜单中的数据配置文件

数据配置文件新的可视化菜单

Databricks计算并显示汇总统计信息。

数据概要
  • 数字和分类特征分别显示在单独的表格中。

  • 在标签的顶部,您可以对功能进行排序或搜索。

  • 在图表列的顶部,您可以选择显示直方图(标准)或分位数。

  • 检查扩大放大图表。

  • 检查日志以对数刻度显示图表。

  • 您可以将光标悬停在图表上,以获得更详细的信息,例如直方图列的边界和其中的行数,或分位数值。

您还可以通过编程方式生成数据概要文件;看到汇总命令(dbutils.data. summary)

使用可视化和数据配置文件

请注意

数据概要文件在Databricks Runtime 9.1 LTS及以上版本中可用。

重命名、复制或删除可视化或数据配置文件

若要重命名、复制或删除可视化或数据配置文件,请单击选项卡名称右侧的三个垂直点。

笔记本可视化下拉菜单

您还可以通过直接单击它并在适当的位置编辑名称来更改名称。

编辑可视化

点击编辑可视化按钮在可视化下面打开可视化编辑器。完成更改后,单击保存

编辑颜色

您可以在创建可视化或编辑可视化时自定义可视化的颜色。

  1. 创建或编辑可视化。

  2. 点击颜色

  3. 要修改颜色,请单击正方形并通过执行以下操作之一选择新颜色:

    • 在颜色选择器中单击它。

    • 输入十六进制值。

  4. 单击颜色选择器外面的任何地方关闭它并保存更改。

暂时隐藏或显示一个系列

若要在可视化中隐藏系列,请单击图例中的系列。要再次显示该系列,请再次在图例中单击它。

若要仅显示单个系列,请双击图例中的系列。要显示其他系列,请单击每个系列。

下载可视化

要下载。png格式的可视化文件,请单击相机图标摄像头图标在笔记本单元格或可视化编辑器中。

  • 在笔记本单元格中,当您将光标移动到单元格上时,相机图标将出现在右上方。

    笔记本电池中的摄像头
  • 在可视化编辑器中,当您将光标移到图表上时,将出现相机图标。看到可视化工具

    可视化编辑器中的摄像头

向仪表板添加可视化或数据配置文件

  1. 单击选项卡名称右侧的三个垂直点。

    添加到仪表板
  2. 选择添加到仪表板.将出现可用的仪表板视图列表,以及一个菜单选项添加到新仪表板

  3. 选择仪表板或选择添加到新仪表板.显示仪表板,包括新添加的可视化或数据配置文件。