可视化
Databricks笔记本有内置的图表和可视化支持。控件时,本节中描述的可视化是可用的显示
命令在笔记本单元格中以pandas或Apache Spark DataFrame的形式查看数据表结果。
有关旧Databricks可视化的信息,请参见传统的可视化.
创建一个新的可视化
若要从单元格结果创建可视化,notebook单元格必须使用显示
命令显示结果。点击+并选择.将出现可视化编辑器。
在可视化类型下拉菜单,选择类型。
选择要显示在可视化中的数据。可用的字段取决于所选类型。
点击保存.
创建一个新的数据概要文件
请注意
在Databricks Runtime 9.1 LTS及以上版本中可用。
数据配置文件以表格和图形格式显示Apache Spark DataFrame、pandas DataFrame或SQL表的汇总统计信息。若要从结果单元格创建数据概要文件,请单击+并选择.
Databricks计算并显示汇总统计信息。
数字和分类特征分别显示在单独的表格中。
在标签的顶部,您可以对功能进行排序或搜索。
在图表列的顶部,您可以选择显示直方图(标准)或分位数。
检查扩大放大图表。
检查日志以对数刻度显示图表。
您可以将光标悬停在图表上,以获得更详细的信息,例如直方图列的边界和其中的行数,或分位数值。
您还可以通过编程方式生成数据概要文件;看到汇总命令(dbutils.data. summary).
使用可视化和数据配置文件
请注意
数据概要文件在Databricks Runtime 9.1 LTS及以上版本中可用。
编辑可视化
点击在可视化下面打开可视化编辑器。完成更改后,单击保存.
下载可视化
要下载。png格式的可视化文件,请单击相机图标在笔记本单元格或可视化编辑器中。
在笔记本单元格中,当您将光标移动到单元格上时,相机图标将出现在右上方。
在可视化编辑器中,当您将光标移到图表上时,将出现相机图标。看到可视化工具.
向仪表板添加可视化或数据配置文件
单击选项卡名称右侧的三个垂直点。
选择添加到仪表板.将出现可用的仪表板视图列表,以及一个菜单选项添加到新仪表板.
选择仪表板或选择添加到新仪表板.显示仪表板,包括新添加的可视化或数据配置文件。