pyspark.sql.DataFrame.explain

DataFrame。 解释 ( 扩展:联盟(bool, str,没有)=没有一个,模式:可选(str]=没有一个 )→没有

打印到控制台(逻辑和物理)计划用于调试目的。

参数
扩展 bool,可选

默认的。如果,只打印物理计划。当没有指定这是一个字符串模式,它是指定的模式。

模式 str,可选

指定计划的预期输出格式。

  • 简单的:只印刷一个物理的计划。

  • 扩展:打印逻辑和物理的计划。

  • codegen:打印物理规划和生成的代码,如果他们是可用的。

  • 成本:打印一个合乎逻辑的计划和统计,如果他们是可用的。

  • 格式化解释输出分割成两个部分:一个具体的计划大纲和节点的细节。

    添加可选参数模式指定计划的预期输出格式。

例子

> > >df解释()= = = =物理计划*(1)扫描ExistingRDD(# 0岁名字# 1)
> > >df解释(真正的)= = = =解析逻辑计划= = = =逻辑分析计划= = = =逻辑优化计划= = = =物理计划
> > >df解释(模式=“格式化”)= = = =物理计划*扫描ExistingRDD (1)(1)扫描ExistingRDD codegen id: [1]输出[2]:[# 0岁名字# 1)
> > >df解释(“成本”)= = = =逻辑优化计划统计…