pyspark.sql.DataFrame.explain¶
-
DataFrame。
解释
( 扩展:联盟(bool, str,没有)=没有一个,模式:可选(str]=没有一个 )→没有¶ -
打印到控制台(逻辑和物理)计划用于调试目的。
- 参数
-
- 扩展 bool,可选
-
默认的
假
。如果假
,只打印物理计划。当没有指定这是一个字符串模式
,它是指定的模式。 - 模式 str,可选
-
指定计划的预期输出格式。
简单的
:只印刷一个物理的计划。扩展
:打印逻辑和物理的计划。codegen
:打印物理规划和生成的代码,如果他们是可用的。成本
:打印一个合乎逻辑的计划和统计,如果他们是可用的。格式化
解释输出分割成两个部分:一个具体的计划大纲和节点的细节。添加可选参数模式指定计划的预期输出格式。
例子
> > >df。解释()= = = =物理计划*(1)扫描ExistingRDD(# 0岁名字# 1)
> > >df。解释(真正的)= = = =解析逻辑计划…= = = =逻辑分析计划…= = = =逻辑优化计划…= = = =物理计划…
> > >df。解释(模式=“格式化”)= = = =物理计划*扫描ExistingRDD (1)(1)扫描ExistingRDD codegen id: [1]输出[2]:[# 0岁名字# 1)…
> > >df。解释(“成本”)= = = =逻辑优化计划统计……