pyspark.sql.DataFrame.cube¶

DataFrame。 多维数据集 ( *关口:ColumnOrName )→GroupedData¶

为当前创建多维数据集DataFrame使用指定的列,所以我们可以运行聚合。

例子

           > > >df。多维数据集(“名称”,df。年龄)。数()。orderBy(“名称”,“年龄”)。显示()+ - - - + - - - + - - - - - - +| | |名字年龄|计数+ - - - + - - - + - - - - - - +零零| | | 2 |零| | 2 | 1 |零| | 5 | 1 |零| 1 | | |爱丽丝爱丽丝| | 2 | 1 ||鲍勃零| 1 | |鲍勃| | 5 | 1 |+ - - - + - - - + - - - - - - +
          

以前的

pyspark.sql.DataFrame.crosstab

下一个

pyspark.sql.DataFrame.describe