pyspark.sql.DataFrame.cube

DataFrame。 多维数据集 ( *关口:ColumnOrName )→GroupedData

为当前创建多维数据集DataFrame使用指定的列,所以我们可以运行聚合。

例子

> > >df多维数据集(“名称”,df年龄)()orderBy(“名称”,“年龄”)显示()+ - - - + - - - + - - - - - - +| | |名字年龄|计数+ - - - + - - - + - - - - - - +零零| | | 2 |零| | 2 | 1 |零| | 5 | 1 |零| 1 | | |爱丽丝爱丽丝| | 2 | 1 ||鲍勃零| 1 | |鲍勃| | 5 | 1 |+ - - - + - - - + - - - - - - +