pyspark.sql.DataFrame.cube¶
-
DataFrame。
多维数据集
( *关口:ColumnOrName )→GroupedData¶ -
为当前创建多维数据集
DataFrame
使用指定的列,所以我们可以运行聚合。例子
> > >df。多维数据集(“名称”,df。年龄)。数()。orderBy(“名称”,“年龄”)。显示()+ - - - + - - - + - - - - - - +| | |名字年龄|计数+ - - - + - - - + - - - - - - +零零| | | 2 |零| | 2 | 1 |零| | 5 | 1 |零| 1 | | |爱丽丝爱丽丝| | 2 | 1 ||鲍勃零| 1 | |鲍勃| | 5 | 1 |+ - - - + - - - + - - - - - - +