pyspark.sql.functions.grouping¶
-
pyspark.sql.functions。
分组
( 上校:ColumnOrName )→pyspark.sql.column.Column¶ -
聚合函数:表示一组的列表中指定的列是否聚合,返回1聚合或0不聚合的结果集。
例子
> > >df。多维数据集(“名称”)。gg(分组(“名称”),总和(“年龄”))。orderBy(“名称”)。显示()+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - + +| |分组名称(名称)(年龄)| |数目+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - + +零| 1 | | |爱丽丝| | 0 | 2 |鲍勃| 0 | | 5 |+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - + +