pyspark.sql.functions.grouping

pyspark.sql.functions。 分组 ( 上校:ColumnOrName )→pyspark.sql.column.Column

聚合函数:表示一组的列表中指定的列是否聚合,返回1聚合或0不聚合的结果集。

例子

> > >df多维数据集(“名称”)gg(分组(“名称”),总和(“年龄”))orderBy(“名称”)显示()+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - + +| |分组名称(名称)(年龄)| |数目+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - + +零| 1 | | |爱丽丝| | 0 | 2 |鲍勃| 0 | | 5 |+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - + +