pyspark.pandas.DataFrame.agg

DataFrame。 gg ( 函数:联盟[列表(str), Dict[联盟[任何元组[,…]],[力量]]列表) )→pyspark.pandas.frame.DataFrame

总轴指定使用一个或多个操作。

参数
函数 dict或列表

dict类型映射的列名称(字符串)聚合函数(字符串)的列表。如果一个列表,对所有列进行聚合。

返回
DataFrame

另请参阅

DataFrame.apply

DataFrame上调用函数。

DataFrame.transform

只有执行类型转换操作。

DataFrame.groupby

在执行操作组。

Series.aggregate

相当于函数级数。

笔记

gg是一个别名。使用别名。

例子

> > >df=psDataFrame([[1,2,3),(4,5,6),(7,8,9),(np,np,np]],=(“一个”,“B”,“C”])
> > >dfA B C0 1.0 2.0 3.01 4.0 5.0 6.02 7.0 8.0 9.03南南南

行聚合这些函数。

> > >dfgg([“和”,“最小值”))((“一个”,“B”,“C”]]sort_index()A B C分钟1.0 2.0 3.0和12.0 15.0 18.0

每列不同的聚合。

> > >dfgg({“一个”:(“和”,“最小值”),“B”:(“最小值”,“马克斯”]})[[“一个”,“B”]]sort_index()一个B马克斯南8.0分钟1.0 - 2.0和12.0南

多索引的列:

> > >df=pdMultiIndexfrom_tuples(((“X”,“一个”),(“X”,“B”),(“Y”,“C”)))> > >dfgg([“和”,“最小值”[[(])“X”,“一个”),(“X”,“B”),(“Y”,“C”)]]sort_index()X YA B C分钟1.0 2.0 3.0和12.0 15.0 18.0
> > >聚合=dfgg({(“X”,“一个”):(“和”,“最小值”),(“X”,“B”):(“最小值”,“马克斯”]})> > >聚合[[(“X”,“一个”),(“X”,“B”)]]sort_index()X一个B马克斯南8.0分钟1.0 - 2.0和12.0南