pyspark.pandas.DataFrame.agg¶
-
DataFrame。
gg
( 函数:联盟[列表(str), Dict[联盟[任何元组[,…]],[力量]]列表) )→pyspark.pandas.frame.DataFrame¶ -
总轴指定使用一个或多个操作。
- 参数
-
- 函数 dict或列表
-
dict类型映射的列名称(字符串)聚合函数(字符串)的列表。如果一个列表,对所有列进行聚合。
- 返回
-
- DataFrame
另请参阅
-
DataFrame.apply
-
DataFrame上调用函数。
-
DataFrame.transform
-
只有执行类型转换操作。
-
DataFrame.groupby
-
在执行操作组。
-
Series.aggregate
-
相当于函数级数。
笔记
gg是一个别名总。使用别名。
例子
> > >df=ps。DataFrame([[1,2,3),…(4,5,6),…(7,8,9),…(np。南,np。南,np。南]],…列=(“一个”,“B”,“C”])
> > >dfA B C0 1.0 2.0 3.01 4.0 5.0 6.02 7.0 8.0 9.03南南南
行聚合这些函数。
> > >df。gg([“和”,“最小值”))((“一个”,“B”,“C”]]。sort_index()A B C分钟1.0 2.0 3.0和12.0 15.0 18.0
每列不同的聚合。
> > >df。gg({“一个”:(“和”,“最小值”),“B”:(“最小值”,“马克斯”]})[[“一个”,“B”]]。sort_index()一个B马克斯南8.0分钟1.0 - 2.0和12.0南
多索引的列:
> > >df。列=pd。MultiIndex。from_tuples(((“X”,“一个”),(“X”,“B”),(“Y”,“C”)))> > >df。gg([“和”,“最小值”[[(])“X”,“一个”),(“X”,“B”),(“Y”,“C”)]]。sort_index()X YA B C分钟1.0 2.0 3.0和12.0 15.0 18.0
> > >聚合=df。gg({(“X”,“一个”):(“和”,“最小值”),(“X”,“B”):(“最小值”,“马克斯”]})> > >聚合[[(“X”,“一个”),(“X”,“B”)]]。sort_index()X一个B马克斯南8.0分钟1.0 - 2.0和12.0南