GroupBy¶

GroupBy GroupBy调用返回的对象是:DataFrame.groupby (),Series.groupby ()等。

索引、迭代¶

GroupBy.get_group(名字)

构建DataFrame从集团提供的名字。

函数的应用¶

`GroupBy.apply`(* args func * * kwargs)	应用函数函数group-wise和组合在一起的结果。
`GroupBy.transform`(* args func * * kwargs)	应用函数column-by-column GroupBy对象。

以下方法只提供DataFrameGroupBy对象。

`DataFrameGroupBy.agg`([func_or_funcs])	总轴指定使用一个或多个操作。
`DataFrameGroupBy.aggregate`([func_or_funcs])	总轴指定使用一个或多个操作。

计算/描述性统计¶

`GroupBy.all`([skipna])	返回True,如果所有的组中的值都是诚实的人,其他的错误的。
`GroupBy.any`()	返回True,如果组中的任何值都是真诚的,其他的错误的。
`GroupBy.count`()	计算组数,不含缺失值。
`GroupBy.cumcount`(【提升】)	每一项数量每组的长度从0 - 1。
`GroupBy.cummax`()	为每个组累积马克斯。
`GroupBy.cummin`()	累积最小为每个组。
`GroupBy.cumprod`()	累计产品为每个组。
`GroupBy.cumsum`()	累计金额为每个组。
`GroupBy.ewm`([com、跨度、半衰期、α…))	返回一个ewm石斑鱼,每组提供ewm功能。
`GroupBy.filter`(函数)	返回一个副本的DataFrame排除元素组不满足布尔函数指定的标准。
`GroupBy.first`([numeric_only])	计算第一组值。
`GroupBy.last`([numeric_only])	计算最后一组值。
`GroupBy.max`([numeric_only])	计算最大集团的价值观。
`GroupBy.mean`([numeric_only])	计算的组,除缺失值。
`GroupBy.median`([numeric_only、准确性)	计算值的组,除缺失值。
`GroupBy.min`([numeric_only])	计算最小值组。
`GroupBy.rank`([方法,提升])	在每组提供的值。
`GroupBy.std`([ddof])	计算标准偏差的团体,不含缺失值。
`GroupBy.sum`()	计算组值的总和
`GroupBy.var`([ddof])	计算方差的团体,不含缺失值。
`GroupBy.nunique`([dropna])	返回DataFrame与独特的观察每组每一列的数量。
`GroupBy.size`()	计算组大小。
`GroupBy.diff`([时间])	第一个离散元素的差异。
`GroupBy.idxmax`([skipna])	回报指数首次出现的最大要求轴组。
`GroupBy.idxmin`([skipna])	回报指数首次出现的最低要求轴组。
`GroupBy.fillna`([值,方法,轴,…))	填补NA / NaN值组。
`GroupBy.bfill`((限制))	的同义词DataFrame.fillna ()与`方法= ' bfill '`。
`GroupBy.ffill`((限制))	的同义词DataFrame.fillna ()与`方法= ' ffill '`。
`GroupBy.head`([n])	每组返回的第n行。
`GroupBy.backfill`((限制))	的同义词DataFrame.fillna ()与`方法= ' bfill '`。
`GroupBy.shift`([时期,fill_value])	每组时间观察转变。
`GroupBy.tail`([n])	每组的最后n行返回。

以下方法只提供DataFrameGroupBy对象。

DataFrameGroupBy.describe()

产生描述性统计,总结集中趋势,分散和形状数据集的分布、排除南值。

以下方法只提供SeriesGroupBy对象。

`SeriesGroupBy.nsmallest`([n])	返回最小的n元素。
`SeriesGroupBy.nlargest`([n])	返回第一个n行命令列在降序排列组。
`SeriesGroupBy.value_counts`([排序,…)	计算组大小。
`SeriesGroupBy.unique`()	返回唯一的值组。

以前的

pyspark.pandas.window.ExponentialMoving.mean

下一个

pyspark.pandas.groupby.GroupBy.get_group