GroupBy

GroupBy GroupBy调用返回的对象是:DataFrame.groupby (),Series.groupby ()等。

索引、迭代

GroupBy.get_group(名字)

构建DataFrame从集团提供的名字。

函数的应用

GroupBy.apply(* args func * * kwargs)

应用函数函数group-wise和组合在一起的结果。

GroupBy.transform(* args func * * kwargs)

应用函数column-by-column GroupBy对象。

以下方法只提供DataFrameGroupBy对象。

DataFrameGroupBy.agg([func_or_funcs])

总轴指定使用一个或多个操作。

DataFrameGroupBy.aggregate([func_or_funcs])

总轴指定使用一个或多个操作。

计算/描述性统计

GroupBy.all([skipna])

返回True,如果所有的组中的值都是诚实的人,其他的错误的。

GroupBy.any()

返回True,如果组中的任何值都是真诚的,其他的错误的。

GroupBy.count()

计算组数,不含缺失值。

GroupBy.cumcount(【提升】)

每一项数量每组的长度从0 - 1。

GroupBy.cummax()

为每个组累积马克斯。

GroupBy.cummin()

累积最小为每个组。

GroupBy.cumprod()

累计产品为每个组。

GroupBy.cumsum()

累计金额为每个组。

GroupBy.ewm([com、跨度、半衰期、α…))

返回一个ewm石斑鱼,每组提供ewm功能。

GroupBy.filter(函数)

返回一个副本的DataFrame排除元素组不满足布尔函数指定的标准。

GroupBy.first([numeric_only])

计算第一组值。

GroupBy.last([numeric_only])

计算最后一组值。

GroupBy.max([numeric_only])

计算最大集团的价值观。

GroupBy.mean([numeric_only])

计算的组,除缺失值。

GroupBy.median([numeric_only、准确性)

计算值的组,除缺失值。

GroupBy.min([numeric_only])

计算最小值组。

GroupBy.rank([方法,提升])

在每组提供的值。

GroupBy.std([ddof])

计算标准偏差的团体,不含缺失值。

GroupBy.sum()

计算组值的总和

GroupBy.var([ddof])

计算方差的团体,不含缺失值。

GroupBy.nunique([dropna])

返回DataFrame与独特的观察每组每一列的数量。

GroupBy.size()

计算组大小。

GroupBy.diff([时间])

第一个离散元素的差异。

GroupBy.idxmax([skipna])

回报指数首次出现的最大要求轴组。

GroupBy.idxmin([skipna])

回报指数首次出现的最低要求轴组。

GroupBy.fillna([值,方法,轴,…))

填补NA / NaN值组。

GroupBy.bfill((限制))

的同义词DataFrame.fillna ()方法= ' bfill '

GroupBy.ffill((限制))

的同义词DataFrame.fillna ()方法= ' ffill '

GroupBy.head([n])

每组返回的第n行。

GroupBy.backfill((限制))

的同义词DataFrame.fillna ()方法= ' bfill '

GroupBy.shift([时期,fill_value])

每组时间观察转变。

GroupBy.tail([n])

每组的最后n行返回。

以下方法只提供DataFrameGroupBy对象。

DataFrameGroupBy.describe()

产生描述性统计,总结集中趋势,分散和形状数据集的分布、排除值。

以下方法只提供SeriesGroupBy对象。

SeriesGroupBy.nsmallest([n])

返回最小的n元素。

SeriesGroupBy.nlargest([n])

返回第一个n行命令列在降序排列组。

SeriesGroupBy.value_counts([排序,…)

计算组大小。

SeriesGroupBy.unique()

返回唯一的值组。