pyspark.pandas.DataFrame.median???
-
数据Frame
中位数
高山市 轴线:Union[int,str,None]=无, 跳田:布卢尔=真实性, 数独:布卢尔=无, 精度:整数=万万 )Union[int、dol、bull、str、bittes. ??? -
返回请求轴值中值
注解
与熊猫不同的是,熊猫对地中值基于约百分数计算法的近似中值,因为在大型数据集上计算中值费用极高
- 参数解析
-
- 轴线 {index/0/列(1)}
-
轴函数应用
- 跳田 布尔默认 True
-
计算结果时排除nell值
支持包括NA/Null值
- 数独 布尔默认无
-
仅含浮点布林列假不支持本参数主要是熊猫相容性
- 精度 int可选
-
默认精度近似大值表示精度提高相对错误可用1.0/精度推导
- 回归
-
- 中位数 标量或序列
实例
>>>df=ss系统.数据Frame{{.'a':[24码,21号,25码,3,26码万事通'b':[一号,2,3,4,5},列内=['a','b')>>>dfab024.021.02225.03333.04426.05
数据Frame上
>>>df.中位数(b)a25.0b3.0d类型:浮点64
数列中 :
>>>df['a'万事通.中位数(b)25.0>>>高山市df['b'万事通+百元).中位数(b)103.0
多索引列
>>>df.列内=pd.多因德ex.从_tuples〔()X级,'a')高山市'y','b')>>>dfxyab024.021.02225.03333.04426.05
数据Frame上
>>>df.中位数(b)x25.0yb3.0d类型:浮点64
>>>df.中位数高山市轴线=一号)012.51.5214.0318.5415.5d类型:浮点64
数列中 :
>>>df[(c)项X级,'a'南都市.中位数(b)25.0>>>高山市df[(c)项'y','b'南都市+百元).中位数(b)103.0