pyspark.pandas.Series.corr¶
-
系列。
相关系数
( 其他:pyspark.pandas.series.Series,方法:str=皮尔森的 )→浮动¶ -
计算相关其他系列中,除缺失值。
- 参数
-
- 其他 系列
- 方法 {“皮尔森”、“枪兵”}
-
皮尔森:标准的相关系数
斯皮尔曼:斯皮尔曼等级相关
- 返回
-
- 相关 浮动
笔记
有行为差异pandas-on-Spark和熊猫。
的方法参数只接受“培生”,“枪兵”
数据不应该包含nan。pandas-on-Spark将返回一个错误。
pandas-on-Spark不支持以下参数(s)。
min_periods的观点是不支持
例子
> > >df=ps。DataFrame({“s1 ':(2,比上年,6,2),…“s2”:(3,6,比上年,1。]})> > >s1=df。s1> > >s2=df。s2> > >s1。相关系数(s2,方法=皮尔森的)-0.851064……
> > >s1。相关系数(s2,方法=“枪兵”)-0.948683……