pyspark.pandas.Series.corr

系列。 相关系数 ( 其他:pyspark.pandas.series.Series,方法:str=皮尔森的 )→浮动

计算相关其他系列中,除缺失值。

参数
其他 系列
方法 {“皮尔森”、“枪兵”}
  • 皮尔森:标准的相关系数

  • 斯皮尔曼:斯皮尔曼等级相关

返回
相关 浮动

笔记

有行为差异pandas-on-Spark和熊猫。

  • 方法参数只接受“培生”,“枪兵”

  • 数据不应该包含nan。pandas-on-Spark将返回一个错误。

  • pandas-on-Spark不支持以下参数(s)。

    • min_periods的观点是不支持

例子

> > >df=psDataFrame({“s1 ':(2,比上年,6,2),“s2”:(3,6,比上年,1。]})> > >s1=dfs1> > >s2=dfs2> > >s1相关系数(s2,方法=皮尔森的)-0.851064……
> > >s1相关系数(s2,方法=“枪兵”)-0.948683……