pyspark.pandas.DataFrame.diff???
-
数据Frame
diff系统
高山市 周期性:整数=一号, 轴线:联盟[整数,字符串万事通=0 )→ pyspark.pandas.frame.DataFrame ??? -
初始离散元素差
计算DataFrame元素与DataFrame中另一个元素之差(默认为前列同列中元素)。
注解
diff当前应用Spark窗口导致单机中所有数据移入单片并可能导致性能严重退化避免此方法对大数据集
- 参数解析
-
- 周期性 int默认1
-
周期移位计算差分,接受负值
- 轴线 int默认0或index
-
可定时为0
- 回归
-
- 悬浮 数据Frame
实例
>>>df=ss系统.数据Frame{{'a':[一号,2,3,4,5,6万事通.'b':[一号,一号,2,3,5,8万事通.C:[一号,4,九九,16,25码,36号},列内=['a','b',C)>>>dfabc0一一一二四二三二九343164552556836
>>>df.diff系统(b)abc0NNNN1.00.03.01.01.05.031.07.041.02.09.051.03.011.0
前列差异
>>>df.diff系统高山市周期性=3)abc0NNNN纳纳纳2 Nan Na33.02.015.043.04.021.053.06.027.0
差差随行
>>>df.diff系统高山市周期性=-一号)abc0-1.00-3.01-1.0-1.0-5.02-1.0-1.0-7.03-1.0-2.0-9.04-1.0-3.0-111.05 Nan Na