pyspark.pandas.DataFrame.diff???

数据Frame diff系统 高山市 周期性:整数=一号, 轴线:联盟[整数,字符串万事通=0 )→ pyspark.pandas.frame.DataFrame ???

初始离散元素差

计算DataFrame元素与DataFrame中另一个元素之差(默认为前列同列中元素)。

注解

diff当前应用Spark窗口导致单机中所有数据移入单片并可能导致性能严重退化避免此方法对大数据集

参数解析
周期性 int默认1

周期移位计算差分,接受负值

轴线 int默认0或index

可定时为0

回归
悬浮 数据Frame

实例

>>>df=ss系统.数据Frame{{'a':[一号,2,3,4,5,6万事通.'b':[一号,一号,2,3,5,8万事通.C:[一号,4,九九,16,25码,36号},列内=['a','b',C)>>>dfabc0一一一二四二三二九343164552556836
>>>df.diff系统(b)abc0NNNN1.00.03.01.01.05.031.07.041.02.09.051.03.011.0

前列差异

>>>df.diff系统高山市周期性=3)abc0NNNN纳纳纳2 Nan Na33.02.015.043.04.021.053.06.027.0

差差随行

>>>df.diff系统高山市周期性=-一号)abc0-1.00-3.01-1.0-1.0-5.02-1.0-1.0-7.03-1.0-2.0-9.04-1.0-3.0-111.05 Nan Na