pyspark.pandas.DataFrame.pad

DataFrame。 ( :联盟(int, str,没有)=没有一个,原地:bool=,限制:可选(int]=没有一个 )→FrameLike

的同义词DataFrame.fillna ()Series.fillna ()方法= ' ffill '

请注意

当前实现“ffill”使用火花的窗口没有指定分区规范。这导致所有数据进入单一分区在单一机器,可能会导致严重的性能下降。避免这种方法对非常大的数据集。

参数
{0或指数}

1,不受支持。

原地 布尔,默认的错误

填写的地方(不创建一个新的对象)

限制 int,默认没有

如果指定方法,这是最大数量的连续向前/向后填补NaN值。换句话说,如果有差距超过这个数字的连续nan,只有部分填满。如果没有指定方法,这是沿着整个轴的最大条目数,nan将填满。必须大于0如果不是没有

返回
DataFrame或系列

DataFrame或系列NA条目填满。

例子

> > >psdf=psDataFrame({“一个”:(没有一个,3,没有一个,没有一个),“B”:(2,4,没有一个,3),“C”:(没有一个,没有一个,没有一个,1),' D ':(0,1,5,4]},=(“一个”,“B”,“C”,' D '])> > >psdfA B C D0南南2.0 01 3.0 - 4.0南12南南南53南3.0 - 1.0 4

传播非空值。

> > >psdfffill()A B C D0南南2.0 01 3.0 - 4.0南12 3.0 - 4.0南53 3.0 3.0 1.0 4

对系列

> > >ps=ps系列([2,4,没有一个,3])> > >ps0 2.01 4.02南3 3.0dtype: float64
> > >psffill()0 2.01 4.02 4.03 3.0dtype: float64