pyspark.pandas.DataFrame.pad¶

DataFrame。 垫 ( 轴:联盟(int, str,没有)=没有一个,原地:bool=假,限制:可选(int]=没有一个 )→FrameLike¶

的同义词DataFrame.fillna ()或Series.fillna ()与方法= ' ffill '。

请注意

当前实现“ffill”使用火花的窗口没有指定分区规范。这导致所有数据进入单一分区在单一机器,可能会导致严重的性能下降。避免这种方法对非常大的数据集。

参数

轴 {0或指数}: 1,列不受支持。
原地布尔,默认的错误: 填写的地方(不创建一个新的对象)
限制 int,默认没有: 如果指定方法,这是最大数量的连续向前/向后填补NaN值。换句话说,如果有差距超过这个数字的连续nan,只有部分填满。如果没有指定方法,这是沿着整个轴的最大条目数,nan将填满。必须大于0如果不是没有

返回

DataFrame或系列: DataFrame或系列NA条目填满。

例子

           > > >psdf=ps。DataFrame({…“一个”:(没有一个,3,没有一个,没有一个),…“B”:(2,4,没有一个,3),…“C”:(没有一个,没有一个,没有一个,1),…' D ':(0,1,5,4]…},…列=(“一个”,“B”,“C”,' D '])> > >psdfA B C D0南南2.0 01 3.0 - 4.0南12南南南53南3.0 - 1.0 4
          

传播非空值。

           > > >psdf。ffill()A B C D0南南2.0 01 3.0 - 4.0南12 3.0 - 4.0南53 3.0 3.0 1.0 4
          

对系列

           > > >ps=ps。系列([2,4,没有一个,3])> > >ps0 2.01 4.02南3 3.0dtype: float64
          

           > > >ps。ffill()0 2.01 4.02 4.03 3.0dtype: float64
          

以前的

pyspark.pandas.DataFrame.notnull

下一个

pyspark.pandas.DataFrame.bool