pyspark.RDDBarrier.mapPartitionsWithIndex¶
-
RDDBarrier。
mapPartitionsWithIndex
( f:可调用的((int,Iterable(T]],Iterable(U]],preservesPartitioning:bool=假 )→pyspark.rdd.RDD(U] ¶ -
通过应用一个函数返回一个新的抽样的每个分区包装抽样,而追踪指数的原始分区。和所有任务都推出了在舞台上的障碍。接口是一样的
RDD.mapPartitionsWithIndex ()
。请查看API文档。笔记
这个API是实验