pyspark.RDDBarrier.mapPartitionsWithIndex

RDDBarrier。 mapPartitionsWithIndex ( f:可调用的((int,Iterable(T]],Iterable(U]],preservesPartitioning:bool= )→pyspark.rdd.RDD(U]

通过应用一个函数返回一个新的抽样的每个分区包装抽样,而追踪指数的原始分区。和所有任务都推出了在舞台上的障碍。接口是一样的RDD.mapPartitionsWithIndex ()。请查看API文档。

笔记

这个API是实验