pyspark.RDD.mapPartitions

抽样。 mapPartitions ( f:可调用的((Iterable(T]],Iterable(U]],preservesPartitioning:bool= )→pyspark.rdd.RDD(U]

通过应用一个函数返回一个新的抽样,抽样的每个分区。

例子

> > >抽样=sc并行化([1,2,3,4),2)> > >deff(迭代器):收益率总和(迭代器)> > >抽样mapPartitions(f)收集()(3、7)