抽样。
mapPartitions
通过应用一个函数返回一个新的抽样,抽样的每个分区。
例子
> > >抽样=sc。并行化([1,2,3,4),2)> > >deff(迭代器):收益率总和(迭代器)> > >抽样。mapPartitions(f)。收集()(3、7)
以前的
pyspark.RDD.map
下一个
pyspark.RDD.mapPartitionsWithIndex