pyspark.RDD.coalesce¶

抽样。 合并 ( numPartitions:int,洗牌:bool=假 )→pyspark.rdd.RDD(T] ¶

返回一个新的抽样降低numPartitions分区。

例子

           > > >sc。并行化([1,2,3,4,5),3)。偷()。收集()[[1],[2、3],[4,5]]> > >sc。并行化([1,2,3,4,5),3)。合并(1)。偷()。收集()[[1、2、3、4、5]]
          

以前的

pyspark.RDD.cleanShuffleDependencies

下一个

pyspark.RDD.cogroup