pyspark.RDD.coalesce

抽样。 合并 ( numPartitions:int,洗牌:bool= )→pyspark.rdd.RDD(T]

返回一个新的抽样降低numPartitions分区。

例子

> > >sc并行化([1,2,3,4,5),3)()收集()[[1],[2、3],[4,5]]> > >sc并行化([1,2,3,4,5),3)合并(1)()收集()[[1、2、3、4、5]]