pyspark.RDD.glom

抽样。 ( )→pyspark.rdd.RDD(列表(T] ]

返回一个抽样由合并每个分区内的所有元素列表。

例子

> > >抽样=sc并行化([1,2,3,4),2)> > >排序(抽样()收集())[[1、2],[3,4]]