pyspark.RDD.distinct

抽样。 截然不同的 ( numPartitions:可选(int]=没有一个 )→pyspark.rdd.RDD(T]

返回一个新的包含不同的元素在这个抽样的抽样。

例子

> > >排序(sc并行化([1,1,2,3])截然不同的()收集())(1、2、3)