pyspark.RDD.sortBy¶
-
抽样。
sortBy
( keyfunc:可调用的((T],年代],提升:bool=真正的,numPartitions:可选(int]=没有一个 )→抽样(T] ¶ -
鉴于keyfunc排序这个抽样
例子
> > >tmp=((“一个”,1),(“b”,2),(' 1 ',3),(' d ',4),(' 2 ',5)]> > >sc。并行化(tmp)。sortBy(λx:x(0])。收集()(' 1 ',3),(' 2 ',5),(' a ', 1), (' b ', 2), (' d ', 4)]> > >sc。并行化(tmp)。sortBy(λx:x(1])。收集()[(' a ', 1), (' b ', 2), (' 1 ', 3), (' d ', 4), (' 2 ', 5)]