pyspark.RDD.takeOrdered???

RDD 取序 高山市 宁美市:整数, 密钥:可选性[可调用性[[T级万事通,S级万事通万事通= )QQ链表 [T级 万事通 ???

从 RDD顺序或可选密钥函数指定的顺序获取N元素

注解

只有当所生成数组预期小时才应使用这种方法,因为所有数据都装入驱动存储器中

实例

>>>sc.并行化10,一号,2,九九,3,4,5,6,7).取序高山市6)一二三四五六>>>sc.并行化10,一号,2,九九,3,4,5,6,7万事通2).取序高山市6,密钥=羊圈X级:-X级)[10、9、7、6、5、4