pyspark.RDD.lookup¶
-
抽样。
查找
( 关键:K )→列表(V] ¶ -
返回的列表值抽样的关键关键。这样操作是有效如果抽样一个已知瓜分者只搜索分区映射到的关键。
例子
> > >l=范围(1000年)> > >抽样=sc。并行化(邮政编码(l,l),10)> > >抽样。查找(42)#慢[42]> > >排序=抽样。sortByKey()> > >排序。查找(42)#快[42]> > >排序。查找(1024年)[]> > >rdd2=sc。并行化((((“一个”,“b”),“c”)))。groupByKey()> > >列表(rdd2。查找((“一个”,“b”))(0])(“c”)