pyspark.RDD.lookup

抽样。 查找 ( 关键:K )→列表(V]

返回的列表值抽样的关键关键。这样操作是有效如果抽样一个已知瓜分者只搜索分区映射到的关键。

例子

> > >l=范围(1000年)> > >抽样=sc并行化(邮政编码(l,l),10)> > >抽样查找(42)#慢[42]> > >排序=抽样sortByKey()> > >排序查找(42)#快[42]> > >排序查找(1024年)[]> > >rdd2=sc并行化((((“一个”,“b”),“c”)))groupByKey()> > >列表(rdd2查找((“一个”,“b”))(0])(“c”)