pyspark.RDD.leftOuterJoin

抽样。 leftOuterJoin ( 其他:pyspark.rdd.RDD(元组(K,U]],numPartitions:可选(int]=没有一个 )→pyspark.rdd.RDD(元组(K,元组(V,可选(U] ] ] ]

执行左外连接自我其他

为每个元素(k、v)自我,由此产生的抽样要么包含所有双(k, v, w) w其他或两人(k, (v,)如果没有元素其他有关键的k。

Hash-partitions结果抽样为给定数量的分区。

例子

> > >x=sc并行化(((“一个”,1),(“b”,4)))> > >y=sc并行化(((“一个”,2)))> > >排序(xleftOuterJoin(y)收集())[(a (1、2)), (“b”,(没有)))