pyspark.RDD.zip

抽样。 邮政编码 ( 其他:pyspark.rdd.RDD(U] )→pyspark.rdd.RDD(元组(T,U] ]

拉链这个抽样与另一个,返回第一个元素的键值对每个抽样的第二个元素在每个抽样,等。假设这两个抽样具有相同数量的分区,每个分区相同数量的元素(例如,一个是通过地图上的其他)。

例子

> > >x=sc并行化(范围(0,5))> > >y=sc并行化(范围(1000年,1005年))> > >x邮政编码(y)收集()((0,1000),(1001)、(1002)、(1003)、(1004)]