pyspark.RDD.zip¶

抽样。 邮政编码 ( 其他:pyspark.rdd.RDD(U] )→pyspark.rdd.RDD(元组(T,U] ] ¶

拉链这个抽样与另一个,返回第一个元素的键值对每个抽样的第二个元素在每个抽样,等。假设这两个抽样具有相同数量的分区,每个分区相同数量的元素(例如,一个是通过地图上的其他)。

例子

           > > >x=sc。并行化(范围(0,5))> > >y=sc。并行化(范围(1000年,1005年))> > >x。邮政编码(y)。收集()((0,1000),(1001)、(1002)、(1003)、(1004)]
          

以前的

pyspark.RDD.withResources

下一个

pyspark.RDD.zipWithIndex