pyspark.RDD.groupWith¶

抽样。 groupWith ( 其他:pyspark.rdd.RDD(元组(任何,任何]],*其他人:pyspark.rdd.RDD(元组(任何,任何]] )→pyspark.rdd。抽样(元组(Tuple (pyspark.resultiterable。ResultIterable(任何)…]]]¶

别名cogroup但支持多种抽样。

例子

           > > >w=sc。并行化(((“一个”,5),(“b”,6)))> > >x=sc。并行化(((“一个”,1),(“b”,4)))> > >y=sc。并行化(((“一个”,2)))> > >z=sc。并行化(((“b”,42)))> > >((x,元组(地图(列表,y)))为x,y在排序(列表(w。groupWith(x,y,z)。收集())))[(a, ([5], [1], [2], [])), (“b”, ([6]、[4]、[], [42])))
          

以前的

pyspark.RDD.groupByKey

下一个

pyspark.RDD.histogram