pyspark.RDD.mapValues

抽样。 mapValues ( f:可调用的((V],U] )→pyspark.rdd.RDD(元组(K,U] ]

通过每个值的键-值对抽样通过映射函数不改变的关键;这也保留原抽样的分区。

例子

> > >x=sc并行化(((“一个”,(“苹果”,“香蕉”,“柠檬”]),(“b”,(“葡萄”))))> > >deff(x):返回len(x)> > >xmapValues(f)收集()[(a, 3), (' b ', 1))