抽样。
mapValues
通过每个值的键-值对抽样通过映射函数不改变的关键;这也保留原抽样的分区。
例子
> > >x=sc。并行化(((“一个”,(“苹果”,“香蕉”,“柠檬”]),(“b”,(“葡萄”))))> > >deff(x):返回len(x)> > >x。mapValues(f)。收集()[(a, 3), (' b ', 1))
以前的
pyspark.RDD.mapPartitionsWithSplit
下一个
pyspark.RDD.max