pyspark.RDD.map

抽样。 地图 ( f:可调用的((T],U],preservesPartitioning:bool= )→pyspark.rdd.RDD(U]

通过应用一个函数返回一个新的抽样,抽样的每个元素。

例子

> > >抽样=sc并行化([“b”,“一个”,“c”])> > >排序(抽样地图(λx:(x,1))收集())[(' a ', 1), (' b ', 1), (' c ', 1)]