pyspark.RDD.map¶

抽样。 地图 ( f:可调用的((T],U],preservesPartitioning:bool=假 )→pyspark.rdd.RDD(U] ¶

通过应用一个函数返回一个新的抽样,抽样的每个元素。

例子

           > > >抽样=sc。并行化([“b”,“一个”,“c”])> > >排序(抽样。地图(λx:(x,1))。收集())[(' a ', 1), (' b ', 1), (' c ', 1)]
          

以前的

pyspark.RDD.lookup

下一个

pyspark.RDD.mapPartitions