pyspark.RDD.flatMap¶

抽样。 flatMap ( f:可调用的((T],Iterable(U]],preservesPartitioning:bool=假 )→pyspark.rdd.RDD(U] ¶

返回一个新的抽样,首先将一个函数应用于所有元素的抽样,然后压扁的结果。

例子

           > > >抽样=sc。并行化([2,3,4])> > >排序(抽样。flatMap(λx:范围(1,x))。收集())(1,1,1,2,2,3]> > >排序(抽样。flatMap(λx:((x,x),(x,x)))。收集())[(2,2),(2,2),(3),(3),(4,4),(4,4)]
          

以前的

pyspark.RDD.first

下一个

pyspark.RDD.flatMapValues