pyspark.RDD.flatMap

抽样。 flatMap ( f:可调用的((T],Iterable(U]],preservesPartitioning:bool= )→pyspark.rdd.RDD(U]

返回一个新的抽样,首先将一个函数应用于所有元素的抽样,然后压扁的结果。

例子

> > >抽样=sc并行化([2,3,4])> > >排序(抽样flatMap(λx:范围(1,x))收集())(1,1,1,2,2,3]> > >排序(抽样flatMap(λx:((x,x),(x,x)))收集())[(2,2),(2,2),(3),(3),(4,4),(4,4)]