pyspark.RDD.fold

抽样。 褶皱 ( zeroValue:T,人事处:可调用的((T,T],T] )→T

聚合每个分区的元素,然后所有的分区结果,使用给定的关联函数和一个中立的“零价值。”

这个函数op (t1,t2)允许修改t1并返回它的结果值,以避免对象分配;然而,它不应该修改t2

这行为有点不同折叠操作实现运作在函数语言像Scala集合。这种折叠操作可能适用于单独分区,然后折叠这些结果为最终结果,而不是对每个元素应用折叠在一些定义的排序顺序。函数不交换,结果可能不同于褶皱应用于运作的集合。

例子

> > >操作符进口添加> > >sc并行化([1,2,3,4,5])褶皱(0,添加)15