pyspark.RDD.fold¶
-
抽样。
褶皱
( zeroValue:T,人事处:可调用的((T,T],T] )→T¶ -
聚合每个分区的元素,然后所有的分区结果,使用给定的关联函数和一个中立的“零价值。”
这个函数
op (t1,t2)
允许修改t1
并返回它的结果值,以避免对象分配;然而,它不应该修改t2
。这行为有点不同折叠操作实现运作在函数语言像Scala集合。这种折叠操作可能适用于单独分区,然后折叠这些结果为最终结果,而不是对每个元素应用折叠在一些定义的排序顺序。函数不交换,结果可能不同于褶皱应用于运作的集合。
例子
> > >从操作符进口添加> > >sc。并行化([1,2,3,4,5])。褶皱(0,添加)15