pyspark.RDD.countApprox

抽样。 countApprox ( 超时:int,信心:浮动=0.95 )→int

近似的版本数(),它返回一个潜在的不完整的结果在一个超时,即使不是所有任务都完成了。

例子

> > >抽样=sc并行化(范围(1000年),10)> > >抽样countApprox(1000年,1.0)1000年