抽样。
countApprox
近似的版本数(),它返回一个潜在的不完整的结果在一个超时,即使不是所有任务都完成了。
例子
> > >抽样=sc。并行化(范围(1000年),10)> > >抽样。countApprox(1000年,1.0)1000年
以前的
pyspark.RDD.count
下一个
pyspark.RDD.countApproxDistinct