抽样。
takeSample
返回一个固定大小的样本子集抽样。
笔记
这种方法应该只用于如果生成的数组将小,因为所有数据加载到司机的记忆。
例子
> > >抽样=sc。并行化(范围(0,10))> > >len(抽样。takeSample(真正的,20.,1))20.> > >len(抽样。takeSample(假,5,2))5> > >len(抽样。takeSample(假,15,3))10
以前的
pyspark.RDD.takeOrdered
下一个
pyspark.RDD.toDebugString