抽样。
坚持
设置这个抽样后的存储水平持续其值在业务第一次计算。这只能用于分配一个新的存储水平,如果抽样没有存储水平集。如果没有指定存储级别默认值(MEMORY_ONLY)。
例子
> > >抽样=sc。并行化([“b”,“一个”,“c”])> > >抽样。坚持()。is_cached真正的
以前的
pyspark.RDD.partitionBy
下一个
pyspark.RDD.pipe