pyspark.RDD.persist

抽样。 坚持 ( storageLevel:pyspark.storagelevel.StorageLevel=StorageLevel(假的,真的,假的,假的,1) )→pyspark.rdd.RDD(T]

设置这个抽样后的存储水平持续其值在业务第一次计算。这只能用于分配一个新的存储水平,如果抽样没有存储水平集。如果没有指定存储级别默认值(MEMORY_ONLY)。

例子

> > >抽样=sc并行化([“b”,“一个”,“c”])> > >抽样坚持()is_cached真正的