pyspark.RDD.saveAsPickleFile¶
-
抽样。
saveAsPickleFile
( 路径:str,batchSize:int=10 )→没有¶ -
保存这个抽样的SequenceFile序列化的对象。使用的序列化器是
pyspark.serializers.CPickleSerializer
、默认批大小是10。例子
> > >从tempfile进口NamedTemporaryFile> > >临时文件=NamedTemporaryFile(删除=真正的)> > >临时文件。关闭()> > >sc。并行化([1,2,“火花”,“抽样”])。saveAsPickleFile(临时文件。的名字,3)> > >排序(sc。pickleFile(临时文件。的名字,5)。地图(str)。收集())[' 1 ',' 2 ',“抽样”,“火花”)