pyspark.RDD.saveAsPickleFile

抽样。 saveAsPickleFile ( 路径:str,batchSize:int=10 )→没有

保存这个抽样的SequenceFile序列化的对象。使用的序列化器是pyspark.serializers.CPickleSerializer、默认批大小是10。

例子

> > >tempfile进口NamedTemporaryFile> > >临时文件=NamedTemporaryFile(删除=真正的)> > >临时文件关闭()> > >sc并行化([1,2,“火花”,“抽样”])saveAsPickleFile(临时文件的名字,3)> > >排序(scpickleFile(临时文件的名字,5)地图(str)收集())[' 1 ',' 2 ',“抽样”,“火花”)