pyspark.RDD.saveAsHadoopDataset

抽样。 saveAsHadoopDataset ( 相依:Dict(str,str],keyConverter:可选(str]=没有一个,valueConverter:可选(str]=没有一个 )→没有

输出一个Python抽样的键-值对的形式抽样[(K,V)))任何Hadoop文件系统,使用旧的Hadoop OutputFormat API (mapred包)。键/值转换为输出使用用户指定的转换器或,默认情况下,“org.apache.spark.api.python.JavaToWritableConverter”。

参数
相依 dict

Hadoop任务配置

keyConverter str,可选

完全限定类名关键的转换器(默认情况下没有一个)

valueConverter str,可选

默认值转换器的完全限定类名(没有)