pyspark.sql.DataFrameWriter.parquet¶

DataFrameWriter。 拼花 ( 路径:str,模式:可选(str]=没有一个,partitionBy:联盟(str,列表(str),没有一个)=没有一个,压缩:可选(str]=没有一个 )→没有¶

保存的内容DataFrame在拼花格式指定的路径。

参数

路径 str

路径在任何Hadoop文件系统的支持

模式 str,可选

指定保存操作的行为当数据已经存在。

partitionBy str或列表,可选的

分区列的名字

其他参数

例子

           > > >df。写。拼花(操作系统。路径。加入(tempfile。mkdtemp(),“数据”))
          

以前的

pyspark.sql.DataFrameWriter.orc

下一个

pyspark.sql.DataFrameWriter.partitionBy