pyspark.sql.DataFrameWriter.parquet

DataFrameWriter。 拼花 ( 路径:str,模式:可选(str]=没有一个,partitionBy:联盟(str,列表(str),没有一个)=没有一个,压缩:可选(str]=没有一个 )→没有

保存的内容DataFrame在拼花格式指定的路径。

参数
路径 str

路径在任何Hadoop文件系统的支持

模式 str,可选

指定保存操作的行为当数据已经存在。

  • 附加:添加内容DataFrame现有的数据。

  • 覆盖:覆盖现有的数据。

  • 忽略如果数据已经存在:默默地忽略这个操作。

  • 错误errorifexists(默认情况下):抛出一个异常如果数据已经存在。

partitionBy str或列表,可选的

分区列的名字

其他参数
额外的选项

额外的选项,请参考数据源的选择在你使用的版本。

例子

> > >df拼花(操作系统路径加入(tempfilemkdtemp(),“数据”))