输入/输出¶

`DataStreamReader.csv`(路径、模式、sep…))	加载一个CSV文件流并返回结果`DataFrame`。
`DataStreamReader.format`(源)	指定输入数据源格式。
`DataStreamReader.json`(路径、模式…)	加载一个JSON文件流并返回结果`DataFrame`。
`DataStreamReader.load`([路径、格式模式])	从数据源加载数据流并返回它`DataFrame`。
`DataStreamReader.option`(关键字,值)	添加了一个底层数据源的输入选项。
`DataStreamReader.options`(* *选项)	增加了底层数据源的输入选项。
`DataStreamReader.orc`(道路、mergeSchema…)	加载一个兽人文件流,返回的结果`DataFrame`。
`DataStreamReader.parquet`(路径[…])	加载一个镶花的文件流,作为一个返回结果`DataFrame`。
`DataStreamReader.schema`(模式)	指定输入模式。
`DataStreamReader.text`(道路、wholetext…)	加载一个文本文件,并返回一个流`DataFrame`的模式从一个字符串列命名为“价值”,和紧随其后的是如果有任何分区的列。
`DataStreamWriter.foreach`(f)	集的输出流查询处理使用提供的作家`f`。
`DataStreamWriter.foreachBatch`(函数)	集的输出流查询处理使用提供的功能。
`DataStreamWriter.format`(源)	指定底层输出数据源。
`DataStreamWriter.option`(关键字,值)	增加了一个输出选择基础数据源。
`DataStreamWriter.options`(* *选项)	为底层数据源添加了输出选项。
`DataStreamWriter.outputMode`(outputMode)	指定数据流DataFrame /数据集是如何写入到流水槽。
`DataStreamWriter.partitionBy`(*峡路)	分区文件系统上的输出通过给定的列。
`DataStreamWriter.queryName`(queryName)	指定的名称`StreamingQuery`可以开始`start ()`。
`DataStreamWriter.start`([路径、格式、…)	流的内容`DataFrame`一个数据源。
`DataStreamWriter.trigger`(* […])	为流查询设置触发器。

以前的

pyspark.sql.streaming.StreamingQueryListener

下一个

pyspark.sql.streaming.DataStreamReader.csv