输入/输出

DataStreamReader.csv(路径、模式、sep…))

加载一个CSV文件流并返回结果DataFrame

DataStreamReader.format(源)

指定输入数据源格式。

DataStreamReader.json(路径、模式…)

加载一个JSON文件流并返回结果DataFrame

DataStreamReader.load([路径、格式模式])

从数据源加载数据流并返回它DataFrame

DataStreamReader.option(关键字,值)

添加了一个底层数据源的输入选项。

DataStreamReader.options(* *选项)

增加了底层数据源的输入选项。

DataStreamReader.orc(道路、mergeSchema…)

加载一个兽人文件流,返回的结果DataFrame

DataStreamReader.parquet(路径[…])

加载一个镶花的文件流,作为一个返回结果DataFrame

DataStreamReader.schema(模式)

指定输入模式。

DataStreamReader.text(道路、wholetext…)

加载一个文本文件,并返回一个流DataFrame的模式从一个字符串列命名为“价值”,和紧随其后的是如果有任何分区的列。

DataStreamWriter.foreach(f)

集的输出流查询处理使用提供的作家f

DataStreamWriter.foreachBatch(函数)

集的输出流查询处理使用提供的功能。

DataStreamWriter.format(源)

指定底层输出数据源。

DataStreamWriter.option(关键字,值)

增加了一个输出选择基础数据源。

DataStreamWriter.options(* *选项)

为底层数据源添加了输出选项。

DataStreamWriter.outputMode(outputMode)

指定数据流DataFrame /数据集是如何写入到流水槽。

DataStreamWriter.partitionBy(*峡路)

分区文件系统上的输出通过给定的列。

DataStreamWriter.queryName(queryName)

指定的名称StreamingQuery可以开始start ()

DataStreamWriter.start([路径、格式、…)

流的内容DataFrame一个数据源。

DataStreamWriter.trigger(* […])

为流查询设置触发器。