pyspark.sql.DataFrameReader.text

DataFrameReader。 文本 ( 路径:联盟(str,列表(str]],wholetext:bool=,lineSep:可选(str]=没有一个,pathGlobFilter:联盟(bool, str,没有)=没有一个,recursiveFileLookup:联盟(bool, str,没有)=没有一个,modifiedBefore:联盟(bool, str,没有)=没有一个,modifiedAfter:联盟(bool, str,没有)=没有一个 )→DataFrame

加载文本文件并返回DataFrame的模式从一个字符串列命名为“价值”,和紧随其后的是如果有任何分区的列。文本文件必须编码为utf - 8。

默认情况下,文本文件中的每一行是一个新行结果DataFrame。

参数
路径 str或列表

字符串或字符串列表,输入路径(s)。

其他参数
额外的选项

额外的选项,请参考数据源的选择在你使用的版本。

例子

> > >df=火花文本(“python / test_support / sql / text-test.txt”)> > >df收集()(行(value = '你好')、行(value = '这'))> > >df=火花文本(“python / test_support / sql / text-test.txt”,wholetext=真正的)> > >df收集()行(value = '你好\服装'))