pyspark.sql.DataFrameReader.text¶

DataFrameReader。 文本 ( 路径:联盟(str,列表(str]],wholetext:bool=假,lineSep:可选(str]=没有一个,pathGlobFilter:联盟(bool, str,没有)=没有一个,recursiveFileLookup:联盟(bool, str,没有)=没有一个,modifiedBefore:联盟(bool, str,没有)=没有一个,modifiedAfter:联盟(bool, str,没有)=没有一个 )→DataFrame¶

加载文本文件并返回DataFrame的模式从一个字符串列命名为“价值”,和紧随其后的是如果有任何分区的列。文本文件必须编码为utf - 8。

默认情况下,文本文件中的每一行是一个新行结果DataFrame。

参数

路径 str或列表: 字符串或字符串列表,输入路径(s)。

其他参数

额外的选项: 额外的选项,请参考数据源的选择在你使用的版本。

例子

           > > >df=火花。读。文本(“python / test_support / sql / text-test.txt”)> > >df。收集()(行(value = '你好')、行(value = '这'))> > >df=火花。读。文本(“python / test_support / sql / text-test.txt”,wholetext=真正的)> > >df。收集()行(value = '你好\服装'))
          

以前的

pyspark.sql.DataFrameReader.table

下一个

pyspark.sql.DataFrameWriter.bucketBy