pyspark.sql.DataFrameReader.text¶
-
DataFrameReader。
文本
( 路径:联盟(str,列表(str]],wholetext:bool=假,lineSep:可选(str]=没有一个,pathGlobFilter:联盟(bool, str,没有)=没有一个,recursiveFileLookup:联盟(bool, str,没有)=没有一个,modifiedBefore:联盟(bool, str,没有)=没有一个,modifiedAfter:联盟(bool, str,没有)=没有一个 )→DataFrame¶ -
加载文本文件并返回
DataFrame
的模式从一个字符串列命名为“价值”,和紧随其后的是如果有任何分区的列。文本文件必须编码为utf - 8。默认情况下,文本文件中的每一行是一个新行结果DataFrame。
- 参数
-
- 路径 str或列表
-
字符串或字符串列表,输入路径(s)。
- 其他参数
-
- 额外的选项
-
额外的选项,请参考数据源的选择在你使用的版本。
例子
> > >df=火花。读。文本(“python / test_support / sql / text-test.txt”)> > >df。收集()(行(value = '你好')、行(value = '这'))> > >df=火花。读。文本(“python / test_support / sql / text-test.txt”,wholetext=真正的)> > >df。收集()行(value = '你好\服装'))