输入/输出

数据生成器

范围(开始、结束步骤,num_partitions])

创建一个DataFrame范围的数字。

火花Metastore表

read_table(名字[index_col])

读表并返回一个DataFrame火花。

DataFrame.to_table(名称、格式、模式,…))

写DataFrame火花表。

三角洲湖

read_delta(路径、版本、时间戳、index_col])

三角洲湖表一些文件系统读取并返回一个DataFrame。

DataFrame.to_delta(路径、模式、…)

写DataFrame三角洲湖表。

拼花

read_parquet(道路、列index_col,…)

从文件路径加载一个拼花对象,返回一个DataFrame。

DataFrame.to_parquet(路径、模式、…)

写DataFrame拼花文件或目录。

兽人

read_orc(道路、列index_col])

从文件路径加载一个兽人对象,返回一个DataFrame。

DataFrame.to_orc(路径、模式、…)

写DataFrame兽人文件或目录。

通用I / O火花

read_spark_io([路径、格式、模式index_col])

加载一个DataFrame火花数据源。

DataFrame.to_spark_io([路径、格式、模式、…))

写DataFrame火花数据源。

平面文件/ CSV

read_csv(路径[9头,名字,…))

CSV(逗号分隔)文件读入DataFrame或系列。

DataFrame.to_csv([路径,9月,na_rep…))

对象写入一个逗号分隔值(csv)文件。

剪贴板

read_clipboard([9])

从剪贴板并通过read_csv阅读文本。

DataFrame.to_clipboard([excel, 9])

将对象复制到系统剪贴板。

Excel

read_excel(io [sheet_name头,名字,…))

Excel文件读入pandas-on-Spark DataFrame或系列。

DataFrame.to_excel(excel_writer […])

对象写入一个Excel表。

JSON

read_json(道路、线、index_col])

DataFrame转换为一个JSON字符串。

DataFrame.to_json([路径、压缩、…)

将对象转换为一个JSON字符串。

HTML

read_html(io、匹配味道,头,…))

读到一个HTML表列表DataFrame对象。

DataFrame.to_html([buf、列col_space,…)

呈现一个DataFrame作为HTML表。

SQL

read_sql_table(table_name反对[、模式…])

读成DataFrame SQL数据库表。

read_sql_query(sql,反对[index_col])

读DataFrame SQL查询。

read_sql(sql,反对[index_col,列])

读取SQL查询或DataFrame数据库表。