核心类¶
|
入口点和数据集和DataFrame API编程火花。 |
|
面向用户的目录的API,可以通过SparkSession.catalog。 |
|
一个分布式数据分为命名列的集合。 |
|
在DataFrame一列。 |
|
类来观察(命名)指标 |
一行在 |
|
|
一组的聚合方法 |
|
一两的逻辑分组 |
处理缺失数据的功能 |
|
功能和统计功能 |
|
在DataFrames效用函数定义窗口。 |
|
|
接口用于负载 |
|
接口用于编写一个 |