Python编程三角洲生活表

这里的文章链接提供指导与三角洲生活使用Python执行编程任务表。这些建议假设熟悉概念和模式在以下文章:

请注意

本文所示模式无法轻易完成只有SQL。因为Python数据集可以定义对任何查询,返回一个DataFrame,您可以使用spark.sql ()必要时利用Python函数内的SQL语法。

您可以使用Python用户定义函数(udf)在您的SQL查询,但你必须定义这些udf在Python文件在同一管道之前调用SQL源文件。看到用户自定义标量函数——Python