Apachespark3.x字段名称排序修改

从spark3.0.0开始,从命名参数创建行不按字母顺序排列字段名称

写由sergios.la

最新发布日期:2023年4月21日

问题

使用DD地图变换时使用Databricks运行时间9.1LTS

因果

Databricks运行时间911LTS和以上集成Apachespark3x从spark3.0.0开始,从命名参数创建行不按字母顺序排列字段名称反之则按输入顺序处理

求解

启动spark2.x样式列排序集PYSPARK_ROW_FIELD_SORTING_ENABLED真实性内聚类spark配置高山市AWS系统|休眠|GCP)

PYSPARK_ROW_FIELD_SORTING_ENABLED=true

ython版本小于3.6,字段名只能按字母排序

删除

警告

未来版Spark将删除


文章有帮助吗