作业故障Spark打包失效异常差错

禁用默认spark洗牌服务环接FetchFailt异常错误

写由shanmugavel.chandrakasu

2022年12月5日

问题

应用中包含聚合或合并级时,执行需要spark打乱级视使用的具体配置而定,如果你运行多流查询交互集群,你可能会打乱FetchFailedException报错

shufflemacheduer最大允许数失败499453号命令(从命令3953728:13启动)因org.spark.sheffle.MetataFletchFa

因果

shuffle取机故障通常发生于集群降级事件、执行器损耗或工人退役等假想中在某些情况下,从执行器打乱文件丢失后继任务获取洗牌文件时失败

洗牌服务默认使用databricks服务提供外部洗牌服务保护执行者撰写的洗牌文件,以便执行者安全清除

运行spark.conf.get("spark.shuffle.service.enabled")ython或Scala笔记本单元格返回洗牌服务当前值万一它返回真实性服务启动

spark.conf.get("spark.shuffle.service.enabled")

求解

禁用默认spark打包服务

停止打乱服务并不妨碍打乱工作,它只是改变执行方式当服务禁用时,洗牌由执行程序执行程序执行程序执行程序执行程序

可添加复位服务禁止spark.shuffle.service.enabled false移到集群spark配置高山市AWS系统|休眠|GCP)

spark.shuffle.service.enabled false

更新后重开集群spark配置.

删除

信息学

洗牌服务失效时性能受微小影响


文章有帮助吗