复制列元数据错误

火花工作与org.apache.spark.sql失败在处理一个三角洲表。AnalysisException发现重复的列(s)的元数据错误。

写的vikas.yadav

去年发表在:2022年5月23日

问题

您的Apache火花工作时处理一个三角洲表工作失败,并显示一条错误消息。

org.apache.spark.sql。AnalysisException:发现重复的列(s)的元数据更新:col1, col2……

导致

三角洲表中有重复的列名。列名只有通过不同情况下被认为是重复的。

三角洲湖是保留,但不分大小写,当存储模式。

拼花是大小写敏感的,当存储和返回列信息。

火花可以区分大小写,但默认情况下不敏感。

为了避免潜在的数据损坏或数据丢失,不允许重复的列名。

解决方案

三角洲表必须不包含重复的列名。

确保所有列名是独一无二的。

这篇文章有用吗?