凭据修订
Databricks编辑审计日志和log4j Apache Spark日志中的密钥和凭据,以保护您的数据免受信息泄露。Databricks在登录时编撰三种类型的凭据:AWS访问密钥、AWS秘密访问密钥和URI中的凭据。一旦发现这些秘密,Databricks就会用占位符替换它们。对于某些凭据类型,Databricks还附加hash_prefix
,这是用于验证的凭据的md5校验和的前8个十六进制字节。
AWS访问密钥编校
对于AWS访问密钥,Databricks搜索以AKIA
然后用REDACTED_AWS_ACCESS_KEY (hash_prefix)
.例如Databricks日志2017/02/08:访问AWS使用AKIADEADBEEFDEADBEEF
作为2017/01/08:访问AWS使用REDACTED_AWS_ACCESS_KEY (655 f9d2f)
AWS秘密访问密钥编校
Databricks将AWS秘密访问密钥替换为REDACTED_POSSIBLE_AWS_SECRET_ACCESS_KEY
没有附加它的哈希值。例如Databricks日志2017/01/08:访问AWS使用99 abcdeuw + zXXAxllliupwqqqzDEUFdAtaBrickX
作为2017/01/08:访问AWS使用REDACTED_POSSIBLE_AWS_SECRET_ACCESS_KEY
.
由于AWS没有为秘密访问密钥提供显式标识符,因此Databricks可能编录了一些看似随机生成的40个字符长的字符串,而不是AWS秘密访问密钥。
URI编校中的凭证
砖检测/ /用户名:password@mycompany.com
在URI中替换用户名:密码
与REDACTED_CREDENTIALS (hash_prefix)
.Databricks计算哈希从用户名:密码
(包括:
).例如Databricks日志2017/01/08:访问https://admin:admin@mycompany.com
作为2017/01/08:访问https://REDACTED_CREDENTIALS (d2abaa37) @mycompany.com
.