Databricks认证数据工程师专业

使用Databricks执行高级数据工程任务

Databricks认证数据工程师专业

Databricks认证数据工程师专业认证考试评估个人使用Databricks执行高级数据工程任务的能力。这包括了解Databricks平台和开发工具,如Apache Spark、Delta Lake、Mbob体育客户端下载Lflow以及Databricks CLI和REST API。它还评估构建优化和清洁的ETL管道的能力。此外,还将评估使用一般数据建模概念的知识将数据建模到Lakehouse。最后,在部署前确保数据管道的安全、可靠、监视和测试也将包括在本次考试中。通过该认证考试的个人可以使用Databricks及其相关工具完成高级数据工程任务。

登记

为了获得这一认证,获奖者必须通过认证考试。要取得此认证,请登录或在我们的网站上创建帐户认证平台bob体育客户端下载

学习途径

该认证是数据工程师学习途径的一部分。

学习的道路

背景图像

考试的细节

关于认证考试的关键细节如下所示。

最低限度合格候选人

最低限度合格的候选人应该能够:

  • 了解如何使用Databricks平台及其工具的好处,包括:bob体育客户端下载
    • bob体育客户端下载平台(笔记本、集群、作业、Databricks SQL、关系实体、repo)
    • Apache Spark (PySpark, DataFrame API,基本架构)
    • Delta Lake(基于sql的Delta api、基本架构、核心功能)
    • Databricks CLI(部署基于笔记本的工作流)
    • Databricks REST API(配置和触发生产管道)
  • 使用Spark和Delta Lake api构建数据处理管道,包括:
    • 构建批量处理的ETL管道
    • 构建增量处理的ETL管道
    • 优化工作负载
    • 删除数据
    • 使用变更数据捕获(CDC)来传播变更
  • 模型数据管理解决方案,包括:
    • Lakehouse(青铜/银/金架构,数据库,表,视图和物理布局)
    • 一般数据建模概念(键、约束、查找表、缓慢变化的维度)
  • 使用围绕安全和治理的最佳实践构建生产管道,包括:
    • 使用acl管理笔记本和作业权限
    • 创建面向行和列的动态视图来控制用户/组访问
    • 安全存储个人身份信息(PII)
    • 根据GDPR和CCPA的要求安全地删除数据
  • 配置告警和存储来监控和记录生产作业,包括:
    • 设置通知
    • 配置SparkListener
    • 记录记录的指标
    • 导航和解释Spark UI
    • 调试错误
  • 遵循管理、测试和部署代码的最佳实践,包括:
    • 依赖关系管理
    • 创建单元测试
    • 创建集成测试
    • 调度工作
    • 版本控制代码/笔记本电脑
    • 编制工作

持续时间

测试人员将有120分钟的时间完成认证考试。

问题

认证考试有60道选择题。问题将按高级别专题按以下方式分发:

  • Databricks工装- 20% (12/60)
  • 数据处理- 30% (18/60)
  • 数据建模- 20% (12/60)
  • 安全和治理- 10% (6/60)
  • 监控和记录- 10% (6/60)
  • 测试和部署- 10% (6/60)

成本

认证考试的每一次尝试都将花费200美元。测试人员可能需要缴纳税款,这取决于他们的地点。测试人员可以想参加多少次考试就可以参加多少次,但每次考试都需要支付200美元。

测试艾滋病

在这次考试中没有可用的测试辅助工具。

编程语言

这个认证考试的代码示例将主要使用Python。但是,对Delta Lake功能的任何和所有引用都将在SQL中进行。

过期

由于数据工程师的职责和Databricks Lakehouse平台的能力变化的速度,本认证的有效期为每个测试人员通过认证考试之日起2年。bob体育客户端下载

准备

为了学习认证考试评估的内容,考生应参加以下Databricks Academy课程之一:

  • 自定进度(可在Databricks学院):高级数据工程与Databricks
  • 自定进度(可在Databricks Academy):认证概述:Databricks认证数据工程师专业考试

注:由教师指导的高级数据工程与数据库课程将于2023年提供

常见问题

要查看常见问题(FAQs)的答案,请参阅Databricks AcademyFAQ文档