描述
在本课程中,您将学习mlop将机器学习模型投入生产的最佳实践。课程的前半部分使用特征存储来注册训练数据,并使用MLflow来跟踪机器学习生命周期,打包用于部署的模型,以及管理模型版本。课程的后半部分将讨论生产问题,包括部署范例、监控和CI/CD。在本课程结束时,您将构建一个端到端管道来记录、部署和监控机器学习模型。
本课程将为你准备Databricks认证机器学习专业考试.
持续时间
1个全天或2个半天
目标
- 跟踪、版本和管理机器学习实验
- 利用Databricks特征存储进行可重复的数据管理
- 实现用于批量、流和实时部署模型的策略
- 构建监控解决方案,包括漂移检测
先决条件
- 有Python和pandas的中级经验(或完成数据科学与数据工程Python入门)
- 熟悉Apache Spark(或完成Apache Spark编程)
- 机器学习和数据科学的工作知识(或完成使用Apache Spark进行可扩展的机器学习)
大纲
第一天
- ML在生产中的应用概述
- 使用Delta和Databricks Feature Store进行数据管理
- 使用MLflow跟踪试验跟踪和版本控制
- 使用MLflow模型和模型注册表进行模型管理
- 使用webhook进行自动化测试
- 部署模式
- 监控和CI/CD
即将举行的公开课程
如有任何疑问,请向我们查询常见问题页面。