教程:Databricks上的端到端ML模型

现实世界中的机器学习是混乱的。数据源包含缺失值、包含冗余行或可能不适合内存。特性工程通常需要领域专业知识,而且可能很乏味。建模经常将数据科学和系统工程混合在一起,不仅需要算法知识,还需要机器架构和分布式系统的知识。

Databricks简化了这个过程。以下10分钟的教程笔记本展示了一个端到端在表格数据上训练机器学习模型的示例。您可以导入这个笔记本并自己运行它,或者复制代码片段和想法供自己使用。

笔记本

MLflow端到端示例笔记本

在新标签页打开笔记本