MLflow指南
MLflow是一个用于管bob下载地址理端到端机bob体育客户端下载器学习生命周期的开源平台。它有以下主要组成部分:
跟踪:允许您跟踪实验记录和比较参数和结果。
模型:允许您管理和部署从各种ML库到各种模型服务和推断平台的模型。bob体育客户端下载
项目:允许您以可重用、可重复的形式打包ML代码,以便与其他数据科学家共享或转移到生产环境中。
Model Registry:允许您集中一个模型存储,用于管理模型的整个生命周期阶段转换:从登台到生产,具有版本控制和注释的功能。
模型服务:允许您将MLflow模型作为REST端点托管。
Databricks提供了一个完全托管的MLflow版本,集成了企业安全特性、高可用性和其他Databricks工作区特性,如实验和运行管理以及笔记本修订捕获。MLflow on Databricks提供了跟踪和保护机器学习模型训练运行和运行机器学习项目的集成体验。
第一次使用的用户应该从快速入门,其中演示了基本的MLflow跟踪api。后续文章将通过示例笔记本介绍每个MLflow组件,并描述如何在Databricks中托管这些组件。
请注意
如果您刚刚开始使用Databricks,可以考虑使用MLflow on数据库社区版,它为轻量级实验提供了一个简单的托管MLflow体验。Databricks Community Edition不支持远程执行MLflow项目。我们计划对实验和运行的数量施加适度的限制。对于MLflow在Databricks Community Edition上的初始发布,没有任何限制。
存储在控制平面中的MLflow数据(实验运行、度量、标记和参数)使用平台管理的密钥进行加密。bob体育客户端下载加密使用用于托管服务的客户管理密钥不支持该数据。另一方面,通过为工作空间存储配置客户管理的密钥,可以使用您自己的密钥对存储在根(DBFS)存储中的MLflow模型和工件进行加密。