管理培训与MLflow运行代码

本文描述了MLflow运行管理机器学习培训。它还包括指导如何管理和比较实验

一个MLflow运行对应于一个单一的模型代码的执行。每次运行记录以下信息:

  • :名字的笔记本推出运行或项目名称和运行的入口点。

    • 版本:笔记本修订如果砖工作区中从一个笔记本,如果逃避或Git commit散列砖回购或从一个MLflow项目

    • 开始和结束时间:开始和结束时间的运行。

    • 参数:模型参数保存为键值对。键和值都是字符串。

    • 指标:保存为键值对模型评价指标。值是数字。可以更新每个指标在整个运行过程中(例如,跟踪你的模型的损失函数收敛),和MLflow记录允许您可视化指标的历史。

    • 标签:运行元数据保存为键值对。您可以更新标签期间和之后运行完成。键和值都是字符串。

    • 工件:在任何输出文件格式。例如,您可以记录图像,模型(例如,腌scikit-learn模型),和数据文件(例如,拼花文件)作为一个工件。

所有MLflow运行都记录到活性实验。如果没有显式地设置一个实验活性试验,运行记录到笔记本的实验。

查看运行

您可以访问运行从其母实验页面或直接从笔记本创建运行。

实验页面运行表中,单击运行的开始时间。

的笔记本,点击外部链接旁边的日期和时间在实验运行栏中运行。

运行屏幕显示使用的参数运行,运行产生的指标,任何标签或笔记。来显示笔记,参数,指标,或标签运行,点击的箭头左边的标签。

你也从运行在这个屏幕访问工件保存。

查看运行

代码片段预测

如果你从运行日志模型,该模型的构件部分出现在这个页面。显示代码片段说明如何加载和使用该模型进行预测火花和熊猫DataFrames单击模型名称。

预测代码片段

查看笔记本或Git项目用于运行

查看版本的笔记本创建了一个运行:

  • 在实验页面,点击链接列。

  • 在运行页面,单击旁边的链接

  • 的笔记本,在实验运行栏,单击笔记本图标笔记本版本的图标盒子里的实验运行。

笔记本与运行相关的版本出现在主窗口中突出显示栏显示的日期和时间。

如果从远程启动运行Git项目,单击链接Git提交现场打开项目的特定版本中使用的运行。内的链接的主要分支领域打开使用的Git项目运行。

添加一个标签

标签是键值,您可以创建和使用后寻找运行

  1. 运行页面,点击标签图标如果尚未打开。标签表出现。

    标签表
  2. 点击的名字价值字段和标签的键和值类型。

  3. 点击添加

    添加标签

编辑或删除一个标签

编辑或删除现有标签,使用的图标行动列。

标签的行为

复制运行的软件环境

你可以复制的软件环境,点击运行复制运行。以下对话框:

复制运行对话框

使用默认设置,当你点击确认:

  • 笔记本是克隆位置所示对话框。

  • 如果原始集群仍然存在,克隆的笔记本连接到原始启动集群和集群。

  • 如果原始集群已经不复存在,一个新的集群使用相同的配置,包括任何安装库,创建并启动。笔记本连接到新的集群。

您可以选择一个不同的位置对克隆的笔记本和检查集群配置和安装库:

  • 选择一个不同的文件夹保存克隆笔记本,点击编辑文件夹

  • 看到集群规范,点击视图规范。克隆只有笔记本而不是集群,请取消选中此选项。

  • 看到库安装在原来的集群中,点击查看库。如果你不关心的原始集群安装相同的库,请取消选中此选项。

管理运行

重命名运行

重命名一个运行,点击三个按钮图标右上角的页面并选择运行重命名

过滤器运行

您可以搜索基于运行参数或度量值。你也可以通过标签搜索运行。

  • 搜索匹配表达式包含运行参数和度量值,在搜索框中输入查询,单击搜索。有一些查询语法的例子:

    metrics.r2>0.3

    params.elasticNetParam=0.5

    params.elasticNetParam=0.5metrics.avg_areaUnderROC>0.3

  • 通过标签搜索运行,输入标签的格式:标签。<键> = <价值>”。必须包含在引号字符串值如图所示。

    tags.estimator_name = " RandomForestRegressor "

    tags.color = "蓝色"tags.size = 5

    两个键和值可以包含空格。如果键包含空格,必须附上在引号如图所示。

    标签。“我的定制标记”=“我的价值”

你也可以过滤运行基于他们的状态(主动或删除)和基于模型版本是否与运行。要做到这一点,让你的选择的状态创建的时间下拉菜单。

过滤器运行

下载运行

  1. 选择一个或多个运行。

  2. 点击下载CSV。下载一个CSV文件,其中包含以下字段:

    运行ID、名称、源类型、源名称、用户状态、< parameter1 >、< parameter2 >,…, < metric1 >、< metric2 >,……

删除运行

  1. 在实验中,选择一个或多个运行中通过点击左边的复选框。

  2. 点击删除

  3. 如果是父母跑,决定你是否还想删除后裔。默认情况下这个选项被选中。

  4. 点击删除确认或取消取消。删除运行保存30天。显示已删除,选择删除在字段。

比较这两种

你可以比较从一个实验或从多个实验。的比较运行页面呈现的信息选择运行在图形和表格格式。您还可以创建可视化运行结果和表的运行信息、运行参数和指标。

创建一个可视化:

  1. 选择情节类型(平行坐标图,散点图,或等高线图)。

    1. 对于一个平行坐标图绘制,选择参数和指标。从这里,您可以确定所选的参数和指标之间的关系,这有助于您更好地为您的模型定义hyperparameter优化空间。

      比较运行页面可视化
    2. 对于一个散点图等高线图,选择参数或指标显示在每个轴上。

参数指标表显示运行参数和指标选择的运行。这些表的列是确定的运行细节表上方。为简单起见,您可以隐藏参数和指标是相同的在所有选择切换运行只显示diff按钮

比较运行页表

从一个单一的实验进行比较

  1. 实验页面,选择两个或两个以上的运行通过点击复选框左边的来看,或选择所有运行通过检查盒子顶部的列。

  2. 点击比较。的比较< N >屏幕出现。

比较运行来自多个实验

  1. 实验页面,选择你想要的实验比较,点击框左侧的实验名称。

  2. 点击比较(n)(n你选择是实验的数量)。屏幕上显示所有的从您选择的实验。

  3. 选择两个或两个以上的运行通过点击复选框左边的来看,或选择所有运行通过检查盒子顶部的列。

  4. 点击比较。的比较< N >屏幕出现。

在工作区之间复制运行

导入或导出MLflow运行或从你的砖的工作空间,您可以使用社区驱动的开源项目bob下载地址MLflow进出口