MLflow实验

MLflow实验数据源提供一个标准API加载MLflow实验运行数据。你可以加载数据笔记本的实验,或者您可以使用MLflow实验实验名称或ID。

需求

砖运行时6.0毫升以上。

从笔记本实验加载数据

从笔记本数据加载实验,使用load ()

df=火花格式(“mlflow-experiment”)负载()显示(df)
瓦尔df=火花格式(“mlflow-experiment”)。负载()显示(df)

使用实验id加载数据

加载数据从一个或多个工作空间实验,实验指定id如图所示。

df=火花格式(“mlflow-experiment”)负载(“3270527066281272”)显示(df)
瓦尔df=火花格式(“mlflow-experiment”)。负载(“3270527066281272,953590262154175”)显示(df)

加载数据使用实验名称

你也可以通过实验的名字load ()方法。

expId=mlflowget_experiment_by_name(“/共享/ diabetes_experiment /”)experiment_iddf=火花格式(“mlflow-experiment”)负载(expId)显示(df)
瓦尔expId=mlflowgetExperimentByName(“/共享/ diabetes_experiment /”)。得到getExperimentId瓦尔df=火花格式(“mlflow-experiment”)。负载(expId)显示(df)

过滤数据基于指标和参数

本节中的示例展示了如何从一个实验后过滤数据加载它。

df=火花格式(“mlflow-experiment”)负载(“3270527066281272”)filtered_df=df过滤器(”指标。损失< 0.01和参数。learning_rate > 0.001”)显示(filtered_df)
瓦尔df=火花格式(“mlflow-experiment”)。负载(“3270527066281272”)瓦尔filtered_df=df过滤器(”指标。损失< 1.85和参数。num_epochs > 30”)显示(filtered_df)

模式

数据源返回的DataFrame的模式是:

|——run_id:字符串|——experiment_id:字符串|——指标:地图||——关键:字符串||——价值:|——参数个数:地图||——关键:字符串||——价值:字符串|——标签:地图||——关键:字符串||——价值:字符串|——start_time:时间戳|——end_time:时间戳|——状态:字符串|——artifact_uri:字符串