迁移到模型服务

本文演示了如何使模型在你的工作区和开关的新模型模型服务建立在经验serverless计算。

需求

  • 模型在MLflow模型注册中心注册。

  • 注册的权限模型中描述的那样访问控制指南

重大的改变

  • 在模型服务,请求发送到端点的格式和端点的响应从遗留MLflow模型略有不同。看到评分模型端点新格式协议的细节。

  • 在模型服务,包括端点URLserving-endpoints而不是模型

  • 模型服务包括完全支持工作流管理资源与API

  • 模型由砖生产就绪并支持SLA服务。

使模型服务为您的工作空间

使用模型服务,您的帐户管理必须阅读并接受条款和条件的账户控制台。

不需要额外的步骤,使模型在工作区中。

迁移遗留MLflow模型服务模型,模型服务

您可以创建一个模型服务端点和灵活过渡模型服务工作流没有禁用遗留MLflow模型服务

以下步骤展示了如何做到这一点的UI。对于每个模型上遗留MLflow模型服务启用:

  1. 导航到服务端点侧边栏的机器学习的工作区。

  2. 按照工作流描述UI工作流如何创建一个服务端点和你的模型。

  3. 转换您的应用程序使用新提供的服务端点URL查询模型,以及新的得分格式。

  4. 当你的模型转换,你可以浏览模型侧边栏的机器学习的工作区。

  5. 选择你想要的模型禁用遗留MLflow模型服务。

  6. 服务选项卡上,选择停止

  7. 消息似乎证实。选择停止供应

部署模型版本迁移到模型服务

在以前版本的模型服务功能,服务端点创建基于注册阶段模型版本:暂存生产。迁移模型的经验,你可以复制行为的新模式提供经验。

本节演示如何创建单独的模型服务端点暂存模型版本和生产模型版本。以下步骤展示了如何实现这一服务端点的API为每个服务模型。

在这个例子中,注册型号名称模型版本1在模型阶段吗生产和版本2在模型阶段暂存

  1. 为您的注册模型创建两个端点,一个用于暂存模型版本,另一个用于生产模型版本。

    暂存模型版本:

    帖子. . / api / 2.0 / serving-endpoints{“名称”:“modelA-Staging”“配置”:{“served_models”:({“model_name”:“模型(一个”,“model_version”:“2”/ /暂存模型版本“workload_size”:“小”,“scale_to_zero_enabled”:真},],},}

    生产模型版本:

    帖子. . / api / 2.0 / serving-endpoints{“名称”:“modelA-Production”“配置”:{“served_models”:({“model_name”:“模型(一个”,“model_version”:“1”,/ /生产模型版本“workload_size”:“小”,“scale_to_zero_enabled”:真},],},}
  2. 验证端点的状态。

    因为将端点:得到. . / api / 2.0 / serving-endpoints / modelA-Staging

    生产端点:得到. . / api / 2.0 / serving-endpoints / modelA-Production

  3. 一旦端点准备,查询端点使用:

    因为将端点:帖子/ serving-endpoints / modelA-Staging /调用

    生产端点:帖子/ serving-endpoints / modelA-Production /调用

  4. 版本更新端点基于模型转换。

    在场景中创建一个新的模型版本3,你可以有模型过渡到版本2生产,而模型版本3可以过渡到暂存和模型版本1存档。这些变化可以反映在单独的模型服务端点如下:

    暂存端点,版本更新端点使用新的模型暂存

    把. . / api / 2.0 / serving-endpoints / modelA-Staging /配置{“served_models”:({“model_name”:“模型(一个”,“model_version”:“3”/ /新的分段模型版本“workload_size”:“小”,“scale_to_zero_enabled”:真},],}

    生产端点,版本更新端点使用新的模型生产

    把. . / api / 2.0 / serving-endpoints / modelA-Production /配置{“served_models”:({“model_name”:“模型(一个”,“model_version”:“2”/ /新产品模型版本“workload_size”:“小”,“scale_to_zero_enabled”:真},],}

额外的资源