提供多个模型到模型服务端点
本文描述了如何为多个模型利用砖的服务端点模型服务。
创建一个端点,并设置初始流量分裂
您可以创建模型服务端点的砖机学习API或砖机的学习用户界面。端点可以注册任何Python MLflow模型在模型中注册中心注册。
以下API示例使用两套模型和创建一个单端点的端点之间的交通分离模型。服务模型,当前的
1、主机版本模型(
和端点流量的90%,而其他服务模型,挑战者号
1、主机版本b型
并获得端点流量的10%。
帖子. . / api / 2.0 / serving-endpoints{“名称”:“多模型”“配置”:{“served_models”:({“名称”:“当前”,“model_name”:“模型(一个”,“model_version”:“1”,“workload_size”:“小”,“scale_to_zero_enabled”:真},{“名称”:“挑战者”,“model_name”:“b型”,“model_version”:“1”,“workload_size”:“小”,“scale_to_zero_enabled”:真}],“traffic_config”:{“路线”:({“served_model_name”:“当前”,“traffic_percentage”:“90”},{“served_model_name”:“挑战者”,“traffic_percentage”:“10”}]}}}
更新交通服务模型之间的分裂
你也可以更新交通服务模型之间的分裂。以下API示例设置服务模型,当前的
,50%的端点交通和其他模型,挑战者号
,剩下的50%的流量。
你也可以把这个更新的服务选项卡中数据砖UI使用机器学习编辑配置按钮。
把. . / api / 2.0 / serving-endpoints /{的名字}/配置{“served_models”:({“名称”:“当前”,“model_name”:“模型(一个”,“model_version”:“1”,“workload_size”:“小”,“scale_to_zero_enabled”:真},{“名称”:“挑战者”,“model_name”:“b型”,“model_version”:“1”,“workload_size”:“小”,“scale_to_zero_enabled”:真}],“traffic_config”:{“路线”:({“served_model_name”:“当前”,“traffic_percentage”:“50”},{“served_model_name”:“挑战者”,“traffic_percentage”:“50”}]}}