为数据团队提供创建新功能、探索和重用现有功能、将功能发布到低延迟在线商店、构建训练数据集和检索用于批量推理的功能值的能力。
作为可重用资产的特性
Feature Registry提供了所有特性、相关定义、源数据和消费者的可搜索记录,消除了跨团队的大量返工。数据科学家、分析师和机器学习工程师可以根据消费的原始数据搜索特征,直接使用特征或派生现有特征。
培训和服务的一致特点
Feature Provider通过两种方式提供特性。批处理模式为训练ML模型或批处理推理提供了高吞吐量的特性。在线模式以较低的延迟为ML模型提供功能,或在BI应用程序中使用相同的功能。在模型训练中使用的特征会被模型自动跟踪,在模型推断期间,模型本身直接从特征存储中检索它们。
具有内置治理的安全特性
特性存储集成提供了用于计算特性的数据的完整谱系。特性具有关联的acl,以确保正确的安全级别。集成MLflow确保特征与ML模型一起存储,消除训练和服务时间之间的漂移。