在大型企业中,有时甚至需要大型解决方案来处理最小的任务,ML也不例外。在康卡斯特,我们正在构建一个全面的、基于配置的、持续集成和部署的平台,用于数据管道转换、模型开发和部署。bob体育客户端下载这是使用一系列工具和框架完成的,如Databricks、MLflow、Apache Spark等。由于有数百名研究人员使用Databricks环境和pb级的数据,规模对康卡斯特来说至关重要,因此让所有这些在无摩擦的体验中协同工作是重中之重。
该平台由bob体育客户端下载许多组件组成:对数据管道和转换的抽象,允许我们的数据科学家自由地组合来自不同框架的最合适的算法,使用MLflow进行实验跟踪,项目和模型打包,以及通过Kubernetes上的Kubeflow环境提供模型服务。
我们将讨论平台的架构、进展和当前状态,以及我们必须克服的挑战,使这个平台在康卡斯特规模上工作。bob体育客户端下载作为一名机器学习从业者,您将在以下方面获得知识:数据管道抽象的示例;大规模包装和跟踪您的ML项目和实验的方法;以及康卡斯特如何在Kubernetes上使用Kubeflow将所有内容整合在一起。
Nick是康卡斯特应用人工智能研究团队机器学习管道和平台战略的领导者。bob体育客户端下载多年来,他一直专注于软件开发、大数据、分布式计算和电信研究。他目前正在UIUC攻读计算机科学硕士学位,空闲时享受物联网。