Productionizing火花毫升管道可移植格式分析

机器学习的普遍看法是,它从数据开始,结束于一个模型。在实际生产系统,传统的机器学习数据科学和工作流的数据准备、工程特点和模型选择,虽然重要,只是一个方面。一块关键的失踪的部署和管理模型,以及模型之间的集成创建和部署阶段。

这是特别具有挑战性的情况下部署Apache火花毫升管道进行低延迟得分。虽然MLlib DataFrame API是强大和优雅,比较适合许多实时预测的应用程序的需要,部分是因为它是紧密耦合的火花SQL运行时。在这个演讲,我将介绍便携式格式分析(PFA)便携、开放和标准化的数据部署科学管道和分析应用程序。

我还将介绍和评价Aardpfark、图书馆出口火花毫升PFA管道,以及比较和对比其他可用的选择包括PMML, MLeap ONNX和苹果的CoreML。

会话标签:# ML1SAIS



«回来
关于尼克彭特里斯

尼克·彭特里斯首席工程师在IBM开源数据中心与人工智能技术(CODAIT),他工作在机器学习。以前,他创办了Graphflow,机器学习创业重点建议。他也曾在高盛(Goldman Sachs)、认知匹配,和Mxit公司——。他是一个Apache火花项目的提交者和PMC成员的作者与火花“机器学习”。尼克是热衷于商业重点结合机器学习和尖端技术构建智能系统,从数据中学习增加业务价值。
尼克已经在30多个会议、在线研讨会、聚会和世界各地的其他活动包括许多以前的火花峰会。