推荐系统中构建一个广而深的模型
笔记本电脑使用的例子,本文带您经历建筑有很大的推荐系统模型。构建一个机器学习的管道广而深的推荐系统涉及到这个图中所示的阶段:
这个参考解决方案涵盖了蓝色所示的阶段:
模型训练和评估
模型导出和版本管理
批处理模式推理
在线服务模型
信息未涉及的步骤,请参阅项目阶段不覆盖。
笔记本用户描述数据集
这个笔记本中使用的数据集包含以下三角洲表:
user_profile
:包含user_id
值和静态配置文件item_profile
:包含item_id
值和静态配置文件user_item_interaction
:包含事件,用户与一个项目。这个表是随机分成三个三角洲表构建和评估模型:火车
,验证
,测试
。
这数据格式是常见的推荐问题。一些例子:
对于广告推荐系统,项目是广告和user-item交互记录用户点击广告。
对于网上购物推荐系统,项目产品和user-item交互的用户审核或订单历史记录。
当你适应这个笔记本数据集,您只需要保存的数据增量表并提供表名称和位置。加载数据主要是可以重用的代码。
有关详细信息,请参阅数据集一代笔记本。
笔记本的例子:广而深的模型
广而深的模型结合了多种线性模型和深层神经网络处理所需的记忆和归纳好的建议。
这个模型只是一个例子在许多深度学习模型的推荐问题或对任何机器学习管道。这里的重点是展示如何构建工作流。你可以交换不同模型对自己的用例和调优模型更好的评价指标。
项目阶段不覆盖
让笔记本专注于显示如何实现一个推荐系统,不包括以下阶段。这些阶段是在工作流图中显示为灰色块。
数据收集和探索性数据分析。看到砖上运行你的第一个ETL工作负载。
工程特性。特性工程是一个重要的推荐系统的一部分,和多的信息可以在这个话题。这个笔记本假定你有一个策划数据集包含user-item交互。本笔记本中使用的数据集的详细信息,明白了笔记本用户描述数据集。工程特性的更多信息,请参阅以下资源:
砖的解决方案加速器笔记本个性化的客户体验的建议展示功能的示例工程推荐系统。
预处理的数据机器学习更深的学习特性的例子工程与scikit-learn MLlib学习和转移。
模型调优。现有管道的模型调优涉及修改代码,包括工程特点、模型结构、模型hyperparameters,甚至更新数据收集阶段,提高模型的性能。关于工具的更多信息模型调优在砖上,看到的Hyperparameter调优。