Apache火花MLlib是Apache火花机器学习库组成的常见的学习算法和工具,包括分类、回归、聚类、协同过滤、降维,底层优化原语。砖推荐以下Apache火花MLlib指南:
例如笔记本电脑
以下笔记本演示如何使用各种Apache火花MLlib特性使用砖。
二进制分类示例
这个笔记本电脑向你展示了如何构建一个二进制分类应用程序使用Apache火花MLlib管道API。
决策树的例子
这些例子展示各种决策树的应用使用Apache火花MLlib管道API。
GBT回归使用MLlib管道
这个笔记本电脑向你展示了如何使用MLlib管道使用梯度推动执行回归树来预测自行车租赁数量(每小时)的信息,比如星期天气,季节,等等。
Apache火花MLlib管道和结构化流的例子
这个笔记本显示如何培养一个Apache火花MLlib管道在历史数据和应用于流媒体数据。
先进的Apache火花MLlib例子
这个笔记本演示了如何创建一个定制的变压器。
MLlib特性信息供参考,砖建议以下Apache火花API参考:
使用Apache火花MLlib从R,请参阅R机器学习文档。
砖支持可视化的机器学习算法,请参阅机器学习的可视化。