Apache火花™已迅速成为大数据处理的事实上的标准在所有行业和用例提供建议基于用户行为分析数以百万计的基因组序列数据加速药物创新和发展个性化医疗。
本电子书,第二个系列,提供了一个技术博客文章最受欢迎的集合,提供一个介绍机器学习在Apache火花,并强调了许多火花MLlib和GraphX周围的主要发展。
不管你是刚刚开始与火花或已经引发电力用户,这个电子书将用知识武装你成功在你的下一个火花项目包括:
- 介绍机器学习在Apache火花
- 使用火花等高级主题聚类,树,图的处理
- 如何使用SparkR在规模与R语言分析数据