介绍R笔记本在砖
Apache 1.4火花发布6月11日,一个令人兴奋的新特性SparkR。我很高兴的宣布,我们现在支持R笔记本和SparkR砖,我们主持火花服务。砖允许您轻松地使用SparkR在交互式笔记本环境或独立工作。
R和火花很好地相互补充的几个重要的统计资料和数据科学的用例。砖R笔记本包括SparkR包默认情况下,数据科学家可以毫不费力地受益于Apache的力量引发R分析。除了SparkR,任何R包可以很容易地安装到笔记本。在这篇文章中,我将介绍的一些特性在我们的笔记本电脑。
开始使用SparkR
在砖开始使用R,简单地选择R语言在创建一个笔记本。自SparkR是最近除了火花,记得把R笔记本任何集群运行火花版本1.4或更高版本。默认SparkR包导入和配置。您可以运行在R火花查询:
使用SparkR可以访问和操作非常大的数据集(例如,tb的数据)从分布式存储(例如,Amazon S3)或数据仓库(如蜂巢)。
airlinesDF分布式DataFrames SparkR提供是语法兼容与R数据帧。你也可以收集一个SparkR DataFrame来当地的数据帧。
免费试着砖