跳转到主要内容
公司博客上

介绍R笔记本在砖

2015年7月13日 公司博客上

分享这篇文章

Apache 1.4火花发布6月11日,一个令人兴奋的新特性SparkR。我很高兴的宣布,我们现在支持R笔记本和SparkR砖,我们主持火花服务。砖允许您轻松地使用SparkR在交互式笔记本环境或独立工作。

R和火花很好地相互补充的几个重要的统计资料和数据科学的用例。砖R笔记本包括SparkR包默认情况下,数据科学家可以毫不费力地受益于Apache的力量引发R分析。除了SparkR,任何R包可以很容易地安装到笔记本。在这篇文章中,我将介绍的一些特性在我们的笔记本电脑。

开始使用SparkR

屏幕截图2015-07-10 1.16.56点

在砖开始使用R,简单地选择R语言在创建一个笔记本。自SparkR是最近除了火花,记得把R笔记本任何集群运行火花版本1.4或更高版本。默认SparkR包导入和配置。您可以运行在R火花查询:

使用SparkR可以访问和操作非常大的数据集(例如,tb的数据)从分布式存储(例如,Amazon S3)或数据仓库(如蜂巢)。

airlinesDF分布式DataFrames SparkR提供语法兼容R数据帧。你也可以收集一个SparkR DataFrame当地的数据帧。
免费试着砖

相关的帖子

看到所有公司博客上的帖子