Apache Spark即服务
回到术语表什么是Apache Spark as a Service?
Apache Spark是一个用于快速bob下载地址实时大规模数据处理的开源集群计算框架。自2009年在加州大学伯克利分校的AMPLab成立以来,Spark已经取得了长足的发展。它目前被评为大数据领域最大的开源社区,拥有来自50多个组织的200多名贡献bob下载地址者。Databricks在多个云中以Spark-as-a- service的形式托管其优化版本的Apache Spark。它带有一组内置应用程序,可以帮助您更快地访问和分析数据。它利用了Spark在大数据上操作的众多功能,比如处理流数据、执行图形计算、提供SQLHadoop以及它的机器学习功能。尽管大多数组织已经认识到Spark提供的机会,但仍有许多组织在苦苦挣扎。为什么?因为组织在试图分析数据流或大量数据时所面临的挑战。然而,这并不意味着在没有硬件投资和全面采用和实现的情况下就不能利用Spark带来的好处。Spark即服务消除了基础设施的挑战,并通过减少所需的大部分成本和工作来加快流程。已经有一些提供商提供Spark即服务,使得这个框架易于快速部署。这种解决方案非常适合短期数据分析项目,可以快速建立并获得高投资回报。Spark as a Service可以方便地处理和查询存储在Hive中的数据,HDFSHBase和Amazon S3。如果你有一个临时的分析项目,Spark as a Service可能是最好的选择。它也被证明是那些希望在自己的大数据处理系统进行大规模投资之前,看到使用大数据和分析的好处的公司的首选。使用Spark as a Service的主要优势:
- 一种访问Spark数据的简单方法
- 不需要专门的编码技能;因此,技术用户和业务用户都可以轻松地使用它
- 更低的成本
额外的资源
回到术语表