跳转到主要内容
公司博客上

建立一个即时数据仓库平台数据砖bob体育客户端下载

通过韦恩·陈

2015年11月30日 公司博客上

分享这篇文章

Lakehouse读取的数据探索为什么lakehouses未来的数据架构和数据仓库的父亲,Bill Inmon。


数据仓库设计交付价值的数据,长期以来企业的实际解决方案。但在当今的大数据领域,企业在处理一个新的水平的体积,品种,和速度的数据,它太具有挑战性和昂贵的数据进入数据仓库,及时理解整个数据集。常见的痛点,数据工程师和科学家的经验在处理传统的数据仓库解决方案包括:

  • 无弹力的计算和存储资源:传统数据仓库需要你计划的最大负载在任何给定的时间。这种不适应性使得很难优化计算和存储,满足不断变化的需求,可以是一个非常昂贵的方法来管理你的资源。
  • 刚性结构很难改变:传统的数据仓库在本质上是刚性由于其schema-on-write架构。这导致不得不建造昂贵和耗时的ETL管道来访问和操作数据。介绍了新的数据类型和来源,需要增加你的ETL管道加剧了问题。
  • 有限的高级分析功能:传统的数据仓库是有限的SQL查询,可以阻碍的深度分析,阻碍你的能力与机器学习解决更复杂的问题,流,图计算。

砖的解决方案:实时数据仓库简单

由Apache火花,砖提供了一种快速、简单、可伸缩的方法来增强现有数据仓储策略相结合可插入支持公共数据来源和按需动态节点和集群规模的能力。此外,砖的火花集群内置SSD缓存补充引发的本地内存缓存提供最佳的灵活性和性能。这使组织能够读取数据从原始数据源和动态执行“即时”查询数据无论它所在,而不是投资于复杂的和昂贵的ETL管道。

JIT-OVERVIEW

砖兑现这一承诺的是怎么做的?

  • 各种数据源的统一bob体育客户端下载平台:合理化api的ETL过程的语言选择和JDBC / ODBC连接器,使企业更容易直接高效地处理数据按需从任何来源。你也有把砖与现有的灵活性数据仓库实现一个统一的数据视图。
  • 在模式读取直接数据访问:定义的模式在阅读的时间点,避免了需要声明,负载,分区和索引在查询之前的数据。
  • 规模随需应变的最大弹性:独立规模资源根据你的数据处理和查询需要几次点击一个按钮,允许数据团队优化资源。
  • SSD对分布式缓存性能:砖的火花内存集群内置固态硬盘缓存,减少预处理和加速你的查询缓存文件提取。
  • 支持先进的数据分析:让你的团队很容易把数据科学到下一个水平内置高级功能像机器学习,图像处理,实时流媒体分析等等。

看看砖来实现或扩展当前数据仓库策略利用更多的数据你已经并更快地交付的见解。

准备好把你的数据仓库到下一个水平?看看我们实时数据仓库解决方案要学习BOB低频彩更多的知识。

免费试着砖
看到所有公司博客上的帖子