我们是怎么走到这一步的

您的数据仓库
不是为今天的世界建造的

就像CD、一次性相机、软盘和其他大多数有40年历史的创新一样,数据仓库也有过辉煌的发展。但是新的用例催生了新的技术。cd不能播放音乐。胶片相机不能共享照片。软盘无法与无限的云存储竞争。数据仓库无法执行人工智能。

是时候采用更简单的方法了

人工智能是每个组织的优先事项。但如今复杂而过时的传统基础设施无法实现人工智能的承诺。现在是时候建立一个新的数据架构来满足您今天的需求了——而且是面向未来的,以便为明天带来的任何事情做好准备。

发现
Lakehouse
湖屋的黎明

数据和人工智能的新时代开启了

数据湖屋是一种开放的数据架构,它在一个平台上结合了最好的数据仓库和数据湖。bob体育客户端下载

现在,您可以将所有数据(结构化、半结构化和非结构化)存储在开放数据湖中,同时仍然可以从数据仓库获得您期望的数据质量、性能、安全性和治理。这使得lakehouse成为唯一一个在一个平台上支持商业智能、SQL分析、实时数据应用程序、数据科学和机器学习的数据架构。bob体育客户端下载

解剖湖屋

一个平台bob体育客户端下载适用于所有用例

三角洲湖

必备成分

Delta Lake是一个开源项目,为您的数据湖提供可靠性、安全性和性能——对于在现有存储系统(如Amazon S3、Azure data Lake Store和谷歌Cloud storage)之上构建湖屋架构至关重要。

Delta Lake以开放的数据格式存储,因此您可以避免专有格式的数据锁定,并可以访问庞大的开源生态系统。bob下载地址如今,数千家公司每月都在使用Delta Lake处理数以十亿字节计的数据。


更多关于三角洲湖→

hex-bg

莱克豪斯怎么样

湖屋能做到仓库做不到的事

Lakehouse跨越了数据仓库的限制,因为它被设计为管理所有类型的数据,同时支持传统的数据仓库工作负载和机器学习。它将所有这些功能添加到您现有的数据湖,创建一个单一的开放系统来管理所有数据并支持每个用例。

数据仓库 Lakehouse
数据格式
数据格式 关闭 开放
数据类型
数据类型 结构* 任何类型的数据
可伸缩性
可伸缩性 有限的* * 高度可伸缩
成本
成本 $ $ $
用例
用例 BI、SQL BI, SQL, ML,实时应用程序
数据访问
数据访问 SQL只 使用SQL、R、Python和其他语言直接访问文件的开放api
可靠性
可靠性 具有ACID事务的高质量、可靠的数据 具有ACID事务的高质量、可靠的数据
治理
治理 表的行/列级的细粒度安全性和治理 表的行/列级的细粒度安全性和治理
性能
性能

*对半结构化数据的有限支持
**扩展成本过高

数据仓库之父对此表示赞同。

免费获得比尔·英蒙的新书,构建数据湖屋。

书的封面

Lakehouse改变了您的数据湖

湖屋克服了将数据湖变成数据沼泽的根本问题。它们通过添加关键的数据仓库功能(如事务、模式和治理),为您的数据湖带来高质量。他们还利用各种性能优化技术来实现快速分析。通过对开放数据湖的这些数据管理和性能优化,湖屋可以在本地支持BI和ML应用程序。

数据湖 Lakehouse
数据格式
数据格式 开放 开放
数据类型
数据类型 任何类型的数据 任何类型的数据
可伸缩性
可伸缩性 高度可伸缩 高度可伸缩
成本
成本
用例
用例 毫升 BI, SQL, ML,实时应用程序
数据访问
数据访问 高度可伸缩 使用SQL、R、Python和其他语言直接访问文件的开放api
可靠性
可靠性 质量低,数据沼泽 具有ACID事务的高质量、可靠的数据
治理
治理 治理不好,因为需要将安全性应用于文件 表的行/列级的细粒度安全性和治理
性能
性能

数据仓库之父对此表示赞同。

免费获得比尔·英蒙的新书,构建数据湖屋。

书的封面

湖边小屋的数据库里

世界上第一个也是唯一的湖屋云平台bob体育客户端下载

Databricks Lakehouse平台在AWS、Microsoft Azure或谷歌Cloud上作为服务交付和管理,使数据湖中的所有数据可用于任何数量的数据驱动用例。bob体育客户端下载

数据工程师可以建立快速可靠的数据管道。业务分析师可以执行BI,比大多数数据仓库更快地运行SQL查询。数据科学家可以简化mlop。当你所有的数据团队都在一个公共平台上时,你可以显著降低基础设施成本,提高数据团队的生产力并bob体育客户端下载加速创新。

Bi和SQL
直接分析你的数据湖

Databricks为您的数据湖带来数据分析,以数据湖经济学的方式提供数据仓库性能。
Databrbob下载地址icks Lakehouse平台使用开源标准来避免数据锁定,提供了数据湖本身缺乏的可靠性、质量和性能能力,价格/性能比传统云数bob体育客户端下载据仓库高6倍。

数据
工程
轻松获得新鲜可靠的数据

Databricks提供了端到端数据工程解决方案——摄取、处理和调度——自动化了构建和维护管道的复杂性,并直接在数据湖上运行ETL工作负载,因此数据工程师可以专注于质量和可靠性,以获得有价值的见解。

流处理
简单、可扩展和容错的流处理

借助Databricks,数据团队可以通过不间断的处理从无界数据中提取可操作的见解,以极低的成本提供服务保证。使用Databricks进行流用例为数据团队提供了创建低延迟、可伸缩和容错的实时数据驱动应用程序的能力。

数据科学与机器学习
完整的机器学习生命周期

Databricks为数据科学和机器学习提供了一个完整、开放的平台。bob体育客户端下载通过启用高质量、高性能的数据管道和先进的机器学习功能,Databricks使数据和机器学习团队能够在统一的平台上协作,加速从功能工程到生产的整个机器学习生命周期。bob体育客户端下载

共同安全与管理
开放数据湖logo

共同安全与管理

Databricks通过细粒度的访问控制来保护您的数据,并能够轻松扩展现有云本地安全策略和身份管理系统的安全性,以创建私有的,兼容的和隔离的工作空间。bob体育客户端下载平台管理员可以轻松地管理端到端平台体验,并控制每个工作区的开销。

数据处理、管理和治理
开放数据湖logo

数据处理、管理和治理

通过自动可靠的ETL、开放安全的数据共享以及跨云提供商的统一治理方法,Databricks简化了数据管理,并形成了具有成本效益、高度可扩展的湖屋的基础。

开放数据湖
开放数据湖logo

高质量、可靠的数据

您的数据湖已经包含了绝大多数结构化、半结构化和非结构化数据。现在,将数据湖的开放性和灵活性与强大的可靠性和质量相结合,以大规模支持所有分析用例的需求。

发现

悬停探索在Databricks上建造的湖屋的层。

直接分析你的数据湖

Databricks为您的数据湖带来数据分析,以数据湖经济学的方式提供数据仓库性能。采用开源标准bob下载地址避免数据锁定,Databricks Lakehouse平台提供了可靠性、质量和安全性bob体育客户端下载
数据湖本身缺乏的性能能力,以及比传统云数据仓库高6倍的性价比。

直接分析你的数据湖

Databricks为您的数据湖带来数据分析,以数据湖经济学的方式提供数据仓库性能。Databrbob下载地址icks Lakehouse平台使用开源标准来避免数据锁定,提供了数据湖本身缺乏的可靠性、质量和性能能力,价格/性能比传统云数bob体育客户端下载据仓库高6倍。

轻松获得新鲜可靠的数据

Databricks提供了端到端数据工程解决方案——摄取、处理和调度——自动化了构建和维护管道的复杂性,并直接在数据湖上运行ETL工作负载,因此数据工程师可以专注于质量和可靠性,以获得有价值的见解。

借助Databricks,数据团队可以通过不间断的处理从无界数据中提取可操作的见解,以极低的成本提供服务保证。使用Databricks进行流用例为数据团队提供了创建低延迟、可伸缩和容错的实时数据驱动应用程序的能力。

完整的机器学习生命周期

Databricks为数据科学和机器学习提供了一个完整、开放的平台。bob体育客户端下载通过启用高质量、高性能的数据管道和先进的机器学习功能,Databricks使数据和机器学习团队能够在统一的平台上协作,加速从功能工程到生产的整个机器学习生命周期。bob体育客户端下载

三角洲湖Databricks通过细粒度的访问控制来保护您的数据,并能够轻松扩展现有云本地安全策略和身份管理系统的安全性,以创建私有的,兼容的和隔离的工作空间。bob体育客户端下载平台管理员可以轻松地管理端到端平台体验,并控制每个工作区的开销。

三角洲湖通过自动可靠的ETL、开放安全的数据共享以及跨云提供商的统一治理方法,Databricks简化了数据管理,并形成了具有成本效益、高度可扩展的湖屋的基础。

高质量、可靠的数据您的数据湖已经包含了绝大多数结构化、半结构化和非结构化数据。现在,将数据湖的开放性和灵活性与强大的可靠性和质量相结合,以大规模支持所有分析用例的需求。

现实世界中的成功

世界领先的公司正在迁往湖边小屋