公司博客上

新的Microsoft Azure数据仓库服务和Azure Databricks结合了分析、BI和数据科学

2019年11月4日 公司博客上

分享这篇文章

自Azure Databricks首次推出以来,在过去两年里,已有数千家公司采用了它,使其成为微软Azure上增长最快的数据和人工智能服务之一。客户现在每月处理超过2艾字节的数据,每天都有数百万个服务器小时在运转。所有这些都是由像伊莱克斯壳牌,可再生能源。人工智能他们正在使用Azure Databricks处理大规模数据,用于数据科学和分析。

在这个惊人的采用中,有一个特定的解决方案体系结构现代数据仓库(MDW).今年早些时候我们写过性能和规模效益此解决方案的一部分,以及该模式成功的一部分是我们与带有高性能连接器的Azure SQL数据仓库这是双方共同设计的,目的是让数据在两种服务之间快速轻松地移动。

Azure Databricks与Azure Synapse Analytics合作的三种方式

今天,微软宣布了他们的下一步发展数据仓库服务:Azure Synapse Analytics.这是一个令人兴奋的消息,我们将继续与微软紧密合作,集成Azure Synapse,并将分析、商业智能(BI)和数据科学整合到一个解决方案架构中。以下是Azure Databricks与Azure Synapse合作的三个关键方式:

    1. Azure Databricks和Azure Synapse之间的高性能连接器将实现服务之间的快速数据传输,包括对流数据的支持。这意味着客户可以继续使用Azure Databricks(直到快50倍而不是开源bob下载地址Apache Spark),用于提取、转换和加载(ETL)工作负载,为Azure Synapse大规模准备和塑造数据。
    2. Azure数据工厂(ADF)支持映射数据流特性。这为大规模的数据准备和转换提供了无代码的可视化ETL,现在ADF是Azure Synapse工作空间的一部分,它提供了另一种访问这些功能的途径。
    3. Azure Synapse和Azure Databricks可以在Azure数据湖存储中对相同的数据运行分析。这为将分析、BI和数据科学解决方案与跨服务的共享数据湖结合提供了更大的机会。

当您开始在现代数据仓库解决方案架构的下一个演进中使用Azure Databricks和Azure Synapse时,我们很乐意听到您的反馈。

免费试用Databricks
看到所有公司博客上的帖子