在加入Databricks之前,Todd是微软SQL Server团队的一员,负责引擎和集群组件。Todd是Couchbase产品团队的一员,并帮助建立了世界上最快的运营数据库。Todd最近在Mesosphere帮助推动应用程序SDK和应用程序可伸缩性产品。
数据共享在数字经济中变得非常重要,因为企业希望与客户、合作伙伴和供应商轻松安全地交换数据,但到目前为止,数据共享解决方案一直绑定在单个供应商或商业产品上。bob体育外网下载今天,Databricks发布了业界首个数据共享开放协议“Delta Sharing”,使数据与其他组织共享变得简单,无论数据位于何处。加入Databricks联合创始人兼首席技术专家Matei Zaharia,以及Databricks工程师兼产品经理Michael Armbrust和Todd greenstein参加Delta Sharing的“问我任何问题”会议。无论您是想深入研究技术,还是想更好地理解场景,这都是您可以提出问题的环节!
(daisna21-sessions-od)
随着组织采用数据驱动的决策,他们必须投资一个可以快速分析大量数据和类型的平台。bob体育客户端下载通过他们的数据湖,这些组织可以在廉价的云对象存储中存储大量数据。通过Delta Lake,我们可以提供ACID事务,使您的数据湖可靠。但是,要使数据湖成为湖屋(为数据湖提供数据仓库的简单性和功能),一个关键组件是能够对数据湖执行特别查询或OLAP查询。
有了光子驱动的德尔塔引擎,你的湖屋现在可以很容易地成为现实。Photon引擎是用c++从头开始编写的,以充分利用现代硬件和数据级和CPU指令级并行性。它优化了文本处理和正则表达式,从而在真实世界的数据和应用程序上实现快速性能。它与Apache Spark™api完全兼容,以确保工作负载无缝运行而无需更改代码。例如,在Photon上运行相同的Spark SQL查询的基准测试比Apache Spark™2.4快20倍。快来加入我们,了解更多关于如何从BOB低频彩根本上加快您的Spark SQL查询与Photon驱动的Delta引擎。
演讲者:托德·格林斯坦