亚伦戴维森

数据库软件工程师

    Aaron Davidson是Apache Spark提交者和Databricks的软件工程师。他的Spark贡献包括独立的主容错、shuffle文件整合、基于netty的块传输服务和外部shuffle服务。在Databricks,他领导性能和存储团队,致力于Databricks文件系统(DBFS)和自动化云基础设施。

    过去的会议

    2021年峰会 介绍NEPHOS:实现没有基础设施管理的Lakehouse

    2021年5月27日下午04:25太平洋时间

    进入下一阶段的民主化分析和人工智能,以提高规模、敏捷性和减少创新时间。随着NEPHOS的引入,Databricks通过将更大的控制权交给数据团队来改善组织与数据和分析平台的互动。bob体育客户端下载通过帮助数据团队更快地工作,同时为治理和安全策略的执行提供信息安全和平台管理的信心,组织可以安全地加速创新。bob体育客户端下载NEPHOS通过即时计算、最优的性价比以及内置的安全性和合规性功能,让数据团队能够更快、更智能地工作。在本节课中,学习新宣布的自动化如何使工作区能够立即运行笔记本或执行SQL查询,而无需进行设置基础设施的劳动密集型和手动任务。

    在本节中请注意:
    Aaron Davidson, Databricks软件工程师
    Vinay Wagh, Databricks产品总监

    (daisna21-sessions-od)

    2019年峰会 使用MLflow 1.0加速机器学习生命周期

    2019年4月24日下午05:00 PT

    去年,Databricks推出了MLflow,这是一个开源框架,用于管理机器学习生命bob下载地址周期,与任何ML库一起工作,以简化ML工程。MLflow提供了用于实验跟踪、可重复运行和模型管理的工具,使机器学习应用程序更容易开发和部署。在过去的一年中,MLflow社区发展迅速:来自40多家公司的80名贡献者为该项目贡献了代码,超过200家公司正在使用MLflow。在这次演讲中,我们将介绍MLflow 1.0的开发计划,MLflow的下一个版本,它将稳定MLflow api,并引入多个新特性来简化ML生命周期。我们还将讨论Databricks和其他公司在2019年剩余时间内正在开发的其他MLflow组件,例如用于模型管理、多步管道和在线监控的改进工具。

    2014年峰会 Spark内部机制的更深入理解

    2014年6月30日下午05:00 PT

    本次演讲将从技术上“深入”探讨Spark的内部架构。这些内容将面向那些已经熟悉基本Spark API的人,他们希望更深入地了解它的工作原理,并成为高级用户或Spark开发人员。

    本次演讲将介绍Spark的主要内部组件:RDD数据模型、调度子系统和Spark的内部块存储服务。对于每个组件,我们将描述其体系结构和在作业执行中的角色。我们还将举例说明SparkSQL和MLLib等高级库如何与核心Spark API交互。

    在整个演讲中,我们将讨论数据序列化、RDD分区和用户定义的RDD等高级主题,重点是用户可以应用于自己的工作负载的可操作建议。

    BOB低频彩了解更多:

    亚伦维