加速创新捷蓝航空使用砖
2023年6月22日 在客户
这个博客是由赛Ravuru高级经理在捷蓝航空数据科学与分析
数据的作用在航空领域拥有悠久的历史。航空公司是第一批大型计算机的用户,今天他们使用的数据已经支持的每一部分业务。在很大程度上要感谢的质量和数量的数据,航空公司是世界上最安全的运输方式。
今天航空公司必须平衡几个变量发生在相互串联在一个实足的舞蹈:
- 客户需要连接到他们的航班
- 袋需要加载到航班和跟踪相同的目标客户
- 机组人员(例如飞行员、乘务员、通勤人员)为他们的航班需要在适当的位置,同时满足法定FAA义务和其他要求
- 飞机不断监控维护需求,同时确保零件库存可以在需要的地方
- 天气在数以百计的临界位置和路由,动态和预测是至关重要的安全、高效飞行操作
- 政府机构会定期更新空域限制
- 机场当局定期更新机场基础设施
- 政府机构会定期更新机场槽限制和调整了地缘政治紧张局势
- 宏观经济力量不断影响Jet-A飞机燃料的价格和可持续的航空燃料(SAF)
- 机上的情况下出于各种原因促使航空公司积极调整的系统
数据,特别是分析的作用,人工智能和毫升是关键为航空公司为客户提供无缝体验,同时保持高效的最佳业务目标操作。
航空公司是最数据驱动的产业在当今世界由于频率、体积和各种变化的客户依赖这至关重要的组成部分,我们的交通基础设施。
为单个飞行为例,从纽约到伦敦,数以百计的决策必须基于因素包括客户、飞行人员、飞机传感器,住天气和住空中交通管制(ATC)的数据。比如大量的破坏残酷的冬季风暴因此会影响成千上万的航班在美国对航空公司来说是至关重要的依靠实时数据和人工智能和ML主动实时决策。
飞机产生tb的物联网传感器数据在张成的空间,每天和客户互动与预订或自助服务渠道,不断操作更改源于动态天气和空中交通的限制只是某些产品突出的复杂性,体积,多样性和速度的数据在捷蓝航空等航空公司。
有六个重点城市(波士顿,劳德代尔堡,洛杉矶,纽约,奥兰多,圣胡安)和一个沉重的浓度的航班在世界上最繁忙的航空走廊,纽约市,捷蓝航空在2023年有:
数据和人工智能在捷蓝航空的状态
由于数据在捷蓝航空的战略重要性,团队的数据是由数据集成、数据工程,商业数据科学、操作数据科学、人工智能和ML工程和商业智能团队报告直接向首席技术官。
捷蓝航空目前的技术栈主要集中在Azure,多重云数据仓库和Lakehouse同时运行用于各种目的。内部和外部数据不断丰富砖Lakehouse批处理的形式、近实时和实时提要。
使用三角洲生活表提取、加载和转换数据允许数据工程师和科学家来满足各种延迟SLA需求而把数据传输到下游应用,人工智能和ML管道、BI仪表板,分析师的需求。
捷蓝航空公司使用内部建立与AutoML BlueML图书馆,AutoDeploy,存储和网络特性特性,以及MLflow模型注册api,和自定义依赖人工智能和ML模型训练和推理。
洞察消费使用REST api连接表指示板砖SQL serverless计算、fast-serving语义层和/或部署毫升服务api。
部署新的ML产品往往伴随着强劲的变更管理过程,特别是业务部门密切受到联邦航空法规和其他法律由于数据的敏感性和各自的决策。传统上,这种变更管理带来一系列的研讨会、培训、产品反馈,和更专业的方式为用户与产品的交互,如角色的kpi和仪表板。
鉴于最近生成人工智能的进步,传统的变更管理和ML产品管理已经中断。用户现在可以使用复杂的大型语言模型(LLM)技术来获得角色的kpi和信息,包括使用自然语言帮助他们熟悉。这样可以大大减少所需的训练成功的产品扩展用户、产品周转时间的反馈,最重要的是,简化了访问相关的总结的见解;不再是获取信息以点击但单词量的问题。
地址生成AI和ML的需求,捷蓝航空的AI和ML工程团队专注于解决企业的挑战。
线的企业 |
战略产品(年代) |
战略目标(s) |
商业数据科学 |
|
|
操作数据科学 |
|
|
人工智能和ML工程 |
|
|
商业智能 |
|
|
使用此体系结构中,捷蓝航空已经加速AI和ML部署在一个广泛的用例生成四个业务部门,每个都有自己的人工智能和ML的团队。以下是业务的基本功能:
- 商业数据科学(CDS)——收入增长
- 操作数据科学(ODS)——降低成本
- AI &毫升工程——市场推广产品部署优化
- 商业智能报告企业扩展和支持
每个业务线支持多个战略产品优先由捷蓝航空的领导定期建立kpi,导致有效战略的结果。
为什么从一个多云数据仓库架构
数据和人工智能技术在主动实时决策至关重要;然而,利用遗留数据架构平台影响的业务成果。bob体育客户端下载
捷蓝航空数据服务主要通过多云数据仓库,导致复杂的设计缺乏灵活性,延迟变化,成本可伸缩性。
延迟——一个10分钟的数据架构延迟成本高组织每年数百万美元。 |
|
复杂的体系结构,数据移动的多个阶段跨多个平台和产品对实时流的用例是低效的,因为这是复杂和浪费。bob体育客户端下载 |
|
高平台TCbob体育客户端下载O,拥有众多的供应商数据平台和资源管理数据平台带来高的运营成本。 |
|
扩大,当前数据架构扩展问题在处理eb(大量数据)生成的许多航班。 |
由于缺乏在线功能存储水化,高延迟的传统建筑阻止我们的数据科学家构建可伸缩的ML培训和推理管道。当数据科学家和AI &毫升工程师Lakehouse有针毫升模型更接近的自由大奖章架构营销策略的效率是解锁。
复杂的体系结构,如动态模式管理和状态/无状态的转换,与经典的挑战来实现多重云数据仓库的体系结构。这两个数据科学家和工程师现在可以使用可伸缩的三角洲住表执行这些变化没有进入壁垒。选择SQL之间移动、Python和PySpark大大增加了捷蓝航空数据团队生产力。
由于管道无法迅速扩大经营规模,缺乏开放源代码的可伸缩设计multicloud数据仓库导致复杂的根本原因分析(rca)当管道失败,低bob下载地址效的测试/故障排除,并最终更高的TCO。MCDW团队密切跟踪计算费用的数据与数据砖在过渡;随着越来越多的实时和高容量的数据提要被激活消费,ETL /英语教学成本增长速度相比,比例低,线性遗产的ETL /英语教学成本多云数据仓库。
数据治理是部署生成人工智能和机器学习的最大障碍在任何组织。因为基于角色的访问重要数据和见解是密切监测在航空等高度监管企业,这些行业在有效数据治理过程感到自豪。策划的必要性嵌入的,只可能在复杂系统与100 +十亿以上参数,像OpenAI chatGPT,复杂组织的数据治理。结合OpenAI嵌入,砖的多莉2.0快速工程,捷蓝航空离线/在线文档存储库需要有效生成AI治理。
以前多云的数据仓库架构
砖Lakehouse架构的影响
与砖Lakehouse平台作为所有用例流的中央枢纽,捷蓝航空bob体育客户端下载公司有效地提供了几个毫升和分析产品/见解处理成千上万的实时属性。这些属性包括航班、客户、空勤人员、空中交通和维护数据。
Lakehouse提供实时数据通过三角洲生活表,使培训的发展历史和实时推理毫升管道。这些管道都被部署为毫升服务api,不断更新的快照捷蓝航空系统网络。任何操作影响产生的各种可控和不可控变量,如快速变化的天气,飞机维修与异常事件,机组人员接近法律责任限制,或ATC限制移民/离职,是通过网络传播。这允许先发制人的调整根据预测警报。
当前Lakehouse架构
天气,飞机的使用实时流传感器,联邦航空局的数据提要,捷蓝航空运营和更多;用于世界上第一个人工智能和ML操作系统编排digital-twin,称为蓝天为高效、安全的操作。捷蓝航空在10毫升产品(每个产品的多个模型)在生产各种垂直包括动态定价、客户推荐引擎、供应链优化、客户情绪NLP和更多。
蓝天行动数字双是最复杂的产品之一,目前正在实施的捷蓝航空数据团队和表单的骨干捷蓝航空的航空业务预测和仿真功能。
现在正在逐步在蓝天,解锁操作效率在捷蓝航空公司通过积极的和最佳的决策,导致更高的客户满意度,机组人员满意度,航空燃油效率,节约成本。
此外,团队合作与微软Azure OpenAI api和砖多莉创建一个健壮的解决方案,满足生成AI治理加快蓝天和类似产品的成功增长最低的变更管理和高效的ML产品管理。
微软Azure OpenAI API服务提供了沙箱嵌入的下载功能用于存储数据库文件存储在一个向量。砖的多莉2.0快速工程提供了一种机制,允许统一目录基于角色的访问数据库文件存储文档的向量。使用这个框架,任何捷蓝航空用户可以访问相同的chatbot隐藏在Azure广告SSO协议和砖统一目录访问控制列表(acl)。每个产品,包括晴空实时数字双,附带嵌入式llm。
通过部署AI和ML企业产品在Lakehouse砖使用数据,捷蓝航空迄今为止解锁一个相对较高的投资回报(ROI)多个两年之内。此外,砖允许数据科学分析团队的快速原型,迭代和发射数据管道、就业和ML模型使用Lakehouse,MLflow和砖的SQL。
我们专门小组在捷蓝航空兴奋未来我们努力实现最新的尖端砖提供的特性。通过利用这些进步,我们的目标是把我们客户的体验提升到新的高度,不断改善我们提供的整体价值。我们的一个关键目标是降低总拥有成本(TCO),确保他们获得最佳的投资回报率。
加入我们在2023年数据+人工智能峰会上,我们将讨论的力量Lakehouse主题,深入我们的迷人实时AI &毫升数字双旅程并提供深入了解我们导航大型语言模型的复杂性