Databricksレ. cerクハウスプラットフォ. cerムは,データストリーミングを大幅に簡素化し,単一のプラットフォームでのリアルタイム分析,機械学習,アプリケーションの実行を可能にします。
任意の言語とツールでストリーミングデータのワークロードを構築し,リアルタイムデータのワークロードの構築と運用管理を自動化できます。また,ストリーミングとバッチデータの両方を処理できる単一プラットフォームにより,データのサイロ化が解消されます。
ストリミングパプラン,アプリケションの構築を高速化
SQLとPythonの統合されたバッチAPIとストリーミンでグAPI,使い慣れた言語とツールを使用できます。組織全体のリアルタ@ @ムな分析、毫升、アプリケ,ションの実行を可能にします。
自動化されたルで運用を簡素化
リアルタ▪▪ムパ▪▪プラ▪▪ンやアプリケ,ションの本番環境への導入と管理を容易にします。自動化されたツールにより、タスクのオーケストレーション、フォールトトレランス/リカバリ、自動チェックポイント、パフォーマンスの最適化、オートスケールを簡素化します。
仕組み
ストリ,ミングデ,タの取り込みと変換
リアルタム分析,ml,アプリケション
自動化されたオペレションル
次世代ストリ,ム処理エンジン
統合ガバナンスとストレ,ジ
ストリ,ミングデ,タの取り込みと変換
Delta活动表により,ストリミングデタパプランのデタ取り込みとetlが簡素化されます。SQLやPythonなど,使い慣れている言語やルを使って,デ,タエンジニアリングを行うためのシンプルな宣言型アプロ,チを活用できます。自動更新の設定を適用してバッチおよびストリーミングのパイプラインを1か所で構築・実行することで,所要時間を短縮し,運用負荷を軽減します。Databricksレ. cerクハウスプラットフォ. cerムでストリーミングデータパイプラインを構築すれば、データの送信先を問わず、ローデータからクリーンデータへの変換にかかる時間を短縮できます。
“デ,タブリックスのプラットフォ,ムを複数の事業部がセルフサ,ビスで利用しています。これは以前には考えられないことでした。デ,タブリックスの導入効果は非常に大きいと感じています。」
コロンビアスポ,
Lara Minor氏
リアルタム分析,ml,アプリケション
ストリーミングデータで,アナリティクスとAIの精度とアクショナビリティを迅速に向上させることができます。ストリーミングデータパイプラインの下流にあるリアルタイムインサイトは,お客様のビジネスの利益となります。SQL分析やBIレポ,トの実行,Mlモデルのトレ,ニング,リアルタイムの業務アプリケーションの構築など,ビジネスに最も新鮮なデータを提供することで,リアルタイムの洞察,より正確な予測,迅速な意思決定を引き出し,競合他社に差をつけることができます。
“常に最新で正確なデータをビジネスパートナーに提供しなければ,インサイトへの信頼を失うことになります。Databricksレaapl . exeクハウスの導入により,これまで不可能だったことが可能になりました。」
ラ·リ,ガ·テックア,キテクチャ責任者吉列尔莫Roldán氏
自動化されたオペレションル
ストリーミングデータパイプラインを構築し,デプロイする際に,砖は本番環境に必要な複雑な運用タスクの多くを自動化します。これには,基盤となるインフラの自動的な拡張,パイプラインの依存関係のオーケストレーション,エラー処理とリカバリ,パフォーマンスの最適化などが含まれます。增强自动定量は,各ワークロードにコンピュートリソースを自動的に割り当てることにより,クラスタの使用率を最適化します。これらの機能に加えて,自動データ品質テストと例外管理により,運用ツールの構築と保守に費やす時間を減らし,データから価値を得ることに集中できるようにします。
次世代ストリ,ム処理エンジン
Spark结构化流は,砖レイクハウスプラットフォーム上のデータストリーミングを解放するコアテクノロジーで,バッチ処理とストリーム処理のための統一されたAPIを提供します。砖レイクハウスプラットフォームは,99.95%の稼働率を誇るマネージドサービスで,Apache Sparkワクロドを実行するのに最適な基盤です。Apache Spark APIと互換性のある次世代レescクハウスエンジン光子により,Sparkワクロドはさらに加速され,数千ノドまで自動的にスケルアップしながら,記録的なパフォ,マンスとコストを実現します。
統合ガバナンスとストレ,ジ
数据库でのデ,タストリ,ミングは,レ▪▪クハウスプラットフォ▪▪ムの基本コンポーネントである统一目录と三角洲湖を利用することを意味します。三角洲湖は,ストリーミングデータとバッチデータの両方に対応するようゼロから設計された唯一のオープンソースストレージフレームワークで,お客様の未加工データを最適化できます。统一目录は,あらゆるデータとAI資産に対して,きめ細かく統合されたガバナンスを提供し,クラウド間でデータを発見,アクセス,共有するための一貫したモデルを提供します。また、统一编目は,他の組織と容易かつセキュアにデータを共有するための業界初のオープンプロトコルである三角洲分享をネ▪▪ティブにサポ▪▪トしています。