データファブリック

プロアクティブ・データ・オブザーバビリティ (可観測性)・プラットフォーム

IBM Databand

継続的なデータ可観測性の実現により
データインシデントを早期に検出し、迅速に解決することで
信頼できるデータを提供します。

解決可能な課題

  • データの処理過程が複雑に絡み合っており、全体を見渡すのが難しく問題解決に時間がかかる
  • ETL処理やデータ分析で発生したデータ障害の原因追及に時間がかかる
  • データ分析結果の信頼性が低くデータに基づいた意思決定が出来ない

サービスのご紹介

注目されるデータの可観測性(オブザーバビリティ)

 データ活用が進む中で、システムの分散化や複数コンポーネントの複雑な連携から、システムの状態を把握することが困難になっています。
 ただ、その一方で安定稼働、高いパフォーマンスを維持することが求められ、常にシステムの状態を把握し、障害時には迅速に問題を特定し解決する必要があります。
 このような背景から注目されているのがデータの可観測性(オブザーバビリティ)になります。
 データの可観測性(オブザーバビリティ)とは、システム内のデータの正常性と状態を把握するための包括的な概念で、ほぼリアルタイムにデータの正常性に関わる問題を特定し解決することを意味します。

Databandとは?

  • Databandはデータ可観測性(オブザーバビリティ)に対応した、データパイプラインオーケストレーションプラットフォームです。
    ※データパイプラインは、異なるデータソース間のデータを収集、変換、移動するための一連の処理を指します。
  • データの品質だけでなくデータを生成するフローの可観測性を提供します。
  • 異なるデータソースとツール間のデータの処理を自動で収集し、データ品質の監視やデータパイプラインの可視化、トラブルシューティングなどを支援します。
  • データ管理者やデータエンジニアが直面するデータパイプラインの問題発見、原因究明にかかる時間を短縮します。

 

Databandによる問題検知と解決の流れ

 具体的には、データフローに関する統計情報、過去のトレンドなどのメタデータを収集し、データ生成におけるベースラインを定めます。そして、定めたベースラインに基づいて監視を行い、ベースラインの基準を満たしていないものに対するアラートを発報することで問題の特定を行いSLAを保ちます。

1 自動的にメタデータを収集

 近年のデータ分析に使用されるソリューションに対応します。

2 統計的な判断基準を作成  

 データパイプラインの過去の稼働状況を元にDatabandが自動でベースラインを作成します。

3 基準に反する異常をアラート

 Databandが自動生成するベースラインやルールに基づいて、意味のないノイズと異常のシグナルを区別します。

4 自動化を活用した解決

 データ品質の監視から問題対処までを自動化し一元管理することにより、データ品質に関する問題を解決します。

お客様のニーズにあわせた2種類の提供形態

導入によるメリット

状態を常に把握

 データパイプラインの動作状態、データの流れ、問題、パフォーマンスをほぼリアルタイムに視覚的に把握することが可能です。

 データフロー最適化、迅速な問題解決、パフォーマンス改善につながります。

より早い解決を支援

 異常検知後、データパイプラインの問題や原因の特定が容易であり、調査にかかる時間を大幅に短縮することが可能です。

データの健全性維持

 データパイプラインで生成されるデータの品質を自動的に追跡、確認することにより、データパイプラインの品質問題を可視化します。

 Databandが自動で生成するベースラインを活用することで、データパイプラインの状態を常に把握することができ、異常を早期に発見することが可能です。

 これにより、データインシデントの被害を最小限に抑え、データの品質向上を支援し、信頼性の高いデータに基づいた意思決定ができます。

ページのトップへ