Technical Blog テクニカルブログ
  1. HOME
  2. テクニカルブログ
  3. IBM Manta Data Lineageの使い方 ユースケース編

IBM Manta Data Lineageの使い方 ユースケース編

投稿者:稲見

こんにちは!NI+C Data Governanceチームの稲見です。

今回は「IBM Manta Data Lineageの使い方 基本編」の続編として以下のユースケースに対してIBM Manta Data Lineage(以下Manta)をどのように使えるのかを説明したいと思います。

  • アプリケーション改修時の影響範囲の確認
  • 分析に使用するデータの信頼性の確認

アプリケーション改修時の影響範囲の確認

アプリケーションを改修する際にテーブルレイアウトの変更(カラム名やデータ型の変更など)が発生する場合があります。
その変更を行った際にどのシステムに影響があり、どこを合わせて改修する必要があるかを調査・確認するのはシステムが複雑になればなるほど労力が必要になるかと思います。

こういうケースの時にMantaを利用することで特定のカラムがどこのシステムで利用されているかをデータの流れに基づいて確認することが可能なため、非常に便利です。

早速、Mantaを使ってデータの流れを確認してみます。

今回はDBとしてDb2とOracle、ETLとしてDatastageを使用してるリネージュを確認します。

ではデータの源泉にあたる左端のDb2の「SALES_DETAL_EC」テーブルの「CUST_ID」(顧客ID)カラムがどこで使われているか確認してみます。

「SALES_DETAL_EC」テーブルの「CUST_ID」(顧客ID)カラムをクリックします。クリックしたカラムが黄色くなり、そのカラムからの流れ(線)と、後工程で使用されている部分が赤色で表示されるようになります。

この赤色の流れを辿っていくと、最終的なデータマートである「SALE_BY_CUSTMER」では「SALES_DETAL_EC」テーブルの「CUST_ID」が使われていて、「DAILY_SALES_SUMMARY_VIEW」では使用されていないことがわかります。

このようにMantaでは、どのカラムがどこからどこまでのシステムで使われているか簡単に把握することが可能となり、アプリケーション改修時にどこに影響があるかを素早く視覚的に把握することが出来ます。

分析に使用するデータの信頼性の確認

データ分析やBIレポート作成をする際に正しいデータや信頼性のあるデータを使用しないと正しい結果を得ることは出来ません。
使用するデータが正しいものなのか信頼性のあるデータなのかを確認することは分析者/レポート作成者の立場では骨が折れる作業になりますし、データ管理者へ確認しなければならないケースや確認しても時間がかかりスピディーなデータ活用ができないようなこともあるかと思います。

分析者/レポート作成者の立場の方でもMantaを使用することでデータ管理者に頼らずに素早く簡単にデータの流れ、データの出どころを確認することが出来ます。

では早速Mantaを使用を使用してデータマートからデータの源泉に向けてデータの流れを確認してみます。
リネージュ上のデータマート(DAILY_SALES_SUMMARY_VIEW)の「AMOUNT」カラムをクリックしてみます。クリックすると元となったデータが青色で表示されます。

この青色を辿ると「SALES_DETAIL_STORE」テーブルと「SALES_DETAL_EC」テーブルの2つのテーブルの「AMOUNT_AFTER_DISCOUNT」カラムからデータが流れてきていることがわかります。

このようにデータマートからデータの流れ、源泉を特定しデータの信頼性を確認することが可能です。今回はデータマートからの確認でしたが、BIツールを含めてMantaと連携することでBIツールのレポートに使われているデータからデータ源泉までを含めたリネージュの作成、データの流れを確認することも可能です。

まとめ

Mantaを使用することでデータの流れを可視化するだけでなく、特定のオブジェクトがどのように使われているか、どこから来ているのかなどデータの流れをより詳細に確認することできるため、データガバナンスをより強化するだけでなく、日々の業務効率の向上にも貢献することことができます。

今回のブログはいかがだったでしょうか。基本編と本編を読んでいただくことでより深くIBM Manta Data Lineageを理解いただけましたら幸いです。

ページのトップへ