Technical Blog テクニカルブログ
  1. HOME
  2. テクニカルブログ
  3. Databricksで生成AIを用いてデータを可視化してみた。

Databricksで生成AIを用いてデータを可視化してみた。

投稿者:Databricks担当

はじめまして、NI+CのDatabricks担当の藤田です。

突然ですが、もし普段使っている話し言葉でAIに話しかけるだけで、自社のデータを参照したデータ集計やグラフ作成が完了するとしたら、試してみたいと思いませんか?

「そんな便利なものが本当にあるのか?」
「専門知識がないと無理でしょう?」
「高価なツールを導入する予算が確保できない…」

そんなお悩みもデータ分析基盤として注目されている「Databricks」なら、解決できます

本記事では、DatabricksへCSVデータをアップロードし、生成AIとの対話形式でデータの可視化まで行う一連の流れを、分かりやすく解説していきます!

もくじ

  • Databricksとは?
  • データを可視化する一連の流れ
    • Step1.DatabricksにCSVファイルを取り込む
    • Step2.生成AIを用いて自然言語でデータを可視化する
  • まとめ

Databricksとは?

冒頭でも簡単に述べさせていただきましたが、改めてご説明させていただきます。
Databricksとは、企業向けのデータ分析や生成AIの利活用を効率的に行うためのプラットフォームです。

プログラミングの知識がなくても、データレイクハウスという技術を使い、データを簡単に整理・活用できます。
これにより、膨大なデータを分析したり、AIエージェントを開発したりする作業がスムーズに進みます。
また、自然言語でデータを検索できる機能もあるため、社内のデータ管理者だけでなく、経理担当者から営業担当者まで、幅広い関係者が自分の言葉で必要な情報を見つけ出すことができます。

データを可視化する一連の流れ

実際にデータを取り込み、生成AI機能を活かしてダッシュボードを作成する作業の流れについてご説明します。
シンプルなGUI操作でのデータ可視化が出来る手軽さを感じて頂ければと思います。
 ※画面内の言語は日本語にも変更可能です。

Step1.DatabricksにCSVファイルを取り込む

DatabricksではSnowflakeなどのDBと接続しデータを取り込むなど、様々なデータ取り込みの手法があります。

今回は、Databricks環境にCSVファイルを取り込ませてみます!

画像1 ホーム画面

CSVファイルをDatabricksに取り込むには「Data Ingestion」項目から行います。
ホーム画面左から青枠内の「Data Ingestion」を選択してください。

画像 2 Data Ingestionの画面

Data Ingestionの画面は、画像2の通りとなっております。
こちらの画面から様々な手法でデータの取り込みを行うことができます。
今回はCSVファイルの入力のため、青枠内の「Create or modify table」 を押下します。

画像3 Create or modify tableの設定画面

「Create or modify table」を選択後、画像3 のような画面になります。
こちらから読み込むファイルを選択します。

ファイルを追加する方法として、青点線枠内をクリックするとエクスプローラーが開き、ファイルを選択することができます。また、ドラッグアンドドロップでも可能です。

画像4 ファイル指定後の画面

ファイル指定後、画像4 の画面でデータのプレビューと保存場所の指定を行うことができます。
保存する場所(カタログとスキーマ)を指定して、「Create table」を押下し、テーブルを作成します。

画像5 作成完了画面

テーブルの作成が完了すると画像5 のような画面となります。これでデータの取り込みは完了です。

Step2.生成AIを用いて自然言語でデータを可視化する

Databricksでは、取り込んだデータを参照し、生成AIに対して自然言語で指示することで、グラフの作成やデータの加工を行うことができます。

今回は先ほど取り込んだデータに、作ってほしいグラフを自然言語で指定して、可視化していきたいと思います!

画像6 Dashboardsへの移動

Databricksでデータの可視化を行う際は、Dashboardsという機能を使います。青枠内の「Dashboards」を選択します。

画像7 Dashboardsの画面

画像7 の画面にてダッシュボードの新規作成ができます。
青枠内の「Create dashboard」を押下します。

画像8 Dashboards編集画面

画像8 がDashboardsの画面です。青枠の部分はcanvasと呼ばれるもので、こちらにグラフや表などを表示したり、そのレイアウトを変更することができます。

絵を描くことで例えるのならば、名前の通りキャンバスや、スケッチブックが該当します。
絵を描くには絵の具が必要だと思います。Dashboardsにおける絵の具はデータです。
そのため、表示したいデータを選択しなければ絵を描くこと(グラフや表を表示する)ことができません。
可視化するデータの指定はオレンジ枠内の「Data」タブを選択することで設定できます。

画像8の画面でオレンジ枠の「Data」タブを選択します。

画像9 データ設定

今回は作成されたテーブルをもとに可視化するため、「Add data source」を選択します。

画像10 テーブル指定画面

先ほど取り込んだデータを選択して、「Confirm」を押下します。

画像11 データ指定完了画面

画像11 のような画面(Result Tableが表示)となればデータの指定が完了です。
次に、どのようなグラフにするか等の可視化についての設定を行うため、canvasに戻ります。
オレンジ枠内の「Untitled page」を選択します。

画像12 ビジュアライゼーションの追加

左から二番目(青枠内)の「Add a visualization」を押下します。

画像13 グラフ表示場所の指定

グラフを表示したい場所にカーソルを合わせ、クリックします。
 ※ドラッグ&ドロップをすることで、表示エリアを拡大 / 縮小することも可能です。

画像14 ビジュアライゼーション設定画面

画像14 の画面でどのように可視化するのかを指定することができます。
右側の「Widget」で手動で設定もできますが、今回は生成AIを用いて作成するため割愛します。
青枠内に作成してほしいグラフの情報を自然言語で指定し、矢印を押下すると、グラフが自動で作成されます。

今回は「カテゴリごとに売上金額の割合を示す円グラフを作成してください」というプロンプトを入力してみます。

画像15 グラフ出力画面

このように(画像15)グラフを作成することができました。
作成されたグラフが自分の意図したものと合致していれば、「Accept」を押下するとグラフの作成完了です!
もし自分の意図したグラフになっていなければ「Reject」を押下します。
この場合、プロンプトを指定する画面に戻ります。

なお、ダッシュボードは手動で保存する必要はなく、自動で変更を保存してくれます

画像16 その他可視化手法

また、円グラフ以外に、画像16のような表、グラフも作成することができ、様々な種類での可視化を行うことができます。

まとめ

本記事では、Databricksを使い、CSVデータの取り込みから自然言語でのデータ可視化までの一連の流れをご紹介しました。専門的な知識がなくても、まるでAIアシスタントと対話するように直感的にデータを加工・可視化できる。
その手軽さと可能性を感じていただけたのではないでしょうか。

最後までお読みいただき、ありがとうございました。

ページのトップへ