Treasure Data CDP<第22弾>Treasure Data CDPとGoogle スプレッドシートを連携してみた!(前編)
投稿者:岡田
NI+C マーケソリューションチームです:)
本Tech Blogでは、NI+Cで取り扱っているTreasure Data CDPを紹介していきます。
本日は 「Treasure Data CDPとGoogleスプレッドシートと連携してみた(前編)」のテーマとなります。
Treasure Data CDPとGoogleスプレッドシートを連携して、データのインプットおよびアウトプットの方法を前編と後編に分けてご説明いたします。
前編では、連携の事前準備とGoogle スプレッドシートからTreasure Data CDPへのデータインプットについて取り上げます。
(後編では、Treasure Data CDPからGoogle スプレッドシートへのデータアウトプットについて紹介いたします。)
また 「Treasure Data CDP<第2弾>Audience Studio の機能 Activation を使ってみた!」こちらも併せてお読みいただくと、さらに理解が深まると思いますので、ぜひご覧ください!
アジェンダ
1.Treasure Data CDPの外部ツールとの連携について
2.Treasure Data CDPとGoogleスプレッドシートの接続設定
3.GoogleスプレッドシートからTreasure Data CDPにデータをインプットする
4.まとめ
1.Treasure Data CDPの外部ツールとの連携について
Treasure Data CDPの大きな特徴の一つとして、外部ツールとの連携が簡単であることが挙げられます。
上図のように、Treasure Data CDPでは、あらかじめ実装された連携コネクタが提供されており、連携したい外部ツールをカタログから選択し、接続キー等を入力するだけで簡単に連携が可能です。
各ボックスの左上には「Input」と「Output」の表示があります。
「Input」は外部ツールからTreasure Data CDPにデータを取り込むことを意味し、「Output」はTreasure Data CDPから外部ツールへデータを渡すことを意味します。
今回のGoogleスプレッドシートは両方の表示があるため、「Input」と「Output」ともに連携コネクタが提供されていることがわかります。
2.Treasure Data CDPとGoogleスプレッドシートの接続設定
まずは、Treasure Data CDPとGoogleスプレッドシートの接続を行います。
はじめに、接続設定としてAuthenticationを作成します。
「Authentication」は連携先の接続情報(ユーザー名やパスワードなど)をあらかじめ設定することで、連携のための架け橋として機能します。
先ほど説明した、カタログの部分へ移動します。
上図のGoogleスプレッドシートの部分にカーソルを合わせると「Create Authentication」というボタンが表示されるのでこちらをクリックします。
Googleアカウントの設定を求められるので、接続したいGoogleアカウントを設定します。既存の設定がある場合はそちらを選択し、ない場合は新規に作成します。
作成したAuthenticationに任意の名前を付けます。今回は「blog_spreadsheet_20240710」としました。
これで、Authenticationの作成が完了しました!
Authenticationの一覧画面を見に行くと、「blog_spreadsheet_20240710」が作成されていることがわかります。
これで、Treasure Data CDPとGoogleスプレッドシートの接続は完了となります。
3.GoogleスプレッドシートからTreasure Data CDPにデータをインプットする
ここからは、Googleスプレッドシートで作成したデータをTreasure Data CDPにインプットする方法を説明します。
今回、インプットするデータはこちらになります!
(※使用するデータはデモデータになります。名前やメールアドレスは架空のものではありますが、モザイク処理をしています。)
項目としては、顧客番号・購入日・年齢・血液型など計14項目あり、データ数としては2000件あります。
では、ここから実際に上記のデータを直接Treasure Data CDPにインプットしたいと思います!
まず初めに、先ほど作成したAuthenticationの画面の「New Source」という部分をクリックします。
クリックすると上図のような5つの設定項目が出てきます。
赤枠で囲まれた5つの項目を設定していくだけで、簡単にインプットすることが可能です。
Connectionでは、データ転送名を入力します。今回は「blog_test_20240710」という名前を付けています。
次にSource Tableの設定をしていきます。
Source Tableでは、Googleスプレッドシートの詳細情報を入力していきます。
~以下項目説明~
・Spreadsheet Key (Required)
Googleスプレッドシートキーを指定します。
d/と/edit?に挟まれた部分がスプレッドキーとなります。
※スプレッドシートキーが分かると、誰でもアクセスできてしまうためモザイク処理を行っています。
・Worksheet Title
Treasure Data CDPに取り込むワークシートのタイトル名です。
注意点として、ブック名ではなくシート名の記載が必要となります。
・Range to fetch
取得するセルの範囲を指定します。(空の場合は、シート全体を取り込む)
今回は赤枠部分の1行目が不必要だったため、範囲をA2:K2020と指定しています。
・Use first row/column as header
最初の行または列をヘッダーとして保持する場合は選択します。
・Skip first rows/columns
行ディメンションを使用する場合は上部の n 行をスキップし、列ディメンションを使用する場合は左側の n 列をスキップします。
・Major Dimension
行または列を選択します。
・Value Render Option
セルの値を読み取る際に使用されるオプションです。これにより、値がどのような形式で返されるかを制御できます。
選択できるオプションは以下があります。
FORMATTED_VALUE:
セルの値を表示されている形式で返します。例えば、日付形式のセルであれば日付形式で、通貨形式のセルであれば通貨形式で返します。
UNFORMATTED_VALUE:
セルの値を生データとして返します。例えば、日付形式のセルでもエポックタイムの数値で返されます。
・Date Time Render Option
セルの日時データを読み取る際に使用されるオプションで、日時の値がどのように返されるかを制御します。
選択できるオプションは以下があります。
SERIAL_NUMBER:
日時をスプレッドシート内部でのシリアル値(数値)として返します。
例えば、日付が「2023-10-03」の場合、スプレッドシートの内部シリアル値として返されます。これにより、日付や時刻が数値として計算されやすくなります。
FORMATTED_STRING:
日時を可読形式の文字列として返します。
例えば、日付が「2023-10-03」の場合、”2023-10-03″のような形式で返されます。これにより、ユーザーが日時データを直接目で確認しやすくなります。
上記が全て入力し終えた画面になります。
ここでNextを押すと該当のGoogleスプレッドシートと連携が開始されます。
連携情報に問題がなければ次へ進むことができます。
次にData Settingsの設定をしていきます。
ここでは、実際に取り込まれるカラム名とデータのタイプを確認します。Source Table設定後、連携対象のGoogleスプレッドシートのカラム情報がTreasure Data CDP側で自動的に読み込まれ、Schema Settings上に表示されます。
カラム名やデータ型が想定通りであれば、このまま進み、想定通りでなければ、修正することが可能です。
例えば、order_dateというカラムがtimestamp型で登録されているところ、string型に変更することが可能です。
次にData Previewの設定をしていきます。
Data Previewでは、Treasure Data CDPで実際に取り込むデータがどのように表示されるかを仮のテーブル構造として示してくれます。
これにより、データのフィールドや形式を事前に視覚的に確認することができます。
「Create Preview」をクリックすると、仮テーブル構造が作成され、インポートされる予定のデータがどのように配置されるかを一目で理解できます。
これにより、データの取り込み前に構造と配置を十分に確認することができます。
※ここで表示されるテーブルはソースから概算されたものであり、実際にインポートされるデータではありません。
確認ができたら、Nextを選択します。
最後にData Placementを設定します。
ここでは、インプットするデータをどこに保存するのか、定期的に取り込むようにするのかといったことを設定できます。
赤枠:
インプットするデータの保存先を設定します。既存のデータベース、テーブル以外にも、新規に作成して保存すること可能です。
今回は新規に作成しており、データベース名「google_test_0712」、テーブル名「blog_20240712」としています。
青枠:
データインプットをスケジュール設定することが可能です。
スケジュールを設定しておくことで、毎日決まった時間にGoogleスプレッドシートのデータをTreasure Data CDPに自動的に取り込むことが可能となります。
以上でインプットするための設定は完了となります。
上記の設定を順番に行うだけで、インプットが完了します。
では実際に、Treasure Data CDPにインプットされているか確認してみましょう!
こちらが、Treasure Data CDPにインプットされたデータとなります。
インプットされたデータは、Create Sourceで設定したデータベースのテーブルに格納されます。
今回は、データベース名「google_test_0712」、テーブル名「blog_20240712」を設定したので、赤枠のデータベース名、テーブル名ともに指定した場所に保存されていることが確認できます。
また右上のデータ件数が2000件ということで、問題なくインプットできたことがわかります!
4.まとめ
以上、「Treasure Data CDPとGoogle スプレッドシートを連携してみた!(前編)」のテーマでお送りいたしました。
Treasure Data CDPは、多種多様なソフトウェアやデータソースへの連携機能を備えており、エンジニアの方でなくとも、簡単な設定を行うだけでスムーズにインプットすることができます。
是非、皆さんも試してみてください!!
次回後編では、Treasure Data CDPからGoogleスプレッドシートへアウトプットする方法をご紹介します。
Treasure Data CDPにご興味を持たれた方はぜひ「こちら」からお問い合わせください
その他、Treasure Data CDP についての記事はこちら↓
セグメント作成について↓↓
Treasure Data CDP <第1弾>Audience Studio の機能でセグメント作成してみた!!
Activationについて↓↓
Treasure Data CDP <第2弾>Audience Studio の機能 Activation を使ってみた!
Predictive Scoring について↓↓
Treasure Data CDP <第3弾>Predictive Scoring のご紹介
データのインポートについて↓↓
Treasure Data CDP <第4弾>Treasure Data にデータをインポートしてみた
SQLを使ったデータの抽出方法について↓↓
Treasure Data CDP<第5弾>SQL を使ってデータ抽出してみた!
Treasure Workflowについて(前編)↓↓
Treasure Data CDP<第6弾>Treasure Workflow とは(前編)
Treasure Workflowについて(後編)↓↓
Treasure Data CDP<第7弾>Treasure Workflow とは(後編)
新機能 ジャーニーオーケストレーションについて↓↓
Treasure Data CDP<第8弾>新機能 ジャーニーオーケストレーション ご紹介
Server Side 1st Party Cookieについて↓↓
Treasure Data CDP<第9弾>Server Side 1st Party Cookieのご紹介
ジャーニーオーケストレーションの機能を使ったジャーニーの作成方法について↓↓
Treasure Data CDP<第10弾>【Journey Ohchestration】ジャーニーを作成してみよう!
Predictive Scoring 予測モデルの作成から実行について↓↓
Treasure Data CDP<第11弾>Predictive Scoringを使ってみた!
Policy Based Permissionについて↓↓
Treasure Data CDP<第12弾>Policy Based Permissionとは?
Treasure Insights について↓↓
Treasure Data CDP<第13弾>Treasure Insights について ご紹介
ID Unificationについて↓↓
Treasure Data CDP<第14弾>ID Unification 機能 ご紹介
アップデートされたAudience Studioについて↓↓
Treasure Data CDP<第15弾>アップデートされたAudience Studioのご紹介!
Utilizationについて↓↓
Treasure Data CDP<第16弾>Utilizationについてご紹介
TD AutoMLについて↓↓
Treasure Data CDP<第17弾>TD AutoMLを動かしてみた!
Policy based Column-level Access Controlについて↓↓
Treasure Data CDP<第18弾>セキュリティ強化機能~カラムレベルでデータを管理してみた!~
Treasure Dataの日時を扱う独自関数について↓↓
Treasure Data CDP<第20弾>Treasure Dataの日時を扱う独自関数をご紹介!
銀行業界でのユースケースについて↓↓
Treasure Data CDP<第21弾>Treasure Dataによる銀行業界でのユースケース【動画】