Technical Blog テクニカルブログ
  1. HOME
  2. テクニカルブログ
  3. BigQuery MLでお手軽に購買データをRFM分析して、可視化してみた その②

BigQuery MLでお手軽に購買データをRFM分析して、可視化してみた その②

投稿者:今井 雄大

BigQuery MLでお手軽に購買データをRFM分析して、可視化してみた その②

初めに

クラウドイノベーション部の今井です。
今回は BigQuery ML を用いて購買データから RFM 分析を実施し、その可視化を DataPortal にて実施してみたいと思います。
本テックブログはこちらの記事を参考に作成しています。

その①では BigQuery ML を用いて購買データから RFM 分析を実施するところまで行いました。
その②(本記事)では DataPortal での可視化を行います。併せて、そのレポートの見方の解説を行います。

背景

今回のブログの背景としては、新人エンジニアの私が難しそうな顧客分析を Google Cloud 上でお手軽に行うことは可能かを検証することが大前提としてあります。
私は今まで顧客分析や機械学習を行ったことはありませんし、今までの案件の中でも SQL や Javascript での Web アプリの改修、 Python でのスクリプト作成などしか経験していません。
その私が、はたして顧客分析をお手軽に機械学習を組み合わせて行うことはできるのかを試していきたいと思います。

Dataportal とは

Dataportal の公式ドキュメントでは以下の特徴が挙げられています。

・詳細な設定が可能なグラフや表を使ってデータを視覚化できます
・さまざまなデータソースに簡単に接続することができます
・インサイトをチームと共有したり、公開したりすることができます
・レポートでチームと共同作業することができます
・組み込みのサンプル レポートを活用し、迅速にレポートを作成することができます

上記の特徴の通り、 Dataportal はさまざまなデータソース(今回であれば BigQuery やスプレッドシート)に接続することができ、作成したレポートを共同で編集作業を行うことができます。
そして、一番の特徴としては無料で利用できる BI ツールとなります。

作成したレポートについて

以下はその①のブログの中で最終的に作成したテーブルになります。

blog_rfm4.png

上のレポートをデータソースとして Dataportal に連携し、Dataportal の標準で備わっている表グラフや散布図グラフを利用し、レポートを作成しました。
作成したレポートの使い勝手をご確認されたい方はこちらのリンクからご確認ください。
作成したレポートのデータソースは BigQuery ではなく、スプレッドシートに変更しています。
これはコストの面からの変更になりますが、データの内容や使い勝手は BigQuery を利用しているときと同等ですので、問題はないと考えています。

blog_rfm5.png

今回作成したデータでは Segment 2,4,1,3,5 の順で優良顧客であると考えられます。
それは今回作成したレポート内にある散布図から読み取ることが可能です。
散布図の縦軸には frequency (購入回数)を設定しており、平均購入回数が大きいほど上に現れます。
散布図の横軸には recency (最新購入日)を設定しており、平均の最新購入日が小さいほど左に現れます。

そして、平均購入回数が大きく、平均の最新購入日が小さいほど、優良顧客であると考えられます。
したがって、散布図は以下のような区分けで読み取ることができます。

blog_rfm7.png

blog_rfm6.png

この画像と散布図のグラフから言えることとしては、ほかにもいくつかあると思います。

例えば、Segment 5の顧客は休眠顧客といえます。
実際の業務の中ではこの Segment 5 のクラスタ内にいるユーザーに対して、定期的にクーポンを配布することで優良顧客への移動を模索すると考えられます。

また、新規顧客群と考えられる Segment 1,3 のクラスタ内にいるユーザーに対しても、休眠顧客にならないように、そして優良顧客になってもらうためにもその顧客がどういったものを購入しているかを分析し、メルマガを送るなどして顧客との接点を増やさなければならないと考えるでしょう。

こういった情報をこのレポートの可視化により読み取ることができるようになります。
また、こういった情報を顧客分析の素人である私のような新人エンジニアにも読み取ること可能となるということは、「データの民主化」を叫ばれる昨今にはよいことなのではないでしょうか。

終わりに

2 回に分けて BigQuery ML と Dataportal を利用してお手軽に購買データから RFM 分析を行いました。
Google Cloud のサービスを利用して、簡単に顧客分析を行うことができることを示せたのではないでしょうか。
実際の業務では顧客の購買データは毎日更新されるため、その①の中で作成した SQL を定期実行するための設定などが必要になると思いますが、今回のブログでは扱いませんでした。
SQL の定期実行が気になるという方は、「BigQuery スケジュールクエリ」で検索されることをお勧めします。

本テックブログがどなたかの参考になりましたら幸いです。
ありがとうございました。

ページのトップへ