Technical Blog テクニカルブログ
  1. HOME
  2. テクニカルブログ
  3. NI+C SAS<第9弾>意外と便利な散布図のご紹介

NI+C SAS<第9弾>意外と便利な散布図のご紹介

投稿者:SASソリューション担当

NI+C SAS<第9弾>意外と便利な散布図のご紹介

日本情報通信株式会社のSAS担当です。

統計を勉強した方なら、「散布図」はご存じですよね。
「散布図」って、相関関係を確認するグラフという認識でしょうか。
総務省統計局の「なるほど統計学園」(※リンク) にもそのように書かれています。

でもこの散布図、別に相関なくてもつかえるんじゃないか、というのが今回の内容です。

 

  目次
     1. SAS Visual Analyticsでの散布図の書き方

     2.散布図の使い方提案
        ①2項目の分布を立体的にとらえる
        ②4象限のマトリックスとして利用する
        ③条件が似ているグループの比較

     3.まとめ

1.SAS Visual Analyticsでの散布図の書き方

今回もSASのトライアル環境を使用して実施しています。
※トライアル環境の設定方法はこちら→SAS Viyaのトライアル登録

散布図を書くのは簡単です。
左側の「データ」からメジャー項目を2つクリックして選び、ドラッグアンドドロップするだけです。
SAS_SCATTER_01.jpg

ここで1つ注意点があります。
先にクリックして選択した項目が横軸(X軸)になります。
もし、逆が良い場合には、右側の「データ役割」で変更しましょう。
メジャーの上側が横軸(X軸)、下側が縦軸(Y軸)になります。
SAS_SCATTER_02.jpg

近似線を表示したい場合には、右側の「オプション」から設定しましょう。
SAS_SCATTER_03.jpg   SAS_SCATTER_04 .jpg

2.散布図の使い方提案

①2項目の分布を立体的にとらえる

次の散布図はまったく相関はありませんね。
SAS_SCATTER_05.jpg

そして、同じようなデータが多くて、プロットが密集していますが、なんとなく、「2つのかたまりがある」ようには見えますね。
右側の「散布マーカー」で透過度を90%に変更してみましょう。
SAS_SCATTER_06.jpg

そうすると、「2つのかたまり」の中でも、濃さが変わって見えますね。(濃いところにデータが集中しています。)
SAS_SCATTER_07.jpg

このように、まるで3Dで浮き上がったかのように2項目の分布をとらえることができます。

②4象限のマトリックスとして利用する

次の散布図は「データサイエンティスト協会スキル定義委員」の「データサイエンス100本ノック(構造化データ加工編)」のデータを加工して作成した、架空のスーパーマーケットの店舗ごとの「顧客単価」と「顧客数」を散布図にしたものです。
SAS_SCATTER_08.jpg
こうなると、相関はまったく関係なく、左右と上下でグループ分けして戦略を考えてみたくなりませんか?

SAS_SCATTER_09.jpg

このように、ビジネスでよく使われる「4象限のマトリックス」としても利用可能なのです。

③条件が似ているグループの比較

②と同じ散布図を別の見方で観察してみます。

例えば、”狛江店”と”二ツ橋店” “大和店”は「顧客数」は同じ30人くらいですが、「顧客単価」はだいぶ違いますね。
SAS_SCATTER_10.jpg

「顧客数」が同じということは、この3店舗の立地条件は近いのかもしれません。
「顧客単価」は”狛江店”だけだいぶ違いますね。もしかしたら”二ツ橋店” “大和店”を参考にすると改善策が見つかるかもしれません。
例えばリストコントロールとクロス表のオブジェクトを追加し、選択した店舗の詳細を簡単に比較するのはいかがでしょうか。
SAS_SCATTER_11.jpg
このように、条件が似ている(同一の並びにある)グループ内の違いなどを見つける事も可能です。

3.まとめ

散布図の使い方をいくつかご紹介いたしましたが、いかがでしたでしょうか。
SAS Visual Analyticsで作成できるグラフはまだまだたくさんあります。
これからも機会があればご紹介出来たらと思います。

ご覧いただきありがとうございました。

ページのトップへ