前回、Tableauをこれから始める方へ向け「Tableau使いになるために知っておきたい3つのこと」を投稿しました。
今回、Tableauを通して得られた「データ分析スキル」を中心に紹介したいと思います。
- 新しい分野に挑戦したいと考えている方
- データ分析に興味があり、何か初めてみたいと思う方
- データ分析で必要な技術スキルがイメージできない方
- データの前処理スキル
- データ視覚化スキル
私がデータ分析業務に参画したのは2019年2月となります。現時点(2020年12月)までの約2年間、複数のお客様へTablaeu導入支援を行ってきました。
お客様の業界としては、飲食/航空/金融・保険/IT・通信など様々です。
主な業務内容としては以下2つとなります。
- ダッシュボード作成
- データ共有基盤構築
これらの実務経験を通して得られたデータ分析スキル(今回は「ダッシュボード作成」)の内2つを以下に記載します。
データを視覚化するにあたり、データの前処理スキルが必要となります。
データは常に見やすく、まとまって連携されるものではありません。
上図のように多くの流入元からデータが発生します。データを視覚化するにあたり、データを収集・加工(データクレンジング)することが大前提です。
データを加工する際、ETLツールと呼ばれるもので作業をすることが多いです。
代表的なETLツールとして、
- Alteryx(アルテリックス / アルタリクス)
- Talend
など様々あります。私はTableau社が提供しているTableau Prepを操作する機会が多いです。
※Tableau PrepのGUI画面。(青枠・インプットデータ/緑枠・アウトプットデータ)
私が苦労した経験として、1000列近い横持ちのデータを集計しやすいように加工することでした。データを活用目的毎に分割し、横持ちを縦持ちへ変換(ピポッド)することで難所を乗り越えました。
データの収集・加工を経て、ようやくデータの視覚化を行います。
私が視覚化をするうえで、特に重要と考えているのは以下です。
- 色
- 比較対象の明確化
- 配置
とあるスーパーストアの年度毎の売上内訳を表現しています。左は小カテゴリ毎、右は大カテゴリ毎で色分けしています。
左はどこから見て良いかわかりませんが、右は各色毎に傾向が掴めますよね。一目で理解できる表現をするために、色は使いすぎではいけません。
一般的に、一つのダッシュボード(帳票)内に多くても最大7~8色までが人の理解できる色数と言われています。私はよりシンプルな表現を意識し、3~4色で収まるように心がけています。
とあるスーパーストアのカテゴリ毎の売上額と目標額を表現しています。左はテキスト、右はグラフで表現しています。
左は1つ1つの数字を目で追わないと理解できませんが、右は直感的に理解できますよね。左は認知負荷※が高く、右は低いと言えます。
※認知負荷 : 情報を理解しようとする際に生じる脳への負荷
比較対象を明確にし、目的に適した表現方法を思案する必要があります。
私もデータ分析業務に参画した当初は、左の様なダッシュボードを作成し、オーディエンス※に活用されない苦い経験をしました。せっかくデータの収集・加工をして作ったダッシュボードですから、オーディエンスに活用されるダッシュボードを提供したいものです。
※オーディエンス : ここでは、ダッシュボードの閲覧/活用を行う利用者を指す
とあるスーパーストアの収益の概要を1つにまとめたものです。一見すると左右どちらも良さそうに見えます。ですが、左は読み手の興味や目線を意識できていません。特に「売上」や「利益」は本ダッシュボードの中では重要な情報にあるにも関わらず、左のダッシュボードでは一番下にあります。また、概要をまとめたダッシュボードですから、都道府県毎の内訳表示もすべて数字を追いかける表現より、一目で把握できるような表現にする方が適切です。Tableauはグラフィカルな表現を得意としているため、ワンクリックで日本地図に売上をマッピングすることが可能です。
人間の目線は上図のように動くと研究されているそうです。そのため、1から4にかけて重要度が高いものを配置していくことが効果的です。作り手として、オーディエンスが何を求めているのかを把握し、ダッシュボードを見せた際の「思考のストーリー」を立ててリードすることが重要だと思います。
ここまでお読みくださってありがとうございます。
簡単ではありましたが、データを可視化するうえで必要な「データの前処理スキル」・「データ視覚化スキル」のイメージはつきましたでしょうか。
次回は「データ共有基盤」(TableauServer構築※)の導入/運用経験を通して得られた技術スキルを中心に紹介したいと思います。
※TableauServer : Webブラウザを通して、オーディエンス全体へダッシュボードを共有するプラットフォームです。