こんにちは。データアナリティクスチームの【もりし】です。
この記事は 『CRESCO Advent Calendar 2019』 4日目の記事です。
本日は当ブログでも何回か紹介している「Tableau」というBIツールのノウハウを紹介します。
※Tableauって何?という方は、まずは公式の紹介動画見てみてください
https://www.tableau.com/ja-jp#hero-video
先日、Tableauをみんなで一緒に使いながら学ぼう!というセミナーの講師をしました。
TableauはUIを意識して作られているだけあって、初めて触る方も基本的にサクサク理解してくれました。「LOD表現以外」は…
LOD表現は他の関数とは違って、直感的ではなく難しいんですよね。
ということで「LOD表現を理解するためのダッシュボード」を作りました。
これでトレーニングすればあなたもTableau中級者!
LOD(Level of Detail)表現とは…
計算したい粒度のレベルをコントロールできる、Tableau特有の3種類の関数のことです。
・INCLUDE : 粒度をより細かなレベルにして計算する
・EXCLUDE : 粒度をより大きなレベルにして計算する
・FIXED : まったく個別のレベルで計算する
ある会社の都道府県別平均売上が下記の通りとします。
通常はディメンションを増やすと、下記のようにTableauが自動で平均を計算し直してくれます。
ここで、例えば
{ FIXED [都道府県] : AVG([売上]) }
という計算フィールドを作ると、下記のような結果となります。
FIXEDを利用して、他の要素に影響されずに「都道府県」のみで計算した平均値を作れるわけです。
下記リンクからダウンロードできます。
https://public.tableau.com/views/LOD_15754122143050/PracticeLOD?:display_count=y&publish=yes&:origin=viz_share_link
※動作には最新バージョンの「Tableau Public(無料)」または「Tableau Desktop(有料)」をインストールする必要があります
開くと下記のようなシートがあります。
それぞれ
AVG([売上])
{ INCLUDE [サブカテゴリ] : AVG([売上]) }
{ EXCLUDE [サブカテゴリ] : AVG([売上]) }
{FIXED [都道府県] : AVG([売上]) }
の結果を1セルに表示しています。
このシートから行のディメンションを削除したり増やしたりして自分の予想と同じ数値になるかを確認しましょう。
最初の状態からサブカテゴリを削除しても、EXCLUDEとFIXEDの値は変化しません。
INCLUDEの場合だけ値が変化し、さらに単純な平均値ともずれている理由を考えてみましょう。
このように、シートの色々なところを変化させて表示の変化を観察すると、LOD表現の使用感覚が次第に身についていきます。
普段あまり使っていないかもしれませんが、メジャーの値を表示する際に「属性」という選択肢があります。
LOD表現で作成した集計関数をシートにドラッグ&ドロップした際にこの「属性」がデフォルトで選択されることがあります。
属性とは「集計対象のデータが全て同一ならその値を表示、異なるなら*を表示」という関数です。
Tableauに慣れた人は「集計対象が全て同一なら平均(AVG)を使っておけばいいか」という思考をしがちです。
作った本人は問題無いかもしれませんが、Tableau初心者が後からLOD関数部分を読んだ際に「なんでここで平均使っているの?」と混乱します。
チームでTableau作業をする際は「属性」を使うか「集計」を使うかルールを決めておくと良いでしょう。
下記のデータを集計するとします。
A組の平均は
(2+3+4)/3=3
B組の平均は
(1+2+3+4+5+6+7)/7=4
ですね。
全体の平均を求めるときは…
((2+3+4)+(1+2+3+4+5+6+7))/10=3.4
という計算になります。
この際、次のような計算間違いをしていまう人がいます。
(A組の平均+B組の平均)/2=(3+4)/2=3.5
リアルな数字を見ていれば気づける人も、集計されたグラフを眺める際やTableauの関数を組み合わせている際に間違いがちです。
よくよく注意しましょう!
以上、できるだけシンプルにLOD表現の習得方法をまとめてみました。
マスターできた人は「Tableau LOD表現」でググって実際の使用例を探してみてください。作れるダッシュボードの幅がすごく広がりますよ!
~最後に宣伝~
弊社データ分析サービスではTableauダッシュボードの作成サービス等もカバーしています。詳しくは下記ページをご覧ください。
<CRESCOデータ分析サービスの紹介ページはこちら>
https://www.cresco.co.jp/service/data_analytics/