こんにちは、経営企画室の梶です。

 

この記事は 『CRESCO Advent Calendar 2018』 8日目の記事です。エンジニアブログ初登場となります、よろしくお願いします。

普段のお仕事は、2016年からスタートした5か年ビジョン『CRESCO Ambition 2020』の実現に向けて、経営企画&推進をはじめ社内外のPR(Public Relations)活動やオフサイトミーティングの企画・運営、新卒&中途の採用活動などを担当しています。

「デジタル変革のリード」を掲げているクレスコでは経営企画室をはじめとしたバックオフィス部門でも、今回ご紹介するセルフBIツール『Tableau(タブロー)』やRPAを活用し、社員情報の見える化や新卒&中途採用レポーティングのデジタル化、クレスコ内部のデジタル変革に取り組んでいます。

と前置きが長くなりましたが、アドベントカレンダーは一種のお祭りみたいなものなので、誰でも?楽しめる内容でお届けしたいと思います!

スポンサー選手 金澤志奈プロについて

2018年、当社は女子プロゴルファーの金澤志奈プロとスポンサー契約を締結いたしました!!

私も数年前からゴルフを始めています。これまで実際にプロのツアーを観戦したことはなかったのですが、金澤選手の応援をきっかけに、すっかりツアー観戦の魅力にはまってしまいました。

洗練されたプロの技術・プレーが目の前で繰り広げられ、試合中の選手と一緒にラウンドしながら一喜一憂できます。テレビでは得られないリアリティ・迫力があり、とてもエキサイティングなのです!!

そこで今回はツアールーキーとして1年間戦い抜いた金澤選手の今シーズンを、『Tableau 』を使って見える化し、分析してみたいと思います!

女子プロゴルフのトーナメントについて

本記事を読んでくださっている方は、ゴルフに詳しい方もそうでない方もいらっしゃると思いますので、この記事を読んでいただくにあたって、知っておくとより理解できる&楽しめるであろうポイントを簡単にご紹介します!

  • 女子プロゴルフのツアートーナメントは毎年3月から始まり、11月頃まで全国各地で行われます。
  • 春先や寒くなってくる秋の季節は暖かい場所で行われ、夏は北海道や避暑地で開催されるようです。
  • 1つの大会は3日間(メジャー大会など大きな大会は4日間)で行われ、初日・二日目が予選ラウンド、上位トップ〇位(だいたい50~60位)までが決勝ラウンドに進出できます。
  • 予選を通過できないと決勝ラウンドは出場できない&賞金も一切もらえません(厳しい世界です・・・)
  • 毎年賞金ランキング50位までが翌年のトーナメント出場が確保される「シード権」が与えられます(金澤選手の今シーズンのランキングは57位、あと一歩でした・・・!!)

材料~用意するもの~

材料はこちらです。今回の記事を執筆するにあたって事前にLPGAにデータ利用の許可をいただきました。LPGA関係者の方々、この場を借りてお礼申し上げます!!
#利用するデータの著作権等々は事前に確認するようにしましょう。

もの 用途 備考 入手先
Tableau Public セルフBIツール『Tableau』の無料版です。今回は2018.3の最新Verをインストールします。 作成したレポートやデータは全世界に公開されるため、利用データの内容にはご注意ください こちら
 金澤志奈選手のデータ  今回は一般社団法人日本女子プロゴルフ協会(LPGA)に公表されている記録を用います  こちら
 Excel  日本を代表する表計算ソフトです  バージョンは問いません  お任せします

下ごしらえ~分析の前段階~

いきなり分析に入ることはできません。実は分析案件の中でも多くの割合を占めるのがこの下ごしらえのフェーズです。前述のLPGAのリンクを見ていただくとわかりますが、そのままデータを使えるわけではないので、少し加工作業が必要となります。

Tableau Publicをインストール

材料に記載したリンクからダウンロード、5分もかからずにインストールできると思いますので、ここは迷わず進められると思います。

LPGAサイトからデータをコピーしてExcelに貼り付ける

  • 2018年開催のトーナメント情報
    1. https://www.lpga.or.jp/tournament/lpgatour/
  • データの加工が必要

    2でコピペしたExcelはこのような形に加工します。

    各トーナメントページから会場情報、都道府県情報を以下の形式に加工します。

    TableauではExcelやCSV形式のデータをはじめ、様々なデータソースに接続できます。成績のデータと大会のデータをTableau上で読み込んで、2つを結合(リレーション)させます。これで準備完了です!

    調理~いよいよ分析!~

    下ごしらえも終わり、いよいよ分析です!Tableau Publicでは様々なデータが可視化できます。ちなみにTableauで作ったレポートを巷ではViz(ビズ)と呼んだりします。

    今回はTableauの中でも目で見て楽しい地理情報を使ったVizを作成したいと思います♪

     

    各会場には都道府県情報を持たせているので、大会ごとの順位を日本地図にプロットしてみます。そのVizがこちらです。※「都道府県  Tableau」でググるとたくさんHitしますので、作成の細かい手順は今回割愛します。

    一見よさそうにみえますが、実はこれだとうまくデータを表現しきれていないことが判明しました。それは、同一都道府県で複数大会が行われていると、一番成績のいい大会の結果しか地図上は表示されてないようです。例えば、兵庫県では4回トーナメントが開催されていますが”11T(タイ)”のみが表示されています。

    これでは正しい分析ができないので修正していきたいと思います。Try&Errorを繰り返しながら求めるVizを作成していけるのもセルフBIツール『Tableau』のいいところですね!!(なんだか営業さんみたいになってきました。)

    マーク欄を「マップ」から「円グラフ」に変えると、都道府県上の表示が円グラフに変わります。と同時に、兵庫県も3色(画像だとわからないのですが、2回予選落ちしています・・)になりました。併せて、賞金がもらえない”予選落ち”をグレーにし、マップにメリハリをつけてみました。一つ前のビューと比較していかがでしょうか?

    色を見ていただくと「西日本で出場した試合の方が上位成績に来ているのでは?」皆さんもそんな気がしてきませんか(笑)?こうした視覚的にインサイト(洞察)を得られるところがTableauの魅力のひとつです。ここをもう少し掘り下げていきたいと思います。

    記事冒頭にもお伝えした通り、シーズンは春から秋まで行われ、春先は暖かい沖縄や西日本で大会が開かれることが多いです。そこで、「得意な季節・苦手な季節はあるのかな?」が気になったので、季節の軸で分析してみたいとおもいます。Tableauではデータのグルーピングも簡易なものであればノンコーディングで行えます。「季節」という項目を新規に作成し、「春」「夏」「秋」でトーナメントの開催月日をグルーピングしていきます。

    新規に作った項目は「フィルター」エリアにドラッグ、右クリックで「フィルターを表示」を行うと右側に「季節」のフィルタが表示されます!試しに”春”で見てみます。

    続いて”夏”。むむむ?グレー(予選落ち)が多いですね。。今シーズンの予選落ちは全部で12回(T T)、そのうち半分の6回がこの夏となっています(T T)
    一方で避暑地である北海道開催では3回中2回で上位(それもかなりの!)の成績です!

    この時点で「得意な季節・苦手な季節はあるのか?」という仮説に対しては少し傾向が見えそうな気がしてきました。本当にそうなのか?外部のオープンデータとして公開されているお天気データを使って分析してみたくなりますね。楽しくなってきました♪

    と、キリがないので今回はこの辺でやめておきます(笑)

    まとめ

    いかがでしたか?ユーザが思いついた視点で自由に分析をすることができ、表現力豊かなダッシュボードで相手に視覚的に訴えることができるのがセルフBIツール『Tableau』の最大の特長だと思います。

    しかし、何をどこまで分析するか?目的・ゴールが不明確だと「で、何がいいたいんだっけ?」となりかねませんので、実際の業務・案件ではその点注意が必要です。

    今回作成した金澤志奈選手の分析VizはTableau Publicに公開されています。ぜひ触ってみてください。

    また、おまけでLPGA 100人ほどの選手の記録データを使って選手比較&分析用のVizも作成してみました!!好きなゴルフ選手を比較&分析してみたり、セルフBIを体験してみてはいかがでしょうか!?

    ここまで読んでいただきありがとうございました♪

    <CRESCOデータ分析サービスの紹介ページはこちら>
    https://www.cresco.co.jp/service/data_analytics/