こんにちは。システムズエンジニアリングセンター(SEC)の三輪です。
みなさんは、Power BIを使用したことがありますでしょうか?
私は業務でPower BIを試行する機会があり、そのときに悩んだGoogleアナリティクスのデータ取得について今回記事にしようと思います。
目次
Power BIはMicrosoft社が提供しているデータ可視化ツールです。
みなさんが使い慣れたExcelやPowerPointと同じ感覚で、簡単に分析レポートの作成をすることができます。
もちろんプログラミングの必要もありません。
また、無料(※)で使い始めることができるところもメリットの1つです。
(※容量が1GB/ユーザーまで)
さっそく本題ですが、Googleアナリティクスのデータを取得する方法を3つの手順にわけて紹介していきます。
まず、Power BI Desktopを開き、ツールバーのホームタブから「データ取得」というボタンを押下します。
表示されたメニューバーの1番下にある「詳細…」を押下します。
「Google アナリティクス」を選択し、「接続」を押下します。
”google”などで検索して表示を絞ると見つけやすいです。
Googleアナリティクスのサインインが出てくるので、サインインボタンを押してサインインを完了させます。
このとき、Googleのアカウントアクセス承認ポップアップが表示されるので、「許可」を押下してください。
サインインが完了したら、”現在サインインしています。”と表示されていることを確認して、「接続」ボタンを押下します。
Googleアナリティクスへの接続が成功すると、以下のようなナビゲーター画面が表示されます。
つづいて、Googleアナリティクスのデータを選択してインポートします。
ナビゲーターに表示にされているデータの中から、
分析に必要なデータのチェックマークにチェックをつけ、「読み込み」ボタンを押下します。
以下にWebサイトのデータ分析でよく使いそうな指標名とデータをまとめました。
数式を使って出力する指標のデータは、手順3で使用します。
私は、以下に記載のデータすべてにチェックをつけてインポートしました。
■ データをそのまま使える指標
指標名 | データ |
---|---|
日付 | Time > Date |
セッション | Session > Session |
ページ | Page Tracking > Page |
ページビュー数 | Page Tracking > PageVIews |
ページ別訪問数 | Page Tracking > Time on Page |
閲覧開始数 | Page Tracking > Entrances |
■ 数式を使って出力する指標
指標名 | データ (数式に使用するために以下のデータを取得) |
---|---|
平均ページ滞在時間 | ・Page Tracking > Exits ・Page Tracking > Time on Page(ページ別訪問数) ・Page Tracking > PageVIews(ページビュー数) |
直帰率 | ・Session > Bounces ・Session > Session(セッション数) |
離脱率 | ・Page Tracking > Exits ・Page Tracking > PageVIews(ページビュー数) |
データの取得は、私が1番時間のかかったところです。
Googleアナリティクスの指標名や指標の詳細などを調べながら、指標を表示するために必要なデータを探す必要があります。
ちなみに、ページのタイトルは、Page Tracking配下のPage Titleで取得することができますが、ページとページタイトルが必ず1対1にはならないため、上の表に記載した指標たちとページタイトルを同時に取得しようとすると、おかしなデータになってしまいます。
私は、ページとページタイトルが1対1になる別テーブルをPower queryを用いて作成するなどしてレポートに出力させましたが、あまり効率のよい方法とは言えないため、今回は説明を省かせていただきます。
また、複数に分けてデータをインポートすることも可能ですが、データ更新が遅くなったり、
ドリルダウンが上手くいかなかったり、データの紐づけが面倒だったりするので、できるかぎり1つのテーブルにすることをお勧めします。
手順2で取得した、■ 計算で出力する指標 についてデータ分析で使用する指標に変換するために、新しい列を追加します。
手順2のデータ取得で作成されたテーブルにカーソルをあてると表示される「…」ボタンを押下し、
表示されるメニューバーから「新しい列」を選択します。
テーブルのなかに、「列」が追加され、ツールバーに列ツールタブと、その下に数式バーが表示されていることを確認してください。
数式バーを編集していきます。
「列」を指標名に変換し、「=」の後に数式を入力します。
以下に平均ページ滞在時間、直帰率、離脱率の数式を紹介します。
数式の意味については、DAX関数を調べてみてください。
「’テーブル名’」の部分は設定されているテーブル名に変えてください。
指標名 | 数式 |
---|---|
平均ページ滞在時間(※) | FORMAT(SUM(‘テーブル名'[Time on Page]) / (SUM(‘テーブル名'[PageViews]) – SUM(‘テーブル名'[Exits])), “hh:mm:ss”) |
直帰率 | DIVIDE(SUM(‘テーブル名'[Bounces]), SUM(‘テーブル名'[Session])) |
離脱率 | DIVIDE(SUM(‘テーブル名'[Exits]), SUM(‘テーブル名'[PageViews])) |
※Googleアナリティクスでは、セッションの最終ヒットとなったページについてページ滞在時間を計算できません。そのため、平均ページ滞在時間の算出上は無視されることを考慮しての計算式にしています。
Power BIでGoogleアナリティクスのデータを取得する方法の説明は以上です。
このあとは、今回の記事では紹介できませんが、取得したデータを用いて自分だけのレポートを作成していきましょう!
Power BIでGoogleアナリティクスのデータを取得する方法について紹介いたしました。
ExcelやPower Pointに比べて、Power BIを使用している方はまだまだ少ないですが、
お客様にデータを用いて有用性を説明する際や、発表の資料としても、”伝わる資料”になります。
また、自分だけの分析レポートとしても簡単に作成でき、大いに活躍するはずです。
Power BIは今回紹介したGoogleアナリティクス以外にもさまざまなデータソースにアクセスすることができます。ぜひご活用ください!