Analytics

SAS初心者のとき困ったところ戸惑ったところ

この記事は 『CRESCO Advent Calendar 2018』 25日目(最終日)の記事です。

今年も最終日担当、金融ソリューション事業部、兼 3D円グラフ撲滅委員 所属のりーだーです。

今回はSASを勉強し始めた初心者のとき困った・戸惑ったところを思い出しながら取り上げていきたいと思います。

SQL使いから、SASを使いはじめて、もうすぐ5年。
SASユーザー総会で発表したり、経験を積むにつれ、だんだん困っていたところを忘れて、初心者の気持ちも忘れてきたので、備忘録として残そうと思った次第です。

SASとは?

 SASと言うと、毎回SASの説明をするくらい私の周りでは残念ながら認知度が低いので、、、簡単に説明します。

続きを読む


シンプソンパラドックスの可視化を3手法で【Excel/BI/R】

この記事は 『CRESCO Advent Calendar 2018』24日目の記事です。

こんにちは。データアナリティクスチームの飯村北海です。

昨年に引き続き[PR]データ分析やっていますと言いながらも、Tableauを使用したダッシュボード開発のプロジェクトに参画しています。
が、Rを使った分析プロジェクトも少しずつ増えてきています。なので今回はR+αの話でブログを書きたいと思います。

本当はTableau+Rによる記事を描きたかったのですが、どうやらRにデータを渡すためには一度SUMなどの集約関数を使用しないといけないようなので、ちょっと当初の目論見から外れてしまったため、今回の記事はちょっと趣向を変えていくつか出ているBIツール等との比較記事を書いてみました。

シンプソンのパラドックス

本題の前に、突然ですが、「シンプソンのパラドックス」についてご存知でしょうか?

私自身、このキーワードを最近知った(参考文献.1)のですが、Wikipedia:シンプソンのパラドックス(2018年12月中旬の本記事執筆時)によると、

母集団での相関と、母集団を分割した集団での相関は、異なっている場合がある。つまり集団を2つに分けた場合にある仮説が成立しても、集団全体では正反対の仮説が成立することがある。

とのことです。

続きを読む


あなたにもできる!Tableau地理データ分析の始め方

この記事は 『CRESCO Advent Calendar 2018』 17日目の記事です。

こんにちは。データアナリティクスチームの【もりし】です。
Tableauでのデータ活用案件を担当しつつ、社内でもBI(データ可視化)を広めようと頑張っています。

最近はクレスコ社内でTableau体験会を開いているのですが、興味を持ってくれる人が少しずつ増えてきてくれています。
体験会ではじめてTableauを触る人に一番人気のテーマが「地理情報の可視化」です。やはり簡単に地図にデータがプロットできると気持ちいいものです。

本記事ではTableauで地理情報を活用する流れをまとめています。
30分~1時間ほどで試せますので、ぜひ一緒に手を動かしてみてください。

続きを読む


【Tableau】日付関数を使った2つの計算方法を作ってみた【DATEDIFF/DATENAME】

この記事は 『CRESCO Advent Calendar 2018』 15日目の記事です。
システムズエンジニアリングセンターの垣屋です。

今回は日付関数を使用した2つの計算方法についてご紹介します。

  1. 前年同月の売上増減率の算出
  2. 1、2、3週間単位のサイクルで日付をスライドする

レポートやグラフを作成するにあたり、日付を使用した計算フィールドを作成する頻度は高いと思います。
日付のディメンションは軸やフィルタなど、様々な使い方ができる便利なディメンションです。
実際にプロジェクトで私が作った計算の考え方を使用し実装しています。

続きを読む


Tableauでテキスト(CSV)やExcelデータを抽出化してコマンドラインで定期更新する

この記事は 『CRESCO Advent Calendar 2018』9日目の記事です。

こんにちは、データアナリティクスチームのさかいです。
あと2週間ぐらいするとクリスマスですね!
仕事や勉強が忙しい時期だと思いますが、
イベントにかこつけて各自積極的においしいものを食べていきましょう。

さて、今回はBI分析ツールの一つであるTableauを利用するときに、
よくありそうなシチュエーションだけど、
意外と手順のなかった方法についてブログを書いてみようと思います。

対象読者

データ分析ツールの1種である「Tableau(DesktopおよびServer)」を使用する方。

分析したい内容に対して新たにデータベースを作るほどでもないけど、
定期的に更新されるテキストデータ(CSVやExcel)があるので
それらを使って運用したい、という方が対象になるかと思います。

続きを読む


当社スポンサー選手をTableau Publicで見える化してみた話

こんにちは、経営企画室の梶です。

この記事は 『CRESCO Advent Calendar 2018』 8日目の記事です。エンジニアブログ初登場となります、よろしくお願いします。

普段のお仕事は、2016年からスタートした5か年ビジョン『CRESCO Ambition 2020』の実現に向けて、経営企画&推進をはじめ社内外のPR(Public Relations)活動やオフサイトミーティングの企画・運営、新卒&中途の採用活動などを担当しています。

「デジタル変革のリード」を掲げているクレスコでは経営企画室をはじめとしたバックオフィス部門でも、今回ご紹介するセルフBIツール『Tableau(タブロー)』やRPAを活用し、社員情報の見える化や新卒&中途採用レポーティングのデジタル化、クレスコ内部のデジタル変革に取り組んでいます。

と前置きが長くなりましたが、アドベントカレンダーは一種のお祭りみたいなものなので、誰でも?楽しめる内容でお届けしたいと思います!

続きを読む


Re:dashでAmazonS3のデータをニアリアルタイム表示させようとしたときに困ったこと

こんにちは、データアナリティクスチームのハガーです。

私はElastic StackのKibanaを使用して可視化することが多いのですが、今回Amazon S3にセンサー系のデータを出力している環境で可視化を行う機会があったため、Amazon AthenaとBIツールのRe:dashを使用して可視化を行うことにしました。

その際、Auto Refresh機能を使いデータをニアリアルタイム表示したかったのですが、手間取ってしまったので備忘録的に記載します。

続きを読む


TableauでABテストの検定結果を表示する方法

こんにちは。データアナリティクスチームの【もりし】です。

<CRESCOデータ分析サービスの紹介ページはこちら>
https://www.cresco.co.jp/service/data_analytics/

今回はTableauを使って、できそうで…なかなかできない…でも頑張ればできる!「統計検定」に挑戦してみます。
サンプルファイルはこちらからダウンロードできますので、お試しください。
※流用の際は自己責任でお願いします

やりたいこと

Webサイト分析でよく使われているABテスト結果をTableauで表示してみました。
Webサイトのデザイン
・cards layout
・single column layout
のどちらが成果につながりやすいか?を比較しています。

続きを読む


データ分析者を困らせるためのデータの作り方

この記事は 『CRESCO Advent Calendar 2017』25日目(最終日)の記事です。

第1金融ソリューション事業部、兼 3D円グラフ撲滅委員 所属りーだーです。

◆はじめに

データ分析者の最も時間のかかる作業は、その名の通りデータの「分析」と思われがちですが、その前の作業、データ前処理に最も作業時間がかかります。
その作業時間は、全体の8割とも、それ以上とも言われています。

データ前処理とはデータを集めたり、データに問題がないか確認したり、分析しやすいように加工したりする作業のことです。

もし提供されたデータが使いづらい、扱いづらいものであると、データ前処理の作業時間は膨大な時間になります。

今回は、どんなデータを渡すと、データ分析者は困ることになるのか、というお話です。

続きを読む


R言語の分析レポートを4枚のPowerPointに出力する

この記事は 『CRESCO Advent Calendar 2017』22日目の記事です。

こんにちは。データアナリティクスチームの飯村北海です。

最近は[PR]データ分析と言いながらも、どちらかというとBI寄りのTableauを使用したダッシュボード開発のプロジェクトに参画し、要件定義フェーズでレポートの設計をしているので、分析自体ををすることが少なくなってしまいました。RStudioを起動することも少なくなりましたが、今回はRの話でブログを書きたいと思います。

以前、社内のプロジェクトでデータ分析をした際に報告形式はRMarkdown + knitrによるHTML出力を採用したのですが、社内イントラのWebで公開するようなものでもなかったので本当はPowerPointでの報告をしたいなと思っていました。

しかし、データ分析における報告にはグラフが出てきます。何十枚と次元を変えて出力されたグラフをPower PointのスライドやWordに貼り付けていくのはかなり苦行です。Webシステム開発の画面テストも自動化が可能な時代です。「神エクセルに貼り付ける」なんてもってのほかです。「手作業でやるのはできる限り避けたい!」ということもあり以前はHTMLで自動生成をせざるをえませんでした。

ということでRでPowerPointが出力できたらとても嬉しいので頑張る、というところが今回のブログの内容です。

続きを読む