Alteryx Designerでハマりがちなポイント

こんにちは、データアナリティクスチームのohsakaです。

以前、Alteryx Designerによるデータ加工を扱いました。(「AlteryxでPDF帳票出力ができますか?」)

本記事では、「Alteryx Disigner」においてハマりがちなポイントや頻出の操作をまとめています。検証に使用したAlteryx Designerの想定バージョンは2020.4.6です。

目次

Alteryx Designerとは?
1. 作業用に全てのデータを使用すると実行に時間がかかってしまう
2. 漢字を含むデータを扱うと文字化けしてしまう
3. 選択ツールで並び順が消えてしまう
4. 日付でファイル名を付けたい
5. バッチファイルを起動したい
6. 任意の列で値が存在するデータを抽出したい
7. 最初に登場した時のみ、フラグを立てる
8. 外部結合をしたい
9. 正規表現ツール以外で正規表現を扱いたい
10. 複数ファイルを一括で読み込みたい
まとめ

続きを読む

Pandasの集計結果をネストしたdictに変換

技研のまつけんです。

Pythonでデータの集計をする際はPandasが便利です。特にgroupby()とcount()やsum()やagg()を組み合わせると、大抵の集計は出来てしまいます。集計する方法などもサーチエンジンなどで検索すると豊富に例が得られます。しかしながら、その結果を取り出す (参照する) 方法については、なかなか情報が見つかりません。結局、index/columns/loc/ilocなどを組み合わせることで取り出すことにしました。今回は、groupby(…).count()の結果をループなどで取り出す方法や、Python標準のdict形式に変換する方法について紹介したいと思います。

続きを読む

縦持ち/横持ちデータの考察〜Tableauの最適なデータ構造を探る〜

はじめに

この記事は『CRESCO Advent Calendar 2021』の18日目の記事です。

みなさんこんにちは。データテクノロジーセンターの飯村北海です。

昨年度からできた部門で引き続き、[PR]Tableauなどを活用したBI導入サービスを提供しています。

もうすぐ2021年も終わりますね(昨年も書いた気がする…)。アドベントカレンダーのシーズンです。今年はあっという間の2021年でした。IT業界の皆様は今年も引き続き、リモートワークをされていた皆様が多かったのではないでしょうか?

私は数年ぶりに引っ越しをしました。第2子が生まれたことで住んでいた家が手狭になったことや、リモートワークがなかなか難しい環境だったこともあり、本格的なリモートワークに向けて引っ越しをしました。今は環境も整いそれなりに快適に仕事ができるようになりました。しかし、これから本格的にテレワークを始めるぞ!というのは今更かもしれません…

さて、今日の記事はデータ可視化に重要なデータ構造の話を取り上げたいと思います。

続きを読む

Tableau Online上のメタデータをMetadata APIを使って取得する

この記事は『CRESCO Advent Calendar 2021』5日目の記事です。

こんにちは、データテクノロジーセンターのn-satoです。

以前TableauOnlineまたはTableauServer上のワークブックやデータソースを管理できるツールを作りたいなと思い、Tableauが提供するREST APIを用いて実装しようとしました。
欲しい情報を取得するためにいろいろなREST APIのエンドポイントにリクエストを投げる必要があり、なかなか利用するのに苦労しました。

Metadata APIはエンドポイント1つに対し、GraphQLを使うことでエンドポイント1つでもいろいろ情報が取れるとのことです。
GraphQL自体使ったことがなかったので、どんな風に実装できるのか調査しました。

本記事ではPythonでMetadata APIでGraphQLのクエリを発行できるようになるまでを記事にしたいと思います。

続きを読む

女子プロゴルファー金澤志奈選手の成長を「Tableau」で見える化してみた

こんにちは、総合企画部の梶です。
普段のお仕事は、2021年からスタートした10か年グループビジョン『CRESCO Group Ambition 2030』の実現に向けて、中期経営計画推進、各種企画&推進を行っています。

今回は前回記事から約3年ぶりとなる、Tableau×女子プロゴルファー金澤選手の特集です!大変お待たせいたしました。
メインスポンサー企業として、また、お客様のDXを支援するIT企業として、金澤選手をデジタルに分析&見える化していきたいと思います♪

本記事はゴルフに関する多少マニアック?な話も入ってきますが、ゴルフを知らない方でも楽しめるようできる限り解説します。
金澤選手のファンの方はより一層ファンになっていただき(笑)、まだ機会がなくてファンになられていない方は、この記事をきっかけに金澤選手のファンになっていただければ幸いです。

続きを読む

PowerBIでGoogleアナリティクスのデータを取得してみた

こんにちは。システムズエンジニアリングセンター(SEC)の三輪です。

みなさんは、Power BIを使用したことがありますでしょうか?
私は業務でPower BIを試行する機会があり、そのときに悩んだGoogleアナリティクスのデータ取得について今回記事にしようと思います。

1.Power BIとは

Power BIはMicrosoft社が提供しているデータ可視化ツールです。
みなさんが使い慣れたExcelやPowerPointと同じ感覚で、簡単に分析レポートの作成をすることができます。
もちろんプログラミングの必要もありません。
また、無料(※)で使い始めることができるところもメリットの1つです。
(※容量が1GB/ユーザーまで)

続きを読む

脱エクセルは不要?Excel+Alteryxで社内データ活用

こんにちは。データアナリティクスチームの【もりし】です。

最近DX(デジタルトランスフォーメーション)という言葉が様々なメディアを通して広がっていることもあり、お客様から「もっと自社データを活用したい」という相談を受けることが増えています。

今回は「自社データ活用をはじめたいけれど何から手をつけて良いのかわからない」人に向けて、エクセル(Microsoft Excel)を長年使ってきた会社が便利なツール「Alteryx(アルテリックス / アルタリクス)」を導入してデータ活用を進める例を紹介したいと思います。

Alteryx(製品サイトページリンク)

当記事の前半は「社内データ活用時のシステム構成解説」、後半は「AlteryxのExcel出力機能紹介」となっています。
※興味のある片方だけでも読んでもらえたら嬉しいです

続きを読む

シンボリック・リンクを用いた分析対象データの管理ノウハウとシェルスクリプト

技術研究所のまつけんです。

技術研究所 (技研) では、画像 (静止画) データや動画データを分析対象として扱います。その際、分析対象のデータを間違えて消してしまったり、書き換えてしまったりすると大変です。今回は、私が実践している「間違いが起きない仕組み」について紹介したいと思います。具体的には、

  • オリジナルファイルを入れたディレクトリは書き込み禁止にし、
  • その隣に作業用ディレクトリを作成し、
  • オリジナルと同じディレクトリ構造を作り、
  • オリジナルファイルへのシンボリック・リンクを作成

します。もちろん、手作業でも出来るのですが、オリジナルファイルが多数ある場合などには自動化しないと大変です。そこで本記事では、そのために作成した、複数のファイルやディレクトリを扱うシェルスクリプトと、その作り方も紹介します。

続きを読む

クレスコで10年続いたアドベントカレンダーを振り返る

この記事は 『CRESCO Advent Calendar 2020』25日目の記事です。

みなさんこんにちは。データテクノロジーセンターの飯村北海です。

今年度から正式にデータ分析に関する専門の部門ができました。
[PR]Tableauなどを活用したBI導入サービス[PR]データ分析に関するセミナーなどのサービスを提供しています。

もうすぐ2020年も終わりますね。今更語ることではありませんが、今年は歴史的な大きな変換点だったと思います。読者の皆様は快適なリモートワークができましたでしょうか?

今日のテーマはクレスコのAdvent Calendarについてです。

実は今年で10周年なんです。

続きを読む

Tableauと私 ~Tableauを軸に身につけたスキル#1~

この記事は『CRESCO Advent Calendar 2020』 23日目の記事です。

こんにちは、 つかじゅん です。

前回、Tableauをこれから始める方へ向け「Tableau使いになるために知っておきたい3つのこと」を投稿しました。

今回、Tableauを通して得られた「データ分析スキル」を中心に紹介したいと思います。

対象読者

  • 新しい分野に挑戦したいと考えている方
  • データ分析に興味があり、何か初めてみたいと思う方
  • データ分析で必要な技術スキルがイメージできない方

続きを読む