こんにちは。データアナリティクスチームの【もりし】です。
今回はテクニカルな話ではなく、少しマネジメント目線の話をしたいと思います。
この記事は『CRESCO Advent Calendar 2020』 1日目の記事です。
データは重要な資源という意味で「新しい石油」と言われることがあります。
「各企業の中にデータという資源が眠っています。活用しないなんてもったいない!」
という言葉を聞いたことがある方もいるかもしれません。
私は企業のデータ活用を手助けする仕事を4年前にはじめました。
当初はエンジニアの立場、現在はエンジニアとマネジメントの中間くらいの立場で働いています。
そのような仕事の中で「データは石油のような資源とはちょっと違うな」と思うようになりました。
石油から精製されるガソリンの価値は「車に入れたら走行させることができる」ことにあり、誰でも知っています。
しかしデータは、そのデータを扱う人や企業それぞれにとって全く異なる価値となっています。
今回はアドベントカレンダーの場を借りて、
・データ活用とは何か?
・データ活用プロジェクトは何が難しいのか?
・プロジェクトの実際の進め方
・データ活用プロジェクトのチーム作り
についてまとめることで「何から手をつけていいの?」と困っている人の手助けができればと思います。
データ活用とはデータを使って「価値を生む」ことです。
一般的な企業にとって「価値を生む」とは
・売上の向上
・経費の削減
の2種類に分けられます。
(データを使って価値を生む例)
・顧客の行動ログデータを可視化して購買行動のボトルネックを発見し、ボトルネック解消施策を行う→売上の向上
・全顧客データの中からAIが「営業すれば買う可能性のある顧客or買わない顧客」を判別し、買うつもりのない顧客への無駄な営業を省く→経費の削減
4年前までは一般的なシステム開発経験しかないエンジニアだった私にとって、データ活用プロジェクトで一番難しいと感じる部分を説明します。
データ活用プロジェクトは、
①データを用意する
②データを加工する
③データを活用する
の順で進みます。
これは料理で例えるとわかりやすいです。
食材を調理して食事を行う。この過程で重要となるのが料理の作り方である「レシピ(マニュアル)」です。
料理のレシピを本、テレビ番組、インターネットなどで入手し、その通りに作れば料理を作ることができます。(もちろんレシピ通りに料理を作る技術は必要です)
データ活用プロジェクトの難しさは「レシピ(マニュアル)の流用がしにくい」点にあります。
なぜかというと、多くのデータ活用プロジェクトはデータと活用方法が決まる前にはじまるためです。
実際のプロジェクトは下記の4段階でプロジェクトを進めます。
食材とどんな料理を誰が食べるのかが決まる前に、調理方法だけを検討してもまとまりません。
よくある「データを使って何かしたい」とだけ決まっていて他に何も決まっていない状態がここにあたります。
「データを使って何かしたい」状態から脱出するには、業務を深く理解すること(理解できている担当者と協力すること)が重要です。
業務理解が進めば「何が売上の向上や経費の削減につながるのか?」=「何が価値を生むのか」がわかり、データ活用のアイディア出しができるようになります。
次に「どんなデータがあるのか?」を調査します。
データの量、質、つながり方を調査して加工方法の検討材料を揃えることを「データアセスメント」と言います。
料理を作る時に冷蔵庫の材料を確認するようなものです。
あると思っていた調味料が切れていたり、賞味期限切れで使えない食材があったりしますよね。
データ活用プロジェクトでも
「あると思っていたアンケート回答データの中身がほぼ空白だった」
「10年間貯め続けているはずのデータが実は毎年上書きされていて1年分しかなかった」
などがよくあります。
「どんなデータがあるのか?」と「何の価値を生むのか」を決めると、加工方法が検討できるようになります。
一般的なシステム構築の「設計」部分です。エンジニアの腕の見せ所ですね。
エンジニアに求められるスキルは「活用方法に合わせた加工方法を選択ができる」ことです。
「そもそもデータが足りていない」状態だと、いくらエンジニアのスキルが高くてもどうしようもありません。
その場合、どうすればデータを入手できるか?というプロジェクトに変化し、エンジニアと協力して考えていくことになります。
ここまでで各ポイントを明らかにした上で何をするかが決まりました。
「食材が揃い、レシピが用意され、食事をする人がいる」
こうなって初めて一連の流れを実践できるようになります。
このような状態を目指すのがデータ活用プロジェクトのマネジメントです。
データ活用プロジェクトは予測しにくい不確実なことだらけなのを前提に進める必要があります。
「活用方法が未確定」「どんなデータがあるか不明」という状態からスタートし、プロジェクトが進むと少しずつ全体が明らかになっていきます。
しかし、全体像が明らかになると「実は当初計画していたことと違うことがやりたい」となることが多いです。
チームで不確実性に対応するために「アジャイル開発(の1つであるスクラム開発)」を選択することが多いです。
いきなり大きなプロダクトを作りはじめるのではなく、短期間でできるだけ早く1つのプロダクトを作りフィードバックをもらえるようにします。
そのフィードバックが更なる業務理解につながり、より高い価値を生むプロダクトを目指せるようになっていきます。
データ分析プロジェクトを行うためのエンジニアは「システム構築スキル」「データ分析スキル」の大きく2つのスキルを要求されます。
しかし、「データ分析スキルを持ったフルスタックエンジニア」というような都合の良い人材はなかなかおらず、育てるには時間がかかります。
そこでコアチームに各種スキルを持った人材を集め、相互にスキルをフォローしつつフルスタックエンジニアを目指していきます。
一時的に、より高度なスキルが必要な場合は期間限定で専門チームでサポートする体制だと進めやすいです。
(専門チームのサポート例)
・基盤分析基盤構築→運用はコアチームに引継ぎ
・機械学習モデルのプロトタイプ作成→改善/運用はコアチームに引継ぎ
他に、チームの生み出すプロダクトの責任者であるプロダクトオーナーを1人必ず決める(エンジニアでも非エンジニアでも良いです)のは重要です。
オーナーを1人決めることで「価値を生むために何を作るか?」の意思決定を素早く行うことができます。
また、チームが健全に機能しているかチェック&サポートするスクラムマスターの担当者がいるとさらに良いでしょう。
チームのスキル不足を補いつつ効率的にプロダクトを作るためにツールの活用も検討します。
特にデータの前処理や可視化アプリケーションのためのツールは近年増えているため、ぜひ活用していきましょう。
コアチームでのデータ活用プロジェクトを続けていくと、プロジェクトの過程で業務理解やデータアセスメントが進みます。
プロダクトを生み出す過程で作られたアセットもチームの重要な成果です。
将来新しいデータ活用プロジェクトを立ち上げるときの初動がスムーズになる(経費削減)というメリットもあるため、ドキュメント等にまとめて残しておくと良いでしょう。
まとめると、下図のような体制になります。
私がこれまで携わってきたデータ活用プロジェクトは
「マニュアルに沿って間違いのないように作業を進める」
ものではなく、
「知らない土地を訪ねて現地の食材を使い、現地の人たちの味覚に合わせて食事を作る」
ようなものでした。
すべての企業が同じような価値観で同じ仕事をしているわけではないので、これは当然のことです。
今回はそんなプロジェクトを前にして困ってしまっている人へ向けてアプローチ方法をまとめました。
一筋縄ではいかないことだらけですが、やりがいがある仕事です。ぜひ挑戦してみてください!
~最後に宣伝~
弊社データ分析サービスはあなたの会社のデータ活用をサポートします。
詳しくは下記ページをご覧ください。
<CRESCOデータ分析サービスの紹介ページはこちら>
https://www.cresco.co.jp/service/data_analytics/