めざせ!『人工知能』エンジニア

こんにちは。先端技術事業部の高津です。

この記事は 『CRESCO Advent Calendar 2018』 4日目の記事です。
最近はAdvent Calendarでしか皆さんとお会いしないのがちょっと寂しいですね。
自分のせいなんですが 笑

さて、昨今巷で話題の人工知能ですが、クレスコでもサービスAIの代表ともいえるWatsonからPythonによるモデル構築まで幅広く人工知能に対応できる体制を築いています。
これまでにもいろいろなコンテンツを利用して育成を進めてきましたが、私を含めてエンジニアの皆さんが「人工知能」エンジニアになるため、最初の学習のために役立ちそうな情報を共有してみたいと思います。

人工知能エンジニアの種類

さて、人工知能エンジニアと呼ばれる人たちの分類分けをしておきたいと思います。
あまり意識されていませんが、人工知能エンジニアと呼ばれる人たちは、その中でさらに幾つかのカテゴリーに分けれられます。
人工知能を活用するという最終目的は変わりませんが、それぞれに求められることは大きく異なっていて、習得すべきスキルも異なるのでしっかり見ておきましょう。

機械学習エンジニア・モデルエンジニア

皆さんがイメージする”いわゆる”人工知能エンジニアです。
画像や音声などさらに細分化されるところもありますが、インプットデータからアウトプットを設定し(アウトプットに合せたインプットを考えることも多いですが)、実装に向けてライブラリやフレームワークの選定を行い、Pythonなどを用い実際の実装および学習を行わせます。
目的の結果が得られない場合は、モデルの再検討やデータの精査などの試行錯誤を行い、必要に応じてデータの前処理などについても実装を行います。

データサイエンティスト・データアナリスト

ビッグデータが認知され、企業がデータの価値を見直してから増えてきたエンジニアです。
ビジネスゴールの設定から、その分析に必要なデータの収集や構造化を行うなどデータ基盤を構築し、その後の予測/分析などを行い、新たな数理モデルの選択などを行います。
結果が保障されているものではないため、望む結果が得られるまで繰り返し試行錯誤を繰り返す必要があります。
また必要に応じBIツールを用いた可視化なども行います。

AI適用コンサルタント・セールスコンサルサント

顧客にどのような課題があり、その解決に向けてAI技術やAIサービスがどのように活用できるか?を顧客に提示し他のエンジニアと連携して顧客のAI利用を推進します。
現在のAIはすべての課題に汎用的に適用できるものは無く、多くの技術・製品に関する知識が必要で、柔軟に思考し解決策の検討、採用を行います。
分かりにくいAIの技術とその効果をしかりと理解いただくためのエバンジェリストとしての顔も持ちます。

学習教材

クレスコでは独自に開発を行った教育教材を使っていますが、初学者がもっとお手軽にアプローチできる教材を少しご紹介させていただきます。

Coursera
https://www.coursera.org/
Courseraはスタンフォード大学コンピュータサイエンス教授Andrew NgとDaphne Kollerによって創立された教育技術の営利団体です。
公開されているWebサイトでは、スタンフォード大学をはじめとする多くの大学が提供するコースをオンラインで受講することができます。
「Machine Learning」コースがあり、初学者むけの基礎講義からコーディングの演習もあるのも良いですね。
日本語字幕もありますが、少しわかりづらい部分もあるので英語字幕も含めて何度か受講することをお勧めします。
Udemy
https://www.udemy.com/jp/
言わずと知れた、世界最大級のオンライン学習サイトです。
人工知能・機械学習といったキーワードで多くの講座が登録されているので幾つか受講してみていいただき、自分のペースをつかんでもらうと良いと思います。
Pythonなど実装面においての講座も数多くあるため、うまく活用すると効果が出やすいサイトだと思います。
慣れてきたら自分も講師となって講座を公開するというのも良いですね。
Qiita
https://qiita.com/
Incrementsが運営するプログラミング情報のナレッジコミュニティ。日本最大級ですので皆さんよくご存じですでに利用されている方も多いのではないでしょうか?
こちらも人工知能・機械学習といったキーワードで多くの情報が登録されていますので、自分にあったものを選んでみてください。(探すのもなかなか大変ではありますが…)
Qiitaには前述のCoursera Machine Learningの受講まとめなどもあったりするので、たのオンライン教材とあわせて利用すると良いと思います。

どれも比較的わかりやすくまとめられていますが、それなりに時間は拘束されます。ある程度覚悟を決めてスタートしたほうが良いと思います。わたしも学習時間の確保に苦労しました…
実装等コーディングの知識などが求めれることも多く、サイトをなめて頭に入れるだけでなく、手を動かす事をお勧めします。

さて、そうやって知識やスキルを蓄えると自分がどれくらいのレベルに達したのか?を知りたくなりますよね。
次は資格やレベル認定について見てみたいと思います。

資格

人工知能に関連する資格は、前述のエンジニアの種類のように機械学習系、統計系、言語系に分類されます。
ここではそれぞれの代表的なものをご紹介させていただきます。
(とは言っても、まだまだ数が少ないというのが実際のところですが。)

G検定・E試験

一般社団法人 日本ディープラーニング協会が実施する資格試験です。
ディープラーニングに関する知識を有し、事業活用する人材(ジェネラリスト)と、ディープラーニングを実装する人材(エンジニア)の育成を目指します。
機械学習、ディープラーニングというとこの試験が一番有名ですね。私もG検定を受験し、無事に合格することができました。

G検定

概要 ディープラーニングを事業に活かすための知識を有しているかを検定する
受験資格 制限なし
試験概要・出題問題 120分、多岐選択式の知識問題226問、オンライン実施(自宅受験)
受験料  12,960円(税込) / 学生 5,400円(税込)

G検定はテキストも出ていますが、テキストに記載されている内容を丸暗記するのではなく、内容の理解と最新の情報にアンテナを張っておくことが重要になります。

E試験

概要 ディープラーニングを実装するエンジニアの技能を認定する
受験資格 JDLA認定プログラムを修了していること
試験概要・出題問題 120分の会場試験(全国の指定試験会場から、お申し込み時に選択)、小問106問の知識問題(多肢選択式)
受験料  32,400円(税込) / 学生 21,600円(税込) / JDLA正会員・賛助会員  27,000円(税込)

統計検定

日本統計学会が実施する、統計に関する知識や活用力を評価する全国統一試験です。
データに基づいて客観的に判断し、科学的に問題を解決する能力は、仕事や研究をするための21世紀型スキルとして国際社会で広く認められています。
高等数学の知識が必要となるためハードルは高いですが、上位級を目指してほしいですね。

試験の種類 試験内容
統計検定 1級 実社会の様々な分野でのデータ解析を遂行する統計専門力
統計検定 準1級 統計学の活用力 ─ データサイエンスの基礎
統計検定 2級 大学基礎統計学の知識と問題解決力
統計検定 3級 データの分析において重要な概念を身に付け、身近な問題に活かす力
統計検定 4級 データや表・グラフ、確率に関する基本的な知識と具体的な文脈の中での活用力
統計調査士 統計に関する基本的知識と利活用
専門統計調査士 調査全般に関わる高度な専門的知識と利活用手法

上記の中でも皆さんに目指してほしい統計検定についてもう少し詳しく記載しておきます。

統計検定 4級

概要 国際的通用性の視点から、統計表やグラフ、調査・実験,確率の基礎と活用の知識に関する学習の理解度を評価し、認証するための検定試験
受験資格 制限なし
試験概要・出題問題 60分、多岐選択式の30問程度、マークシート
受験料  3,000円(税込)

統計検定 3級

概要 統計学とその応用分野を専門とする大学教員が国際的通用性を重視した問題を開発し、統計活用力を評価し、認証するための検定試験
受験資格 制限なし
試験概要・出題問題 60分、多岐選択式の30問程度、マークシート
受験料 4,000円(税込)

統計検定 2級

概要 統計学分野の教育課程編成上の参照基準に示されている大学基礎科目レベルの統計学の知識の習得度と活用のための理解度を問うために実施される検定
受験資格 制限なし
試験概要・出題問題 90分、多岐選択式の35問程度、マークシート
受験料 5,000円(税込)

統計検定 準1級

概要 統計学分野の教育課程編成上の参照基準に示されている大学基礎科目レベルの統計学の知識の習得度と活用のための理解度を問うために実施される検定
受験資格 制限なし
試験概要・出題問題 120分、多岐選択式の20~30問程度、部分記述問題5~10問、論述問題3問中1問選択
受験料 5,000円(税込)

統計検定 1級

概要 統計学分野の教育課程編成上の参照基準に示されている大学基礎科目レベルの統計学の知識の習得度と活用のための理解度を問うために実施される検定
受験資格 制限なし
試験概要・出題問題 「統計数理」:90分(午前)、「統計応用」:90分(午後)、「統計数理」5問出題され、受験時に3問選択。「統計応用」4分野(人文科学、社会科学、理工学、医薬生物学)から申込時点で1分野選択。5問出題され、受験時に3問選択。
受験料 10,000円(税込)、統計数理のみ 6,000円(税込)、統計応用のみ 6,000円(税込)

つづいて実装レベル把握のための試験としてPython試験をご紹介します。

Python試験

一般社団法人Pythonエンジニア育成推進協会が実施する民間試験です。
すでに実施されているPython3エンジニア認定基礎試験に加えて、2019年夏にはPython3エンジニア認定データ分析試験も開始予定です。
機械学習のおかげでPython人気が沸騰中です。ぜひ皆さんもチャレンジしてみてください。

Python3エンジニア認定基礎試験

概要 Pythonの文法や基礎知識を問う内容となっており、これからプログラミングを学ぶ方や、初めてPythonに触れる方にも最適です。
受験資格 制限なし
試験概要・出題問題 60分、多岐選択式の40問(CBT)
受験料 10,800円(税込) / 学生 5,400円(税込)

Python 3 エンジニア認定データ分析試験

概要 データ分析の基礎知識および方法を問う試験です。 現在策定中で2019年夏の実施を目標としています。
受験資格 制限なし
試験概要・出題問題 60分、多岐選択式の40問(CBT)
受験料 10,800円(税込) / 学生 5,400円(税込)

※Python 3 エンジニア認定データ分析試験の内容は2018年11月時点の予定情報です。

おわりに

簡単にですが人工知能エンジニアになるための学習コンテンツなどについてまとめさせていただきました。
人工知能エンジニアはこれまでの開発エンジニアと異なり、設計書に沿ってコーディングを完了すれば終わりというものではなく、試行錯誤の連続が必要となります。
学習においてもテキストを読んで知識を入れれば良いのではなく、実際のフィールドを意識した学習を心がけるようにしていくと良いと思います。

多くの皆さんの学習の手掛かりになれば幸いです。