お久しぶりです、特派員三年目のI.Mです。

 

いきなりですが、日本ディープラーニング協会(JDLA)のG検定をご存知でしょうか。

G検定とは

日本のAI研究第一人者である、東京大学の松尾豊准教授が理事長を務め
「ディープラーニングを中心とする技術による日本の産業競争力の向上を目指す」
という目的で設立された組織がJDLAです。
このJDLAが
「ディープラーニングの基礎知識を有し、適切な活用方針を決定して事業応用する能力を持つ人材」
をジェネラリスト(Generalist)と定義し、その知識を認定する検定試験がG検定です。

2017年からすでに4回の検定試験が実施されており、
今後2019年7月6日(土)に第5回、11月9日(土)に第6回の実施が予定されています。
(2019年5月末現在)

この検定試験に合格したジェネラリストを、本当か嘘か2020年までに10万人規模で輩出することを目指していると記載がありました。

私は前回の第4回を受験、無事合格し認定をいただくことができましたので、
役立ったと思う勉強法などを記載したいと思います。

なお、技術や情報の鮮度が大事な分野のため、試験には西暦と、その年の試験実施回が記されます。
つまり私は第四回である2019年実施1回目の検定合格者ということで「2019#1のG検定合格者」と表現されることになります。
(2017年実施の第1回は”2017″、2018年実施の第2・3回は”2018#1″、”2018#2″)

受験の背景と準備

クレスコではAI技術者の育成に力を入れています。

技術研究所でも当該認定を取得する方が増えており、
ディープラーニング研究最前線(=技術研究所)で色々見聞きしただけの門前のおっさんにも
「せっかくだから受けてみない?」
と懐の深いオファーがあったのは、2018#2(2018年11月実施)受験者の合格報告の場でのことでした。

かくしてG検定2019#1を受けることになりましたので、
情報を収集するため、JDLAのHPより資格試験のページを確認します。

  • 試験の概要
    受験形式や試験日時、申込期間などを確認。
    自宅でのオンライン実施なので資料を参照しながら受験が可能。
    小問226※を2Hで解かなければいけない。つまり1問あたり30秒あまりです。
  • 実施レポート
    合格率、受験者の属性、合格者アンケートなど。
  • 学習のシラバス
    試験で必要とされる知識の細目
  • 推薦図書
    JDLAが監修・推薦する、もしくは検定合格者が推薦する参考書

とりあえず、技術研究所に転がっていた以下の書籍が監修図書だったので借りて持ち帰り、
ペラペラ読むところから始めました。

バリエーション豊かなDLの活用事例が掲載されていますが、
全篇縦書きのため、アルファベットの用語などは少々読み辛いです。

勉強開始【受験1か月前~】

購入したテキストがそろそろ埃を被ろうかというところで、思い出したように開きました。
学習のシラバスを確認したところで、詳細な知識がまとまった形で記載されている公式テキストは必須だと思います。

でもこれ、第3回試験(2018#2)実施のひと月前に発売されたようですが、
それまでの受験者はどうやって勉強したんだろうと思うほどです。

AI研究黎明期にどんな研究者がどんな発言をした、とかさっぱり覚えられませんでした。。。
しかし、イーロン・マスク氏はテスラやスペースXを創業し、火星移住計画をぶち上げるなど話題性の高いカリスマ経営者として私も知っているので、この人の発言だけは頭に残りました。
発言一覧のあるページに付せんを貼り付けるなどアクセスしやすくしておきます。
こういうとき、紙媒体はまだまだ有用ですよね。

余談ですがSFドラマの金字塔、スタートレックシリーズの劇中で、マスク氏が宇宙開発のキーマンの一人として名を挙げられています。
同作のファンであるらしいAmazon創始者のジェフ・ベゾスは映画版にて特殊メイクで出演を果たしているのですが、マスク氏に嫉妬しているかも知れませんね。

閑話休題。
人工知能研究の第一次~第三次ブームの違いや、人工知能が抱える問題は理解しやすいと思います。
爆弾と心中するロボットとか面白いですね。
AI研究の歴史はざっくりと読み進めて、ディープラーニングの各種要素、用途が本題です。

DNN, CNN, RNN…用語は紛らわしいですが、略語ではなく用途や技術の違いに着目すると頭に入りました。
でも(データの)「正規化(normalization)」と「正則化(regularization)」。これはダメだ。。。。

問題演習【受験2週間前~】

テキストに目を通すだけなら、十数時間あれば充分ですが、それで問題が解けたら苦労はしませんよね。。。
試験の約一か月前に発売された問題集を購入して演習をおこないます。

試験の出題形式をシミュレートして、回答形式に慣れることができます。
全八章のうち七章までが単元ごとの問題(各章平均大問×10程度)、八章が総仕上げ問題(大問×70)で全問題に解説が付与されています。
実力確認(主に打ちのめされるため)に丁度良いと思います。
問題を解くと(ちゃんと考えるので)理解度が上がる気がします。

何も見ずに一通り問いてみましたが、一巡目の正答率は4割台※と、まんまと打ちのめされました。
(※文中の穴埋め=小問が全部一致しない場合は大問を不正解としていたため)
初回は各章約一時間ほどかけて解答の解説を読み込み、出題方式や公式テキストの記述と照らし合わせて問題となるポイントを理解することに力を入れます。
ポイントとなりそうな解説ページには付せんを挟み込んで、公式テキストの記述との読み合わせを行います。

なお、同様に受験したS氏は問題集を3周して、「過学習が心配」と仰っていました。
ジョークにもAI用語を差し入れてくるとは、余裕ですね!

理解は一巡目の復習をおこなうことでできると思います。
二巡目以降は勉強した気になるのですが、受験時に資料を参照できるので、時間に余裕があるときに行うべきでしょうか。
時間に余裕があるとき何も見ないで解いた二巡目の正答率は7割程度でした。

直近の動向について

DLに関する動向について、ニュースサイトなどで記事を集めます。

どのような分野で活用されているか、など公式テキストに掲載されているもののニュースソースなどを確認したり、
公式テキストに載っていない最新の事例、法整備状況、各国の動向などは、通勤時間などを利用して目を通しておきます。

Google Chromeで記事を読んでいると、おすすめの記事として似たような要素の最新ニュースをフィードしてくれるようになるので食い読み漁ります。
その記事からニュースサイトで過去情報にアクセスできたりして、情報収集はハカドルのですが、
いくら記事を読み漁っても「勉強できた」という実感が沸いてきません。。。
でもそれはそれで、慢心に繋がらないので問題なかったことにしておきます。

ちなみに私が受験した回は公式テキストに掲載されているコラムが出題ネタになっていたりしたので、
それも目を通しておきましょう。続報などが出題される可能性もあります。
(スルーした挙句、受験時に「KAIST※って何だ?」と焦りました)

※Korean Advanced Institute of Science and Technology;旧称 韓国科学技術院(大学)
AIを軍事目的に応用する研究を進めると伝えられ、海外の一部のAI研究者から批判を受けた。
(Wikipediaより)

受験当日

13:00開始で試験時間120分の長丁場なので、早めに昼食を摂ります(11:00頃)。
受験用のノートPCと、情報検索用のPCを2台並べ、参考書の付せんを挟んだページが開きやすいかどうかを確認します。

ノートPCを2台並べて受験したのは、好プレーでした。

12:50から受験サイトが有効になるというので、サイトを開くとなし崩し的に試験が開始されてしまいました。
13:00開始とは言え、実質的には開始時刻を12:50~試験開始できなくなる時間まで選べる仕様だったようです。
試験時間(120分)は開始のタイミングで変わらないようです。

試験開始直後は基本的な問題ばかりから始まりますが、覚えきれないようなところは公式テキストを参照しながら解いていきます。
小問226については、文章中穴埋め一か所につき1問ということだったようで、少し気が楽になりましたが、
しばらく解いていくと、最新の動向を扱った問題や、公式テキストのより深い設問がしばらく続き、
受験用PCと情報検索用PCを行ったり来たりする必要に迫られ、結構神経を擦り減らしました。
試験終了後、検索用PCのブラウザには30近いタブが開かれていました。

でもニュースサイトで情報を拾い読みしていたおかげか、
ヒットしやすいキーワードでの検索結果から目当ての情報に早めにアクセスすることができたように思います。

結局218/226を消化したところでタイムアップでした。

受験を終えて

問題集を解くことで解答のポイントが掴みやすくなりました。

でも繰り返し解くよりは、公式テキストを読み込むことは大事だと思いますし、
ジェネラリストの本質的にも最新情報にアンテナを張っておくことは重要だと思います。
例えば人工知能による創作活動の著作権の帰属先や、自動運転に関する道路交通法の改正(案)など、法律関係はまだまだどうなるかわからない部分があります。

なお私自身も知りたいところの得点および合格ラインは開示されませんが、後日公開された試験実施レポートにG検定の合格率が記載されていました。

2017:56.8%
2018#1:57.1%
2018#2:64.9%
2019#1:72.8%

前回(2018#2)で合格率が上昇したわけは公式テキストが発売されたことによるもの、
今回(2019#1)更に合格率が上昇したわけは問題集が発売されたことによるものでしょうか。
個人的には今後問題が難しくなり、合格率が下がる可能性もあると思いますが、
そうすると目標の10万人輩出が覚束ないので、まずは受験者数を増やす必要があるような気がします。

皆さんもジェネラリストになってみませんか?