G検定個人的メモ

背景

G検定を来週受けることにした。 基本的に落ちることはないだろうという舐めた考えを持ってはいるが、念の為公式本で一通り勉強しようと考えている。

昨年まで画像処理の研究室にいたため、 3, 4章は既にある知識で問題なく、5章は一般常識でどうにかなると考え、1, 2章だけ勉強ためのカンニングペーパーを作った。

追記(2021.08.05)

一昨日、G検定2021#2の結果が返ってきた。

  1. 人工知能とは.人工知能をめぐる動向.人工知能分野の問題:90%
  2. 機械学習の具体的手法:100%
  3. ディープラーニングの概要:100%
  4. ディープラーニングの手法:93%
  5. ディープラーニングの社会実装に向けて:87%
  6. 数理・統計:83%

機械学習の研究を少しでもやっていた人なら、特に難なく合格できると思う。

とはいえ、公式本の1, 2章の箇所の、機械学習の歴史や動向については少し目を通した方がいいかも。

メモ

1-1 人工知能とは

人工知能

1956年にアメリカでのダートマス会議でのジョンマッカーシー (edited) 人工知能の解釈は複数存在し、一意に定まらない

AI効果

AIに対してそれは単純な自動化であって人工知能ではない、と結論づける人間の心理的効果

人工知能とロボットの違い

物理的な身体は存在しない、考えることを中心に扱う

人工知能のレベル
  • レベル1: シンプルな制御 エアコンの温度調節など、振る舞いがあらかじめ決められているもの
  • レベル2: 古典的な人工知能 ロボット掃除機、診断プログラムなど探索・推論、知識データの活用で状況に応じて極めて複雑な振る舞いをするもの
  • レベル3: 機械学習 検索エンジン、交通渋滞予測など非常に多くのサンプルデータをもとに入力と出力の関係性を学習するもの
  • レベル4: ディープラーニング 画像認識、音声認識、自動翻訳など、特徴料と呼ばれる変数を自動的に学習するサービス

1-2 人工知能研究の歴史

エニアック

1946年アメリカのペンシルバニア大学、真空管を使った電算機

ダートマス会議

1956年にアメリカで開催、人工知能という言葉が初めて使われる

知的に行動したり、試行したりするコンピュータプログラムの実現可能性について議論

ロジック・セオリスト

世界初の人工知能プログラム、ニューウェルとサイモン

数学の定理を自動で証明

第一次AIブーム

推論・探索の時代(1950年代後半〜1960年台)

東西冷戦下でのアメリカでは英語-ロシア語の機械翻訳が注目されていた

トイプロブレムが解けても複雑な現実の問題が解けないことが明らかになった

第二次AIブーム

知識の時代(1980年台)

エキスパートシステム、と呼ばれる実用的なコンピューターがたくさん作られた

日本では第五世代コンピュータと名付けられた大型プロジェクトが推進された

知識を蓄積管理することの難しさが明らかになった

第三次AIブーム

機械学習・特徴表現学習の時代(2010年代〜)

機械学習が実用化された

ディープラーニング登場

シンギュラリティーに関する懸念が生まれた

2-1 探索・推論

STRIPS

Stanford Research Institute Problem Solver

前提条件、行動、結果の3つで記述する

SHRDLUしゅるどぅる

テリーウィラード、英語による指示を受け付けコンピューター画面に存在する様々な積み木の物体を動かすことができる

Cycプロジェクトに引き継がれていく

ヒューリスティックな知識

探索を効率化するのに有効な知識

不完全な情報でも探索や推論を有効に進められるようにする

Mini-Max法

自分が行動するときはスコアが最小に、相手が行動するときは(自分の)スコアが最小になるように行動する

αβ法

αカット:スコアが最小のものを選ぶ過程ですでに出現したスコアよりも大きいノードが現れた過程でその先につながるノードの探索を辞めてしまうこと

βカット:スコアが最大のものを選ぶ過程ですでに出現したスコアよりも小さいノードが現れた過程でその先につながるノードの探索を辞めてしまうこと

GPS将棋

670台のコンピューターを接続して1秒間に3億手を読む

モンテカルロ法

ゲームがある局面まで進んだら、あらかじめ決められた方法でゲームの局面を評価する、ということを放棄する

コンピューターが二人の仮想的なプレイヤーを立て、完全にランダムな手を差し続ける方法でゲームをシミュレーションする(プレイアウト)

ある局面からプレイアウトを複数回実行するとどの方法が一番勝率が高いかがわかる

2-2 知識表現

人工無能

チャットボット、おしゃべりぼっとと呼ばれる、特定のルール・手順に沿って会話を機械的に処理するだけ

会話の内容を理解していないから人工無能と呼ばれる

イライザ

相手の発言をあらかじめ用意されたパターンと比較しパターンに合致した発言があるとそのパターンに応じた発言を返答する

後の音声対話システムに影響を与えた

イライザ効果

あたかも本物の人間と対話しているような錯覚に陥ること

エキスパートシステム

専門分野の知識を取り込み、その分野のエキスパートのように振る舞うもの

マイシン

1970年代にスタンフォード大学で開発

血液中のバクテリアの診断支援を行う

500のルールがあらかじめ用意されており、順番に質問に答えていくと感染した細菌を特定しそれにあった抗生物質を処方することができる

69%で正しい解答、専門医は80%

DENDRAL

スタンフォード大学1960年代

未知の有機化合物を特定するエキスパートシステム

エドワード・ファインゲンバウムは1977年に知識工学を提唱

インタビューシステム

専門家から上手にヒアリングするシステム

ドキュメント、事例よりも専門家から知識を獲得することがとても難しかったから

知識ベースの保守の難しさ

たくさんデータを集めると、矛盾していたり一貫していないものがあるから

意味ネットワーク

概念をラベルがついたノードで表す

is-aの関係: 継承関係を表す。矢印が向いている側が上位概念(動物)、矢印の始点が下位概念(哺乳類)

part-ofの関係: 属性を表す(一部である)

Cycプロジェクト

全ての一般常識をコンピュータに取り込む

1984年スタート、30年たった今も続いている

パリはフランスの首都です、全ての木は植物です、みたいな文章を入力していく

オントロジー

知識を体系化する方法論のこと

元々は哲学用語で存在論のこと「概念化の明示的な使用」という言い方が広く受け入れられている(トム・グルーパー)

オントロジーの目的は知識の共有と活用

ヘビーウェイトオントロジー

構成要素や意味的関係の正当性について哲学的な考察が必要

ライトウェイトオントロジー

構成要素の分類関係の正当性について深い考察を行わない、ウェブマイニング、データマイニングでよく使用される

ワトソン

IBM、2011年にアメリカのクイズ番組に出演し、話題に

歴代のクイズチャンピオンに勝利した

Question-Answeringの研究分野の成果

ライトウェイトオントロジーを利用

シェフワトソン、と呼ばれる新しい料理のレシピを考える分野にも挑戦

ワトソンの仕組み

質問を分析して解答候補を複数選ぶ、質問との整合性や条件をそれぞれの回答候補がどの程度満たしているかを複数の観点でチェックし、総合点を出す

一番総合点が高いものを回答する

質問に含まれるキーワードと関連していそうな答えを高速に検索しているだけ

東ロボ君

2011年〜2016年

6月の進研模試で偏差値57.8をマーク

何かしらのブレイクスルーがないと東大合格が不可能であるという理由から2016年に開発が凍結

2-3 機械学習・深層学習

統計的自然言語処理

複数の語句や単語を一まとまりにした単位で用意された膨大な量の対訳データをもとに最も正解である確率が高い訳を選抜する

bankには銀行、土手という意味があるが近くにmoneyやinという単語が現れた場合に銀行であると確率が高いため、銀行という訳を選択する

パーセプトロンの性能と限界に関する論文

特定の条件かの単純パーセプトロンでは直線で分離できるような単純な問題しか解けない

誤差逆伝播法でこれを打開

2021年のILSVRC

ジェフェリー・ヒントン率いるSuperVisionが圧倒的勝利を収める