文字を学ぶ人工知能、ビジュアルチューリングテストに合格

2015.12.17 22:00
  • このエントリーをはてなブックマークに追加

151214_visualturingtest1.jpg


人間みたいに、文字のコンセプトを理解して実践。

マサチューセッツ工科大学(MIT)のJosh Tenenbaum教授などによる研究チームが、あるタスクにおいて人間と見分けの付かない人工知能を作り出すことに成功しました。それは「見たことのない文字を真似して書く」という一見簡単そうなタスクですが、裏には深い意味があるんです。

研究チームが行なった実験では、まずソフトウェアと人間それぞれが見慣れない文字のようなものを提示されます(上の画像がその例です)。次に彼らはその文字のようなものを、コピーするのではなく微妙に変化させながら真似て書くように指示されます。書かれた結果を人間の審査員が見たところ、人間が書いたのか人工知能が書いたのかほとんどわからず、正解率は50%でした。答えは二択なので、50%というのは当てずっぽうと同じです。つまりこのソフトウェアは、ビジュアルチューリングテストに合格したのです。

チューリングテストとは、ある機械が知的かどうかを判定するために考え出されたテスト方法です。一般的には、人間の審査員が人間と人工知能それぞれと文字ベースで会話し、審査員の30%に人工知能が見破られなければ合格とされます。2014年にロシアのチームが作ったプログラムが史上初めてチューリングテストへの合格を認められ、話題となりました。

ただ今回の実験で判定対象となったのは会話ではなく、文字の真似方である点がちょっと違います。また別の実験では、人間とコンピューターがいくつか見たことのない文字を提示され、その文字システムの中にありうる新しい文字を作るよう指示されたりもしました。実験の詳細は学術誌サイエンスで公開されています。

(そのテストって審査員がダメだったんじゃ?と思ったら、上の画像を見て、どれが人工知能によるものか当ててみてください。9つの文字のパネルそれぞれが、人工知能または人間が作ったものです。それぞれの文字について、1と2どちらが人工知能によるものかわかるでしょうか? この記事の最後に答えをのせておきます)

変わった実験のように思われるかもしれませんが、じつはとても深い意味があります。通常、人工知能システムはタスクを行なう前に大量のデータで訓練しておかなくてはいけない場合が多いのです。でもコンピューターと違って人間には、研究者が「ワンショット・ラーニング」と呼ぶことが比較的簡単にできてしまいます。

Tenenbaum氏らはベイジアンプログラム学習という手法を使って、人間と同じようなことができる人工知能を作り出したと示唆しています。そのシステムは、人間があるコンセプトを理解するのと似たアプローチで文字を識別・学習します。研究チームがそのソフトウェアの仕組みを次のように説明しています。

従来のコンピュータープログラムがシステム的にハイレベルなタスクをもっとも基本的な計算に分解していくのに対し、確率的プログラムでは、それを動かす元となるデータは非常に粗いものでいい。推論アルゴリズムが事例の集合を分析することで、モデルの細部を埋めていく。

その段階で研究者らのモデルは、人間の文字を書くシステムには、ペンの上げ下げで区分される字画があること、そして字画は、ペンの速度がゼロになる点で区分される副字画で構成されることを明らかにした。

システムは次にそのモデルを使い、いくつかの文字システムにおいて、字を書いている人間のモーションキャプチャの記録数百件を分析した。それにより、連続する字画と副字画の間の関係や、ひとつの字画を実際書く際に許容される変化について統計的に学習した。

その結果がご覧の通りです。研究チームも興奮を隠していません。「現在の人工知能界では、パターン分類が非常に注目されています」とプレスリリースでJosh Tenenbaum氏は言っています。「でもそこで見落とされているのは、知性とは単に分類や認識だけではないということです。それは思考するということです。だから我々は、手書き文字の研究をしてはいるのですが、『コンセプト』という言葉を使うことに躊躇がないのです。文字に関して、よりリッチで複雑なコンセプトをもってできることがたくさんあるからです」

ちなみに上の問題の答え、人工知能が書いた文字は、上の段が1、2、1、下の段が2、1、1でした。わかりましたか?


source: ScienceMITNew York Times

Jamie Condliffe-Gizmodo US[原文
(miho)

  • このエントリーをはてなブックマークに追加
・関連メディア