視覚野フル再現に偉大な一歩! グーグル人工脳、YouTubeで「ネコ」を覚える

視覚野フル再現に偉大な一歩! グーグル人工脳、YouTubeで「ネコ」を覚える 1

自走カー、ARメガネなど極秘プロジェクトを手がけるグーグル「Xラボ」で数年前から人工脳をこしらえて「なんでも覚えておいで」とネットに放ったら、なんとYouTubeで真っ先に「ネコ」を覚えたそうですよ。

泣いていいんだか笑っていいんだかですが、ニューヨーク・タイムズはこう書いてます。

 

スタンフォード大学コンピュータサイエンティストのアンドリュー・Y・ング(Andrew Y. Ng)氏とGoogleフェローのジェフ・ディーン(Jeff Dean)氏率いるグーグル研究チームでは、1万6000台のプロセッサを繋いで結合点が10億以上あるニューラル・ネットワーク(神経回路網)を造り、そこにYouTube動画1000万本から抽出した任意のサムネール画像をフィードしてみた。

ビデオはランダムに選んだもので、それそのものにネット時代のヒトの興味が反映されてもいる。が、この研究成果は別の意味でも衝撃だった。なぜなら「1個1個のニューロン(神経細胞)は脳内で訓練され、意味ある物を識別できるようになる」という生物学の理論を、今回研究班が作ったソフトウェアベースのニューラル・ネットワークがかなり近いところまで反映しているからだ。

現在ある商用機械ビジョン技術の多くは、人間が具体的な特徴をラベル付けし、学習プロセスを「監修」することで実現されている。今回のグーグルの研究では、特徴を掴む上で機械には手助けをしていない。

「目立つ特徴を研究者たちに拾ってもらうのではなく、アルゴリズムにデータをどんどん与えて消化してもらって、そのデータからソフトウェアに自力で学習してもらう、ということですね」(ング博士)

「トレーニング中、『これがネコだよ』とは我々の方から一度も教えてないんですよ」と語るのは、そのむかし同時処理可能なタスク多数にプログラムを簡単に分割できるソフトをグーグルが開発した際に補佐したディーン博士(Dr. Dean)。「つまりネコという概念を自分で生み出したのです。ネコの側面図もたぶんいけると思います」

グーグル脳は、何百万枚という画像を見て大まかな特徴を捉え、その記憶位置のヒエラルキーをなぞらえることにより、夢に出てくるようなネコの絵を構築したことになる。が、脳の視覚野で起こることを再現できるサイバネティック(人工頭脳)のいとこを開発した、という言い方もできそうだ、と研究者たちは話している。

  

世界最大級の人工脳がネコ探して喜んでるって思うと笑っちゃいますけど、YouTube動画はネコだらけなので、いくらランダムにサンプル抽出してもネコが大量に混じっちゃうっていうのもあるんでしょうね。

今回の実験では物体2万個を特定する精度も従来のほぼ倍に上がっているわけですが、個人的にすごいと思ったのは、人間の視覚野に匹敵するシステム(まあ、規模はまだ人間脳のそれの何100万分の1ですけどね)が開発できた、というポイント。

「スタンフォードとグーグルの共同論文は、ニューラル・ネットワークのサイズと規模を従来の研究から桁違いに押し上げるものだ」、このペースでコンピュータの技術が進めば「今の10年(2010年代)の終わりまでに人間の視覚野をフルに再現するのも夢ではない」と、ジョージア工科大学高性能コンピューティング学部デビッド・A・ベイダー(David A. Bader)部長はニューヨーク・タイムズに語ってます。2010年代に、ですか...!

 

[arXiv via New York Times]

JAMIE CONDLIFFE(米版/satomi)