猫は右耳!? MITのディープラーニング研究から開発されたアルゴリズムMemNet。記憶に残る画像はどんな画像?

猫は右耳!? MITのディープラーニング研究から開発されたアルゴリズムMemNet。記憶に残る画像はどんな画像? 1

どんな写真が、写真のどこが頭に残るか…。

記憶に残る写真、残らない写真は何が違うのでしょう。被写体? 色? 構図? どうやら、写真には頭に残るエリアというのがあるようです。マサチューセッツ工科大学(MIT)が開発するアルゴリズムが、そのエリアを解析します。

MITが開発した新たなプログラムMemNetは、人工知能研究のディープラーニングからの技術を応用したシステムで、画像がどれだけ記憶に残るのかをリサーチします。MemNetに画像を見せると、ヒートマップ表示で、画像のどのエリアが人の脳に残るかを予想します。赤いエリアが記憶に残りやすいと推測された場所。米GizmodoのStone記者が猫の写真でMemNetを試してみたところ、猫の向って右耳が最も記憶に残るという結果が。

猫は右耳!? MITのディープラーニング研究から開発されたアルゴリズムMemNet。記憶に残る画像はどんな画像? 2

そもそも、ディープラーニングとは、多層構造のニューラルネットワークの機械学習のこと。ニュートラルネットワークシステムを用いて、コンピューターに新たなスキルを教え、トレーニングさせるものです。繰り返し何度も何度も膨大な量の計算をする=より多くのデータをプロセスすることで、ますますパフォーマンスが向上していきます。アップルのSiriや、グーグルの自動予測の裏側にあるものも、これですね。

さて、そのディープラーニングが、写真の中で印象に残るエリアを予想するMemNetにどう役立っているのでしょう。MemNetには、複数のデータベースから何千何万という画像が詰め込まれました。それらの画像はすべて、事前にオンライン調査で人間に回答してもらった、印象に残りやすさが点数制で紐づけられており、これによって莫大な量の画像トレーニングをつんだわけです。その後、MemNetは、見たことない画像を使い、それらがどれだけ記憶に残るかの予想テストを行ないました。その結果、同じテストをした人間の予想には若干劣ったものの、既存の類似プログラムよりも、予想精度が30%も高いことがわかりました。

MemNetは、つまりは、人が判断するのに非常に近いレベルで、画像がどれだけ記憶に残るかを予想することができるわけです。これを応用できれば、とても賢い画像編集ソフトができると思いませんか? 写真だけでなく、例えば記憶に残りやすいロゴやマークを開発する手助けにもなるでしょう。デジタルアシスタントの能力をより向上させる手助けにもなるでしょう。

現在、すでにMemNetはオンラインで公開されており、誰でも試してみることができます。画像をアップすると、その画像が記憶に残りやすいかどうか、HIGH/LOWといった具合に教えてくれます。研究員は、今後MemNetを動画編集アプリにしたいと考えているということです。

source: MIT News

Maddie Stone - Gizmodo US[原文

(そうこ)