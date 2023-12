「マインドブローイング(頭のネジぶっ飛ぶ衝撃)」と、1日で136万回も再生されたこちらのデモ。

先日Google(グーグル)が発表したChatGPTの対抗AI「Gemini」の実働シーンなのですが、結構ガッツリ編集されていることがわかりました。

一見すると、あひるのお絵描きを見ながら、あたかもリアルタイムの音声でAIが何を描いているのか当てっこしているように見えるのですが…実はこれは早送り。フレームごとに静止画を見せながら、人間がテキストプロンプト(質問を文字で入力すること)で引き出した答えを、人間が読み上げてるデモなんです。

別に隠していたわけではなくて、Googleの声明を細かいところまで読むと、ちゃんと「動画のスチル写真を使ってGeminiにプロンプトしたものであり、プロンプトはテキストで行ないました」とあります。

さらにYouTubeの解説欄にも「デモ用に待ち時間は省略しました。また、時間の都合上、Geminiの出力も短縮しています」と明示されています(スクリーンショットの矢印部分)。

要するにデモで披露されたのは、Geminiの動作を縮めたものであり、現実にはしゃべらないし、あのスピード感もないってことになります。

一応、Geminiの回答はいじっていません。ナレーションしているのは現実の文字出力からの抜粋だと、GoogleはBloombergに説明しています。

まあ、最近は盛り盛りのデモが当たり前なので、みんなある程度は割り引いて見てるんじゃないかなーとは思いますけどね。あれが本当だと思って使うと「あれ?しゃべらない…」「お、遅い…」となっちゃうので注意が必要です。

なお、ChatGPT対抗の本命馬であるGemini Ultraは、来年までリリースはお預けです。先にBardに実装されたライト版のGemini Proも、「思ったほど良くない」「外国語は苦手だね」と反応はイマイチ。

ちょっとややこしい話題になるとスルーされるらしくて、以下のBojan Tunguzさんは「ガザの現況を教えて」と尋ねたら、「複雑で激変中なので、現況はGoogleで検索してください」と言われたんだそうですよ? ははは。「ググれカス」と翻訳されちゃったりしてね。

So I just asked Gemini Pro in Bard for the updates regarding the hottest news story these days, the war in Israel and Gaza, and its answer essentially was, I kid you not, "just Google it." 🤦‍♂️ pic.twitter.com/GZthPlOLzI

Filip Piekniewskiさんは「Pythonの基本的なコードも書けない」と報告しています。

Tried gemini based Bard, and well, it still can't write intersection of two polygons. It's one of those rare relatively simple to express functions that wasn't ever implemented in python, there is no stack overflow post, and all these models fail on it. pic.twitter.com/RKjmkEw2Qr