議論がヒートアップしても、冷静に聞き分け。
Google AIは日々進化しています。Google I/Oの基調講演にてGoogle AIを利用した次世代の音声解析のデモンストレーションが行なわれました。

一例として提示されたのがYouTubeの自動字幕機能。これまでは、複数が同時に発言すると、この画像のようにそれぞれの言葉が混じって解析されてしまい、チグハグな会話になってしまいました。だって同時にしゃべるんだもん。しょうがないよね。
でも、そこをしょうがないよねで済ませないのがGoogleのスゴイところです。新しい音声解析機能を以下よりどうぞ。
お互いの声を聞き分け、議論が白熱していようとも発言者ごとに字幕を生成してくれるというわけです。OK、とりあえず落ち着こう。
すでにGoogleHomeが最大6人の声を聞き分けられますが、こちらは声の違いで個々を認識するだけではありません。正確に内容を理解して、文字起こしまでしてくれるって凄くないですか?ものすごい速度でテレビに字幕を入れるお仕事がありますけど、まるでそういった方が裏にいるかのような精度と速度です。
デモンストレーションはYouTubeでしたけど、こうした個々を認識する解析精度が高まるにつれ、スマスピやアシスタントとの会話の精度もどんどん向上していくはず。
そして将来的に議事録やインタビューのテキスト化なんてものは、人がやらなくて済む時代がやってきて、僕の仕事の何%かは楽になるのです。
Google AI最高かよ!
今回のGoogle I/Oで発表されたことについてのまとめはこちら!
Image: Google
Source: Google, YouTube(Google I/O'18: Google Keynote)
(小暮ひさのり)