アップルのAI秘密兵器「VocalIQ」とは?

Siriを「おもちゃ」と笑い、アプリ公開前にアップルに青田刈りされた英国の「VocalIQが、Siriを次段階に押し上げる秘密兵器?と話題ですね。

Tech Insiderに情報筋が語ったところによると、アップルに買収される前に社内で行なった会話テストの正答率は、Siri、Google Now、Cortanaが約20%だったのに対し、VocalIQは90%以上だったそうですよ?

VocalIQは速習型、前の質問を覚えてる、タッチ不要

さぞかしデータを大量に食わせたんだろうなーと思いきや。それがそうでもないんです。

VocalIQの開発チームではプログラムが完成した後、アマゾンの「Mechanical Turk」で契約スタッフを大量調達して会話調の質問をさせ、人間との会話に慣らしていきました。データには1万回の会話が記録されていましたが、3,000回こなした辺りで急に精度が上がるようです。

つまり週10億件もの質問をこなしているSiriより、たったの数千件でVocalIQはずっと賢くなっちゃった、ということになります。

会話調の質問というのは、「近場の中華料理店を探してね。駐車場が空いてて、WiFiがあって、子どもOKのところ」というような長いもののこと。たとえば1時間後に気が変わって「代わりにメキシコ料理店を探してね」と言いつけると、残りのWiFiや駐車場や子どもの条件は覚えてて、それで探しなおしてくれるというスマートさで、車載でも充分いけると言われてます。

あと今の音声アシスタントは結局最後には画面をタップしないと操作を確定できないものが多いですけど、VocalIQは音声だけでタスクが完了できます。ポケットに携帯入れっぱなしでメールチェックしたり、そういうことも可能。

AppleWatchますます要らなくなっちゃいますね。

ジョブズが見た「Voice First」の未来

AI分野への出遅れで最近いろいろ心配されてるアップルですが、これまでに買収したAI企業はSiri、Emotient、Perceptio、VocalIQなど。

このうちSiriはジョブズが最後に買収した会社です。ジョブズは「未来はVoice First(音声主導)になる」という考えのもとiPhoneからSiri共同創業者のDag Kittlausに電話をかけて誘い、その数週間後には推定2億ドルで買収が成立しました。

ただアップルに合流後、Siriの社外パートナー40社はどんどん切られていきます。もともとオープンなものづくりを目指していたDagは手足を縛られたような閉塞感を味わい、iPhone 4SでSiriの搭載が発表された2011年10月4日の翌日、ジョブズが亡くなった日にアップルを辞めます。ティム・クック体制のもと社内のSiri熱は薄れ、Siri技術トップのAdam Cheyerも辞めてDagと合流し、Six Five LabsとVivを立ち上げました(最初の出資主は中国の大富豪・李嘉誠の荘月明夫人=故人)。

一方、アップルはSiriのSDKをWWDCで公開するという噂が広まってます。そこにVocalIQがどう絡んでくるのかはまだちょっとわかりません。

でもモバイル決済の専門家のBrian Roemmeleさんなんかは「少しでも採用されたら大躍進だね!」とブログで大興奮。「27年前に夢見た音声端末の時代がきた。音声端末は広告がなくなって、声だけで買い物や支払いもできるようになる。それを牽引するのは、Viv、Alexa、Google Home、Facebook M、今は無名のスタートアップ数百社。ガレージからまた革命が始まる」と書き、「かく言う自分もRaspberry PI、Apple TV + Remote、アマゾンAWSを使ってSiriにオンラインで買い物させるマシン作っちゃったよ。アグリーだけど」と披露してますよ。

「髭剃りない?」と話しかけると、Siriが「○○社の○○が○○ドルです。買いますか?」とおすすめを紹介し、「YES」と答えると、「OK。○○.comで○○のカードで買います。注文完了です。2日ほどで届きます」というところまでやってくれてます。へー!

ハックと言えば、Echoは音声でテスラを出車させるシスコ傘下TropoのJason Goecke CEOのハック(下)が話題になったばかりです。

ドローンで撮る必然性はないんだけれど

ここはアップルもVocalIQなりAPI公開で波に乗りたいところですね!

source: Medium

(satomi)