Siriの音声認識、グーグルを超えた #WWDC2015

Siriの音声認識、グーグルを超えた #WWDC2015 1

5%と8%の違い、とはいえ大きい。

VentureBeatによると、アップルのクレイグ・フェデリギ上級副社長が、今日のWWDCのキーノートの中でSiriの音声認識精度が「業界最高」に達したと発表しました。音声認識精度の指標として単語誤り率なるものがよく使われていて、低ければ低いほど良いのですが、アップルはこれを40%低減させて5%にまで落としたんだそうです。

これに対しグーグルはというと、つい先日Google I/Oでスンダル・ピチャイ上級副社長が発表したGoogle Nowの単語誤り率は8%でした。2013年に23%だったこの数字をこの2年で大幅に下げてドヤ顔で発表した矢先だったんです。

ちなみに単語誤り率はざっくり言うと「間違って認識した単語の数÷認識した単語の数全体」で計算されます。5%と8%は小さな違いのようにも見えますが、単純計算すると、たとえばSiriは20単語で1回しか間違ってないのに、Google Nowは12~13単語で1回間違うということになります。実際使うときのイライラ度合いは大きく違ってくるかもしれません。

アップルでは去年Novauris Technologiesという音声認識の会社を買収したり、音声認識の専門家を採用したりしてSiriの強化に努めています。音声認識技術に関しては、アップルのSiri買収が2010年だったのに対し、グーグルでは2008年に音声検索サービスをリリースするなど先行している印象がありました。でもとりあえず現時点では、音声認識精度においてグーグルがアップルに抜かれてしまったようです。

SiriはiOS 9へのアップデートで、柔軟なリマインダ設定や写真検索といった音声認識以外の機能も強化されています。今年秋のリリースでSiriさんがどれだけ成長しているのか、ますます楽しみになってきました。

source: VentureBeat

(miho)