「Siri」さん、ディープラーニングでロボ声を改善。違いを聞いてみよう

  • 5,374

  • author 塚本直樹
  • Twitter
  • Facebook
  • LINE
  • はてな
  • クリップボードにコピー
  • ×
  • …
「Siri」さん、ディープラーニングでロボ声を改善。違いを聞いてみよう
Image: Hadrian / Shutterstock.com

結構違いますよ。

Apple(アップル)製品に搭載されている、AIアシスタントの「Siri」。普段からお世話になっている人も多いでしょう。そのSiriさんですが、実はディープラーニングによって徐々に滑舌が自然になっていること、お気づきでしたか? 英語版のSiriではありますが、Appleはその進化を研究結果として公開しているんです。

AppleがMachine Learning Journalに公開した「Deep Learning for Siri`s Voice」というウェブページでは、どのようにしてSiriの発音を改善したのかが明かされています。

ちょっと考えてみると、私たちが喋る口語は文章の構成や意図によって、強調する場所やイントネーションが変わりますよね。しかしそれをいちいちスマートフォン上のアルゴリズムで判断し、しゃべらせようとするとプロセッサに大きな負担がかかります。そこでAppleは膨大なデータから文章の自然なアクセントやイントネーションを導き出すために、「ディープラーニング」を利用したのです。

研究発表のページのほぼ最下部の「Table 1. Examples of Siri`s new voice in iOS 11」という項目では、iOS 9からiOS 10、そしてiOS 11と、どのようにSiriの発音が自然になっていったのかを実際に聞くことができます。その進化の度合は、一聴瞭然(?)。iOS 9では「これロボだな〜」と感じる発音がiOS 10ではかなりマシになり、iOS 11では非常に流暢に文章を発音することができるようになっているんです。

ちなみに、iOS 11はこの秋にリリースされる予定です。例年通りなら新型iPhoneに標準で搭載されて出荷されるiOS 11ですが、新型iPhoneの派手な見た目の変化だけでなく、その発音の進化にも耳を傾けてみたいですね。

Image: Hadrian / Shutterstock.com

Source: Apple via The Next Web

(塚本直樹)