声のPhotoshop「VoCo」は、発言のフォトショを可能にする

    音声版Photoshop「VoCo」、Adobeがベータ版をチラ見せ

    良くも悪くも使えそう。

    Photoshopを使うと、ただ写真をきれいにするだけじゃなく、元の写真に存在しないものを貼り合わせたり、入れ替えたりして、いろんことできます。The Drumによれば、Adobeはそれと同じことを「声」でもやってしまうソフトウェアを開発しているようです。

    その名も「VoCo」、Adobeが自社カンファレンス「MAX」でチラ見せしてくれました。そのときの動画がこちらです。

    動画の中では、エンジニアのZeyu Jinさんが、ステージ上にいたコメディアンのJordan Peeleさんの録音された音声を次々と編集していきます。元々は「僕はイヌにキスして、それから妻にキスしたんだ」というセリフから、「僕は妻にキスして、それからイヌにキスしたんだ」と順番を入れ替えたり、さらには「僕はジョーダンにキスしたんだ、3回」と、言ってない言葉を付け加えたりもしています。しかもそれは付け加えたい言葉をテキストで入力するだけでできちゃうんです。

    となると心配なのが、言ってもないことを言ったっていう証拠をでっち上げられたりすることです。でもJinさんによれば、その可能性はもう考えてあって、透かしを入れるなどして、ニセの声と本物の声は見分けられるようにするつもりだそうです。また動画のデモではほんの3秒くらいのセリフが元データになっていますが、実際には声の特徴を学習するために20分程度の音声データが必要になるとのこと。

    これが使えるようになれば、たとえば適当に撮った動画に、好きなタレントの声でナレーションを入れたりもできるってことですよね。自分の発言を捏造されちゃう可能性は怖いんですが、映像関係の仕事の人なら、まっとうな使い方で重宝する人がいることでしょう。

    ちなみにまだベータ版で、リリース時期などは発表されていません。

    source: The Drum

    (福田ミホ)