久々に完成度の高いジェネレーターきたって感じ。
Tesla(テスラ)のCEOイーロン・マスク氏が出資するOpenAIは、テキスト生成技術を開発しています。そのソフトウェア「GPT-2」は、以前「高性能すぎて危険」と自称するほどの完成度でした。約800万のWebページから抽出した40GBものデータを学習し、「こんなテキストの後にはこんなテキストが続く」を高精度に予測できるんです。高精度で危険すぎるって理由で、以前その成果を発表したときはあえてフルバージョンを公開していませんでした。
文章の続きを高精度に予測できるだけでどうして危険なのかというと、OpenAI自身がフェイクニュースの生成があまりに簡単にできてしまうと考えたからです。マスク氏はたびたびAIの危険性を指摘してきましたが、その考え方はOpenAIにも大きく影響しているのでしょう。フェイクニュースだけじゃなく、スパムとかフィッシングのメールを書いたり、ステマコメントを作ったり、使い方はいろいろ考えられます。
そして、本当にそんなにも高精度なのかというと、以前GPT-2にアクセスしたThe Guardianからは「文体もテーマも与えられたものにマッチする、もっともらしい文章を書くことができる」と絶賛されています。たしかに、それっぽい文章を書くのってけっこうたいへんなのに、GPT-2を使えば数秒で済んでしまいます。
が、そのGPT-2フルバージョンが先週公開されました。公式ブログによると、OpenAIではGPT-2が第三者に悪用されるケースを想定し、「あるテキストがGPT-2で生成されたものかどうか」を判定する手法も作り出し、その精度は最大95%に達したそうです。またGPT-2のモデルはその筋の人が見れば悪用もできる状態で数カ月間公開されてきましたが、「さしあたって悪用されたというはっきりした証拠がない」とのことです。
で、GPT-2のアルゴリズムを使って実際テキストを生成できるジェネレーター「Talk to Transformer」も公開されてるんですが、実際触ってみると…危険というより、むしろ笑える結果となりました。
完ぺきな文体+シュールな展開がツボ
何が笑えるかって、たとえばこんなんです。(以下、太字になってる部分がユーザーからの入力、その後の文章がGPT-2が生成したものです)

トランプが牛を屠殺した。
「人々が声を上げた。私は牛の屠殺方法を知っている。私にはできる。そして私はやる」ニューハンプシャー州での予備選に勝利した後、彼は支持者に対し語った。
彼はその後訂正し、彼が言いたかったのは「チキン」であり、「牛」ではなかったとした。
なんというか、文章のつながり方とか文体がすごくそれっぽいのに、展開が斜め上へ上へと転がっていく感じなんです。
詩のような小説のような、不思議な文章が生まれることもあります。


戦争。戦争は決して変わらない。
- バンパイア、これは本当によい考えだと思う?
- バンパイア、彼をどうする?
- バンパイア、彼はまだ地下室にいる?
- バンパイア、本当に彼を殺さなかったの?
- バンパイア、彼はどこにいる?
- バンパイア、本当に彼を家の中で殺さなかったの?
- バンパイア、彼はまだ地下室で生きているの?
- バンパイア、どうして私を助けてくれないの?
- バンパイア、あなたは遠すぎる。
- バンパイア、私はあなたを助けよう、もし私の家族を傷つけないと誓ってくれるなら。
- バンパイア、これを家に戻すと約束してくれない限り、私はあなたを助けない。
- バンパイア、あなたは遠すぎる。
- バンパイア、あなたは私の父を絶対に見つけられないはずだ。
その後の展開が気になって仕方ありません…!
「フェイクニュースメディア」と振ってみたところ…

フェイクニュースメディアは陰謀論と盲目的憎悪で クレイジーになっている。@MSNBCと@CNNは見ていられない。@foxandfriendsは偉大だ! - Donald J. Trump (@realDonaldTrump) July 20, 2017
ADVERTISEMENT
トランプはMSNBCとCNNを何度も「見ていられない」「ひどい」とし、土曜日には彼らがトランプに対抗して共謀していると批難しているようだった。
「あなたの味方について彼らが何を言っているか、ご存じの通り。あの嘘つきメディアが」トランプはウェストバージニア州でのスピーチの中で、喝采する群衆に語りかけた。「フェイクメディアはコントロール不能だ。」
「それにはっきり言って、うそつきメディアはコントロール不能だ。本物のメディアが、記事をでっちあげ、情報源をでっちあげている」彼は付け加えた。「あいつらは事実を報道しない。私が先週、法王と話したことも、アブラハム・リンカーンが暗殺されたときにその部屋にいたということも、外国のたくさんの指導者たちと話したということも、報道したがらないように。」
トランプのTwitterフィードを再現したり、そこでいかにもトランプが言いそうなメディア批判をしたりもすごいんですが、サラっとバレバレのデタラメ(アブラハム・リンカーンのくだり)を混ぜてくるトランプ話法まで体得してるのは脱帽です。「ADVERTISEMENT」が混ざってるのもむしろリアルでいい感じ。
GPT-2は、ラップの歌詞の別バージョンも作れます。エミネムの『Lose Yourself』の一節に、まったく違うけどなんとなくそれっぽい続きが付いてきてます。

米Gizコメント欄もAI大喜利状態に
米Gizmodoのコメント欄はさっそく大喜利状態、というか何かしら打ち込むだけでGPT-2が大喜利の答えを出してくれる感じです。まずはHeartBurnKidさんが試した、最近米国の20〜30代で流行ってる「OK Boomer」というベビーブーマー世代を黙らせる決めゼリフが「OK Boomerang」に変換され、さらに次々とシュールに展開していった例。
OK Boomerang、じゃあ私はこれができる」彼女は笑った。
「だから、このためにブーメランを取ったの?」
「そうよ。髪をやるとき、まっすぐにきれいにするのが難しいの。私、髪のスタイリングうまくなくて、自分でやるよりは人にやってもらいたいくらいだし。でもこいつは使えたの」
彼女は一瞬黙り、そして続けた。
「これ本当に便利よ。すぐ手が届いて投げられる武器があるっていいでしょ、それほど強力じゃなくても」
エルサにはほとんど反論できなかった。彼女が妹を疑う理由はなかった。アナがブーメランを盗んだのだろうと反論することはたやすかったはずだし、それは事実だったろうが、証拠がなかった。エルサには妹の言葉しかなく、腰の引けた非難をするのがせいぜいだった。
「だから盗んだの? 私は
なぜブーメランがヘアブラシ(ヘアアイロン?)代わりに使われるのか、なぜこの会話をしてるのが『アナ雪』姉妹なのか…疑問は尽きないのに、なんでか場面が目に浮かびます。そしてアナの髪がボサボサというのもじつは映画の設定に合ってるんですが、それは800万ページの学習によって得た知識なのかどうなのか…?
DarthClem3さんは「内なる12歳を召喚した」そうで…こんなん出ました。
ウンコしたいです!
ウンコするんだなーって思うのがイヤなわけじゃなくて、ただできてないだけなんです。遅かれ早かれしなきゃいけないのはわかってるけど、まず何をすべきかがわからないんです。
どんな協力もすごく感謝します。
誰か、した経験があればそれについてぜひ聞かせてほしいです。する気がおきない人も、教えてくれればこの中に入れておきます。
するのが待ちきれません!
地域掲示板とかにありがちな、お手伝い募集のテンプレートにウンコが入っちゃったのでしょうか?
トイレネタ続いてすみません。Tybotさんより:
妻と私は、トイレットペーパーの向きについていつも意見が合わない。彼女はそれは便器に直行すべきだと考えており、私はそれはあまりうまくいかないと思っている。妻はペーパータオルを使うのを好まないので、シンクにはだいたいトイレットペーパーを置いている。私たちはさまざまな方法を試したが、トイレの底から物が落ちないように、少しだけ流す必要があると考えてきた。
トイレの後できれいにする方法を探しているなら、毒性のない洗剤を使うことを考えよう。液体のトイレットペーパーリムーバーと、毒性がなく、名前に「アンモニア」が入っている洗剤がおすすめだ。
それから液体のトイレットペーパー・ディスペンサーも試してほしい。トイレットペーパー・ホルダーや、トイレットペーパーのロールを使ってもいいだろう。
トイレットペーパーの「向き」って、端っこがロールの上か下かってこと、ですよね…? そして液体のトイレットペーパー・ディスペンサーとは?
日本語も(一応)通ります
日本語も試したら、一応文字化けとかはせず、なんとか使えました。が、こちらは日本語力が微妙なため、ますます異世界に。

馬男の世界! 人類へのこだわりも気になります。

文字にするとおかしいんですが、居酒屋で泥酔して朝の閉店まで眠りこけた後、無理やり起こされてお店から引きずり出されたりするときの発声を書き起こすとこうなるのかもしれないと思いました。すみませんよう。最後の英語、「このテキストの実際の意味がわかりません」はGPT-2の本音なんでしょうか?

解説の舞の海さんが魂の力士について語ってくれたようですがと思います。

発動も楽しむのね…。
と、日本語は意味不明すぎるものも多いんですが、それも含めてワクワク感のあるジェネレーターです。アルゴリズムの学習に使っているデータがRedditからリンクされている記事ということなので、日本語はアニメとかサブカル系が中心になっているのか、ときどきアニメが元ネタかな?と思う固有名詞が入ってきたりしました。
そんなわけで日本語の生成結果は微妙すぎるんですが、英語に関してはかなりそれっぽいものができてます。ただその中身が不思議な方向に飛躍していくことが多いので、今はそれを読んで楽しめる結果となってる感じです。
それでも、一見ちゃんとした文章を一瞬で作れるAIの力は実感できました。AIの全自動で何もかも書かせるのは不安だけど、機械が作ったものを人間がチェックして直す、みたいになっていくのかもしれませんね。Gmailの入力予測、Smart Composeも、まだ英語版しか試せませんがときどき悔しいくらい的確だし、数年後にはSNSも、またはこういう記事も、半自動で書かれたりするんでしょうか。そんな未来も遠くないな、と感じられるこのジェネレーター、こちらからいろいろ試してみてください!
Source: Talk to Transformer、OpenAI、The Guardian