不倫サイト「アシュレイ・マディソン」流出データ大検証! 女性ユーザーはほぼ全員偽物

2015.08.27 21:57
  • このエントリーをはてなブックマークに追加

150827womeninashleymadison.jpg


なんだよ…。じゃぁ、女性いない場所でリークの危険冒して何やってたんだよ。

不倫サイト「アシュレイ・マディソン」ハッキングにより、さまざまなデータがでてきました。ハッキングしたImpact Teamは、サイトにある女性プロフィールページのうち90から95%が偽物だと力説しています。これが事実だとしたらとんでもない割合ですが、現在実際に調査したところはありません。そこで、米GizmodoのAnnalee Newitz編集長がデータをダウンロードして検証してみました。その結果、Impact Teamの言う通り、女性ユーザーはほぼ全員偽物=サクラだというとんでもないことがわかってしまいました。Newitz編集長がどのように検証したのか、詳しくみていきましょう。

Newitz編集長の調査でわかったことを一言で言うならば、このサイトは誰の想像も遥かに超えた悲惨な状態だったということ。不倫に誘いこむ男のワンダーランドではありません。それどころか、データにある550万人の女性ユーザーに対して3100万人の男性ユーザーが群がる熾烈な場所ですらありませんでした。言うならば、アシュレイ・マディソンは地球上のすべての女性が死に絶え、どこかのエンジニアが作った粗悪なロボットが女性の代わりに存在する、そんなSFチックな悪夢のような場所だったのです。

アシュレイ・マディソンの男性ユーザーは、ふらっとプロフィールページを作っては消えてしまう女性と出会うためにお金を払っていたのです。この女性たちは何者なのか…。botか? 運営側が用意したサクラか? それとも何かの残骸か? それが何であろうとも、Newitz編集長が調査を進めれば進めるほど、これら550万人の女性ユーザーアカウントのほとんどが動きのないものだということがわかってきました。彼女たちはサイトを使ってどの男性と会話することもないどころか、プロフィールページを作ったあと、サイトを利用すらしていなかったのです。いや、550万人すべてがそうではありません。実際に活動していた女性アカウントもありました。が、それはたった1万2000件という非常に少ない数だったのです。

調査でわかったことを見ていけば、アシュレイ・マディソンに登録していた男性ユーザーの多くは不倫をしていなかったというのを否定しがたくなってきます。では、彼らは何にお金を払っていたのかと聞かれたら、それは、悲しいかな「不倫というファンタジー」と言わざるをえません。


あふれる証拠


アシュレイ・マディソンのユーザー男女比率において、大きな差があるというのは運営も含め異論はないでしょう。約3700万人の全ユーザー数から「女性」と申告しているユーザー数はわずか550万人


150827womeninashleymadison01.jpg


よくあることですが、公表されている数字というのは実際の数よりも少ないものです。さて、数年前のこと、元社員が、カナダでアシュレイ・マディソンを訴えています。その内容は、ひどい職場環境によるストレス。元社員の女性曰く、会社から3ヶ月で1000件の偽プロフィールを作るよう言われ、手に反復ストレス傷害を負ったというのです。ちなみに、1000件のプロフィールはポルトガル語で作成、これはブラジルのユーザーを惹き付けるためだと指示をうけたといいます。この件に関してはすでに和解が成立しており、アシュレイ・マディソン側は、この元社員が偽のプロフィールを作ったという事実はなかったとしています。

また、アシュレイ・マディソンでは、サイトの利用における注意事項として、ユーザーのなかにはただの「エンターテイメント」として利用する人がいるという点をあげています。サイトに登録しコミュニケーションを楽しんではいますけど、実際に会うつもりはない人もいますから、と。もちろん、偽のプロフィールですとは言ってませんが、多くのプロフィールが出会うつもりのないちょっとした楽しみでやってますよと、公式も認めているわけです。

以上のことから、これは偽プロフィールがたくさんあるのではと察したわけです。では、どれくらい偽プロフィールがあるのか、それは会社が公開していないデータを調査する必要があります。ハッキングでリークしたデータですね。

問題は、膨大なデータの中からどうやって偽物を見つけるのかということ。本物のユーザーの中にも、記入すべき情報でちょいちょいフェイクを挟む人が多いようなので、これがなかなか難しいのです。しかし、プロフィール全部が偽ならば、データにその影が残ります。そこで、Newitz記者は、人口学を専門とするデータ科学者に連絡をとり、男性ユーザー/女性ユーザーのプロフィールの全体像を見て、変則的なパターンを比べてみなさいというアドバイスを得ました。

Newitz編集長の調査は、プロフィールデータをもとにしています。クレジットカードデータなんかは関係なし。そもそもアシュレイ・マディソンでは女性ユーザーは無料ですし、カード情報に性別はのってないので、有料アカウントを基に調査してもダメでしょう。

さて、プロフィールページ。ここにはユーザーが入力すべきデータが多々あります。ニックネームとか、性別とか、誕生日とか、好みとかですね。一方で、プロフィールページには、表にはでないけれど運営側に必要なデータもあります。アカウント作成のためのEメールアドレスや、最後にユーザーがメッセージをチェックした日など。

Newtz編集長がまず調べたのは、Eメール。アカウント作成に登録されたEメールに何かパターンは見えたのでしょうか。もし自分がアシュレイ・マディソンの社員で偽プロフィールを作る任務に当たるとしたら、登録に使うEメールアドレスは「〇〇@ashleymadison.com」でしょう。ユーザーで@Ashleymadison.comを持っている人はいません、これは社員オンリーのアドレスです。なのにいざ検索してみると…ビンゴ! @ashleymadison.comのEメールで登録されているアカウントがなんと約1万件ヒットしました。多くのEメールアドレスはbot的に作られたようで、100@ashleymadison.com、200@ashleymadison.com、300@ashleymadison.comてな具合のものでした。

男性ユーザーと女性ユーザーで、この@ashleymadison.com登録アカウントで比べてみると、9000件強が女性アカウントで、のこり約1000件が男性もしくは性別記入なしアカウント作成に使用されていました。

これは偽アカウントの証拠として、1つの要素になりますよね。確実に言えることは、偽アカウントと思われるもの(運営側が作ったものかもしれないし、本当の女性ユーザーが偽情報をいれたのかもしれない)、そのほとんどが性別登録が「女性」となっていたということです。数千件の偽と思われる女性アカウント、Impact Teamが言っていた通りです。

次に調査したのは、IPアドレス。これで、アカウント作成に使ったパソコンの位置情報がわかります。男女ともに最も多く利用されたIPアドレスは、OnXという会社のもの。この会社はアシュレイ・マディソンのバックアップをホスティングしています。匂いますね。多くのアカウントが、アシュレイ・マディソン社員によって作成されたのかもしれません。どこかで大きなデータ移行があって、ユーザー全員のIPアドレスがOnXのものに変更されたのかもしれません。男女間で大きな違いは見られませんでしたが、OnXのIPアドレス82%は男性ユーザーのものでした。これは、全体のデータベースにおける男性ユーザーの比率とほぼ同じ。

では2番目に多く利用されたIPアドレスはなんだったのでしょう。8万805アカウントが利用したIPアドレスは127.0.0.1。コンピューターシステム関係者ならばすぐにピンと来るのではないでしょうか、ローカル・ループバック・アドレスです。一般向けに言うならば、ホームコンピューターです。つまり、このIPアドレスのアカウントは、アシュレイ・マディソンのホームコンピューターで作成されたということ。このIPアドレスで作成された8万805アカウントのうち、6万8709件は女性アカウントでした。残りは、男性または性別記入なしアカウント。


150827womeninashleymadison02.jpg


おかしいですね。データベースの85%が男性ならば、どのIPアドレスも85%は男性ユーザーのものってのが確率として普通なのでは。が、ホームIPアドレスから作られたアカウントの82%が女性アカウントとか。これまた、Eメールでの調査と同じく女性アカウントの偽物具合に拍車をかけます。

プロフィールを見ていて、もう1つおかしなことがありました。最も多く登録に使われている女性の苗字が、ものすごーく珍しい苗字なんですね。さらにこの苗字、アシュレイ・マディソンの運営会社に10年前に勤めていた女性のものと同じなのです。まるで、この女性または誰かが、大量にテストアカウント作ったような…。一方男性は、最も多い苗字がSmith、続いてJones。これは、北アメリカで多い苗字と同じですね。

もちろん、IPアドレスもEメールも男性女性ともにユニークなものが何百とありました。3700万人ものユーザーがいれば、それは当たり前のことですけどね。誕生日も調査しましたが、こちらは特に問題なし。というか、問題あって当たり前。理由は、男女問わず嘘の誕生日を記入している人が多いからです。男女ともに2/3の人が1月生まれだと登録していますが、そんなはずはないでしょう。これは、ドロップダウンのメニューで1月が最初だから選んだというよくあるもの。オンラインの(しかも不倫サイトとくりゃ)誕生日調査ではよくある偏りです。

調査すればするほど、女性のアカウントには特定のパターンが見えます。そしてそのパターンは、偽アカウント(またはテストアカウント)を示唆するものばかり。とはいえ、偽と思われるのは数万件なので、その他は問題ないアカウントでしょうと思いきや…。


女性のいない場所


さらに調査を進めると、ある3つの項目で大変なことがわかりました。1つ目は「mail_last_time」。これは、アシュレイ・マディソンのメールボックスをユーザーが最後にチェックした時間がわかるデータ項目です。ユーザーが1度もメールチェックをしていなければこの項目は空の状態となりますが、例え1度でもチェックすればデータが記録されます。約2/3、つまり2020万人の男性ユーザーは、少なくとも1度はメールチェックしています。一方、女性ユーザーはと言えば、メールチェックしたことがあるのはたったの1492人だけなのです。これは注目です。


150827womeninashleymadison03.jpg


似たようなパターンが他の項目でも見られました。「chat_last_time」という項目です。こちらは、アシュレイ・マディソンのシステムを使って最後にチャットした時間がわかるもの。男性は1100万人がチャット体験しているのに対し、女性はたったの2400人。


150827womeninashleymadison04.jpg


最後に「reply_mail_last」という項目でも同じようなことが…。この項目は、最後にアシュレイ・マディソンでメールに返信した時間が記録されています。男性ユーザーは590万人、女性ユーザーは9700人。

これら3つの項目を見て明らかなのは、女性のアクティブユーザーの少なさ。プロフィールが作られてからいかに活動していないか、それがよくわかります。

気になるのは、メールチェックをした1492人の女性に対し、返信した女性が9700人という数字のギャップ。これはどういうことかと不思議に思いますが、これもリアルユーザーがどのようにアシュレイ・マディソンを使っていたかを見ると説明がつきます。サイトにログインすると、「メール来てます。返信します?」と、ポップアップが開きます。また、1度に複数のメッセージにまとめて返信することもできます。つまり、メールボックスをチェックすることなく、返信はできる仕組みになっているのです。なるほど、数字の差も納得ですね。


150827womeninashleymadison05.jpg


ハッカーImpact Teamも不満爆発のユーザーも、アシュレイ・マディソンを詐欺サイトだと評しています。その最たる理由に、アカウント閉鎖は有料なのにデータを消さず残していたというのがあがっています。今回の調査でもこの手のデータがデータベースに残されていました。17万3838個もの男性アカウントがEメールアドレスとともに「paid_delete」として残されていました。女性アカウントは1万2108個。これらのアカウントに関する他のデータも保持されたままでした。

この女性の1万2108個のアカウントこそ、もしかしたら偽ではなく本物の女性ユーザーの数だったのかもしれません。お金を払ってアカウントを削除するのは、登録した証でしょう。しかし、それ以上にアシュレイ・マディソンに対する失望の証です。

調査全体を通して見ると、550万人の女性ユーザーのうち、プロフィール制作後なんらかの動きがあったユーザーはほぼ0。

男性ユーザーはと言うと、2000万人が期待をこめてメールボックスを覗き、1000万人以上がチャットを試みていました。女性ユーザーの動きがあまりに少ないことから、あの場には女性がいなかったも同然だと言えます。

動きのなかったアカウントでも、偽ではなく、実在の女性がサイトに興味をもって試しに作ったという場合もあるでしょう。中には、夫の浮気を探るために作られたアカウントもあるでしょう。Newitz記者のようなジャーナリストによる登録もあるでしょう。しかし、それをさっ引いたとしても、いくらなんでも動きのないアカウントが多すぎるでしょうに。これらのアカウントの多くは、不倫を求める女性が出会いを望んで作ったわけじゃありません。アシュレイ・マディソンには女性ユーザーがいる、そう男性ユーザーに思わせるために作られたアカウントです。

アシュレイ・マディソンの社員は、何百万という女性アカウントを本物っぽく上手いこと作ってはいました。写真やニックネーム、セクシーなコメントなどなど、男性を惹き付ける要素を盛り込みました。が、データで見ると、偽アカウントの雑な面が見えてきます。EメールアドレスやIPアドレスは、偽アカウントのサインです。そして、あまりに少ないユーザーの動き、これではオンライン上で彼らが存在しないも同然です。アシュレイ・マディソンの社員は、そこまでフェイクで作り上げることはしなかったのです。

今回調査でわかった矛盾のあるデータ。偽アカウントではなく、別の理由がある可能性も0ではありません。もしかしたら、先述の3項目で女性アカウントのデータに何か不具合が起きたのかもしれません。もしかしたら、本当に登録しただけで活用しなかった女性が多いのかもしれません。どちらにせよ、アシュレイ・マディソンという出会いを目的としたサイトは、多くの男性が集まり、存在しない女性にあててメールを送り、チャットで話しかけていた悲しい場所だったことに間違いはありませんけれど。



art by Tara Jacoby
Thanks to Carlos Aguilar and Josh Laurito for tips and help analyzing the Ashley Madison dataset.

Annalee Newitz - Gizmodo US[原文
(そうこ)

  • このエントリーをはてなブックマークに追加
  • Anker® iPhone5S / iPhone5C / iPhone5用 強化ガラス液晶保護フィルム
  • Anker
  • Apple ハイビジョン対応 Apple TV MD199J/A
  • Apple Computer
・関連メディア