薬物使用や同性愛も。Facebookの「いいね!」からわかっちゃうこと

薬物使用や同性愛も。Facebookの「いいね!」からわかっちゃうこと 1

人種とか宗教とか支持政党とか。

我々がオンラインで公開している情報は何だって、自分について多かれ少なかれ開示するものです。でも、大量のデータを集めて統計的手法で分析することで、開示した情報以上のプライベートなことがバレてしまうことがわかりました。

ケンブリッジ大学とマイクロソフトリサーチは共同で、Facebookの「いいね!」からどれだけのことがわかるのかを研究してきました。彼らはMyPersonalityというFacebookアプリを使ってFacebookユーザーのデータを集め、そのうち5万8000人分のFacebookやパーソナリティ・テストのデータを対象に、コンピューターサイエンティストたちが分析したのです。

その結果、性別や人種、宗教、政治的信条などを80%以上の精度で推定できることがわかりました。元データはこちらの公開Wikiで見られます。

ウォール・ストリート・ジャーナルには次のように書かれています。

研究者らはコンピューターモデルを使い、ある人物の支持政党が民主党か、共和党かを85%の精度で推定黒人/白人は95%、同性愛者/異性愛者は88%の精度で推定できた。

この研究による論文は学術誌「Proceedings of the National Academy of Sciences」で公開されました。さらにウォール・ストリート・ジャーナルによれば、こんな意外な発見もありました。

研究者らは、「テキサス州オースティン」、映画「ビッグママ」シリーズ、「付き合いはふたりでするものであって、宇宙全体とじゃない」という言葉にすべて「いいね!」している場合、その人物が薬物を使っていることを推定できた。同様の「いいね!」の組み合わせが10パターンほど発見された。一方、水泳、チョコチップクッキー生地入りアイスクリーム、「靴下をはいて床の上を滑る」すべてに「いいね!」している場合、薬物を使っていない人物だと推定された。

「いいね!」からそこまでわかっちゃうなんて怖いですが、じゃあもう「いいね!」しなければいいかっていうと、そういう問題でもありません。この研究ではたまたまFacebookの「いいね!」データを使っただけであって、同様の手法を他のデータ用にアレンジすれば、同じような推定ができてしまうと考えられます。つまり、我々がオンライン上に何気なく公開しているデータの寄せ集めで、いろんなことがバレてしまうんです。ううむ。

PNAS via WSJ via Verge

Image by Ksayer1 under Creative Commons license

Jamie Condliffe(原文/Miho)