あなたのDNA情報、グーグルに提供してみますか?

あなたのDNA情報、グーグルに提供してみますか? 1

いろいろとハードルはありそうですが、これがきたる未来かも?

Tech Reviewによると、過去18ヶ月間、グーグルは密かにDNA用のクラウドコンピューティングサーヴィスGoogle Genomicsを公開してきました。近い将来、これによって、数百万のDNA情報がサーバーへ保存可能になり、研究者が手軽にその情報をダウンロードできるようになるかもしれません。勿論、そこにはプライヴァシーへの懸念がありますが、心配すべきなのはグーグルの魔の手ではないのです。

DNAのデータベースはGoogle Genomicsが初ではありません。ただ、最も新しく、野心的なプロジェクトであることは間違いないでしょう。既に、血筋を辿ることで先祖や遠い親戚を見つけるデータベースや、国立研究施設によって運営され、一般公開されている遺伝子情報データベースが存在します。さらに、研究グループが用途に応じて閲覧可能なデータセットも無数にあります。

Google Genomicsは研究施設や大学に赴き、彼らの保有するDNA情報を、ひとつあたり年間25ドルで管理するともちかけています。保管できるDNAが多ければ多いほど、研究者たちによるデータ共有が容易になるわけです。

Google Genomicsの大いなる可能性とは?

DNA塩基配列は、単体では意味を成しません。他のサンプルと比べなければ通常と変異の区別がつかないのです。サンプルが2つあれば少しずつわかってきますが、変異にもさまざまな種類があり、限界があります。でも、サンプルが何百、何千とあれば、問題を特定できる可能性は飛躍的に向上します。データベースは大きければ大きいほど良いのです。

DNAシークエンシングはこれから安くなる一方ですが、そこから生まれるテラバイト級のデータを管理するのは容易ではありません。サイズが膨大なうえに、異なるデータセットが各々の研究グループによって管理され、一定の条件下でのみデータがやりとりされています。対照的にグーグルが目標とするのは、研究者が一度に何百万もの配列にアクセスできるような、集中型のデータベースです。これこそが、パーソナル化された医療のためのインフラと言えます。

例えば、あなたが希有で謎の病気にかかったり、癌になったとします。そんな時、あなたの塩基配列をデータベース内の何百万人もの人のそれと比較すると、あなたという個人に最適な治療方法が見えてくるのです。

でも、ブライヴァシー問題をどう解決する?

プライヴァシの問題は、ビッグデータにはつきものです。DNAデータベースの最大の問題は、DNA情報と共にどれだけの個人情報を提供するのかということ。年齢、性別、場所、喫煙するか等、情報が多ければ多い程研究者にとって有用となりますが、その分個人の特定が容易になってしまいます。

昨年に行われたサイエンス誌の実験によると、一般公開されている1,000人ゲノムプロジェクトのDNA情報と、Y 染色体、年齢、場所、そして家系データを照合するだけで、数人が特定できてしまったそうです。Google Genomicsのデータは一般ではなく研究者向けのものですが、膨大なDNA情報を提供する以上その懸念は深まります。

例えば、癌の研究のためにあなたのDNA情報をシークエンシングしたとします。あなたの情報は中央データベースにアップロードされ、全く別の研究をしている研究者達がそれをダウンロードし、偶然稀な病気や、あなたも知らない兄弟を発見したとします。彼らはそれをあなたに伝えるべきなのでしょうか?

この懸念は何もGoogle Genomicsに限ったことではありませんが、彼らの目標とするスケールがあまりに膨大なため、その分問題の可能性も大きくなってしまうのです。研究者たちは、グーグルに任せるかどうかは別として、中央型DNAデータセンターたちに、プライヴァシーに関する方針を標準化するように求めています。Google Genomicsが成功するとしたら、それはDNAシークエンシングに関するプライヴァシー問題があっても、我々が納得せざるを得ないようにするためです。

Sara Zhang - Gizmodo US[原文

(scheme_a)