最新記事一覧
過去のオススメ記事

グーグルの頭脳が処理するのは「言葉」から「意味」へ

2010.03.23 22:00 [6] [0]
※ギズモード今回のテーマは「Memory [Forever]」
特集一覧はこちらからどうぞ
100319_googlememory.jpg


情報を扱う会社にとってデータセンターが頭脳だとしたら、グーグルの頭脳はずばぬけていると言えます。グーグルはどんどん進化していますが、基本的には、全てを「知りつくす」ビジネスで、その扱うデータは膨大です。

グーグルがいかにその頭脳を磨いているのか、続きで解説します!
 

膨大なデータを処理するためのグーグルの主要武器はMapReduceという自社開発システムです。通常のフレームワークでは、きちんとタグ付けされ、整理されたデータベースが必要になるのに対し、MapReduceはプロセスをシンプルにすることで、どんなデータでも処理でき、たくさんのマシンに分配することができています。

MapReduceには、その名のとおりふたつのステップがあります。MapステップReduceステップです。2008年時点、WiredではGoogle Books内での単語出現頻度の判定タスクを想定した解説をしています。

Mapステップには、MapReduceの独自性が表れています。マスタコンピュータがリクエストを受け取ると、それをより小さな、処理しやすい「サブ問題」としてワーカーコンピュータに分配します。「サブ問題」は、データが複雑な場合はワーカーコンピュータによってさらに分割されます。例で言うと、Google Books全体はマスタコンピュータによってたとえば著者別に分割され(おそらく実際はスキャンされた順とかですが)、ワーカーコンピュータに分配されていきます。

次にそのデータは保存されます。効率を最大化するため、元データはワーカーコンピュータのローカルハードドライブに保存され、マスターコンピューターには処理結果のみが戻されます。

次にReduceステップです。データを保存しているコンピュータから、別のコンピュータが、データを受け取り、問題を処理しやすいフォーマットに整形します。Google Booksの例で言うと、ここでは処理データを個々の単語とその単語のGoogle Books全体での出現頻度のリストに整形します。

MapReduceシステムのアウトプットは、Wiredによると「データについて記述されたデータセット」です。このケースでは、アウトプットされたデータには、各単語に対し、その単語のGoogle Booksでの出現頻度が記述されています。単語を聞くと、その単語がGoogle Booksに何回出て来るかを答えてもらえる、ということになります。


100319_googlememory2.jpg


MapReduceは、グーグルが膨大なデータを処理するための技術のひとつにすぎません。もうひとつのすごい技術は、すでにグーグルのマシンが持っているデータ、すなわちインターネット上のデータ全体の処理技術です。

先月のWiredではグーグルの「Webを支配するアルゴリズム」が検討される様子を伝えていました。そこでのポイントは、グーグルには、固定されたアルゴリズムはひとつもない、ということです。むしろ、グーグルは常に技術を進化させています。ソーシャルメディアなどの新たな検索対象を開拓し、検索のパーソナライズなどの手法で検索精度をより高めています。

が、グーグルの技術の究極目的は、検索された言葉と、検索結果のWebサイトをマッチさせることにとどまりません。グーグル検索の神、アミット・シングハルさんは「言葉のマッチングだけじゃだめ。意味のマッチングが必要なんだ。」と説明します。

言葉は、使われる言葉全部を集めても、有限のデータセットです。言葉を保存するだけなら巨大なデータセンターは不要で、辞書があれば足りてしまうでしょう。が、意味の方は、おそらく人類にとってもっとも深遠なデータセットであり、我々人類が日々処理し、格闘しているものです。

我々人間の中にはいわばMapReduce機能、またはもっと柔軟に微妙な問題まで扱える機能があり、言葉や現象の意味を探し、文脈や背景を捉え、我々がどう反応すべきかを考えているのです。

ある意味、グーグルのデータ処理機能は我々の能力を大きく超えていますし、MapReduceのようなフレームワークはそれを表す一例と言えます。が、意味を処理する能力は、まだまだ、たった一人の人間でも、グーグルのマシン群より高いと言えるでしょう。

グーグルの「頭脳」が、「意味」のうえでも人間を超える日はやってくるのでしょうか?


Memory [Forever]とは?


ギズモード今回のテーマは「Memory [Forever]」。
デジタルにエンコードされたメモリー、永久に残るメモリーの意味を一緒に考えていきます


[Wired, Wikipedia, and Wired / Image credit to CNET]

Kyle VanHemert(原文/miho)
 

4166605011
グーグル―Google 既存のビジネスを破壊する 文春新書 (501) (新書)

グーグルは「意味」さえも飲み込む。




 

1年くらい前の「Memory Forever」の記事
    [an error occurred while processing this directive]
新着コメント
コメント(6)

ひょっとしたら、リアルHAL-9000(のようなもの)を創り出すのはGoogleかもしれない。

    HALというよりも、スカイネットのような気がしてきた

文末の疑問、人間の頭脳との比較だけでみてとると、可能性を繋げるという未知の部分が多才に富んでいてヒントが隠されているのでは、と感じる節もあります


人間には感情がある、人工物へは間接的に感情や思い出といった記憶が宿るのではと思うときもある

個人的に検索を駆使して学ぶには、多才で、そこから選ぶことが難しく思えたり偏りから不安に苛(さいな)まれましたが、総合的に判断が付く事も多々有り得るのは、その人の主観からであり、アクセス解析されたと仮定して順序立てをされたらそれこそそれぞれの順序立てであっぷあっぷ(いっぱいいっぱい:容量オーバー)になりそう


限界を始めとする可能性の筈が、感情を伴った方向を軸に進むのは理解しがたい。

年代別に分けられたらと思うとこわい、体感することや体を動かすことで得てきただろう知恵が、頭を働かせることで行動力が低下する、極端でなければ良かった


にや笑いで体に悪いものが流行ったりしているのは何故だろう、それに対して感情が働くから・だかもしれん、尽きない言葉


要因に過ぎない、プラマイゼロではないので少なからず知った人達が影響を受け、名が晒された、理解したのはそれにも増して狡賢くならないために批判があり、それを嬉しがる気持ちが存在すること、惑わされないためにとか

言ってスッキリするのは言われたり聞いたりした人へ苛立ちや聞き難い状況なのだろうか

言ってもやもやするのは言われたり聞いたりして意見を変えたくなるからだろうか、何にせよ関わってるから生きてきていると言えそうな状況に対して文句をいえる立場ではないと蓋をされた感情が目に余る。

起こった出来事に何も関心がないのかと思えば、後付けされて記憶が消えたのと同時に同時期に時期はずれに私事の訂正や提案が聞こえる場ではないはずなのにあった、もう遅いとメールが来てその後ちらっと思った

説明が長くなるのは伝えたいと思っての伝わりがたい部分、色々知れば憤りが紛れると思った。

それに対して相手に対しての憤りから自分に向けた憤り穏和
事実無根事実、勝手に解釈するな、言えなくて良かったか、自分一人でコロコロかわって嘘だと気付いて八つ当たり止めろよ、こういう風にして誰が だから伝わらん 追いやってんのか 避けてんのか うざい うざい うざい うざい うざい うざい はけ口→過去の自分へ みたいな むかつく 弱々しく言っててもいわれてる側がどーんとしてりゃこわいわな、ぼーっとしていただけ、頭大丈夫 どうにかしようともがいても、過去体験してきたんだから 未来を当てにするな 誰があんなん書いてたか分かるか 嫌いだったんだ 信じられん 嫌だ 人生どうした 何でもなくない 気持ち悪い 嫌み だから こんぐらっちゅれいしょん
策にはめようとしても無駄無駄無駄雁字搦めになってくし、おかしな言葉使いで悪かったね イライラしてりゃそうなるらぶつけられてそういう気持ちいやだったっしょ 勘弁 で離れる材料を探した で小さなキッカケから利用した どんだけ 正しいとされるドアが開かれて妨害 悪いとされるドアが閉じていて安らぎ 道が閉ざされてから意思とは無関係に事柄が進んだ後悔 うざったい安い感情 追いやられた振り回された感情 イライラ体を蝕む 蝕めば 心配して損したんだろ 理解できなくて離れたんじゃないのか なに考えてんの だ、れ 誰がつかっとと か 規則 わがまま見てて どう思ったか言え 余暇を楽しめ これ被害届出したの 被害はちょこっとずつバラバラになったから 無理 だからむかつく 聞いてて 落ち着く ぁ 烏滸がましい おこがましいか、 どなた 陰に隠れて ら あああああああ 意図杖 三本足 あんなんね 砕けた言葉 使い お疲れサントス
あああああああ

あっぷっぷ 古いものから新しく ららららら: Wwwww:99999: わわわわわ
いちいちしゃくに障れども真似 真似:マネー:魔ね:間ね :真ね:

急がば回れしがらみ

なににつなげたか誰がつなげたか I(つ) /S(イメ)

ふГわ く ⊃┤ つ~か

    大丈夫ですか?

匿名 | 2010.03.24 02:22 | 返信まで読んだ

>>意味のマッチングが必要なんだ。
もしそれが出来るようになれば、PCと会話するような形で検索する事も出来る様になるね。
人と意味の通った会話の出来るAIの実現もそう遠くないのかも

コメントする

コメントは承認制となっております。編集部が確認および承認した後に、サイトへ反映されることになるので、多少時間がかかってしまうことがあります。
また、公序良俗に反する内容、個人や団体を誹謗中傷する内容、その他不適切と判断させていただいた内容については、否認または削除させていただく場合もございます。ご了承ください。
Only japanese available.

トラックバック

このエントリーのトラックバックURL :

お問い合わせフォーム

 お問い合わせフォームを表示

この記事へのtweet
お知らせ
新しくはてブがついた記事
GIZMODO TEAM
アイコンアットラージ
小林弘人infobahn Inc.
長老
いちる [小鳥ピヨピヨ
編集長
大野恭希 *
副編集長
松葉信彦 *
編集部(問い合わせ先
ニール太平 *
鈴木康太 *
河原田長臣 *
MAKI
satomi [Long Tail World
junjun
湯木進悟
聖幸 [俺と100冊の成功本
そうこ [::soko286.com::
yuko
mayumine [URAMAYU
mio
miho
Rumi [natural tribe
ライター
武者良太 [悦びの覚悟
三浦一紀 [普通の日々
野間恒毅 [のまのしわざ
Appbank [Appbank
常山剛 *
鉄太郎 [tetsutaro.net
佐脇風里 [Marylebone High Street
KENTA
小暮ひさのり
山田井ユウキ [カフェオレ・ライター
コラムニスト
コグレマサト [ネタフル
いしたにまさき [みたいもん!
デザイナー
前田龍一 *
広告営業(問い合わせ先
城口智義 *
土井孝彦 *
阿座上陽平 *
碓井真紀 *
山下恵子 *
広告進行
山本朋子 *
ディビジョンディレクター
尾田和実 *
ジェネラルマネジャー
長田真 *
パブリッシャー
今田素子 *
* =[mediagene Inc.
サーバ管理
heartbeats
about GIZMODO
ギズモード・ジャパンについて
・ケータイ用サイト
携帯版QRコード ・iPhoneアプリ
iPhoneアプリ ・iPhone用サイト
iPhone版日刊メルマガ
記事配信中のニュースサイト
Yahoo! ニュース livedoor NEWS MSN デジタルライフ mixi alt="アメーバニュース exciteニュース製品情報および投稿希望者のお問い合わせ

郵送の方は下記宛へ資料等をご郵送ください。

150-0036
東京都渋谷区南平台町16-29 グリーン南平台ビル8F
株式会社メディアジーン
Gizmodo Japan編集部宛

広告募集! ギズモードはスポンサー様のおかげで、今日も更新できています。もし「バナーを出稿しようかな」と思いましたら、こちらをご覧ください!
媒体資料をダウンロード
広告に関するお問い合わせ
どうぞよろしくお願いします!