- Galaxy S IIIがもう売ってるみたい。ドバイで。
- 「ご近所の皆さまへ...」新本社屋についてAppleからお手紙が届きました。
- 金環日食ベスト写真&動画(海外編)
- 明暗をわけたフェイスブック取引初日のNASDAQシステム障害...FINRAが調査へ
- 〆切は本日23:59:59! 【シューティングチャレンジ:特別編】美人マイスピライターのスピたまさんが選んでくれますよ。金環日食をテーマに写真を撮ろう!
- この噂は本当か...来月発売の新「MacBook Pro」にはNvidiaの最新GPU「GeForce GT 650M」を搭載?
- [Android]見せてもらおうか、速さを追求したベータ版の性能とやらを! 『FireFox Beta』(比較動画あり) #TABROID
- Windows 8を複数モニターで使ってみた
- APSフィルム・カメラの時代がほぼ完全に終わりました
- 【グリーンアップル】Appleのデータセンターは全て再生可能エネルギーを使用します
- 画期的です! ソファのクッションの間に物がはさまって困...らない収納ソファ
- 太陽電池で動く人工網膜、ラットの実験に成功
- これ未来から来たの? 立体的なジェスチャーでMacやPCをコントロールできる「LEAP」がプレオーダー中! (動画)
- Chrome世界一! IEを抜いて、世界で最も使われているブラウザに
- 何月何日生まれが多いのか、一目でわかる誕生日チャート
- 家電店によってはMacBook Proがセール中! つまり...新モデルくるぞ!
- アップル、Siriに不満タラタラなユーザーへ「まだまだベータ版ですから」と反論中...
- おっ、このパソコン、5万円以下で安く買える...というケースで考え直したほうがいい5大原則! あと少しお金をかけるといい覚えておくべきポイントとは?
- ペンタックスが海外でK-30を発表
- アウトレットのPocket WiFi本体が月々2980円で使える! 新しくてお得な月額プランで使い倒す
- iPadがデスクトップで懐かしの「iMac G4」になっちゃうドックスピーカーが大人気
- iPadの時代は終わるのか...半額以下で買えちゃうアマゾンの新タブレット「Kindle Fire」の衝撃を斬ってみる!
- このiPad壊れてまちゅ! 赤ちゃんにとって雑誌は無意味(動画)
- おぉ!? 2012年にiPad miniがくるのかー!?
- iPadを擬似的に3D拡張する技術を日本の女子大生が開発中!
- iPhoneやiPadの音楽をAirPlayでワイヤレスに飛ばせるスピーカー、ポータブルな最強モデルが新発売
- 無敵iPadについに好敵手登場! Kindle Fire徹底レビュー
- 続々と挑戦者現る...ギズが出したiPad早打ちギネス記録を破っちゃえ!(動画)
- iPadの「スライドしてロック解除」をサーキットみたいに! by Audi(動画)
- iPhoneやiPadの楽器アプリで演奏するタイのガールズバンドとても素敵(動画)
- Appleファンが微笑むとってもレトロなiPad 2ケース
- iPhone・iPadを地デジ・CS/BS対応のワイヤレスデジタルテレビに! Wi-Fiアクセスポイントにもなるテレビチューナー
- iPadをしっかりと支えてくれるクマちゃん
- すごく細かい図形も描けるiPad用のスタイラスペン、Cregle iPen(動画)
- iPadじゃダメだ! Kindleじゃダメだ! 紙の本じゃなくちゃダメだ!(動画)
- 【募集!】GIZMODOなどメディアジーンの運営するメディアの営業にご興味のある方!
グーグルの頭脳が処理するのは「言葉」から「意味」へ
※ギズモード今回のテーマは「Memory [Forever]」
特集一覧はこちらからどうぞ
情報を扱う会社にとってデータセンターが頭脳だとしたら、グーグルの頭脳はずばぬけていると言えます。グーグルはどんどん進化していますが、基本的には、全てを「知りつくす」ビジネスで、その扱うデータは膨大です。
グーグルがいかにその頭脳を磨いているのか、続きで解説します!
膨大なデータを処理するためのグーグルの主要武器はMapReduceという自社開発システムです。通常のフレームワークでは、きちんとタグ付けされ、整理されたデータベースが必要になるのに対し、MapReduceはプロセスをシンプルにすることで、どんなデータでも処理でき、たくさんのマシンに分配することができています。
MapReduceには、その名のとおりふたつのステップがあります。MapステップとReduceステップです。2008年時点、WiredではGoogle Books内での単語出現頻度の判定タスクを想定した解説をしています。
Mapステップには、MapReduceの独自性が表れています。マスタコンピュータがリクエストを受け取ると、それをより小さな、処理しやすい「サブ問題」としてワーカーコンピュータに分配します。「サブ問題」は、データが複雑な場合はワーカーコンピュータによってさらに分割されます。例で言うと、Google Books全体はマスタコンピュータによってたとえば著者別に分割され(おそらく実際はスキャンされた順とかですが)、ワーカーコンピュータに分配されていきます。
次にそのデータは保存されます。効率を最大化するため、元データはワーカーコンピュータのローカルハードドライブに保存され、マスターコンピューターには処理結果のみが戻されます。
次にReduceステップです。データを保存しているコンピュータから、別のコンピュータが、データを受け取り、問題を処理しやすいフォーマットに整形します。Google Booksの例で言うと、ここでは処理データを個々の単語とその単語のGoogle Books全体での出現頻度のリストに整形します。
MapReduceシステムのアウトプットは、Wiredによると「データについて記述されたデータセット」です。このケースでは、アウトプットされたデータには、各単語に対し、その単語のGoogle Booksでの出現頻度が記述されています。単語を聞くと、その単語がGoogle Booksに何回出て来るかを答えてもらえる、ということになります。

MapReduceは、グーグルが膨大なデータを処理するための技術のひとつにすぎません。もうひとつのすごい技術は、すでにグーグルのマシンが持っているデータ、すなわちインターネット上のデータ全体の処理技術です。
先月のWiredではグーグルの「Webを支配するアルゴリズム」が検討される様子を伝えていました。そこでのポイントは、グーグルには、固定されたアルゴリズムはひとつもない、ということです。むしろ、グーグルは常に技術を進化させています。ソーシャルメディアなどの新たな検索対象を開拓し、検索のパーソナライズなどの手法で検索精度をより高めています。
が、グーグルの技術の究極目的は、検索された言葉と、検索結果のWebサイトをマッチさせることにとどまりません。グーグル検索の神、アミット・シングハルさんは「言葉のマッチングだけじゃだめ。意味のマッチングが必要なんだ。」と説明します。
言葉は、使われる言葉全部を集めても、有限のデータセットです。言葉を保存するだけなら巨大なデータセンターは不要で、辞書があれば足りてしまうでしょう。が、意味の方は、おそらく人類にとってもっとも深遠なデータセットであり、我々人類が日々処理し、格闘しているものです。
我々人間の中にはいわばMapReduce機能、またはもっと柔軟に微妙な問題まで扱える機能があり、言葉や現象の意味を探し、文脈や背景を捉え、我々がどう反応すべきかを考えているのです。
ある意味、グーグルのデータ処理機能は我々の能力を大きく超えていますし、MapReduceのようなフレームワークはそれを表す一例と言えます。が、意味を処理する能力は、まだまだ、たった一人の人間でも、グーグルのマシン群より高いと言えるでしょう。
グーグルの「頭脳」が、「意味」のうえでも人間を超える日はやってくるのでしょうか?
ギズモード今回のテーマは「Memory [Forever]」。
デジタルにエンコードされたメモリー、永久に残るメモリーの意味を一緒に考えていきます
[Wired, Wikipedia, and Wired / Image credit to CNET]
Kyle VanHemert(原文/miho)
グーグルは「意味」さえも飲み込む。
-
[an error occurred while processing this directive]
-
申し訳ありません。訂正しました。...
-
オーギュスト・ピカール氏の気球による実験の先例がありますから、宇宙開発としてはロケットよりルーツは古...
-
カメラジャーナリストの田中長徳さんはiPadで雑誌記事の仕事をこなしておられるようですよ。RealD...
» 本当にノートパソコンが要らなくなるタブレットを実現するための3原則はこれだ! 最新のiPadでさえ物足りなく感じる理由とは...
-
俺の誕生日付近めちゃ濃くてワロタクリスマスチャイルドかよ...
-
どうやってメールは送られるの?という問いの答えはテキトーに済ませて後半は聞かれてもいないことを延々と...
コメントは承認制となっております。編集部が確認および承認した後に、サイトへ反映されることになるので、多少時間がかかってしまうことがあります。
また、公序良俗に反する内容、個人や団体を誹謗中傷する内容、その他不適切と判断させていただいた内容については、否認または削除させていただく場合もございます。ご了承ください。
Only japanese available.
このエントリーのトラックバックURL :












ひょっとしたら、リアルHAL-9000(のようなもの)を創り出すのはGoogleかもしれない。
HALというよりも、スカイネットのような気がしてきた
文末の疑問、人間の頭脳との比較だけでみてとると、可能性を繋げるという未知の部分が多才に富んでいてヒントが隠されているのでは、と感じる節もあります
人間には感情がある、人工物へは間接的に感情や思い出といった記憶が宿るのではと思うときもある
個人的に検索を駆使して学ぶには、多才で、そこから選ぶことが難しく思えたり偏りから不安に苛(さいな)まれましたが、総合的に判断が付く事も多々有り得るのは、その人の主観からであり、アクセス解析されたと仮定して順序立てをされたらそれこそそれぞれの順序立てであっぷあっぷ(いっぱいいっぱい:容量オーバー)になりそう
限界を始めとする可能性の筈が、感情を伴った方向を軸に進むのは理解しがたい。
年代別に分けられたらと思うとこわい、体感することや体を動かすことで得てきただろう知恵が、頭を働かせることで行動力が低下する、極端でなければ良かった
にや笑いで体に悪いものが流行ったりしているのは何故だろう、それに対して感情が働くから・だかもしれん、尽きない言葉
要因に過ぎない、プラマイゼロではないので少なからず知った人達が影響を受け、名が晒された、理解したのはそれにも増して狡賢くならないために批判があり、それを嬉しがる気持ちが存在すること、惑わされないためにとか
言ってスッキリするのは言われたり聞いたりした人へ苛立ちや聞き難い状況なのだろうか
言ってもやもやするのは言われたり聞いたりして意見を変えたくなるからだろうか、何にせよ関わってるから生きてきていると言えそうな状況に対して文句をいえる立場ではないと蓋をされた感情が目に余る。
起こった出来事に何も関心がないのかと思えば、後付けされて記憶が消えたのと同時に同時期に時期はずれに私事の訂正や提案が聞こえる場ではないはずなのにあった、もう遅いとメールが来てその後ちらっと思った
説明が長くなるのは伝えたいと思っての伝わりがたい部分、色々知れば憤りが紛れると思った。
それに対して相手に対しての憤りから自分に向けた憤り穏和
事実無根事実、勝手に解釈するな、言えなくて良かったか、自分一人でコロコロかわって嘘だと気付いて八つ当たり止めろよ、こういう風にして誰が だから伝わらん 追いやってんのか 避けてんのか うざい うざい うざい うざい うざい うざい はけ口→過去の自分へ みたいな むかつく 弱々しく言っててもいわれてる側がどーんとしてりゃこわいわな、ぼーっとしていただけ、頭大丈夫 どうにかしようともがいても、過去体験してきたんだから 未来を当てにするな 誰があんなん書いてたか分かるか 嫌いだったんだ 信じられん 嫌だ 人生どうした 何でもなくない 気持ち悪い 嫌み だから こんぐらっちゅれいしょん
策にはめようとしても無駄無駄無駄雁字搦めになってくし、おかしな言葉使いで悪かったね イライラしてりゃそうなるらぶつけられてそういう気持ちいやだったっしょ 勘弁 で離れる材料を探した で小さなキッカケから利用した どんだけ 正しいとされるドアが開かれて妨害 悪いとされるドアが閉じていて安らぎ 道が閉ざされてから意思とは無関係に事柄が進んだ後悔 うざったい安い感情 追いやられた振り回された感情 イライラ体を蝕む 蝕めば 心配して損したんだろ 理解できなくて離れたんじゃないのか なに考えてんの だ、れ 誰がつかっとと か 規則 わがまま見てて どう思ったか言え 余暇を楽しめ これ被害届出したの 被害はちょこっとずつバラバラになったから 無理 だからむかつく 聞いてて 落ち着く ぁ 烏滸がましい おこがましいか、 どなた 陰に隠れて ら あああああああ 意図杖 三本足 あんなんね 砕けた言葉 使い お疲れサントス
あああああああ
あっぷっぷ 古いものから新しく ららららら: Wwwww:99999: わわわわわ
いちいちしゃくに障れども真似 真似:マネー:魔ね:間ね :真ね:
急がば回れしがらみ
なににつなげたか誰がつなげたか I(つ) /S(イメ)
ふГわ く ⊃┤ つ~か
大丈夫ですか?
匿名 | 2010.03.24 02:22 | 返信まで読んだ
>>意味のマッチングが必要なんだ。
もしそれが出来るようになれば、PCと会話するような形で検索する事も出来る様になるね。
人と意味の通った会話の出来るAIの実現もそう遠くないのかも