2008-11-28

10歳になったGoogle ([著]Googlerたち, [版]Official Google Blog) #7

Building a future that's clean and green -- Posted by Bill Weihl, Green Energy Czar (9/22/2008)

But for that vision to become real, the technologies to power it will have to be economically competitive -- otherwise they won't scale. So we are focusing much of our effort on technology innovation to drive down the costs of key renewable technologies.

これからの10年の間に、世界はより清潔に、緑あふれるようになる。それを夢見ている、と。ただしそのためには、エネルギーに関する新技術(ないしは既存のものへの革新)が必要である。さらに、それが従来の化石燃料を燃やしたり、重い元素を分裂させたりと言った方法とくらべて「安い」ものでなければならない。でないと、普及しないから。だから(Googleでは)既存の(革新可能な)技術のコストを下げることに注力している、と。

まあ、そんな内容。無闇に新しい代替手段を求めるのではなく、すでにあるけどコスト的に見合わないものを、競争力のある程度にまでコストを下げる方法を探る、という現実的な路線を選ぶところがgoogleっぽい、ってところかな。

Sorting 1PB with MapReduce ([著]Grzegorz Czajkowski, [版]Official Google Blog)

Official Google Blog: Sorting 1PB with MapReduce

Sometimes you need to sort more than a terabyte, so we were curious to find out what happens when you sort more and gave one petabyte (PB) a try. One petabyte is a thousand terabytes, or, to put this amount in perspective, it is 12 times the amount of archived web data in the U.S. Library of Congress as of May 2008. In comparison, consider that the aggregate size of data processed by all instances of MapReduce at Google was on average 20PB per day in January 2008.

It took six hours and two minutes to sort 1PB (10 trillion 100-byte records) on 4,000 computers. We're not aware of any other sorting experiment at this scale and are obviously very excited to be able to process so much data so quickly.

...Where do you put 1PB of sorted data? We were writing it to 48,000 hard drives (we did not use the full capacity of these disks, though), and every time we ran our sort, at least one of our disks managed to break (this is not surprising at all given the duration of the test, the number of disks involved, and the expected lifetime of hard disks).

ペタは 2^50。って、正直言って、一般人じゃ想像の及ばないスケールになっている。

そして、スケール感にくらまされて見落しがちなのが次の段落にある「1PB のデータをどこに置く?」ってこと。「うん? HDD をいっぱい用意すればいいんじゃね?」と、ここまでは想像がつく。けどその先、1回ソートを実行すると、48000個の HDD のうち1個が必ずぶっこわれる、ってことまでは気が届かない。

日常のスケールでは問題にならない信頼性(の高さ)でも、極端なスケールを扱う場合には欠陥として浮上してくる。そういう問題を扱うときには相応の対策が必要なのだ。指摘されれば理解できるけど、経験がないと気付けないよねえ。実際、こういうレベルのスケールを扱ったことのあるヒトって少ないでしょう? まったくビックリだよ(;゜Д゜)

関連エントリ

2008-11-16

STUDY STYLE LIFE HACKS 勉強法 ([著]佐々木正悟, [版]Gakken)

まずは自分のタイプを自己診断してみる。

暗記型と理解型 → 理解型

好奇心型と目的達成型 → 好奇心型

独習型とスクール型 → 独習型

以下にそう判定する理由を本文からの引用で示す。

理解型の理由

p.16
一般の書籍のようにこぼれ話やエピソードなどいろいろなことが「書いてある」のを読んでみて、面白いと感じる人は、理解型勉強法が向いているでしょう。そうした人は理解することが自然と面白く感じられる人なのです。

好奇心型の理由

p.23
勉強することで収入がアップしたり称賛されればそれはそれでうれしいかもしれませんが、その喜びはあくまでも付加的・二次的なものであって、勉強する理由は勉強したいから

独習型

p.27
「ひとりのほうがずっと気楽・・・(後略)・・・」