週末アメリカは落雷、うるう秒でネットが大混乱

週末アメリカは落雷、うるう秒でネットが大混乱 1

インターネットが落ちるなんて滅多にないのですが、週末アメリカは落雷と閏(うるう)秒のバグで落ちまくりでした! 

 

落雷停電がEC2米東部のサーバー直撃

 

まず30日(米時間)夜、米首都ワシントンを秒速80マイル(129km)近い暴風が通過し、倒木などで22名が死亡、落雷で停電が大発生しました。

北ヴァージニアにあるアマゾンウェブサービス「EC2(Elastic Compute Cloud)」米東部地域のサーバーも影響をモロに被り、EC2を利用しているネットフリックス、インスタグラム、ピンテレスト、SocialFlow(米ギズが記事のツイートやフェイスブックへのリンク投稿に使ってる)などのサイト&サービスがどっとダウン。

 

週末アメリカは落雷、うるう秒でネットが大混乱 2

 

アマゾンはEC2サービスレベルアグリーメントで「99.95%のアップタイム」を保証しているので、本当はあってはならない問題なのですけどね...。5月に米ギズの「ネットを破壊する方法(英語)」という記事を書いたサム・ビドル記者はD.C.郊外でアムトラック(電車)が止まって車内で立ち往生しました...これもカルマでしょうか...。

停電は一部の地域で月曜の翻訳段階も続いていて、3日連続の猛暑とあいまって大変なことになってます。早く復旧するといいですね。

  

3年半ぶりのうるう秒で障害

 

週末アメリカは落雷、うるう秒でネットが大混乱 3

 

しかも30日夜は「うるう秒」バグでYelp、Reddit、ギズのGawkerが落ちまくるダブルパンチ!

うるう秒というのは、地球の自転が時計より遅いため、その遅れを埋めるため世界中の国際原子時計を1秒止めて待ってやることで、この1秒を「うるう秒(leap second)」と呼びます。1972年から既に24回やってて今回が25回目。それがよりによって嵐で阿鼻叫喚の最中、グリニッジ標準時6月30日から7月1日の日付けの変わり目に起こったんでございますよ。

本来なら原子時間に合わせてサーバー、ネットワーク、ラップトップも6月30日12:59、12:60(0:00)、0:00...という具合に、0:00を足踏みして2回カウントしなきゃならないんですが、その対応をしてないとマシンの調子が狂っちまうのですね。この障害でGizmodoも東海岸時間8:00pm(グリニッジ標準時の-4時間)キッカリにダウンし、復旧までに大体45分かかりました。トホホ...。

逆に対応がしっかりしてたのが、グーグルです。ワイヤードが書いてるように、うるう秒に備えて、なんと昨年9月から「Leap Smear(うるう退治)」というパッとしない対応戦術を練り、実行してきたそうなんですよ。Googleブログには、こう説明があります。

「当社が行き着いたソリューションは、後に『Leap Smear』と呼ばれるようになったもの。うるう秒が来る前に社内のNTPサーバーを調整し、アップデートの度に数ミリ秒ずつ徐々に加えていって時間枠内に分散するのだ。これならいざ深夜零時に1秒加える段になっても、当社の時計は既にこれを見越して調整済みというわけだ。サーバーもすべて通常通り運転が続けられる、うるう秒が起こったことなど意識せずに。今後IERSからうるう秒の発表があれば、またこの『leap smear』のテクニックを使う予定だ。」

日本はうるう秒対応もしっかりしてましたねー。(追:mixiは4時間落ちたんですね、失礼しました!)

 

関連:"閏秒"、3年半ぶり25回目の実施-ナショナルジオグラフィック

Adrian Covert(原文1, 原文2/satomi) Image: Thingkstock, Thinkstock