NW屋的日常徒然日記

ネットワークを専門にする元社内SEの日常とITネタ諸々を綴って行きます。

Googleが誤経路制御情報を送信した件の続きについて

 こんばんは。Googleが誤経路制御情報を流してしまい、OCNやKDDIがとばっちりで通信障害を引き起こした問題についての考察が出ていましたので、取り上げます。

 こちらはITproの記事です。

itpro.nikkeibp.co.jp

 記事でも書かれているように、確かに海外で同規模の障害が発生したというような話は特に出ていませんでした。なぜ日本、特にOCNとKDDIに集中したのか?という疑問が新たに出てきます。そのあたりに関して、分かりやすく解説されています。

 本来経由しなくていいパケットまで「OCNへの最短経路はベライゾンからGoogleへ向かうルートだ」という大量の誤経路制御情報を掴んでしまったルータによって迂回させられたというのが真相のようです。大回りすることで遅延やパケットロスが発生してしまったと解説されています。

 これ以外にも大量の経路制御情報を掴まされてしまった各ISPのルータが経路再計算のために大幅にリソースを消費してしまい、まともに機能しなくなってしまったことで通信障害が発生したことが真相のようです。KDDIの場合はGoogleからベライゾンに送られてきた経路制御情報が大量に降ってきたことで、配下のISPにも通信障害が発生したとあります。

 そして、こちらは著書「インターネットのカタチ」で話題になっているあきみちさんのブログです。オレゴン大学が公開しているBGPフルルート情報を解析したという記事です。

GoogleがBGPでリークした情報の中身を見てみよう:Geekなぺーじ

 Googleが正しい経路制御情報を8分後に送信したことが解析結果より間違いないとの分析をしておられました。8分後に訂正したから、即座に解消するわけではないという理由についても説明しておられます。正しい情報を受け取っても、そこからさらに再計算して適切な経路を算出しないといけません。膨大な間違った情報を受け取ってしまったルータが正しい経路を再計算するのに時間もかかりますし、処理能力を超える誤ったデータを受け取ってしまったルータはハングアップという事態に陥ったことも理解出来ます。「大量の経路制御情報を受け取らないようにフィルタをかけてなかった」というような指摘もありましたが、特にBGPにおいては性善説で成り立っている部分が大きいですから、根本的問題解決はそう簡単ではないんだろうなぁと思います。

 と、余談ですが、産経新聞の記事で野田総務大臣が今回の障害の詳細を調査すると会見しました。

www.sankeibiz.jp

 既にGoogle側のミスだということは報道されていますが、効果的な再発防止策は見つからないと思うのですが…。まさかプロトコルの根幹から変えるとか言い出したりはしないですよね???