Infoseek 楽天

KDDIは通信障害をどのように検知してインフラを守っているのか ネットワークセンターに潜入

ITmedia Mobile 2024年7月24日 17時2分

 KDDIは7月23日、東京・多摩市にある通信ネットワークの設備を公開した。名称は「多摩第5ネットワークセンター(多摩第5NC)」で、常にネットワークを監視・運用する。

 同日、KDDIが重要な社会インフラである通信ネットワークをどのようにして、24時間365日守るのか、通信障害などの対策をどのように行うのかを説明した他、通信ネットワークを監視するモニターや災害を支援する車載基地局などを公開した。

●スマートオペレーションとAIによる自動化がもたらす効果

 多摩第5NCがある多摩は地盤が硬く揺れにくい地形で、水害リスクが低いエリアとなっている。加えて、建物を免震構造とすることで、地震発生時にも稼働できるようにしている。

 ネットワークセンターは日頃耳にしないため、聞き慣れない人が多いだろう。似た設備に例えると、地下鉄や新幹線の司令塔、航空機の管制塔だ。司令塔や管制塔では列車や航空機の運行状況や、位置の把握、トラブルの対応などを行う。ネットワークセンターの役割もこれに似ており、通信ネットワークの状況を監視したり、通信障害が起きた際に対応したりする。

 施設は外部からの侵入や攻撃から守るため、住所は非公開としている。これは他キャリアも同様で、鉄道の司令塔、航空機の管制塔も場所は非公開。国の重要なインフラを守る役割も担っているからだ。

 多摩第5NCは2021年7月15日に開設。それまでの新宿に代わる拠点だが、より高度な取り組みを導入している。コア技術統括本部 エンジニアリング推進本部 副本部長の鈴木信貴氏は、「新しい技術やシステムが複雑化していくことに伴い、人為的な運用の脱却が必要であり、2016年から運用の自動化に取り組んでいる」と前置きした上で、AIを活用した障害の検出やシステム運用を、さらに高度化させていることを説明した。

 この自動化をKDDIでは「スマートオペレーション」を銘打ち、これまで熟練者が実行していた運用をより効率的に行うことで、監視者の稼働を削減できることに加え、サービスを迅速に復旧できる。結果、復旧までの時間短縮につながる。

 従来の運用では「設備の方から上がってくる情報をもとに、どこがおかしいかを切り分けて障害に対処する」(鈴木氏)手法を取っていた。

 これに対し、スマートオペレーションでは3つの基盤で構成される。1つは情報基盤で、障害や復旧対応履歴などの情報を扱う他、X(旧Twitter)を見ながら社内外に情報を通達する。次にサービスを監視するための基盤だ。設備から上がってきた障害を検知、分析する。最後の3つ目は自動化基盤だ。「すぐに復旧できるものをゼロタッチ、サービスの状況を見ながら復旧するワンタッチ」というように、状況に応じてオペレーションを変えている。

 そのスマートオペレーションに欠かせない監視モニターでは日付、時刻、テレビ、通信ネットワークの状況、通信障害が発生した場合の各種情報など、多岐にわたる情報を一覧で表示でき、それを複数人が同時に閲覧、把握できるようにしている。一般の人への公開が許されていないため、その全てをお見せすることはできないが、テレビ画面やPCのウィンドウがたくさん並んでいるようなイメージだ。

 障害検知は自動化を目的にAIを活用している。トラフィック量やCPU の使用率などを学習し、未来の推移を予測できるようにした。予測結果と実際の値が増えると異常と判定。固定のしきい値を利用する場合、サービス監視システムで検知できるような障害しか検知できない。例えば、「トラフィックは落ちているものの、サービスはまだ使えてるような状態」(鈴木氏)を検知可能だ。それに対し、AIの活用で小さな異常も検知できる他、パフォーマンスの低下、特定の端末だけ使えないような状況も把握できるという。

●他事業者も24時間365日サービスの監視が可能に

 KDDIは2023年から同社保有のメールシステム、インターネット上でドメイン名を管理するシステムDNS(Domain Name Systemr)などをISP(Internet Service Provider)事業者に提供している。

 ISPの安定的な提供には堅牢(けんろう)性のある設備やそれにかかる投資、それに専門知識を持ったエンジニアが必要となり、ISP事業者にとっては負担の1つとなってしまう。そこで、KDDIがISP事業者に助け舟を渡すような形で、KDDI設備をそのまま利用してもらう。

 加えて、先のスマートオペレーションも利用してもらうことで、「アプリケーションをユーザーの要望に合わせてアップデートしていくことに集中できる」としている。スマートオペレーションやクラウドインフラの設計・構築は開発段階からKDDIが支援する。これにより、「電子決済サービス事業者などでも、KDDIのようにサービスの状況を24時間365日監視できる」(鈴木氏)そうだ。

●自然災害で苦労すること 事業者間の連携強化で早期復旧を目指す

 また、近年は自然災害による通信設備への影響が「長期化する傾向にある」(コア技術統括本部 エンジニアリング推進本部 ネットワーク強靭化推進室長 大石忠央氏)ため、大規模自然災害に備えた取り組みの重要性も増している。

 こうした地震や台風では土砂災害や電柱倒壊により電源が確保できなくなり、光回線も切断されてしまう。そのため、暫定的な処置として、ポータブル発電機や電源車を現地へ搬送し、基地局に電源供給を行うことでサービスを復旧させる。他に、車載型基地局や可搬型基地局、衛生回線を利用した復旧方法もある。

 災害時におけるサービスの早期復旧に向けては、万が一中継伝送路の1つが被災しても、他のルートへ切り替えることで、通信サービスを提供できるようにしている。首都直下型地震の対策としては、広い範囲を丸ごとカバーできる「大ゾーン基地局」を設置してサービス提供の継続を可能にしている。

 記憶に新しい大規模災害といえば、2024年1月1日に石川県能登半島を襲った地震だ。崩落や土砂崩れで道路が使えなかった他、渋滞発生により必要な機材の運搬に「時間を要した」(大石氏)。能登半島地震では現場環境の変化が激しい中、現地の安全を確保しながら作業に当たることも急務となった。ベースキャンプ車両を派遣して、作業員が宿泊できるようにした。

 KDDIは災害時にも、数千機の低軌道周回衛星で地上にブロードバンド接続を提供する「Starlink」を活用している。光回線をバックホールとWi-Fiとして活用。auサービスは移動基地局、Starlink、発電機などを利用し、「1日最大500人体制でエリア支障を順次解消」(大石氏)した。Starlinkは2023年に導入したため、活用の経験メンバーが少なく、能登半島地震では「100人ほどを育成」(大石氏)しながら復旧作業を行わなければならなかった。

●NTTから「一緒に船上基地局を運搬しないか」との連絡が

 自治体や自衛隊、通信事業者との連携も復旧に向けた取り組みの1つで、能登半島地震では船上基地局が活躍した。「NTTから連絡があり一緒に船上基地局を運搬しないか、という提案を受けた」(大石氏)KDDIは、船上基地局をNTTと一緒に運搬することを決めた。「ドコモはKDDIを温かく迎え入れた。船酔いしながら滑りやすい機材をベルトで固定し運搬した」(大石氏)

 船上で活躍したStarlinkは避難場に350台を無償で提供。大石氏は「使える状態にして金沢へ発送した。1つ1つを荷下ろしして、3~4時間かけて運んだ」と当時の苦労を明かす。だが、孤立集落にてStarlink Wi-Fiが活用できたことで、孤立集落に避難生活をしていた人は、スマートフォンでビデオ通話を行えた。運搬時の苦労が実を結んだ。

 大石氏は災害時の復旧について、「競争ではなく協調領域である」と言い表しており、船上基地局の共同運用だけでなく、車載・可搬型基地局の燃料を給油する際も相互に連携を図るとしている。日頃はライバルである事業者間の連携が強化されることで、サービスの早期復旧が期待できる。

●多摩と大阪の2拠点で通信ネットワークを同時に監視

 KDDIは通信インフラを守る技術力を向上させるため、全国に12カ所ある拠点を連携させており、中でも多摩と大阪の2拠点で通信ネットワークを同時に監視する。「設備の異常をアラームとトラフィックから検知して、冗長化された設備の切り替えや切り離しをいち早く行い、サービスを復旧する」(KDDIエンジニアリング 運用保守事業本部 サービス運用本部長 山本智也氏)ことに取り組む。それ以外の拠点では次の障害に備えた措置を講じる。

 サービスの復旧に向けては、実際の復旧作業内容、関連する知識が必要となるため、訓練や技能コンテストを実施している。訓練の開催回数は「年間で約1000回」(山本氏)で、富士山噴火などの大規模災害を想定し、「全社一丸となって行う」という。技能コンテストはエンジニアの技術力向上や、災害現場でも安全を確保した作業を目指すべく実施している。

 KDDIが報道陣に多摩の通信ネットワークの設備を公開し、説明会を開催するのは今回で3回目。「つなぐ力」を主眼に置き、日々の生活に欠かせない通信ネットワークを守れるよう、KDDIはいずれ完全に人の手を介さずに時短復旧できる「スマートネットワーク」を目指す。

この記事の関連ニュース