1. トップ
  2. 新着ニュース
  3. 社会
  4. 社会

1日2億アクセス超のお化けサイト「世界のコロナ感染状況」がわかる画期的システムが米国で生まれたワケ

プレジデントオンライン / 2022年6月8日 9時15分

画像=「COVID-19 ダッシュボード」ウェブサイトより

米ジョンズ・ホプキンス大学のつくった追跡サイト「COVID-19 ダッシュボード」は、WHOよりも早く世界各国の感染者数やワクチン接種者数を公開している。「画期的なシステム」と評価されるサイトはどのようにして生まれたのか。産経新聞外信部の黒瀬悦成編集委員の著書『世界最強の研究大学 ジョンズ・ホプキンス』(新潮社)より、一部を紹介する――。

■カフェテリアでの雑談から生まれた大発明

2020年1月21日、米東部メリーランド州ボルティモア。ジョンズ・ホプキンス大学にあるカフェテリアの片隅で、2人の人物が世界の疫病対策に大きな一石を投じる発明を生み出そうとしていた。

システム科学工学センターのローレン・ガードナー准教授、そして大学院博士課程の留学生で、ガードナー氏の下で研究をしていた中国人の董恩盛氏だ。

董氏は中国山西省の太原市(人口約530万人)出身。重慶市の西南大学で地理学を学んだ後に米国に渡り、アイダホ大学の大学院で地理学と統計学の修士号を取得。その後、ジョンズ・ホプキンス大学の大学院に進んだ。

きっかけは、休憩時間の雑談だった。2人は初めのうち、デング熱や麻疹の研究などについて話し合っていたが、やがて話題は新型コロナへと移っていった。董氏の出身地は、武漢から約960キロ離れた山西省の省都・太原市。武漢からはある程度離れているものの、当然のことながら、太原市に住む家族や親族の身の安全を案じていたのだ。

■わずか1日でコロナ追跡サイトの原型が完成

また、2日前の1月19日、太平洋岸の米西部ワシントン州で全米初の新型コロナウイルス感染者が確認された。2人はウイルスの脅威が東海岸のボルティモアにもひたひたと近づいていることを肌で感じていた。

翌日、2人は再び顔を合わせ、一つの考えで一致した。

「世界を席巻する勢いをみせるウイルスに対処するには、ウイルスの動向を注意深く追っていくことが不可欠だ」

ガードナー氏は董氏に対し、新型コロナの感染状況をオンライン上で追跡するサイトを立ち上げることを提案した。そして、2人は「COVID-19 ダッシュボード」の原型となるウェブサイトをわずか1日で作り上げた。

まず行ったのは、中国の国内における感染状況の一つ一つを地図に落とし込むという作業だ。最初に収集されたのは、中国のいくつかの都市のデータで、数百件程度だったという。

■画期的システムを生み出すにはうってつけの人材

データを打ち込む作業は董氏が行った。

パソコンに入力する手のクローズアップ
写真=iStock.com/dusanpetkovic
※写真はイメージです - 写真=iStock.com/dusanpetkovic

董氏は、地理学と統計学に加え、地図の専門家でもあった。統計データをマッピングという手法で地図上に表示する「地理情報システム」(GIS)のソフトウェアの扱いにも心得があった。アイダホ大学の大学院に在学中は、アイダホ州政府の保健福祉局のインターンとなり、同局がGISを使って保健関連のデータを収集するのを手助けしたこともある。

ガードナー氏は、董氏のこうしたスキルを見込んで、追跡サイトの立ち上げを持ちかけたのだ。

ガードナー氏は「私は疫病の感染状況がどうなっているかを知ることに関心があり、董氏はそれをビジュアル化することに関心を抱いていた」と振り返る。

実は董氏はその数カ月前、ガードナー氏が進めていた、米国が麻疹の流行にどれほど脆弱(ぜいじゃく)であるかを検証する研究を手伝い、その一環で麻疹リスクのデータをGISを使ってビジュアル化する作業を手掛けていた。

董氏がこのときに完成させた手作りの「麻疹追跡サイト」は当時、米紙ニューヨーク・タイムズやCNNテレビでも紹介された。このときの実績が、董氏が新型コロナ禍という地球規模の危機に際して追跡サイトという画期的なシステムを生み出す素地になったのは間違いない。

■寝る間も惜しんでデータ収集・入力に没頭した

董氏のデータ収集のソース(供給源)となったのは、主に感染の状況を伝えるウェブサイト上での情報やメディアの報道、ツイッターなどのソーシャルメディアへの書き込み、そして中国の医師や薬剤師など医療従事者向けのサイト「丁香园」(DXY.cn)だった。

丁香园は2000年7月23日に開設され、現在は全世界に300万人以上の利用者がいるとされる、世界最大級の医療関連のコミュニティーサイトだ。中国は感染の震源地である一方、信頼に足る公式データが非常に少ない。丁香园は現地の公式データを独自に追跡していたことから、他に頼るべきデータが少なかったサイトの立ち上げ当初は、特に重要な情報源となったという。

収集したデータは1日に2回の頻度で追跡サイトでアップデートした。董氏がソフトウェア企業とのインタビューなどの場で語ったところでは、追跡サイトの開設から約1カ月間の睡眠時間は1日に5時間以下で、起きているときはひたすらデータを集めてGISソフトに入力することに没頭した。

董氏が寝る間も惜しんでサイトをアップデートせざるを得ない状況となったのは、データ入力を全て手作業でやっていたためだ。

■感染症の「警戒警報」を示す真紅のドット

見かねた大学側は、サイトのアップデートと維持を支援するボランティアを編成し、董氏をバックアップした。以前に董氏がインターンをしていたGISソフトの開発・販売会社「Esri」(本社・カリフォルニア州)も、各種のウェブサイト上に存在するデータを抽出する「データスクレイピング」や、収集したデータを自動的に追跡サイトに取り込む「オートメイティング」の専門家チームを派遣して董氏を支えた。

集めたデータをどのようなデザインで見せるかについても董氏は頭を絞った。その結果、追跡サイトが感染症の「警戒警報」であるとの性格を強調するため、感染地域を黒地に真紅のドット(光点)で表すことにした。ドットが大きいほど感染者数が多いというわけだ。

ドットの大きさを具体的にどれほどのサイズにするかも思案のしどころだった。

追跡サイトの狙いは、ウイルス危機について人々に可能な限り正確な全体像を提供し、対策をとるうえで役に立つことだ。そのためには警告の意味を込め、それぞれのドットは人々の注意を引くような大きさであった方がいい。

しかし、個々のドットが大き過ぎれば追跡サイトの地図は全面真っ赤になり、それを見た人々を「私たちが危機を脱することは到底できない」と絶望に追いやってしまうかもしれない。

董氏のチームは、適切なドットの表示を追い求めて、常に調整を続けているという。

■サイト開設からすぐにアクセスが殺到

サイトは立ち上げから数日間で、1日当たりのアクセス数が2億回を突破した。

世界各地で新型コロナ危機が深刻化するにつれ、追跡サイトを訪れる人の数も一気に増えていった。そのせいでサイトが急激に高まる負荷に耐えられなくなり、何度かクラッシュ(作動停止)した。

サイトの閲覧数が急上昇してクラッシュにつながったのは、決まって特定の地域で新たな感染が一気に拡大したときだ。2020年2月には、イタリアを中心とする欧州諸国で感染者数が増加し、なにが起きているのか知ろうとした多数のイタリア人がサイトに殺到したため、対応しきれなくなったという。

■データの出所はWHO、CDC、地元メディア…

そこで大学は、追跡サイトを全面支援する態勢を作り上げた。学内の別部門である応用物理学部の実験室を開放し、同学部が所管する大学の大規模コンピューター設備を活用できるようにした。というのも、追跡サイトが扱うデータの量は拡大の一途をたどり、ガードナー氏がそれまで使っていたシステムでは対応できなくなっていったからだ。それらの膨大なデータを全て保管し、希望者がいつでも必要な情報にアクセスできるようにしておくには、大学の基幹システムを使うことが必要になったのだ。

サイトを運営するのは、サイトの立ち上げと同時に設立された、大学のコロナウイルス・リソース・センター(CRC)だ。日々の管理作業は、ガードナー氏が共同所長を務めるシステム科学工学センターとジョンズ・ホプキンス応用物理学研究所、Esriの社員ら25人ほどのスタッフが行っている。

サイトを支えるデータの出所は多種多様だ。代表的なところでは、世界保健機関(WHO)、米疾病予防管理センター(CDC)、欧州疾病対策センター、各国政府の保健衛生担当官庁、州や省などの政府や地方自治体などの当局の統計、地元メディアの報道などだ。米国とカナダ、オーストラリアといった国は都市別のデータも提供している。

■WHOよりも迅速に感染状況を収集・発信している

感染が広がる中でサイトの自動化が進み、精度も高まっていった。WHOが新型コロナを「パンデミック」であると公式に認定した2020年3月頃には、少なくとも米国に関してはデータ収集とサイトへの入力の完全自動化を果たした。

ガードナー氏によれば、世界各地のデータ収集ポイントは2021年夏の時点で1万カ所を優に超えた。このうち約3500カ所からは、1時間おきに最新のデータが上がってくる。

グローバルコミュニケーション
写真=iStock.com/imaginima
※写真はイメージです - 写真=iStock.com/imaginima

追跡サイトは、新型コロナの症例が確認された場所と症例数、死者数と回復した人の数を国・地域ごとに表示する。地図は終日、半自動的に更新され、感染者や死者などの数もほぼリアルタイムで更新されるようになっているという。加えて、世界各地でどのような種類のワクチンを何人が何回接種しているかもデータとして日々蓄積され、数字がリアルタイムで公開されている。

こうした複合的なデータ集積と公表のシステムにより、追跡サイトはWHOを含む世界の主要な保健機関よりも迅速に感染状況を報告できている。

サイトに掲載されている全てのデータは公開されており、誰でも入手可能だ。世界の保健当局や研究者らが新型コロナ対策などの研究でデータを自由に使うことができるようになっているのだ。

■世界各国の保健当局がコロナ政策に活用

実際、多くの米政府機関も追跡サイトが提供するデータを有効活用している。CDCは今後のウイルス感染についての予測モデルを作成するための基礎資料として追跡サイトのデータを利用している。米政権の新型コロナに関するタスクフォースや連邦緊急事態管理庁(FEMA)は、全米で感染が拡大しつつあった当初、感染被害の深刻度に合わせて全米各州や主要都市にどれだけの医療物資や機器、医師などの人員を送り込むかという対処計画を策定するために使用していた。

また、世界各国の保健当局の多くが外国からの入国規制を実施するにあたり、追跡サイトの数字を元に諸外国の大まかな感染状況を把握し、規制実施の是非をめぐる判断材料として利用していると指摘される。

こうしたデータは元来、感染症の専門家が将来の疫病の発生を予測し、新たな疫病にどう対応していくか対策を練り、政府や自治体の疫病対策に反映させていくのに使われる。

■「疫病の実態をリアルタイムで知りたい」

ガードナー氏によると、追跡サイトは元々、感染症対策などに携わる自身の研究仲間の間だけで使うことを想定していたというが、ウイルス危機の拡大で全世界の人々がロックダウン(都市封鎖)などの行動規制を強いられて自宅にこもり、インターネットを通じてウイルス関連の情報収集を図ろうとしたことも、追跡サイトの需要が高まった要因の一つとみられている。

ガードナー氏は言う。「今回のように疫病が世界規模に広がったことにより、一般の人々も自身の問題として疫病の実態に関する情報をリアルタイムで知りたいと思うようになった。人々が簡単にウイルス情報にアクセスできるようなプラットフォームを作ったこと、それをタイムリーに提供できたから、追跡サイトの需要がこれほど拡大したのだと思います」

黒瀬悦成『世界最強の研究大学 ジョンズ・ホプキンス』(新潮社)
黒瀬悦成『世界最強の研究大学 ジョンズ・ホプキンス』(新潮社)

同氏はその上でこう付け加えた。

「新型コロナのダッシュボードのプロジェクトを立ち上げてから約1年半の間に学んだ最大の教訓は、『情報の価値』がいかに大きなものであるかということです。一般の人々は、事実を聞かされることを切望していました。情報にアクセスして特定の物事や事象に対する理解を深めるという行為が、この地球上に住む一人一人の生死を左右することになったからです」

ダッシュボードを公開して以降、米国や世界の大学や医療機関、政府当局からガードナー氏の元には問い合わせが殺到した。ガードナー氏はオンラインの講演やセミナーなどを通じてダッシュボードの「成功の秘密」について出し惜しみすることなく説明している。

----------

黒瀬 悦成(くろせ・よしなり)
産経新聞東京本社編集局副編集長 兼 外信部編集委員
1966年2月生まれ。慶應義塾大学法学部政治学科を卒業後、88年に読売新聞東京本社に入社。ニューデリー支局長、経済部、ジャカルタ支局長、ワシントン特派員などを経て、2013年産経新聞社に入社。ワシントン支局長(2017〜21年)を経て現職。論説委員室論説委員兼務。著書に『ジャンボ鶴田 第二のゴング』(朝日ソノラマ)、『膨張中国』(共著、中公新書)、『世界最強の研究大学 ジョンズ・ホプキンス』(新潮社)など。

----------

(産経新聞東京本社編集局副編集長 兼 外信部編集委員 黒瀬 悦成)

この記事に関連するニュース

トピックスRSS

ランキング

記事ミッション中・・・

10秒滞在

記事にリアクションする

記事ミッション中・・・

10秒滞在

記事にリアクションする

デイリー: 参加する
ウィークリー: 参加する
マンスリー: 参加する
10秒滞在

記事にリアクションする

次の記事を探す

エラーが発生しました

ページを再読み込みして
ください