Excelの限界が原因?英国でコロナの検査結果が大量に報告漏れ

  • 6,328

Excelの限界が原因?英国でコロナの検査結果が大量に報告漏れ
Image: Gizmodo/Flickr CC

現在、新型コロナの第2波に見舞われているイギリスで、英国公衆衛生庁(PHE)が「データのロード中」に起きた「技術的な問題」によって1万5841件の症例の報告漏れがあったと発表しました。どうやらExcelの使い方のせいでデータが抜け落ちてしまった模様。

検査結果照合用データベースに抜けが発生

PHEはイギリス全土の公共・民間のラボから提供されるコロナの検査結果の照合を担当しています。このデータは毎日公表されるはずのもので、データベースは接触者追跡対策に使われます。PHEいわく、この技術的な問題によって9月25日から10月2日にかけて入力されたデータが一時的に失われたとのこと。失われたデータの大部分は9月30日から10月2日にかけて報告されるはずだったものだと、声明文に記載されています。

PHEは、陽性だと診断された患者全員が検査結果を知らされていて、現在はすべての情報が国民保険サービス(NHS)の接触者追跡システムに追加されたと主張しています。しかし、今回のトラブルによって貴重な時間が失われてしまいました。この問題が見落とされていた間も、およそ5万人の接触者が見逃されていたことになるThe Guardianは推測しています。

Excelのデータ上限に達してしまったから?

では、このような事態を招いた原因は何だったのか?PHEで検査結果の照合に使われたExcelスプレッドシートがデータの上限に達したものの、手遅れになるまで誰も気づかなかったからでは?という疑いが高まっています。GuardianDaily Mailのような報道各社は、ラボから受け取ったCSVファイルをマスターリストに追加した際にスプレッドシートが最大値に達してしまったのではないかと主張しています。スプレッドシートの上限は104万8576行と1万6384列。米GizmodoはPHEにコメントを求めましたが、返信はありませんでした。

今回の大失態はボリス・ジョンソン首相がコロナの感染拡大と厳格なロックダウンの実行とで厳しい時を迎えるだろうと市民に警鐘を鳴らしているタイミングで発生しました。PHEはこのパンデミックを通じて災難に見舞われており、近い将来廃止されて新しい機関に取って代わられることになっています。

Excel絡みのトラブルはほかにもあり

オックスフォード大学の研究者でOur World In Dataプロジェクトの創設者Max Rosser氏は、ここぞとばかりにスプレッドシートデータの完全性を重視する必要を強調しています。同氏は「過去に、最も緊急性の高い次のステップは機械学習とAIではないと資金提供者に説明するのに苦心したことがある。きちんとした正確なCSVファイルがフロンティアなんだ」とツイート

Guardianが指摘するように近年、Excel絡みで大きなトラブルとなったケースはいくつかあります。2013年、JPモルガンは600億ドルの損失は、部分的には財務モデリングに使われたExcelスプレッドシートのエラーのせいだと語っていました。今年の8月には、Excelが遺伝子の略称を日付に変換してしまうというかねてからの問題のため、研究者らは27の遺伝子の名前を変更したと発表。Excelを捨てるより、名前を変えるほうが簡単だったのです。

Source: gov.uk, The Guardian(1, 2, 3 ,4), Daily Mail, bbc, time, twitter(1, 2), Businessinsider, The Verge

    あわせて読みたい