Пресс-центр

Как возник и работает самый популярный в мире трекер коронавируса от университета Джона Хопкинса

14.04.2020
Рубрика:ГИС

Многие веб-сайты отслеживают разрушительное распространение болезней и смертей, вызванных пандемическим коронавирусом 2020 года, начиная с глобальной карты Всемирной организации здравоохранения (ВОЗ, см. global map) и заканчивая подсчетом случаев заболевания на уровне округов в США (см. county level). Но одна из первых попыток демонстрации распространения этого заболевания, онлайновая операционная панель, управляемая Университетом Джона Хопкинса (Johns Hopkins University online dashboard), быстро стала и остается наиболее популярным местом для получения постоянно актуализируемых данных о взбудораживавшей и затронувшей всех новой коронавирусной заразы (COVID-19).

Запущенный в Хопкинсе трекер Coronavirus COVID-19 Global Cases с его картой черного мира, усеянной красными кругами, актуальными данными по случаям заболеваний, летальных исходов и выздоровлений, графиками тенденций и другой информацией, представленной в глобальном масштабе, по странам и более мелким регионам (по отдельным странам), придерживается основного принципа — никаких причудливых графических изысков, всё должно быть простым и понятным.

Тем не менее, этот сайт, на котором фиксируется более 1 миллиарда посещений в день, стал самым авторитетным источником данных о случаях COVID-19, на который постоянно ссылается другие. Он используется новостными компаниями и агрегаторами, государственными органами, международными организациями и множеством людей по всему миру. Его операционная панель (дашборд) с той или иной степенью подобия была скопирована многими государствами и регионами. Например, его можно было увидеть на стене на фото из комнаты центра войны с коронавирусом Министерства здравоохранения и социальных служб США.

Как же это всё возникло? У истоков этого сайта находится Лорен Гарднер (Lauren Gardner), со-директор Центра системной науки и техники университета Хопкинса в Балтиморе, чья предыдущая работа была посвящена пространственному моделированию эпидемий кори и вируса Зика. Гарднер побеседовала с представителями новостного агентства ScienceInsider в пятницу, 3 апреля, в день, когда случаи заболеваний COVID-19 превысили 1 миллион во всем мире, с более чем 50 000 смертей. Ниже приведено краткое изложение этого интервью, недавно опубликованное на сайте Science, автор Jocelyn Kaiser. Этот новостной блок по COVID-19 поддерживается Пулитцеровским центром.

– Есть много сайтов, отслеживающих случаи COVID-19. Как ваши разработки вышли на первое место?

– Вероятно, потому что они имеют самую долгую историю. Мы стартовали в январе, когда вспышка была в основном только в Китае. Мой аспирант Эншен Донг (Ensheng Dong), а он китаец, проявил личную заинтересованность в реализации этой идеи. И за несколько часов мы создали начальную версию нашей операционной панели (дашборда). А на следующий день [22 января] я выложила ее в Твиттер, и она сразу привлекла внимание и стала очень популярной.

– Содержание этой панели основано на сотнях информационных источников: от данных ВОЗ до сайтов, которые собирают новости и сообщения о COVID-19 в социальных сетях. Как вы убеждаетесь, что данные точны и не содержат повторов?

– На представляемые на панели данные смотрят миллионы внимательных глаз. Так что, если мы отойдем от истины, люди обратятся к нам очень быстро. Мы получаем тысячи сообщений по электронной почте. И нам, например, скажут: «Эй, здесь есть два новых случая, о которых вы не знаете». Теперь у нас также есть система обнаружения аномалий, которая предупреждает нас о расхождениях в отчетах о случаях, которые мы собираем и анализируем в автоматическом режиме.

Нам нужно беспокоиться о замкнутых циклах (петлях), когда наши собственные данные передаются нам как оригинальные случаи. В США существует сайт агрегации СМИ под названием called 1point3Acres, за которым мы очень внимательно следим. Мы берем у них данные по США, а они получают от нас глобальные данные. Мы должны быть очень осторожны, чтобы ссылаться только на национальные данные. Но дело в том, что если появилась какая-то петля, о которой не говорится в отчетах, и нет подтверждающих сообщений [о случаях заражения и смертях от COVID-19], то возникает обоснованное сомнение в ее достоверности. Поэтому мы подозреваем, что этого на самом деле не было, и действуем, исходя из такого предположения.

Я хотела бы, чтобы все различные местные органы здравоохранения продолжали совершенствовать свои собственные отчеты таким образом, чтобы мы могли получать данные непосредственно из них, а не из сообщений местных СМИ.

– Можете ли вы получать данные по США из Центров по контролю и профилактике заболеваний?

– Это предположение кажется логичным. Но эти центры предоставляют данные только на уровне штата, и иногда это происходит с задержкой от 24 до 48 часов. В их отчетах нет ничего на уровне округа.

– Насколько велика ваша команда?

– Сначала это была моя группа, в которой около шести человек. Но уже на ранней стадии руководство Хопкинса протянуло руку помощи и предложило внутреннюю поддержку. Потому что мы взорвали серверы Amazon [облачных вычислений] со всеми нашими требованиями. Теперь Лаборатория прикладной физики [в Хопкинсе] помогает с внутренней обработкой данных и технологиями. Компания Esri, которая создала и предоставляет современное картографическое программное обеспечение, помогает сопровождать нашу платформу. А люди в Хопкинсе управляют взаимодействием со средствами массовой информации и коммуникациями. Но в целом, группа все еще намного меньше, чем она должна быть для того объема работ, который мы выполняем.

– Какова у вас рабочая нагрузка? Вы работаете посменно?

– Более двух месяцев мы пытались принимать решения о том, откуда собирать данные, каким данным можно доверять, как их агрегировать и проверять. Изначально все это мы делали вручную. Теперь почти весь процесс автоматизирован с помощью различных перекрестных проверок. Содержание нашей инструментальной панели автоматически обновляется ежечасно. Мы также работаем посменно круглые сутки при решении таких вопросов, как обслуживание серверов и обработка потоков данных. Например, у нас есть доктор философии, студент в Англии, который получает раннюю утреннюю смену (по нашему местному времени).

Это большая общественная работа на добровольной основе. Мы просто стараемся сделать ее как можно лучше, но мы осознаем, что мы не идеальны.

– Вы подвергались критике за название страны Тайвань [что не вполне корректно с политической точки зрения] и за то, что изначально разместили данные по случаям заболеваний на круизном лайнере Diamond Princess в центре Соединенных Штатов, в Канзасе.

– Да, каждый день чреват новыми сюрпризами. Геополитические последствия были для нас стрессовыми и отвлекающими. Я просто хочу сообщить данные, которые будут наиболее полезными и подходящими для людей, которые пытаются получить к ним доступ. Вирусу нет дела до национальных границ.

Вплоть до вчерашнего дня (4 апреля) у нас было много случаев без связанного с ними географического местоположения – на Нул-Айленде («Остров Ноль»; Null Island, место в Атлантическом океане у западного побережья Африки в Гвинейском заливе с нулевыми координатами широты и долготы. Это весьма символично. Я подумала, что это отличное место для размещения всего, что еще не имеет определенного местоположения. Но это расстроило многих людей, пришлось от этой затеи отказаться.

– По мере роста количества случаев COVID-19 приходится больше работать?

– На самом деле, это теперь все в меньшей степени ручная работа, потому что она автоматизирована. Сейчас мы проводим больше времени, занимаясь другими видами исследований. Почти 90% моих интересов и усилий возвращается к математическому моделированию этой болезни. Мы проводим оценку рисков в реальном времени того, что происходит в Соединенных Штатах, и стремимся донести эти результаты до разработчиков политики, чтобы сказать: «Вот те округа, о которых нам следует побеспокоиться в ближайшее время». Мы можем сделать это, поэтому мы должны помочь с решением этих вопросов.

– Вам удается выспаться?

– Это утомительно. Мы занимаемся этим с января. Мы бросили все остальные дела в лаборатории. И, вероятно, так будет еще как минимум пару месяцев. И я думаю, что мы будем отслеживать вспышку в течение всего года. Все это будет продолжаться со скачками по всему миру. Так что это наверняка 110% усилий. Я думаю, что все работники общественного здравоохранения, работающие в этом пространстве, чувствуют то же самое.

Примечание. Подобная операционная панель по ситуации с COVID-19 на территории России создана специалистами Esri CIS на основе того же ГИС-приложения Operations Dashboard for ArcGIS и размещена Здесь.

Источник: ДАТА+

Возврат к списку

наверх