Как искусственный интеллект предсказал пандемию раньше ВОЗ

Канадский стартап BlueDot заметил вспышку инфекции в Китае и просчитал ее распространение
Основатель BlueDot Камран Хан
Основатель BlueDot Камран Хан / Andrew Francis Wallace / Toronto Star via Getty Images

Основатель BlueDot Камран Хан как-то пошутил, что борьба с эпидемиями стала его дурной привычкой. Вот и сейчас программа искусственного интеллекта BlueDot засекла опасность 30 декабря, вскоре после полуночи по канадскому времени: она нашла в интернете сообщения о необычных случаях пневмонии, локализованных в одном месте – в Ухане.

В тот день китайский врач Ли Вэньлян обсуждал онлайн с коллегами странное заболевание у пациентов, а вечером (в Торонто – раннее утро, минус 12 часов) департамент здравоохранения Уханя оповестил о подозрительном заболевании медицинские учреждения города. Его поначалу приняли за разновидность SARS, возвращения которого в регионе боятся еще со времен эпидемии 2003 г. Но это оказался не известный раньше коронавирус, впоследствии он получил название SARS-CoV-2, а вызываемая им болезнь – COVID-19.

Искусственный интеллект BlueDot может лишь анализировать информацию и выделять подозрительные случаи; решение, что предпринять, остается за людьми. Сотрудники BlueDot выпустили оповещение для больниц и минздрава Канады, авиакомпании Air Canada и прочих своих клиентов 31 декабря. В тот же день власти Китая информировали ВОЗ о случаях пневмонии неизвестного происхождения, о ней написали СМИ, не только китайские, но и западные – например, немецкая DW.

Под контролем искусственного интеллекта

BlueDot анализирует авиасообщение между странами. Он выслал своим клиентам список городов за рубежом, в которых выше всего риск появления зараженных новым вирусом. В нем были Бангкок, Гонконг, Токио, Тайбэй, Пхукет, Сеул, Сингапур и др. Первый случай заболевания за пределами Китая 13 января был обнаружен в Бангкоке, затем во всех 11 городах из списка.

О надвигающихся эпидемиях BlueDot сообщает не первый раз. В 2014 г. он спрогнозировал, что вспышка лихорадки Эбола выйдет за пределы Западной Африки. В 2016 г. еще за полгода предсказал всплеск лихорадки Зика во Флориде. В том же году стартап рассчитал вероятность заражения вирусом Зика в Бразилии и убедил ВОЗ не ограничивать поток туристов на летние Олимпийские игры в Рио-де-Жанейро. На прошлой неделе, 27 марта, канадское правительство объявило, что будет использовать BlueDot для мониторинга ситуации с COVID-19 и принятия решений.

BlueDot – не единственный стартап, использующий искусственный интеллект для обнаружения эпидемий. Одновременно с ним о вспышке в Ухане объявили американские Dataminr (основан в 2009 г.) и HealthMap (основан в 2006 г., главный клиент – Центры по контролю и профилактике заболеваний США). Но когда эпидемия коронавируса переросла в пандемию, точность предсказаний искусственного интеллекта резко снизилась – и тому есть логичное объяснение.

Как Хан познакомился с эпидемиями

В 1996 г. Хан окончил медицинский факультет Университета Торонто, поработал по специальности несколько лет и уехал учиться в Колумбийский университет в Нью-Йорке – как раз во время вспышки лихорадки Западного Нила в Северной Америке, в ликвидации которой он принял участие. Не успел Хан в 2003 г. вернуться на работу в больницу Св. Михаила в Торонто, как столкнулся со вспышкой SARS. Тогда в Канаде умерло 44 человека, в том числе две медсестры и врач.

«У меня дежавю, – говорит он сейчас. – В 2003 г. я наблюдал, как вирус захлестывает город и выводит из строя больницу. Мы [врачи] были невероятно морально и физически истощены. И я подумал – не допустим этого снова!»

Когда с SARS справились, выяснилось, что в городах, таких как Торонто, где есть прямые рейсы из Гонконга, атипичной пневмонией заражаются в 25 раз чаще, чем там, куда можно попасть только стыковочным рейсом. В городах, расположенных на расстоянии двух пересадок, не было зарегистрировано ни одного случая.

Хан загорелся проектом, который выявлял бы вспышки эпидемии в любой точке планеты и предсказывал их распространение по миру. «Мы не всегда сможем вовремя получить информацию об инфекционных заболеваниях, если станем ожидать ее от госорганов», – говорил он.

Как BlueDot ищет эпидемии

У Хана ушли годы на переговоры с авиакомпаниями, чиновниками, операторами сотовой связи и интернет-компаниями. Сейчас BlueDot, как сказано на его сайте, мониторит более чем 100 000 онлайн-СМИ и сайтов госорганов на 65 языках, получает в обезличенном виде данные о миллиардах авиаперелетов и перемещении сотен миллионов мобильных устройств. Fortune уверяет, что BlueDot и подобным ему службам поставляют данные интернет-компании (например, Google и Facebook): сведения о перемещениях пользователей, сообщения из принадлежащих им соцсетей, информацию о поисковых запросах и т. д.

«Мы ни в коем случае не утверждаем, что искусственный интеллект решает проблемы. Он всего лишь один из наших инструментов, – говорил Хан. – Мы не используем искусственный интеллект вместо человеческого. В основном он нужен, чтобы найти иголку в стоге сена и показать ее команде, которая анализирует информацию».

В 2008 г. Хан запустил научно-исследовательскую программу при больнице Св. Михаила, которую назвали BioDiaspora. В июне 2009 г. он заявил о себе научному сообществу, опубликовав в журнале New England Journal of Medicine прогноз, как авиапассажиры станут разносить по миру вирус свиного гриппа H1N1. В январе 2012 г. в журнале The Lancet вышла статья о том, каковы риски вспышки эпидемии летом, во время Олимпийских игр в Лондоне.

В 2014 г. Хан решил сделать из BioDiaspora самостоятельный стартап. Получив инвестиции от Horizons Ventures, он основал BlueDot. Название позаимствовано у астрофизика Карла Сагана. По его настоянию зонд «Вояджер-1», когда отлетел от Земли на 6 млрд км, сделал фотографию нашей планеты – получилась крохотная голубая точка на темном фоне.

Зачем BlueDot нужен ветеринар

В 2014 г. в Гвинее началась эпидемия лихорадки Эбола. США и Великобритания принялись проверять всех пассажиров, прилетающих из Западной Африки, а политики требовали вовсе закрыть авиасообщение с регионом. BlueDot сделал расчеты о риске занесения инфекции в другие страны и опубликовал их в The Lancet. Хан в статье сделал неожиданный вывод: западным странам будет гораздо дешевле и эффективнее скинуться и организовать скрининг не у себя на входе, а за рубежом на выходе – проверять улетающих пассажиров в аэропортах Гвинеи, Сьерра-Леоне и Либерии.

В мае 2015 г. BlueDot зафиксировал ряд сообщений из Бразилии о необычном заболевании. Это оказалась лихорадка, которую вызывает вирус Зика. Исследование Хана и его команды, вышедшее в The Lancet, предсказывало: вероятнее всего, вспышка болезни случится во Флориде. Дело не только в большом пассажиропотоке между штатом и Бразилией, во внимание принимались и иные факторы – благо в BlueDot работает более 40 человек самых разных профессий: от специалистов по big data и эпидемиологов до ветеринаров и географов. «Мы эклектичная группа, ведь и проблемы, которые мы решаем, разнообразны», – говорит Хан. В исследовании использовались карты температур, данные о видах комаров в разных штатах и их способности переносить вирус Зика, информация о стоячих водах и т. д.

Олимпиада состоялась

В преддверии летних Олимпийских игр 2016 г. в Рио-де-Жанейро к Хану обратилась ВОЗ – насколько велик риск для зрителей и спортсменов заразиться вирусом Зика? Хану удалось доказать, что вероятность этого в городах проведения Игр низка, и ВОЗ не стала вводить ограничения.

Одно из главных преимуществ искусственного интеллекта – он может следить за всем происходящим на Земле, пока люди отвлекаются на шумиху вокруг коронавируса. «Мы видим вспышки, которые раньше ограничились бы какой-нибудь отдаленной деревней в Африке или Азии, а сейчас быстро разносятся по миру, – говорит Хан. – Проблема не только в том, что новые болезни возникают в невиданном прежде темпе. Мы еще и распространяем их невероятно быстро. Каждый год около 4 млрд пассажиров пролетают почти 7 трлн км. Это где-то 20 000 рейсов до Солнца и обратно». BlueDot сейчас пристально следит не только за COVID-19, но и за вспышкой лихорадки Ласса в Западной Африке. Она не перерастет в пандемию, но может доставить немало проблем, причем не только африканцам, как свидетельствует опыт других, подобных BlueDot, проектов.

В январе 2010 г. на Гаити произошло землетрясение, а через 10 месяцев – эпидемия холеры. Жители ринулись подальше от опасного места. Команда работников здравоохранения вместе с телекоммуникационной компанией Digicel Haiti использовали ряд данных: о перемещении абонентов после землетрясения и теперь, во время холеры, о местах компактного проживания выходцев с Гаити в Америке, о морских и воздушных маршрутах. Проект позволил определить, где в США ждать холеры. Так события на далеком Гаити аукнулись в пяти округах Флориды и пяти – штата Нью-Йорк.

Что искажает прогнозы

Но у искусственного интеллекта есть свои ограничения. Как только он сталкивается с новым для себя явлением, точность прогнозов резко падает. Ему нужно для анализа несколько миллионов единиц данных. В случае с COVID-19 счет пока идет на сотни тысяч (на 1 апреля ВОЗ говорит о 751 000 заболевших. – «Ведомости»), поясняет сайт о высоких технологиях LeMagIT. Он советует не доверять искусственному интеллекту в предсказаниях дальше чем на неделю. Ошибки в прогнозах имеют несколько объяснений. Например, у многих заболевших коронавирусом не проявляются симптомы и они заражают других, будучи невидимыми для статистики.

Стартап Metabiota, как и BlueDot, анализирует данные авиасообщения. Но как только власти принялись запрещать авиаперелеты, накопленная информация о перемещении людей стала бесполезна.

Искусственный интеллект стартапа HealthMap засек коронавирус, когда уханьские врачи стали обсуждать странное заболевание на сайте международного общества по проблемам инфекционных болезней ProMED-mail. Сайт был основан еще в 1994 г. Сейчас у ProMED-mail есть сотрудники в 32 странах мира, которые собирают информацию из местных источников и сообщений врачей на форуме сайта и публикуют новости о подозрительных инцидентах. Но это профессиональный ресурс – а можно ли использовать обычные соцсети? HealthMap отслеживал вспышку холеры на Гаити в 2010 г. в том числе по сообщениям в Twitter, писал The Scientist. Но Хан уверяет, что его стартап не принимает в расчет посты в соцсетях, потому что панические настроения сильно искажают картину и сбивают искусственный интеллект с толку.

Показательна попытка Google сделать алгоритм, предсказывающий эпидемии гриппа в США. Его специалисты проанализировали данные о вспышках болезни и 50 млн самых популярных в Америке запросов. Они нашли 45 запросов, частота использования которых коррелирует с ростом заболеваемости. Проект Google Flu Trends был триумфально запущен в 2008 г. и тихо прикрыт в 2015 г. Дело в том, что в 2009 г. программа проморгала вспышку свиного гриппа, а в сезоне 2011–2012 и 2012–2013 гг. ее оценки количества заболевших обычным гриппом в два раза разошлись со статистикой Центров по контролю и профилактике заболеваний США. Интересно, что в искажении данных отчасти оказался виноват сам Google: как и сейчас, он запустил информационную кампанию про эпидемию. Ссылка на нее выскакивала при заходе на поисковик и спровоцировала вал запросов про грипп.