Цифровые следы москвичей объединят в систему
ДИТ заказал апгрейд платформы анализа поведения интернет-пользователейНовым функционалом планируется оснастить информационную систему СТАТС, запущенную в 2017 г., изначально она была предназначена для анализа поведения посетителей онлайн-порталов и сервисов правительства Москвы. После доработки, которую «Программный продукт» выполнит за 276 млн руб., система сможет собирать данные о том, что пользователь делал и на других ресурсах.
Согласно документам госзакупки в системе появятся модули для загрузки геоданных, загрузки обезличенных данных об оплате услуг и штрафов, данных WiFi-сессий в общественном транспорте, сведения о нарушениях медицинских ограничений, данные о проездных документах. Помимо того, система сможет анализировать показатели лояльности и участия в событиях. Инструменты помогут «оперативно выявлять возникающие тренды» и «формировать целевые показатели активности пользователей», говорится в документах. В систему будут загружены данные «из информационных систем правительства Москвы и других источников».
Тендер на усовершенствование СТАТС объявлен осенью прошлого года, поставщик был определен месяц назад. Работы должны быть завершены до 31 октября 2022 г., говорится в контракте.
Помимо этого контракта «Программный продукт» получил в феврале от ДИТа и подведомственного ему «Инфогорода» еще два контракта на общую сумму в 730 млн руб. Один из них предусматривает развитие информационной системы развития предпринимательства и промышленности (ИС РПП) за 602 млн руб., а другой – доработку информационной системы управления данными в распределенной вычислительной среде (ИС УДРВС) за 132 млн.
Анализ поведения пользователей того или иного сервиса – стандартная практика для многих государственных и коммерческих организаций, которые предоставляют услуги и сервисы для жителей и стремятся повысить их качество и удобство, объяснили «Ведомостям» в пресс-службе ДИТа. В ведомстве заверяют, что данные будут храниться в обезличенном формате: «Профиль и персональные рекомендации формируются не для конкретного человека, а для устройства. Система работает без привязки к персональным данным пользователя и не посягает на тайну его личной жизни».
Основная задача системы – повысить удобство и качество предоставляемых сервисов на основе данных об их использовании, полученных с различных устройств – смартфонов, планшетов и других гаджетов, говорят в ДИТе: «Для этого городу не требуется детальная информация о штрафах или проездных документах. Важно понять, заходит ли пользователь на страницу сервиса оплаты штрафов, или указал ли он в каком-либо разделе сведения о проездном документе. Для анализа интернет-активности в рамках работы СТАТС важен сам факт обращения пользовательского устройства к тому или иному сервису, баннеру или другому элементу сайта, а не конкретная информация, указанная при использовании сервиса». Сопоставляться с какими-либо другими данными полученная информация не будет, подчеркивают в ДИТе: «Анализ интересов пользователей по-прежнему будет проводиться исходя из их активности на городских интернет-ресурсах».
В то же время в техзадании к апгрейду СТАТС говорится, что «модуль формирования персонализированного контента должен обеспечивать формирование витрин данных интересов интернет-посетителей по результатам аналитики посещаемых пользователями ресурсов правительства Москвы и других источников данных, а также сервис предоставления сформированного контента внешним потребителям».
Что имеется в виду под «другими» источниками данных, в пресс-службе ДИТа не ответили. Также в техзадании говорится о возможности выявления уникального интернет-посетителя «без использования cookies для увеличения точности сопоставления профилей».
Файлы cookies позволяют системе узнать, чем интересовался пользователь на том или ином сайте в том случае, если эти файлы на разных сайтах синхронизированы, объясняет принцип работы системы человек, близкий к ДИТу. Для того чтобы у системы СТАТС появился доступ к такой аналитике, в программный код сайта нужно добавить одну строчку кода, подтверждает другой бывший сотрудник ДИТа.
Вместо cookies идентификатором, позволяющим проследить цифровой след пользователя, может служить номер телефона, говорит он. Под обезличенностью ДИТ понимает идентификаторы, которые хранятся в системе, однако при необходимости, по запросу правоохранительных органов например, идентификаторы из разных систем и ресурсов могут быть связаны и деобезличены, утверждает человек, знакомый с функционалом системы.
Современные технологии позволяют с большой точностью установить конкретного человека по набору таких данных, соглашается старший юрист Digital Rights Center, эксперт «Роскомсвободы» Владимир Ожерельев: «Даже если данные будут собираться в обезличенном виде, это не исключает возможности их соотнесения с другой информацией, что в совокупности позволит идентифицировать конкретного человека, к которому эти данные относятся. Реализация возможности выявления уникального интернет-посетителя косвенно подтверждает, что все данные в совокупности либо изначально не будут обезличенными, либо будут иметь предпосылки стать таковыми».
В компании «Программный продукт» на вопросы «Ведомостей» не ответили.
Данные, которые ДИТ хочет агрегировать в одной системе, избыточны для заявленных целей по персонализации контента на сайтах правительства Москвы, считает бизнес-консультант по безопасности Cisco Systems Алексей Лукацкий: «Чем больше данных, тем выше риски: у ДИТа неоднократно случались утечки данных, например, о заболевших коронавирусом, а в СТАТС планируется хранить цифровой профиль клиента с информацией из самых разных систем».