Взгляд из камеры. Как компьютерное зрение могло бы изменить городскую среду
«Объективная польза от технологий перевешивает доводы из теории восстания машин»Многие из нас, когда слышат о современных технологиях – искусственном интеллекте, роботах, машинном зрении или интернете вещей, – сразу представляют фильм «Робокоп» или «Матрица». Некие опасения, конечно, присутствуют, но объективная польза от технологий и будущий прогресс, которые они могут дать, перевешивают доводы из теории восстания машин. В частности, появившаяся в 1960-х гг. область компьютерного зрения значительно продвинулась вперед благодаря росту производительности вычислительной техники. По прогнозам MarketsandMarkets, этот рынок вырастет с почти $16 млрд в 2021 г. до более чем $50 млрд к 2026 г.
Основные задачи компьютерного зрения включают в себя распознавание объектов, оценки позы и движения, визуальное отслеживание и т. д. Сегодня эта технология активно используется в промышленности и на производстве, но можно представить несколько сценариев ее применения в городе.
Комфортная среда для людей с ограниченными возможностями
В метрополитене и на вокзалах созданы службы, куда маломобильные люди могут отправить заявку с просьбой оказать помощь в перемещении в транспорте. Но обычно это надо делать заранее. На подходах к транспортным узлам можно поставить камеры. Они будут распознавать посетителей, передвигающихся на колясках, и передавать оповещение соответствующим сотрудникам, чтобы те оказали оперативную помощь. Тогда можно будет совершать поездки в любое удобное время.
Также нейросеть можно обучить распознавать людей с ограничениями по зрению, заложив туда паттерн их поведения. Система может хранить всю аналитику по работе с такой категорией граждан: оказанной или не оказанной им помощи, времени, событию, местоположению, частоте использования, возникающим проблемам. Внедрение такого сценария на транспорте поможет повысить комфорт и качество городской среды для людей с ограниченными возможностями. Можно применить этот сценарий в ритейле, сфере питания, развлекательных комплексах, кинотеатрах, что повысило бы доступность социальных и развлекательных услуг для маломобильных людей. Социальная составляющая бизнеса приобретает все большее значение, и, если владельцы ресторанов или магазинов запустят такой сервис, это скажется на лояльности покупателей в целом.
Камеры можно установить на инвалидные кресла слабовидящих, ведь слепые люди не всегда передвигаются пешком. Проводились исследования, где с помощью разработанных алгоритмов компьютерного зрения определялись важные особенности местности (бордюры, обрывы и т. д.), которые в режиме реального времени обрабатывались камерами, прикрепленными к инвалидному креслу. Затем информация передавалась путешественнику в виде синтезированной речи, звуковых сигналов или тактильной обратной связи, чтобы он мог использовать эти данные для самостоятельного управления креслом-коляской.
Пассажиропотоки и транспорт
В период пандемии стало популярным использование видеонаблюдения, технологий искусственного интеллекта и компьютерного зрения для создания социальной дистанции между людьми. Например, американский интернет-ритейлер Amazon начал тестировать сервис, который позволяет следить за соблюдением социальной дистанции на складах компании. Мониторы выделяли сотрудников, подошедших слишком близко к коллегам. В городских условиях подобная технология может помочь создавать тепловые карты в местах скопления людей, в том числе во время массовых мероприятий, что поможет разграничить потоки, избежать толкучки, давки, несчастных случаев. Болельщики мюнхенской «Баварии», например, собираясь на «Альянц арену», с помощью мобильного приложения получают информацию о дорожной ситуации и оптимальных маршрутах, чтобы без пробок попасть на стадион. Все это делается с помощью smart-системы, где собираются данные.
Технология распознавания лиц и компьютерного зрения поможет и в общественном транспорте: в мониторинге пассажиров, не оплачивающих проезд, в отслеживании целевого использования социальных карт, в контроле за сотрудниками, проверяющими оплату проезда, за состоянием водителей. Например, в Азербайджане разработали решение по мониторингу безопасных условий пассажирских перевозок на междугородных рейсах. Технологии машинного зрения и машинного обучения позволяют в режиме реального времени получать информацию о пассажиропотоке и усталости водителей, с помощью интернета вещей можно отслеживать техническое состояние и условия в салоне транспортного средства, а также биометрические показатели водителя. Например, в Литве был реализован пилот на 10 пригородных поездах, когда программное обеспечение на основе компьютерного зрения использовало информацию с камер видеонаблюдения для измерения пассажиропотока в транспорте. Велся подсчет людей, входящих и выходящих из поезда на каждой остановке, граждан с детьми, животными, а также пассажиров, перевозящих велосипеды. Если дополнить информацию о потоках пассажиров в режиме реального времени данными о продажах билетов, можно сократить количество безбилетников. Считать пассажиров планировали и московские власти.
Эмоции как сервис
Использование технологии распознавания лиц вызывает много споров, поскольку тесно связано с массовым сбором персональных данных. Но ее применение набирает обороты. Причем не только для выявления преступников или нарушителей, но и для прохода в метро, и для оплаты в банкоматах. Также компании начинают использовать систему для распознавания эмоций своих клиентов. Например, о тестировании соответствующей технологии сообщала сеть кофеен, которая с ее помощью собиралась определять новых и постоянных клиентов, анализировать посещаемость по дням и часам, определять возраст, пол и эмоции.
В свою очередь, объединение фитнес-клубов запустило систему распознавания лиц для борьбы с мошенничеством и для сокращения затрат на администраторов. Клиентов теперь встречает и узнает нейросеть. Несмотря на разные правовые нюансы, эту технологию можно было бы использовать для повышения лояльности клиентов и определения сотрудников, которые делают посетителей «счастливыми». Например, в банках или МФЦ – часто посещаемых в городе местах – есть устройства с разными смайликами для оценки обслуживания. Их может заменить система распознавания эмоций, которая определяла бы, насколько доволен клиент обслуживанием. Кстати, эта технология применима и для оценки уровня «счастья» и удовлетворенности посетителей онлайн-мероприятий: конференций, воркшопов, онлайн-уроков, мастер-классов и т. д.