Как научить нейросеть видеть женщину
MAER рассказал, как нейросети создают новый тренд в наружной рекламе.В преддверии женского весеннего праздника на центральных улицах российских городов появился удивительный образ женской красоты, олицетворяющий наступление весны. Авторы проекта — медиахолдинг MAER и студия мультимедиа-дизайна SHUM — рассказали, как в соавторстве с искусственным интеллектом можно создать динамичный визуал, герои которого — реальные люди.
В крупнейших городах России с приходом календарной весны на огромных цифровых экранах медиахолдинга MAER появился своеобразный символ весны — образ женской красоты, переливающийся красками, словно в калейдоскопе.
Крупноформатная видео-открытка — комплексный проект из нескольких этапов, который рушит грань между цифровым миром и реальностью. Инициатива удивляет глубиной и сложностью технологического подхода. Для создания необычного видео понадобились 50 реальных женщин, 8 фотографов, 6 визажистов, 5 дизайнеров, 2 фотостудии и 2 видеооператора. А ещё — 2 медиахудожника, которые объяснили искусственному интеллекту — нейросети Stable Diffusion (18+) — как нужно увидеть и преобразить женщину.
«50 сотрудниц для прохождения эксперимента прибыли!»
Первым этапом на творческом пути стал выбор фотомоделей. 50 сотрудниц медиахолдинга выразили желание поучаствовать в эксперименте. Съемка проходила несколько дней в двух городах: Москве и Екатеринбурге. И везде женщины недоумевали: «Приходить в черном?!».
По словам художников студии мультимедиа-дизайна SHUM , для правильного восприятия нейросетью образа человека фотосессию необходимо проводить в едином цветовом стиле: одежда участниц должна быть одного тона, без мелких принтов, узоров или чрезмерного декольте. Участники эксперимента договорились, что сотрудницы MAER наденут чёрный верх — пиджак или блузку. Таким способом можно помочь нейросети определить главный объект и направить «мысли» в нужное русло. И это первое обязательное правило проекта, которое установили участники. Второе — портрет не должен быть перегружен лишними деталями и информацией, а значит «фото как на паспорт» — самый правильный формат.
«Нюдовый» этап
При подготовке фотографий, на базе которых будет происходить обучение нейросети, требования к макияжу тоже специфичные. И не всем женщинам они подошли. Оказалось, что подчеркнуть контуры лица необходимо только с помощью нюдового макияжа. Яркий мейкап просили смыть. Студия SHUM поделилась советами, как создать фотографии для обработки искусственным интеллектом:
· В первую очередь, выберите однородный фон;
· Одежда может быть любого фасона, но цвет стоит определить один, контрастный фону;
· Откажитесь от украшений на голове и шее (серьги, ободки, цепочки и др.);
· Свет выставьте мягкий, рассеянный. Важно не допустить появление жестких теней на лице и фоне;
· Положение головы — прямое, чтобы одинаково хорошо были видны глаза, нос и губы. Взгляд — в камеру;
· С выражением лица определитесь заранее. Лучше, чтобы все модели показывали одну и ту же эмоцию. Например, либо все улыбаются, либо фотографируются безэмоционально;
· На этапе цветокоррекции сохраните естественную цветовую гамму, одинаковую для всех фотографий. Экспозиция, контрастность и резкость должны быть в норме.
Слияние в цельный образ
Этап обработки фотографий с помощью нейросети состоял из нескольких подготовительных ступеней. На первой — необходимо было подготовить фотографии (подогнать под определенный формат, выровнять экспозицию, сделать минимальную ретушь), на второй — слить все фотографии в единый образ (обучить нейросеть на подготовленном датасете), на третьей — приступить к художественной обработке.
Художники студии SHUM столкнулись с проблемой почти сразу: если какой-то портрет не отвечал заданным параметрам, то нейросеть вместо женского облика выдавала «карикатуры». Пришлось обучать нейросеть учитывать особенности каждого лица, неровность света, и т.д. Процесс обучения был достаточно нестабилен, и это главная сложность этапа.
В процессе были опробованы несколько вариантов обучения с разным количеством проходов нейросети по изображениям и разным коэффициентом обучения. Чтобы избежать «карикатурного» результата, нейросети были даны сотни команд (промптов). Одной неправильной было достаточно, чтобы картинка преобразилась в совершенно неподходящую. Баланс между реалистичной картинкой и абстрактной помогли найти терпение и опыт.
Кто кого учит?
Есть мнение, что искусственная нейросеть — настолько мощный интеллектуальный инструмент, что он способен заменить представителей творческих индустрий. По команде она рисует и обрабатывает картинки, пишет тексты и программные коды, сочиняет музыку и даже преподаёт научные дисциплины — казалось бы, выполняют функции дизайнеров, копирайтеров, программистов, диджеев, учителей и т.д. Например, месяц назад один из студентов Российского государственного гуманитарного университета (РГГУ) написал и даже защитил дипломную работу с помощью нейросети ChatGPT (18+).
Однако, предупреждают художники SHUM, не все так просто. На сегодняшний день нейросеть может создавать качественный контент лишь в соавторстве с человеком, который будет её обучать и контролировать. Это подтвердил и сам студент РГГУ, который подробно и поэтапно ставил ИИ задачи по составлению дипломного плана и содержанию глав. Заметим, что нейросеть, которую он использовал, заблаговременно уже была обучена разработчиками и пользователями: пропустила через себя огромный массив текстов из всех областей знаний, от классической литературы до ядерной физики.
Несамостоятельность «кибер-разума» подтверждает и эксперимент медиахолдинга MAER. В этом проекте нейросеть изучала фото девушек десятки тысяч раз и потратила на это несколько дней. А чтобы превратить конечный результат в 20-секундный видеоролик — понадобилось задать около 700 текстовых и математических команд. На постановку задач у художников ушло две недели.
«Важно понимать, что искусственные нейронные сети — это наша реальность сейчас и завтра. Они становятся полноценным инструментом для художника, который не использует их как кнопку «Шедевр», а который может с помощью нейросети развиваться, упрощать поиск информации и приходить к новым формам творчества. Освоивший этот инструмент сейчас сможет применять его и в искусстве, и в бизнесе, и в повседневности».
С маленьких на большие
После подготовки нейро-открытки на компьютере студии SHUM ее увидели на экранах страны. Дизайнеры медиахолдинга MAER адаптировали видео под крупноформатные рекламоносители, отличающиеся разнообразием форм и размеров. Нейро-открытка создала праздничное нестроение в Москве, Екатеринбурге, Волгограде, Новосибирске, Челябинске, Нижним Новгороде, Перми, Уфе, Самаре, Тюмени и т.д. Её увидели миллионы.
Техническая начинка медиаэкранов MAER позволила чётко и без искажений передать даже мелкие детали насыщенного креатива. Происходит это за счёт большого количества пикселей, из которых состоит экран. Например, разрешение одного из 3D-медиафасадов MAER в Москве — на ул. Велозаводской, 13, стр.2 — 3008х960 пикселей, что почти вдвое больше, чем стандартное разрешение медиафасадов. Передать видеоконтент в приятном для зрительского восприятия формате помогли оптимальные яркость, контраст, широкий угол обзора, а также качественная цветопередача — более 16 млн цветов.
Сегодня искусственный интеллект — это новый технологичный тренд для бизнеса, который хочет развиваться в ногу со временем, считают художники. Одна из ключевых задач, с какими нейросеть поможет предпринимателям и креативщикам, — избежать «страха белого листа»: когда нет понимания, с чего начать создание творческого продукта. Даже малого объёма вводных достаточно, чтобы генеративная система предложила предварительные варианты, способные вдохновить на качественное окончательное решение. Поскольку тренд на нейросети только набирает обороты — «у бизнеса есть шанс запрыгнуть в первый вагон и усилить позиции бренда с помощью нейрокомпетенций», заявляют специалисты.
«Лично меня в этом проекте удивили наши сотрудницы. Они с легкостью согласились на эксперимент, а теперь образы, созданные с помощью их красоты видит вся страна. Вероятно, изображения, сгенерированные нейросетью из наших сотрудниц, ещё никогда не были такими огромными! Наши крупноформатные рекламоносители — не только источник позитивных эмоций, но и площадка для самых смелых экспериментов. Спасибо студии SHUM за смелый проект, наши сотрудники рады новым предложениям!».
«8 марта — первый весенний праздник, поэтому визуальную концепцию мы выбрали именно такую: образ девушки, символизирующий тепло и жизнь, — это образ весны, которая сменяет «мёртвую» зиму и оживляет мир! Соавторство с нейросетью помогло нам добиться результата в ярких красках, которых очень не хватает российским городам после зимы. Мы реализовали проект вместе с медиахолдингом MAER, который признаем лидером в российском сегменте медиафасадов. MAER подсветил проект в таком масштабе, что мы сами, казалось бы, уже привыкшие к ярким картинкам на компьютере, радовались, как дети!».