Голосовой помощник «Яндекса» «Алиса» заговорит на иностранных языках

Его обучат украинскому, белорусскому и казахскому
67 млн россиян к концу 2017 г. пользовались мобильным интернетом
67 млн россиян к концу 2017 г. пользовались мобильным интернетом / Андрей Гордеев / Ведомости

«Яндекс» планирует создание мультиязычной версии «Алисы», рассказал «Ведомостям» сотрудник компании – партнера поисковика. Планируется, что «Алиса» будет говорить на языках стран СНГ, где велика аудитория «Яндекса», утверждает он. Собеседник «Ведомостей», знакомый с менеджерами «Яндекса», уточняет, что речь пока идет о локализации «Алисы» на украинском, белорусском и казахском языках.

По словам одного из источников «Ведомостей», заговорить на иностранных языках «Алиса» может уже в 2019 г.

Сейчас «Яндекс» фокусируется на русском языке, отметил его представитель Матвей Киреев. Но при этом думает о масштабировании «Алисы» на другие языки с прицелом на страны присутствия «Яндекса», указал он. Конкретные планы «переозвучивания» «Алисы» он не прокомментировал.

Аудитория «Яндекса» – это постсоветское пространство: люди, жившие в республиках СССР, и их потомки, рассуждает политолог Алексей Макаркин. По его словам, несмотря на разницу между Украиной, Белоруссией и Казахстаном, с точки зрения национальных языков там идут схожие процессы. На Украине сейчас идет украинизация, Белоруссия занимается продвижением белорусского языка, озабочены развитием казахского языка и власти Казахстана, рассказывает Макаркин. Очевидно, «Яндекс» готовится к изменению языковых предпочтений аудитории, заключает эксперт.

Аудиторию на Украине, в Белоруссии и Казахстане поисковик не раскрывает, равно как и свои доходы в этих странах. Официально на Украине сервисы «Яндекса» не работают, напоминает его сотрудник. В мае 2017 г. украинские власти предписали операторам блокировать их наряду с сервисами Mail.ru Group.

Украина, Белоруссия и Казахстан – не самый маленький рынок, но все же он значительно уступает российскому, отмечает гендиректор «ТМТ консалтинга» Константин Анкилов. По его словам, в частности, пользователей мобильного интернета во всех трех странах примерно в 2,5 раза меньше, чем в России. К концу 2017 г. мобильным интернетом пользовалось почти 60% жителей России, или 67 млн человек, следовало из материалов аналитической компании GfK.

67 млн россиян к концу 2017 г. пользовались мобильным интернетом

По данным МТС, проникновение смартфонов (их пользователи могут установить «Алису») в Белоруссии и на Украине превышает 60%. По данным «Казкоммерс секьюритиз», на конец прошлого года в Казахстане этот показатель составлял 55–60%. К началу 2018 г. на Украине 42% населения (18,7 млн человек) использовало мобильный интернет, вытекает из исследования компании We Are Social.

По данным Internet World Stats, в декабре 2017 г. в Белоруссии было 6,7 млн пользователей интернета, на Украине – 40,9 млн, в Казахстане – 14 млн. Проникновение интернета достигало 71,1, 93 и 76,4% соответственно.

При этом, как следует из материалов Internet World Stats, к началу года в Казахстане на казахском языке говорило 64% населения, т. е. 11,8 млн человек, на Украине на украинском – 67%, или 27,4 млн человек. Данных о Белоруссии Internet World Stats не приводит.

Перевод голосового помощника на каждый язык может стоить несколько миллионов долларов, посчитал директор по маркетинговым коммуникациям Brand Analytics Василий Черный. Это затраты на подготовку и обучение алгоритмов на новом языке, подготовку базовых диалогов и навыков, пояснил он. Чтобы система понимала и воспроизводила ответы на вопросы на похожем языке, используется transfer learning, рассказывает замдиректора по исследованиям и разработкам компании ABBYY Татьяна Даниэлян. «Вы применяете архитектуру работающей нейросети, но обучаете ее на данных новой языковой модели тому, как устроен язык. Это его фонетика, морфология, синтаксис, семантика и т. д.», – объясняет она. Виртуальные ассистенты не только обрабатывают текстовые сообщения, но и распознают речь и генерируют устные ответы, отмечает Даниэлян. Люди в разных странах и регионах разговаривают и произносят слова по-разному, отличаются диалекты, они по-разному ставят ударение в словах, используют разные предлоги, согласование и т. д. Все это требует дообучения нейросети на множестве диалогов – как в текстовой, так и в звуковой форме, говорит Даниэлян. По ее словам, как правило, такая разработка может занимать от одного месяца до полугода в зависимости от сложности языка, близости одного языка к другому и др.

Чтобы перевести «Алису» на другие языки, не потребуются большие затраты, так как семантика сохраняется, считает основатель венчурного фонда IMI.VC Игорь Мацанюк. Странно, что «Яндекс» не сделал этого раньше, разводит он руками. Это стандартная практика, когда компании запускают продукт сразу на нескольких языках, так, например, происходит с играми, отмечает Мацанюк. Но 90% населения Украины, Белоруссии и Казахстана русскоговорящие и могут пользоваться «Алисой» и с российским интерфейсом, говорит он.-

«Алиса» и беспилотный автомобиль: что Путин увидел в «Яндексе»