Интеллектуальное прочтение
Как меняется рынок ПО для автоматизированной обработки документовИнтеллектуальная обработка информации крайне востребована у российских компаний из разных отраслей и с разными масштабами бизнеса. В 2022 г. иностранные поставщики подобных решений (ABBYY, Kofax и т. д.) ушли с российского рынка. Но в отличие от других ИТ-направлений здесь изобретать велосипед не потребуется. Российские вендоры на протяжении многих лет разрабатывали и внедряли комплексные решения на отечественном рынке. За последний год они представили ряд продуктов, которые внесены в реестр отечественного ПО и доступны для коммерческих и государственных клиентов.
По пути цифровизации
С каждым годом все больше компаний в борьбе за эффективность внедряют цифровые технологии в бизнес-процессы, в том числе связанные с интеллектуальной обработкой данных. Эта задача актуальна для отраслей, в которых есть значительный объем поступающих и исходящих документов: финансового сектора, ритейла, энергетики, промышленности, образования, госорганов на всех уровнях.
Благодаря технологиям машинного обучения и способности обрабатывать информацию на естественном языке современные интеллектуальные платформы распознают, классифицируют, извлекают, проверяют и передают в информационные системы данные из любых текстовых сообщений и документов, задействованных в производственных процессах. Выполняемый отдельно вручную каждый из этих этапов потребовал бы существенного времени нескольких сотрудников.
Решения для интеллектуальной обработки документов широко востребованы, так как позволяют автоматизировать рутинные операции, сократить расходы на этот вид задач, повысить скорость работы профильных подразделений и в целом оптимизировать бизнес-процессы.
С учетом все возрастающего объема информации в мире растут и требования к точности и мощности подобных систем. Например, платформа ContentCapture от российского вендора Content AI позволяет обрабатывать документы со скоростью до 2000 страниц в минуту. Такие возможности помогают автоматизировать процесс даже предприятиям с потоком документов более 3 млн в день. Вручную обработать такое количество документов крайне затруднительно, особенно без найма большого числа сотрудников.
Хороший пример – банки, которые получают десятки и сотни тысяч запросов о предоставлении информации по операциям клиентов и отчетности от судов, органов юстиции, Росфинмониторинга, Банка России и других государственных ведомств. На предоставление сведений дается несколько дней, а ручная подготовка ответа может занимать недели. Высок риск человеческого фактора – ввода некорректных данных или потери информации. При этом финансовые организации не могут предсказать примерное количество таких запросов и оценить нагрузку на сотрудников.
Другой пример из банковской сферы – обработка документов для открытия счета юридического лица. Сделать это с первого раза удается лишь в четверти случаев, потому что клиенты часто забывают какой-либо документ из требуемых 8–10 наименований или присылают сканы низкого качества. После получения полного пакета документов их требуется отсканировать, внести данные в различные системы, идентифицировать по ПОД/ФТ (система противодействия отмыванию денег и финансированию терроризма), провести скоринг клиента, зарезервировать счет, создать карточку юрлица и только после этого непосредственно открыть счет.
По словам лидера трайба (подразделения) «Цифровая платформа» «Цифра банка» Сергея Комарова, системы интеллектуальной обработки документов, в которых есть алгоритмы анализа текста, существенно облегчают труд сотрудников кредитных организаций в обработке входящей корреспонденции.
В подобных сценариях автоматизация играет ключевую роль. Автоматическая классификация запросов, оперативное перенаправление их в нужный департамент, проверка комплектности пакета документов, извлечение требуемых данных, их валидация и сверка с внутренними источниками позволяют в разы ускорить процесс подготовки ответов, избежать критичных ошибок и вовремя оказать клиенту услугу или предоставить необходимые данные.
В образовании технологии интеллектуальной обработки документов применяются при проверке результатов ОГЭ, ЕГЭ, приеме документов от абитуриентов, рассказывает генеральный директор Content AI Светлана Дергачева. Кроме того, по ее словам, существует большой пул задач, связанных с оцифровкой архивов и библиотек, которые также можно решить при помощи этих инструментов. «Сложностей с этим множество: низкое качество бумаги, различные шрифты печатных машинок, готические шрифты, однако продукты Content AI способны не просто распознать и обработать такие архивные документы, но и сформировать на их основе удобные цифровые хранилища данных», – отмечает Светлана Дергачева.
В современных российских решениях также есть актуальные для всех отраслей возможности: сравнение договоров, помощь в проверке благонадежности контрагентов по различным базам (ФНС, судебных дел и т. д.). Поиск упоминаний публикаций о компании в СМИ и определение ее тональности – это тоже работа решений по интеллектуальной обработке данных.
«Программы по интеллектуальной обработке документов могут решать и узкоспециализированные задачи. Например, производить категоризацию судебных текстов и их маршрутизацию на исполнение, определять тональность сообщений, новостей. Также они могут производить интеллектуальный поиск типовых ответов и решений, подготовленных в рамках обработки прошлых входящих запросов, автоматизировать обработку входящих обращений в государственный орган власти: занесение документов в систему, заполнение реквизитов в карточке документа, подготовку проекта резолюции для руководителя и автоматическое определение исполнителей», – отмечает директор по продвижению ECM-систем К2Тех Алексей Пестерев.
Решения на основе искусственного интеллекта также умеют убирать лишние шумы и помехи, выделяя главное, и не важно, речь идет о рукописи XV в. или о некачественном фото документов клиента.
Как изменился рынок после ухода международных игроков
В прошлом году многие западные компании заявили об уходе с российского рынка. Среди них были и безоговорочные лидеры интеллектуальной обработки информации – ABBYY, Kofax. Вопреки опасениям, российский ИТ-рынок в данном сегменте сохранил жизнеспособность после ухода международных вендоров.
«По нашим оценкам, ABBYY занимала 80% в корпоративном секторе, а другие иностранные корпорации, Kofax и DataCap IBM, – меньше 20%. Были еще RPA (Robotic Process Automation) вендоры, у которых встречались кусочки решений систем интеллектуальной обработки текстов, но это не были полноценные системы, – уточняет Светлана Дергачева. – Локальные российские игроки были только нишевые и узкоспециализированные. На сегодня комплексные решения в России предлагают единичные вендоры, к ним относится и Content AI, который, по сути, является технологическим наследником ABBYY».
По ее словам, понять ситуацию на рынке интеллектуальной обработки информации поможет сравнение с автомобилем. Выбирая авто, мы обращаем внимание на бренд, внешний вид, комфорт. Движок в меньшей степени волнует покупателя. При этом двигатель является самым технологически сложным, так как для его разработки требуется огромный опыт, экспертиза. И потому ничего странного, что, скажем, в автомобиле Bentley используется двигатель от Volkswagen. «Так и в нашем бизнесе – технологии нарабатываются десятилетиями сбором обратной связи, методом проб и ошибок, – поясняет Светлана Дергачева. – Сейчас на рынке есть множество компаний, которые говорят: “Мы умеем вот этот тип документа классно распознавать”, но этого недостаточно для клиента. Зачем клиенту кресло или педали, если всего остального нет? Клиент хочет надежное, стабильное, гибкое и масштабируемое решение».
Content AI удалось сохранить в России передовые технологии и оперативно выпустить для нужд отечественного бизнеса и госорганов свои продукты для интеллектуальной обработки информации. Все ключевые решения включены в реестр отечественного ПО.
Эти продукты полностью адаптированы под требования российских заказчиков. Можно с уверенностью сказать, что за плечами Content AI стоит 30-летний опыт разработки интеллектуальных продуктов. При этом есть решения как для малого и среднего бизнеса, так и для крупных корпораций.
Есть еще один немаловажный момент – бесшовный переход на отечественные решения. «Так как мы выросли из ABBYY и досконально знаем их продукты, то нам по силам обеспечить для клиентов в России безболезненный, бесшовный переход на отечественное ПО так, чтобы не вставали бизнес-процессы», – указала Светлана Дергачева.
Драйверы роста
По словам Светланы Дергачевой, рынку интеллектуальной обработки информации есть куда расти и драйверами этого роста станут все возрастающие потребности наиболее технологичных отраслей экономики – финансового сектора и ритейла. По словам эксперта, прибыльность обеих во многом зависит от эффективности бизнес-процессов и снижения операционных издержек. Также заинтересованность во внедрении интеллектуальных решений обработки информации наблюдается со стороны государственных заказчиков, но пока это не массовая история.
Если говорить про решение несложных задач – чтение карт, паспортов, QR-кодов и т. д., то существует достаточно много отечественных продуктов, которые способны хорошо выполнять эти операции. Однако в целом на рынке отмечается высокий спрос на более интеллектуальные комплексные решения, которые умеют не только распознавать данные, но и обрабатывать их по определенным сценариям. «Заказчики все чаще хотят, чтобы продукт сам за них подумал, проанализировал объективный контекст и сформировал базу для принятия управленческого решения, – отмечает Светлана Дергачева. – Запрос на повышение интеллектуальности ПО отчасти связан с достижениями в области искусственного интеллекта, и мы формируем стратегии развития своих ИТ-продуктов с учетом этих потребностей бизнеса».