Дмитрий Ломилин: «Основной фокус – сбор аналитики для принятия правильных решений»

Директор IT-департамента «Роснефти» – о том, зачем компания создала единую цифровую платформу для всей компании
Директор IT-департамента «Роснефти» Дмитрий Ломилин
Директор IT-департамента «Роснефти» Дмитрий Ломилин /ПАО «НК «Роснефть»

В начале июля «Роснефть» запустила в опытно-промышленную эксплуатацию Единую цифровую платформу компании (ЕЦПК) с интегрированными сервисами на базе российского, в том числе собственного, программного обеспечения (ПО). Платформа позволит ускорить и упростить выполнение бизнес-задач и разработку новых решений. О том, как работает ЕЦПК и какой функционал на нее планируется добавлять в будущем, рассказал директор IT-департамента «Роснефти» Дмитрий Ломилин.

– В начале июля «Роснефть» объявила о запуске ЕЦПК. В чем цель, какие стоят задачи для бизнеса?

– ЕЦПК была введена в опытно-промышленную эксплуатацию в начале июля – совсем недавно. И в настоящее время перед нами стоит задача по обучению работе с платформой и ее инструментами. В первую очередь мы строим платформу для того, чтобы максимально ускорить реализацию проектов компании. Их много, и длительность у них зачастую достаточно большая. С помощью нашей платформы мы планируем ускорить проекты в несколько раз. Кроме того, мы хотим дать инструменты самообслуживания пользователям, которые смогут делать отчеты, выполнять свои задачи, не обращаясь в IT-департамент, и получать результат мгновенно.

– Что такое единая цифровая платформа? С чем это можно сравнивать?

– ЕЦПК – это информационная система, включающая набор популярных цифровых сервисов на базе современных инфраструктурных и облачных инструментов. Основной функционал ее позволяет обеспечить команды разработки всем необходимым, например базами данных, брокерами сообщений, облачными хранилищами и т. д. То есть это такая общая мастерская, в которой содержатся все инструменты, необходимые для разработчиков компании, для программистов, чтобы они могли выполнять стоящие перед ними задачи. Эти инструменты совместимы друг с другом, и с их помощью можно быстрее добиваться необходимого результата.

Дмитрий Ломилин

директор IT-департамента «Роснефти»
1999
окончил МГУ им. М.В Ломоносова, факультет прикладной математики. В 2001-2002 гг. получил образование по направлению экономики в Российской экономической школе
2002-2004
бизнес-аналитик в Ernst & Young
2004-2006
старший консультант в Accenture
2006 –2010
занимал разные должности в компании Deloitte, был в том числе директором группы по внедрению и поддержке бизнес-приложений департамента консалтинга «Делойт СНГ»
2010–2015
занимал руководящие должности в Ernst & Young
2016
работал в САП СНГ, отвечая за продажи по одному из продуктовых направлений
2016–2019
сооснователь и гендиректор компании BI Center (ООО «Биай центр»), специализирующейся на построении BI-решений различных вендоров
В настоящее время
директор IT-департамента «Роснефти»
– Это функционал только для сотрудников из сферы IT или для других подразделений тоже?

– Есть ряд сервисов, которые используются только IT-специалистами, и они ориентированы именно на разработчиков. Они помогают быстрее писать код и подключать необходимые потоки данных. Помимо того, на платформе есть ряд сервисов, ориентированных на конечных пользователей, чтобы бизнес-пользователь мог быстрее сделать свой дашборд или отчет, быстрее проанализировать бизнес-процесс или смоделировать его. Эти сервисы сделаны так, чтобы бизнес мог использовать их самостоятельно без привлечения IT-специалистов.

– А можно привести какой-то конкретный пример?

– Например, на удаленном объекте всегда требуется поставка каких-то запчастей, материалов. Через витрину данных на платформе люди смогут найти информацию о том, когда будет эта поставка, а если она задерживается – то почему, на какой срок и когда она приедет. При необходимости можно обратиться уже к IT-специалистам, и тогда мы проанализируем бизнес-процесс и поймем, почему, например, поставка задерживается. Если это происходит на системной основе, то сможем разобраться, как поправить бизнес-процессы компании, чтобы поставка в будущем всегда приходила вовремя.

– На кого будет ориентирована ваша платформа? На топ-менеджмент?

– Наша задача при использовании платформы – обеспечить топ-менеджера наиболее полными проверенными данными, которые опираются на надежные источники информации. И тогда он сможет принять адекватное решение. Если необходимо, туда же мы добавим прогноз по трендам, по моделям искусственного интеллекта (ИИ), чтобы руководитель понимал не просто позицию сотрудника, который готовил служебную записку, а видел максимально объективную картину, основанную на данных.

– Вы строили платформу с нуля? Есть ли на сегодняшний день в отрасли какие-то отечественные наработки?

– Можно сказать, что мы строили ее с нуля, но при этом также встраивали внутрь платформы отдельные программные продукты российских разработчиков, если они оказывались лучшими на рынке. У нас не было задачи создавать все самостоятельно. Соответственно, мы брали или open-source ПО, или писали собственные разработки там, где на рынке нет продуктов достаточного качества, которые удовлетворяют задачам компании. В остальных ситуациях мы использовали коробочные продукты и заставляли их работать внутри платформы в гармоничном виде.

При выборе решения с открытым кодом было необходимо соблюсти баланс между информационной безопасностью (ИБ), доступностью, возможностью адаптировать этот код под свои задачи и трудоемкостью его дальнейшей поддержки. Разработчиком выступил «Сибинтек».

– Вы сказали о необходимости соблюдения ИБ. Многие российские организации за последние два года столкнулись с резким ростом хакерских и DDoS-атак. Фиксирует ли «Роснефть» повышенный интерес хакеров к своей инфраструктуре?

– Да. За последние два года мы видим значительный рост количества атак на IT-инфраструктуру и информационные ресурсы компании, в том числе через внешние сервисы, которые использует «Роснефть». Мы стали фиксировать DDoS-атаки на публичные ресурсы компании с начала 2022 г., в связи с чем общества группы по максимуму перешли на непубличные каналы связи. Публичные каналы связи защитили сервисами от DDoS-атак. ИБ – важнейшее направление в рамках реализации платформы ЕЦПК. Чтобы обеспечить эффективную ИБ, необходимо заниматься ею непрерывно, а значит, ее компоненты должны использоваться на всем этапе жизненного цикла любых продуктов, публикуемых на платформе. От анализа исходного кода до непрерывного контроля библиотек, как в процессе разработки, так и в процессе эксплуатации.

– А почему компания приняла решение о создании собственного облака? В чем была острая необходимость?

– Для компании очень важна ИБ и контроль над своими информационными ресурсами. Ни один из вариантов частных облаков (OnPremise), представленных на российском рынке, не обеспечивал того технологического базиса, который был нам необходим. Соответственно, мы принципиально не рассматривали внешние облачные сервисы, тем более зарубежные. Мы всегда строили разработку внутри, на базе собственной инфраструктуры. Вот для того, чтобы объединить эти возможности в единую платформу, и была придумана ЕЦПК. Цель ЕЦПК – максимально оперативно и легко развивать ее сервисы под бизнес и IT-потребности с минимальной зависимостью от вендоров. При этом важно отметить, что ЕЦПК – это некий гибрид: целый ряд российских IT-продуктов являются частью сервисов ЕЦПК. Платформа развернута на базе корпоративного центра обработки данных (ЦОД), оператором которого является одно из дочерних обществ и внутренний IT-интегратор «Сибинтек».

ЕЦПК собрана таким образом, чтобы масштабироваться на ЦОДы. Соответственно, мы планируем развивать региональные ЦОДы с учетом фактических бизнес-потребностей обществ группы. Специально под ЕЦПК оборудование пока не закупалось. В ЦОДе эксплуатируется как имеющееся оборудование, закупленное при запуске центра, так и отечественное, приобретенное при расширении мощностей в 2023 г. По мере внедрения новых информационных ресурсов ЕЦПК ЦОД будет докупать оборудование по обезличенным техническим требованиям и по критерию «минимальная стоимость при условии соответствия всем требованиям ЦОДа».

– Остались ли в технологическом стеке компании какие-то иностранные решения? У каких зарубежных продуктов до сих пор нет аналогов?

– Быстро отказаться от исторических систем, реализованных на иностранном ПО, невозможно, поэтому, конечно, такие решения еще используются, но с каждым годом их количество уменьшается.

– Есть ли решения, которые «Роснефти» пришлось разрабатывать полностью самостоятельно?

– В компании существует программа по импортозамещению, которая реализуется поэтапно. К сожалению, на российском рынке еще не в полном объеме появились полноценные аналоги используемого у нас ПО – например, те же решения на базе SAP заменять очень тяжело. Но тем не менее частично функционал SAP уже есть на ЕЦПК (Data Steward, Data Services, частично BW). Кроме того, в компании широко используются решения на базе собственной разработки. Часто это уникальные продукты под специфичные бизнес-процессы, аналогов которых или нет на рынке, или адаптация которых требовала сопоставимых затрат.

– Цифровизация заявляется как одна из целей в стратегии «Роснефти», причем по всей производственной цепочке, и, конечно, многие процессы уже оцифрованы. Значит ли, что это все будет собрано под единой крышей?

– Мы идем к этому через сбор данных о процессах. То есть мы пока не планируем переводить все бизнес-процессы в нашу платформу. Хотим делать это только в тех случаях, когда в цифровизации бизнес-процессов есть какие-то пробелы, – тогда мы будем использовать платформу. Но основной фокус – это сбор аналитики, данных по всем бизнес-процессам компании для принятия правильных управленческих решений.

– Планируете ли вы внедрять какие-то модели ИИ в платформу?

– ЕЦПК содержит необходимые компоненты для внедрения решений, использующих машинное обучение и ИИ в производственных процессах. На базе платформы отслеживается жизненный цикл моделей и применяются современные подходы.

Мы планируем использовать ИИ во многих реализуемых IT-проектах. С течением времени данные могут меняться, а обученные модели – деградировать. Поэтому ими необходимо управлять и переобучать. В теории решения изобретательских задач есть такая концепция: «идеальная система – та, которой нет (а ее функция при этом выполняется)», т. е. затраты на нее нулевые, а функции ее выполняются. И для того чтобы это обеспечить, необходимо построить «автопилоты», которые выполняли бы какие-либо функции, либо отдать эти инструменты в руки бизнеса, чтобы пользователи могли самостоятельно все донастраивать и не привлекать IT под свои быстро меняющиеся потребности.

Поэтому мы рассматриваем внедрение огромного множества решений, от классических оптимизационных задач и прогнозов до цифровых ассистентов на базе больших языковых моделей для работы как со структурированными, так и неструктурированными данными. Неважно, как именно обеспечивается бизнес-результат. Важна ценность, которую несет решение бизнесу.

Мы идем от потребностей бизнеса, соответственно, строим работу по интеллектуальным сценариям. Сейчас мы собрали с бизнеса ряд потребностей, которые у них уже есть на данный момент. Это порядка 100 сценариев, в которых бизнес заинтересован. Они технологически распадаются на несколько групп, таких как машинное зрение, оптимизационные задачи, работа с временными рядами. И по этим направлениям мы сейчас уже сделали ряд прототипов. Показываем их бизнесу, получаем обратную связь и улучшаем. По мере решения этой задачи мы будем переносить прототипы на платформу и запускать уже как полноценные сервисы.

– «Роснефть» разрабатывает своего цифрового помощника. Как это решение будет работать в масштабах компании и какие задачи выполнять?

– ИИ ярко проявляет себя в электронных помощниках, которых можно создать, используя сервисы платформы. В этом контексте важным направлением работы является обработка естественного языка. В настоящее время активно развиваются языковые модели, и у нас тоже есть рабочие прототипы на платформе с использованием больших языковых моделей как для структурированных, так и для неструктурированных данных.

Для структурированных данных это тексты вида SQL, которые позволяют на естественном языке задавать вопросы к аналитическим витринам. Для неструктурированных это работа с документами. Ввиду масштабов у нашей компании имеется большое количество нормативной документации, и организация быстрого поиска конкретных нормативных документов – это возможность повышения эффективности работы конкретных бизнес- пользователей. В настоящее время в «Роснефти» разрабатывается прототип цифрового помощника «Чат-ЛНД» (поисковая система), который меняет подход компании к обработке больших объемов неструктурированных и структурированных данных.

Когда в 2022 г. большие лингвистические модели получили бешеную популярность, мы стали думать, как их использовать на благо компании. И поняли, что внутренний язык компании достаточно сложен и никакая языковая модель без дополнительного обучения его не поймет. Именно поэтому мы сделали «Чат-ЛНД», научили большую языковую модель понимать всю терминологию компании, разбираться в специфике бизнес-процессов и общаться с сотрудниками, по сути, на их же языке.

В данный момент прототип «Чат-ЛНД» включает только функционал для поиска по нормативным документам. Теперь у сотрудников нет необходимости вручную искать информацию в нормативных документах компании, потому что большая языковая модель знает всю документацию наизусть и может ответить по ней на любой вопрос, выдать ссылку на конкретный документ, показать страницу с запрашиваемой информацией.

В будущем планируется дополнить прототип функционалом поиска по проектной документации, контрактам, счетам-фактурам, отчетам, электронным письмам и др., включая базы данных различных информационных систем. Прототип будет обрабатывать нередактируемые документы с помощью моделей оптического распознавания символов (OCR), а взаимодействие с базами данных для получения интеллектуальной аналитики будет осуществляться с помощью модели, которая сама генерирует необходимый SQL-код. В дальнейшем мы планируем дообучать его дополнительным навыкам и встраивать в бизнес-процесс компании.

Вторым важным направлением является интеграция технологии компьютерного зрения в различные области деятельности – это сценарии, связанные с промышленной безопасностью и охраной труда, а также с другими задачами контроля производственных площадок компании.

Третье – это задачи по объединенным наборам данных таких областей, как логистика, производство, финансы.

Ну и конечно, существенный объем данных составляют табличные данные разного вида. Это и временные ряды, и просто исторические табличные данные, накопленные в разных системах. И на них можно строить огромное количество моделей, которые позволяют принимать более качественные решения. В будущем мы собираемся построить целый набор умных помощников, завязанных на GPT-подобных моделях, – мы их назвали РН-GPT. Эти помощники будут обеспечивать эффективное выполнение процессов каждым из бизнес-пользователей.

– Вы можете лишить работы огромное количество сотрудников.

– Скорее, мы упростим работу огромному количеству сотрудников, которые, как, честно говоря, и я, зачастую путаются в этих нормативных документах, – а теперь можно в течение минуты узнать ответ на любой вопрос.

– Когда, по вашей оценке, окупятся затраты на проект?

– Проект является самоокупаемым с положительными показателями рентабельности. Технологии, которые там используются, достаточно инновационные. Это позволит снижать затраты на IT. Мы видим, что, по ближайшим прогнозам, проект окупится в несколько раз и будет очень хорошей инвестицией.