Сергей Голицын, ВТБ: В ближайшем будущем персональные советники станут трендом в развитии ИИ
Во II квартале 2023 г. банки зафиксировали 279,7 тыс. мошеннических операций — это на 28,5% больше относительно среднего значения предшествующих четырех кварталов. Как банки сегодня борются со злоумышленниками с помощью искусственного интеллекта, и какие еще финансовые процессы он позволяет оптимизировать, в интервью CNews рассказал Сергей Голицын, вице-президент, заместитель руководителя департамента анализа данных и моделирования ВТБ.
«Точный эффект от внедрения ИИ подсчитать очень сложно»
CNews: За последние три года ВТБ удалось получить 300 млрд рублей от цифровой трансформации. Можно ли посчитать, какая доля этого эффекта обеспечена внедрением ИИ-инструментов в бизнес-процессы?
Сергей Голицын: Стоит отметить, что цифровая трансформация банка включает далеко не только внедрение ИИ и ML, но и замену большого парка «железа», создание новой архитектуры, унификацию процессов, строительство новых ЦОДов, ситуационных центров и т.д. То есть эффект был достигнут далеко не только за счет ИИ-решений, и оценить, какая доля эффекта пришлась именно на внедрение моделей машинного обучения, крайне сложно, порой — невозможно. Ведь модель — это лишь элемент процесса, он может быть ключевым, но может — и незначительным.
Для большинства тяжелых процессов оценка эффекта от внедрения ИИ выльется в сложный и дорогостоящий проект. Полноценные системы АБ тестирования, причем на разных клиентских сегментах, параллельные мониторинговые системы, которые должны отслеживать эффекты в смежных процессах… Поверьте, что даже методологически описать изменения на таком предприятии как банк задача крайне сложная, не говоря уже про реализацию. Конечно, это делается, но с существенными допущениями.
Давайте попробуем типизировать внедрения за счет искусственного интеллекта на верхнем уровне, не сильно детализируя. Один из типов изменений — это улучшение действующих алгоритмов, т.е. была одна модель искусственного интеллекта в процессе, ее заменили на другую модель. Эффект от такого изменения в первом приближении посчитать не сложно, достаточно сравнить результаты от прежнего процесса и измененного. Несмотря на кажущуюся простоту итоговый эффект можно померить лишь спустя достаточно длительное время.
Второй тип — это абсолютно новая разработка или процесс, основанный на технологии ИИ. Оценки эффекта делаются, как правило, на основе набора эвристик, так как эталонных показателей внутри организации нет. При этом получить драйверы для оценки эффекта с рыночных продуктов конкурентов скорее всего не получится. Для упрощения можно отнести всю выгоду от нового процесса на счет ИИ, однако это будет сильным искажением действительности, который не позволит корректно учесть аллокацию эффекта от обязательных элементов процесса или продукта. Например, банковский продукт не живет сам по себе, есть сеть отделений через которую продаются продукты, колл-центр, инфраструктура, поддержка, а ИИ — лишь маленькая шестеренка в этом процессе, но без которой процесс не «поедет».
CNews: Можете привести пример?
Сергей Голицын: Большая часть P&L, доходов и расходов любой кредитной организации приходится на кредитный процесс. Весь он сегодня, по сути, строится на ИИ, машинном обучении и предикативных моделях. Да, наверное, разработчникам алгоритмов будет приятно думать, что большая часть экономического эффекта достигается за счет ИИ, но нельзя сказать что весь эффект — это ИИ. достоверная оценка таких изменения, если банк действительно попытается ее сделать, может обойтись так дорого, что нивелирует весь эффект от внедрения ИИ.
Возьмем, например, чат-бот, который может заменить сотню операторов банка — нам кажется, что мы сэкономили на специалистах, но правда в том, что внедрение этого инструмента задевает большое количество смежных процессов, и настоящий эффект вы, пожалуй, не сможете измерить никогда. Ведь чат-бот может и привести к оттоку клиентов, причем не сразу, а через длительный период времени в силу накопленного негатива от общения с «бездушным роботом» — людям все еще приятнее слышать по телефону голос другого человека.
CNews: Какие сценарии применения ИИ в банках сегодня наиболее распространены?
Сергей Голицын: Если мы имеем в виду под сценариями режимы применения моделей, здесь нужно говорить о том, под какие процессы и продукты мы их выбираем. Их не так много: это пакетное исполнение, онлайн-режим, когда мы оцениваем поведение клиента и тут же отдаем результат, и Data streaming, потоковая обработка данных, когда мы любое событие в каждый момент поступления новой информации обрабатываем в режиме реального времени.
Последнее — сложный и дорогостоящий процесс, который актуален для некоторых направлений, например, транзакционного антифрода. Сложный он потому, что нужно обеспечивать поступление в систему принятия решений данных из множества чувствительных информационных систем в реальном режиме времени.
CNews: А на что стоило бы сделать акцент в ближайшем будущем?
Сергей Голицын: Мир так быстро меняется и предсказать, какие алгоритмы и кейсы будут максимально приоритетны, сложно. Однако мы видим огромный потенциал в персональных советниках, их развитие приведет к появлению большого количества новых сервисов. Внутри советников применяется множество алгоритмов и в различных режимах, от пакетной обработки до потоковой. Оптимизация — отдельная ветка применения ИИ. Оптимизационные алгоритмы вместе с моделями ИИ выводят на иной уровень точность процессов
Еще один сценарий — применение ИИ в симбиозе с доверенными средами. Сейчас мы вместе с нашими технологическими партнерами МФТИ и Т1 работаем над продуктом криптоанклав — это защищенная доверенная среда, в которую встроены Auto ML-алгоритмы. Мы сделали инструмент безопасного объединения данных из различных источников, включая внешние. Алгоритмыобрабатывают данные, проверяют их качество, строит внутри модели машинного обучения, проводят их валидацию, ставит в прод. Это полноценное решение, которое позволяет заказчику не беспокоиться за передачу своих данных.
Отдельный большой трек, за которым будущее — это стриминговая обработка данных.
«В Китае высокий уровень применения ИИ в банках»
CNews: Если сравнить российский финтех с зарубежным в контексте применения ИИ-инструментов — на каком этапе проникновения технологий мы находимся?
Сергей Голицын: Нельзя сказать, что мы активно обмениваемся информацией с западным или восточным банковским сообществом, но, безусловно, следим и за R&D, и за применением ИИ. В этой области мы скорее лидируем, нежели догоняем. Но тут есть нюансы. На Западе прерогатива исследований часто отдается консалтинговым компаниям, мы же идем другим путем, в российском банковском сообщества сильно развита исследовательская функция ИИ, банк выступает не только заказчиком, но и разработчиком.
В Китае, например, довольно высокий уровень применения ИИ в банках, связано с законодательством Поднебесной — оно предоставляет банкам более простой доступ к данным, чем в России. Это сильно стимулирует развитие технологий, так как данные — ключевое сырье, позволяющее генерировать гипотезы. В Китае те же технологии социального скоринга построены на огромном количестве данных телеком-компаний, банков, медицинских учреждений, университетов.
Нам в этом плане немого сложнее, прежде всего в силу очень строгого отношения регулятора к защите персональных данных пользователей. Поэтому нам приходится искать пути безопасного взаимодействия с другими игроками рынка. Большую помощь в этом вопросе оказывает АНО «Цифровая экономика», Ассоциация больших данных, которые помогают объединиться участникам рынка, государству и научному сообществу.
CNews: А по каким моментам есть отставание?
Сергей Голицын: Прибавлять нужно во всем, что касается инфраструктуры, облачных вычислений, доверенных сред. В том числе поэтому мы продвигаем технологию криптоанклава. Есть высокая потребность в графических ускорителях, к сожалению их нельзя импортозаместить за год или два. Промышленные оптимизаторы долгое время не входили в высокий приоритет отечественных разработчиков. Как правило оптимизационные задачи решались либо кастомно по конкретный кейс, либо применяя западные солверы. Сегодня в силу санкционного давления рынок предъявил высокий спрос на такие решатели.
CNews: Давайте приведем пример, как внедрение ИИ помогает оптимизировать банковский процесс. Идет ли речь только о различных прогностических моделях, например, о нейросетевой модели оценки вероятности дефолта?
Сергей Голицын: Нейросети сегодня применяются в огромном количестве процессов и в том числе в кредитном. Да, мы разработали нейросетевые модели оценки вероятности дефолта на основании транзакционных данных банка, использовали ее для улучшения качества действующих скоринговых моделей. Это не ноу-хау, аналогичные решения есть есть в большинстве крупных банков.
В данном примере через повышение разрешающей способности математической модели применяемой в процессе можно реально посчитать эффект в деньгах. Он достигается за счет выдачи более качественного портфеля при том же уровне отказов моделью. По сути модель начинает лучше детектировать проблемные кредитные заявки, тем самым доля заявок которые потенциально выйдут в дефолт максимально концентрируется в отказном бакете. В другом подходе можно повысить объем выдаваемого портфеля при сохранении уровня дефолта.Это классический подход, в банке есть калькулятор, включающий в себя сотни параметров — процентные ставки, комиссии, средние сроки погашения и т.д. Такой калькулятор позволяет получить P&L от изменения процесса.
CNews: Расскажите про модель гео-потенциала при управлении сетью продаж. Как она работает и какой эффект приносит бизнесу?
Сергей Голицын: Эта модель построена на основе исторических данных о поведении клиентов в точках продаж и большого объема обезличенных гео-слоев. С ее помощью можно прогнозировать ключевые метрики для открытия офиса в новой локации. Получив численную оценку новых привлеченных клиентов, «перетоков» между офисами и возможных оттоков клиентов, можно оценить экономический эффект от открытия точки, оптимизировать расположение новых локаций.
Платформенное решение содержит огромное количество кросс-отраслевых данных, уложенных на карту слоями по определенному алгоритму. Каждая локация 500 на 500 метров параметризована, и может насчитывать тысячи параметров.
Это и распределение проживающих по возрасту, проценту проживающих и работающих, по образованию, количеству жетей и так далее, что население локации чаще всего покупает и часто ли пользуется кредитками и другими финансовыми продуктами.
Вообще все, что касается геоаналитических сервисов — это один из больших трендов в области data fusion. Геоплатформы актуальны не только для банков, но и для торгово-сервисных предприятий: аптек, пекарен, прачечных и тд
«Модель транзакционного антифрода фиксирует нетипичное поведение клиента»
CNews: ВТБ также разрабатывал модель транзакционного антифрода — как работает она?
Сергей Голицын: Модель транзакционного антифрода базируется на стриминговой обработке данных. Она выделяет транзакции, которые кажутся ей аномальными. Они могут свидетельствовать о компрометации карты, взломе системы, любых противоправных действиях. Система понимает, что это нетипичное поведение для конкретного клиента.
CNews: Получается, искусственный интеллект можно успешно использовать для борьбы с мошенниками.
Сергей Голицын: Да, его возможности сегодня широко применяются. Вопрос в том, что вы хотите детектировать, на каких данных можете строить свои решения, в каком режиме они будут поступать. К примеру, это могут быть поведенческие данные о транзакциях, геопозиционирование, Clickstream пользователя, голос, видео, текстовые сообщения и так далее. Отталкиваться можно, допустим, от того, что клиент не использует определенные речевые обороты — тогда модель фиксирует, что это не тот же самый человек.
Хороший эффект дает и графовый анализ — это сегодня мощнейший инструмент fraud-detection моделей. Это набор методов, направленных на изучение связей между сущностями, они помогают выявлять неочевидные зависимости через различные метрики из графовой математики
Красота графового представления в том, что глядя на граф или подграф, можно даже глазами увидеть иную плотность связей некоторых узлов, неговоря про математические алгоритмы, которые подкрашивают аномалию как риск. Также модели умеют выявлять дроперов — котрые переводят денежные средства в больших объемах. Дроперы — это один из элементов мошеннической цепочки.
Технологии ИИ на компьютерном зрении активноприменяютспри оформлении кредитов также для выявления мошеннических операцийколл-офисах и у банкоматов.
CNews: А могут ли такие модели выявить людей, потенциально уязвимых для мошенников?
Сергей Голицын: Да, учитывая, какой всплеск социальной инженерии мы сейчас наблюдаем, мы обязаны отслеживать не только фродстеров, но и людей, которые могут им поверить. Модели детектируют наиболее уязвимые группы людейи помогают сформировать рекомендации по предупреждающим коммуникациям и каналам таких коммуникаций.
■ erid:2SDnjeZgu36Рекламодатель: Банк ВТБ ПАОИНН/ОГРН: 7702070139/1027739609391Сайт: www.vtb.ru
Полный текст статьи читайте на CNews