«95% решений по кредитам принимается без участия человека». Как Big Data меняет банки
Мы давно живем в эпоху больших данных: храним фотографии в облаке, пользуемся экосистемами мировых сервисов, оцифрованы и привычные для нас действия вроде получения кредита в банке или покупка каких-то товаров в супермаркете по акции. Разговором о том, почему без Big Data уже невозможно оказывать финансовые услуги, мы начинаем большую серию интервью с топами белорусского Сбера. В ней мы покажем, как технологии помогают преодолевать трудности и создают новую реальность.
Сегодня наш собеседник — исполнительный директор Сбер Банка (Беларусь) Константин Калинин. Именно он отвечает за то, как сырые цифры превращаются в понятные для потребителя и практичные для бизнеса продукты.
Наравне с интернет- и телеком-компаниями банки уже давно стали крупными операторами данных, с помощью которых могут многое рассказать о своих клиентах. Они знают их пол, возраст, где они любят совершать покупки и какими услугами пользуются. И, по мнению Константина Калинина, альтернативы тому, что в скором времени принятие многих решений в оказании финансовых услуг будет отдано на откуп нейронным сетям и AI, нет.
«То, на что человеку требуется два дня, модель делает за пять минут»
«Уже сейчас в нашем банке модели участвуют в достаточно большом числе операций, процессов, именно моделям отдано на откуп принятие решений — например, по кредитованию физических лиц и бизнеса в сегменте „микро“. В этих операциях людей либо нет вообще, либо их участие минимальное, — говорит Константин Калинин. — Когда я в 2015 году пришел в белорусский Сбер, в кредитном отделе работали 26 сотрудников. Сегодня — с учетом возросшего объема заявок — со всем справляются семь человек».
Конечно, в банке понимают риски, связанные с цифровыми инициативами и активностями, но отдают себе отчет: то, на что человеку при принятии решений требуется два дня, модель в стабильном многопоточном режиме поступления заявок отрабатывает за пять минут.
«Применение AI-моделей, нейронных сетей при принятии решений — это тот путь, свернуть с которого мы уже не можем. Думаю, что как раз тот, кто по нему не следует, в итоге останется в проигрыше», — уверен исполнительный директор Сбер Банка (Беларусь).
«В кредитных решениях — там, где применяются модели, — мы четко понимаем, какие алгоритмы лежат в их основе. И пока элементов саморазвития там немного. Причем все используемые модели минимум раз в год подлежат перевалидации, перекалибровке, оценке качества и донастройке. В целом моделей, способных работать исключительно без влияния человека, сейчас немного», — описывает текущее положение дел Константин Калинин.
Большие данные помогают банкам внедрять новые продукты
В Сбер Банке работу с большими данными рассматривают как возможность повышать эффективность и находить новые каналы взаимодействия с клиентом, анализировать поведенческие модели, риск-профили или клиентские профили с точки зрения понимания того, что клиентам предложить, как достучаться до их интересов.
Конечно, сама по себе работа с данными — недешевое увлечение. «Для этого надо обеспечить инфраструктуру по сбору, хранению, обработке, обеспечению качества, выстраиванию процессов, построению витрин данных для доступа к ним в режиме онлайн, — объясняет исполнительный директор. — Сейчас мы решаем вопросы качества, занимаемся интеграцией в хранилище всех источников данных, построением моделей, внедрением этих моделей в процесс принятия решения. И хорошо в этом направлении уже продвинулись. У нас обеспечена историчность данных на уровне 8–9 лет».
Например, если говорить о кредитных продуктах, то в случае розничных заявок важна скорость: клиент, приходящий за кредитом, достаточно избалован, не хочет ждать несколько дней, а хочет практически все получить онлайн. Поэтому со стороны кредитного аналитика, специалиста фронт-офиса, который занимается продажами, обратиться к специалисту по большим данным, чтобы тот выдал ему некий скоринговый балл, будет слишком медленно.
«Это должна быть встроенная в систему принятия решений „коробочка“, в основе которой лежит модель — отвалидированная, проверенная, с гарантированным качеством. И, подавая массив данных в виде кредитной заявки в эту „коробочку“, менеджер, находящийся на позиции фронт-офиса, должен получать оперативный ответ», — продолжает Константин Калинин.
Но, чтобы разработать эту «коробочку», надо сначала построить гипотезу зависимостей: вернет такой клиент кредит или нет и в какие сроки. Понять, где эти данные могут быть, проанализировать затраты на их сбор, потом их проагрегировать, почистить, убрать лишние атрибуты, сделать экспериментальную модель, оттестировать...
В корпоративном сегменте мы внедряем те продукты, которых раньше не было. Из последних примеров — тепловые карты.
Чтобы решения принимались онлайн, в Сбер Банке только в отношении физических лиц в постоянном режиме работает около полутора десятков моделей. И практически 95% решений по кредитам физическим лицам принимаются без участия человека. Это большой труд — нескольких лет. Но большие данные это не только про улучшение существующих бизнес-процессов.
«В корпоративном сегменте мы внедряем те продукты, которых раньше не было. Из последних примеров — тепловые карты. На основе анализа, как часто клиенты снимают деньги в банкоматах или обращаются за конкретными товарами в магазинах, можем предложить оптимальные варианты размещения точек обслуживания. Или подсказать, как предпочтительнее коммуницировать с клиентом по розничным расчетам: использовать эквайринговый терминал или кассовый аппарат. Благодаря моделям мы умеем это делать и предлагаем такой продукт».
Как компании понять, что ей уже пора «дружить» с большими данными?
Здесь наш эксперт советует начать с ответа на вопрос: зачем? «Это недешево, требует больших человеческих и материальных ресурсов, помещений для инфраструктуры. Даже не каждый банк себе может это позволить, не говоря уже об организациях, которые существенно меньше, чем кредитные. Но сейчас на рынке появляется все больше готовых решений от компаний, которые уже прошли определенный путь. Например, один из инструментов — облачные технологии, благодаря которым можно удешевить сам процесс работы с данными за счет экономии на затратах на собственные хранилища».
Затем нужно оценить свои потенциальные ожидания. Чего вы хотите от этого? Радикально изменить модель бизнеса? Или получить инструмент, благодаря которому вы будете по-другому продавать клиенту свою продукцию или иначе к клиенту обращаться? Либо хотите оптимизировать свою сеть продаж, а может, повысить эффективность инструментов по расчетным операциям? И при этом нужно понимать, что это не те инвестиции, которые окупаются быстро, не стоит ждать отдачи в течение короткого временного горизонта.
У бизнесов, которые развивались 20–25 лет, часто уже есть огромный массив неструктурированных данных. Если их упорядочить, то они могут принести пользу компании. Причем, по мнению Константина Калинина, это вовсе не обязательно делать самому.
«Постепенно формируется рынок больших данных, появляются организации, которые способны обработать и структурировать данные. Это молодые компании, где работают молодые ребята. Но они делают все быстро и качественно. Если, например, ваш архив состоит из 400 тысяч записей, то в Excel на обычном компьютере вы не обработаете их никогда. А специалист, который обладает опытом работы в SQL, сделает вам это за 15 минут».
Правда ли, что людям в желтом галстуке не дают кредиты?
Когда в Беларуси появились первые скоринговые модели, основанные на больших данных, один из банкиров, объясняя, как это работает, пошутил: «Мы выяснили, что люди в желтых галстуках редко возвращают кредиты, а потому такой человек, придя в банк, получит отказ». Но ведь в каждой шутке, как известно, лишь доля шутки. Сталкиваются ли в банках при анализе и интерпретации больших данных с подобными удивительными открытиями?
Если не сильно озадачиться, то можно найти достаточно устойчивую логическую связь между температурой в Англии и количеством утюгов в Индии.
Здесь исполнительный директор Сбер Банка вспоминает такую историю: «Наш преподаватель эконометрики рассказывал анекдот: если не сильно озадачиться, то можно найти достаточно устойчивую логическую связь между температурой в Англии и количеством утюгов в Индии. И эта связь будет очевидно прослеживаться. Вопрос в другом: а будет ли иметь смысл данная связь с точки зрения практического применения и будет ли она выдерживать эмпирическую оценку с точки зрения здравого смысла?»
Константин Калинин вспоминает, как в Сбер Банке как-то анализировали работу одной из моделей, которая к тому времени действовала уже года два. На ее основе специалисты пытались математически аргументировать, почему избыточно собирать некоторые социодемографические данные по кредитополучателям: не было стопроцентной связи с тем, как эти данные могут влиять на вероятность вернуть кредит банку.
«В итоге попросили ребят „покрутить“ исторический массив данных на базе этой модели и действительно сделали для себя ряд инсайтов: то, какие сведения сообщает о себе человек, обращаясь за кредитом (а мы их проверить не можем, это заявительные данные), влияет на поведенческий профиль при возврате кредита. Уровень образования, жилищное положение, наличие автомобиля — где-то больший вес, где-то меньший... Но влияет!»
Статья подготовлена в рамках проекта «Технологии, меняющие мир».
Партнер проекта — Сбер Банк.
Фото: Александр Хмелёв и pixabay.com
Партнерский материал