Pull to refresh

Comments 16

Вы тут описали вначале что политика банка возвращать кредиты и спрогнозировать это, А как вы в нейронную модель загнали коллекторский отдел?
На этом этапе мы пытаемся предугадать заранее – кому из клиентов можно давать кредиты, а кому – не стоит. Соответственно коллекторский отдел пока в планах.
Это же про юридических лиц, с местом в data-lake под физиков не так всё хорошо (хотя и по «юрикам» — в КИХ может не хватать данных :)
Спасибо за статью!
Скажите, пожалуйста, правда ли, что в моделях кредитного скоринга не используются признаки, которые могут внести в модель дискриминирующий bias (например, пол и национальность)?
В статье речь о корпоративных клиентах, но в целом для нас проблемы дискриминирующих признаков неактуальны.
Спасибо за ответ.
но в целом для нас проблемы дискриминирующих признаков неактуальны.

А по какой причине? Вы считаете, что использование подобных признаков корректно, или ни один подобный признак не сработал для вас как хороший предиктор, и поэтому вам просто неважна эта проблема?
Потому что у корпоративных клиентов нет в явном виде признаков, которые могут быть восприняты как дискриминационные (юридическое лицо не имеет пола, национальности, цвета кожи и пр.)
Я понимаю, но вы написали:
В статье речь о корпоративных клиентах, но в целом для нас проблемы дискриминирующих признаков неактуальны.

И вторая часть воспринимается так, будто проблемы нет и для не корпоративных клиентов.
Или я неправильно понял?
ну так «отказ, банк не комментирует» небось, даже если это и проблема, об этом никто не знает
Жаль для физиков нет, а то очень удивляют звонки от call-центра с заманчивыми предложениями, которые явно основаны «не на тех данных».
А детали самой модели покажите? Какие методы, как потимизировались, тестировались, отбирались переменные, какие результаты? Без этого не очень похоже на тему для хаба Машинное обучение…
Модель базируется на ФКР (факторах кредитного риска), которые мы (как банк) раскрывать не можем. В посте же речь скорее об инфраструктуре для эффективного построения моделей data science аналитиками, которые работают в рисках.
Так никто не просить расскрывать сами факторы или их веса. Как проводился отбор факторов, инжиниринг, по каким метрикам. Какой тип модели: регрессия, RF, сеть и т.д.
Если уж в заголовке упомянули Джини, то хоть итоговое значение напишите.
В большинстве случаев ФКР разрабатываются на основе экспертных суждений, и впоследствии тестируются в рамках моделей прогнозирования дефолтов. Основной инструмент (алгоритм) для моделирования – обычная логрегресссия, что позволяет получить интерпретируемые результаты. Мы в рамках пилота пробовали различные алгоритмы (случайный лес, градиентный бустинг), которые позволяют улучшить качество моделей (+несколько пунктов Джини), но при этом модель теряет в интерпретируемости.
Интересная статья. Вопрос насчет эффективности решения.
Не нашел у решения анализ эффективности и коррекцию алгоритмов.
В банковском кредитовании «action plan» (US market), т.е. работа над ошибками и коррекция процессов — обязательный этап. У вас этот этап не описан. Это для простоты описания или не внедрено?
В данном пилотном решении нет модуля, который бы позволял выгружать обученные модели в продуктивную среду (deploy) и, соответственно, встраивать в модели метрики контроля качества. Это все планируется реализовать на следующем этапе.
Sign up to leave a comment.