Pull to refresh
11
-0.3
Банк ВТБ @VTB

Организация

Send message

Маленький data-science для большого бизнеса, или В анализ данных со школьной скамьи

Reading time8 min
Views3.4K

Привет, Хабр! В одной из предыдущих статей команда ВТБ обещала подробнее рассказать, как на конкурсе «Большие вызовы» в образовательном центре «Сириус» команда школьников занималась разработкой сервиса геоаналитики для бизнеса. Итак, время пришло, давайте же скорее начинать!

Меня зовут Максим Воля, мне 17 лет, и я один из тех самых школьников, который принял участие в этом конкурсе в составе школьной команды разработки. В статье расскажу, как мы готовились к проекту и создавали его, с какими данными работали, какой стек технологий применяли, с какими сложностями столкнулись и что получилось в итоге. На проекте я был Product-менеджером, также в команду входили Илья Демидов, который занимался машинным обучением, Даниил Ануфриев — компьютерное зрение, Дмитрий Рынин — аналитика, Владислав Секин — фуллстек-разработка. Сейчас подробно все расскажу. Добро пожаловать под кат!

Читать далее
Total votes 5: ↑4 and ↓1+3
Comments0

Применение нейросетевых подходов для формирования признаков в моделях

Level of difficultyMedium
Reading time9 min
Views2.2K

Наша команда Графовой аналитики стрима Моделирование КИБ и СМБ занимается различными исследовательскими задачами для двух основных направлений: риск- и бизнес-моделирования.

В данной статье мы расскажем о том, как продвинутые подходы машинного обучения, в частности нейронные сети, помогают генерировать признаки для моделей, сокращая трудозатраты на проработку гипотез и операционные издержки при подготовке данных для моделей.

Интересно? Поехали...
Total votes 10: ↑10 and ↓0+10
Comments0

Надежность ВТБ: как мы добились «четырёх девяток» доступности банковских систем

Level of difficultyMedium
Reading time7 min
Views4.6K

Привет! Меня зовут Иван Мартинович, я заместитель руководителя департамента поддержки прикладных систем и сервисов — вице-президент в ВТБ. В теперь уже далёком 2019 году мы запустили одну из ключевых программ цифровой трансформации банка, нацеленную на обеспечение надёжности целевых систем. О том, как мы проводили её в разгар пандемии коронавируса и что из этого всего вышло, мне бы и хотелось сегодня рассказать. Добро пожаловать под кат.

Читать далее
Total votes 22: ↑17 and ↓5+12
Comments20

Фреймворк vtb_scorekit для разработки интерпретируемых скоринговых моделей

Level of difficultyMedium
Reading time14 min
Views2.3K

Всем привет! Меня зовут Сакович Руслан, я занимаюсь корпоративным риск-моделированием, и сегодня расскажу о построении скоринговых моделей. Эти модели позволяют оценивать кредитные риски и являются крайне важными в деятельности банка. К ним предъявляются высокие требования в плане точности, стабильности и интерпретируемости результатов, поэтому мы в основном не можем использовать методы «черные ящики» (как например бустинги или нейросети), и обычно вынуждены пользоваться логистической регрессией. Сам по себе метод логистической регрессии довольно простой с точки зрения математики, однако для построения хорошей модели он требует тщательной предварительной обработки и энкодинга исходных данных, а также последующего довольно трудоемкого отбора переменных в модель. Причем стандартные библиотеки вообще не предоставляют возможности построения хоть какой-нибудь адекватной модели прямо из коробки. Мы решили стандартизировать весь процесс разработки скоринговых моделей, собрали используемые нами алгоритмы и объединили в библиотеку vtb_scorekit.

Читать далее
Total votes 8: ↑8 and ↓0+8
Comments0

Autobinary: библиотека для простого обучения «деревяшек» – часть третья

Level of difficultyMedium
Reading time4 min
Views1.1K

Привет! Я Василий Сизов, тим-лид команды «Модели управления Жизненным Циклом Клиента», и мы продолжаем нашу серию материалов о библиотеке autobinary.

Ранее мы рассказали вам о кросс-валидации в autobinary, которую можно использовать не только для расчета усредненной оценки модели или расчета усредненных важностей фичей, но и для подбора параметров модели, отбора фичей в модель и т.д.

В этой статье мы расскажем вам о том, как можно использовать библиотеку autobinary для подбора параметров с помощью Optuna, а также о том, как можно интерпретировать вклад фичей с помощью Shap и PDPbox. 

Читать далее
Total votes 5: ↑5 and ↓0+5
Comments7

Autobinary: библиотека для простого обучения «деревяшек» — Part 2

Level of difficultyMedium
Reading time7 min
Views1.2K

С ростом количества источников данных, методов генерации и извлечения признаков возникает вопрос: «А надо ли нам столько информации? Не ухудшит ли каждый новый фактор предсказательную силу модели?» И правда, для решения большинства задач нет необходимости использовать все доступные нам признаки в финальной модели, так как часть из них не несет в себе никакой информации и даже может запутать алгоритм. Для того, чтобы решить эту проблему и сократить признаковое пространство, были придуманы методы отбора факторов в задачах машинного обучения. О некоторых методах, которые мы внедрили в библиотеку Autobinary расскажем в этой статье.

Поехали
Total votes 6: ↑6 and ↓0+6
Comments0

Autobinary: библиотека для простого обучения «деревяшек» — Part 1

Level of difficultyMedium
Reading time4 min
Views1.6K

Рождение autobinary, как и многих других фреймворков, началось с автоматизации рутинных задач. На тот момент мы создавали много look-alike моделей (в основе - модель бинарной классификации) по разным продуктам банка. Одни и те же скрипты писать было скучно. Более того – накопилось много разрозненных скриптов, которые хотелось привести к единому формату.

Что из этого получилось
Total votes 4: ↑4 and ↓0+4
Comments0

Как выбрать библиотеку стайлинга и заменить несколько дизайн-систем на одну. Часть 1

Level of difficultyMedium
Reading time6 min
Views2.4K

Привет! Меня зовут Вадим Казаченко, я лид фронта дизайн-системы ВТБ. Год назад устроился в банк и получил командную задачу — построить единую библиотеку компонентов, настолько универсальную, чтобы ее можно было использовать в любом продукте дизайн-системы банка, и при этом она не должна становиться «узким горлышком», как это обычно происходит с UI-китами в крупных компаниях. Дело в том, что в ВТБ существует множество дизайн-систем, над которыми работают десятки дизайнеров.

Непростая задача требовала проработки архитектуры дизайн-системы и сильно зависела от выбора решения для стайлинга. В этой статье подробно расскажу, от чего мы отталкивались и на чем остановили свой выбор.

Читать далее
Total votes 6: ↑6 and ↓0+6
Comments6

Стресс-тестирование: как мы формировали комплексный взгляд на динамику стоимости банковского кредитного портфеля

Reading time9 min
Views2.4K

Стресс-тестирование кредитного портфеля банка преследует цель сформировать ожидаемую оценку потерь в зависимости от прогнозных сценариев макроэкономических факторов. При этом базовой метрикой стресс-теста, как правило, выступает именно ожидаемые потери — математическое ожидание или, в случае с регрессией, условное по макрофакторам математическое ожидание потерь. Однако, если получается построить распределение таких потерь, то тогда стрессовые потери можно определять вероятностно, используя доверительные интервалы и метрики самого распределения.

Читать далее
Total votes 2: ↑1 and ↓10
Comments3
Когда речь заходит об участии банка в каком-либо масштабном проекте, все сразу представляют гигантские финансовые потоки. На самом деле современный банк может поделиться не только деньгами, но и технологиями. Пример – история, как ВТБ помог Мосгортрансу изменить систему общественного транспорта Москвы.   
Подробности – под катом
Total votes 19: ↑18 and ↓1+17
Comments70

«Толик — лапочка», или как мы делали опрос IT-удовлетворенности на 20 тысяч человек

Reading time5 min
Views10K
А вообще нормально ли нашим сотрудникам работается с внутренними системами? В небольшой компании это вопрос простой, всех сотрудников и их системы IT-служба знает почти наизусть. Но нашим айтишникам сложновато запомнить 20 тысяч человек — а именно столько в ВТБ используют IT-сервисы в работе. Мы задали всего один вопрос, но и этого было достаточно для получения большого количества информации о наших пользователях. В этом посте мы поделимся своим опытом организации массового опроса удовлетворенности — надеемся, он пригодится и вам.


Читать дальше →
Total votes 22: ↑20 and ↓2+18
Comments18

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Works in
Registered
Activity