Открыть список
Как стать автором
Обновить
19
Карма
0
Рейтинг
Кирилл Косолапов @kirillkosolapov

CEO DATA4

One pixel attack. Или как обмануть нейронную сеть

ПрограммированиеАлгоритмыМашинное обучениеЧитальный залИскусственный интеллект
Давайте познакомимся с одной из атак на нейросети, которая приводит к ошибкам классификации при минимальных внешних воздействиях. Представьте на минуту, что нейросеть это вы. И в данный момент, попивая чашечку ароматного кофе, вы классифицируете изображения котиков с точностью более 90 процентов даже не подозревая, что “атака одного пикселя” превратила всех ваших “котеек” в грузовики.

А теперь поставим на паузу, отодвинем кофе в сторону, импортируем все необходимые нам библиотеки и разберем как работают подобные атаки one pixel attack.
Читать дальше →
Всего голосов 34: ↑34 и ↓0 +34
Просмотры12.2K
Комментарии 12

Что влияет на выдачу кредита. Обзор соревнования Home Credit Default Risk

Data MiningАлгоритмыМашинное обучениеНаучно-популярноеИскусственный интеллект
Рассмотрим, как работают алгоритмы в банковском скоринге, какие метрики используются и какие параметры заемщика влияют на то, выдадут кредит или нет. В статье описывается прошедший конкурс с kaggle по предсказанию вероятности дефолта и приводятся влияющие на риск дефолта параметры.

Ошибка первого и второго рода


Цель банка – заработать деньги. Первый риск, с которым сталкивается кредитная организация — дать кредит заемщику, который допустит дефолт. Дефолт может иметь разные причины, от финансовых трудностей заемщика, и заканчивая фродом.

Для банка это — ошибка первого рода.

Но если банк будет вести жесткую политику, и никому не выдает кредиты, даже тем, кто вернул бы деньги, то банк не заработает на процентах. Отказ в кредите ответственному заемщику – ошибка второго рода.

Для оценки качества принимаемых алгоритмом решений, используется коэффициент Джини (GINI). В экономике и в Data Science коэффициент Gini имеет разную интерпретацию. Для кредитного скоринга он рассчитывается, как

GINI = 2 ROC AUC — 1

Для оценки банковского скоринга используется стандартная ROC AUC кривая!



Читать дальше →
Всего голосов 23: ↑17 и ↓6 +11
Просмотры14.3K
Комментарии 22

Обзор Kaggle ML & DS Survey 2019. Или сколько зарабатывают ML специалисты

PythonData MiningМашинное обучениеНаучно-популярноеИскусственный интеллект
Ежегодно Kaggle проводит опрос среди специалистов по анализу данных, и объявляет конкурс на поиск инсайтов из полученных данных. В этом году в опросе участвовало 19717 человек со всего мира. В статье рассматриваются лучшие обзоры и решения Kaggle ML & DS Survey 2019.


Читать дальше →
Всего голосов 10: ↑7 и ↓3 +4
Просмотры5.1K
Комментарии 5

9 подходов для выявления аномалий

АлгоритмыМатематикаМашинное обучениеЧитальный залИскусственный интеллект
В предыдущей статье мы говорили о прогнозировании временных рядов. Логичным продолжением будет статья о выявлении аномалий.

Применение


Выявление аномалий используется в таких областях как:

1) Предсказание поломок оборудования


Так, в 2010 году Иранские центрифуги были атакованы вирусом Stuxnet, который задал неоптимальный режим работы оборудования и вывел из строя часть оборудования за счет ускоренного износа.

Если бы на оборудовании использовались алгоритмы поиска аномалий, ситуации выхода из строя можно было избежать.


Читать дальше →
Всего голосов 17: ↑8 и ↓9 -1
Просмотры6.3K
Комментарии 0

Временные ряды в прогнозировании спроса, нагрузки на КЦ, товарных рекомендациях и поиске аномалий

Data MiningАлгоритмыМашинное обучениеЧитальный залИскусственный интеллект
В статье рассматриваются области применения временных рядов, решаемые задачи, и используемые алгоритмы. Прогнозирование временного ряда используется в таких задачах, как прогнозирование спроса, нагрузки на контактный центр, дорожного и интернет-трафика, решения задачи холодного старта в рекомендательных системах и поиска аномалий в поведении оборудования и пользователей.

Рассмотрим задачи подробнее.


Читать дальше →
Всего голосов 10: ↑8 и ↓2 +6
Просмотры5.7K
Комментарии 3

10 лайфхаков разработки рекомендательных систем

Data MiningАлгоритмыМашинное обучениеУправление e-commerceИскусственный интеллект
В предыдущей статье мы обсудили основы устройства рекомендательных систем и кейсы использования. Узнали, что основной принцип заключается в рекомендации товаров, понравившихся людям с похожим вкусом, и применении алгоритма коллаборативной фильтрации.

В данной статье, будут рассмотрены лайфхаки рекомендательных систем на основе реальных бизнес кейсов. Будет показано, какие метрики лучше использовать, и какую степень близости выбрать для предсказания.


Читать дальше →
Всего голосов 11: ↑9 и ↓2 +7
Просмотры4.3K
Комментарии 6

Введение в рекомендательные системы

Data MiningАлгоритмыМашинное обучениеУправление e-commerceИскусственный интеллект
В статье рассматриваются подходы по построению персонализированных товарных и контентных рекомендаций, и возможные кейсы использования.

Персонализированные товарные и контентные рекомендации используются для повышения конверсии, среднего чека и улучшения опыта пользователей.


Читать дальше →
Всего голосов 6: ↑4 и ↓2 +2
Просмотры8.4K
Комментарии 3

Применение речевой аналитики в бизнесе

Монетизация IT-системУправление продажамиУправление персоналомЧитальный залБизнес-модели
Конверсия в покупку — ключевая метрика бизнеса. Конверсия зависит каждого этапа воронки продаж, от маркетинга, до момента перевода средств на счёт. Если этап переговоров воронки продаж работает неэффективно, он пропорционально снижает общую конверсию продаж.
Технологии речевой аналитики улучшают показатели конверсии на этапе продаж. Навыки речи продавца напрямую влияют на вероятность сделки.



Работая над разработкой решений речевой аналитике в команде DATA4, мы убедились, что конверсия у продавцов, владеющих техникой переговоров и необученных сотрудников отличается в 2-3 раза.
Читать дальше →
Всего голосов 19: ↑6 и ↓13 -7
Просмотры2.7K
Комментарии 0

Капсульные нейронные сети

АлгоритмыBig DataМатематикаМашинное обучениеИскусственный интеллект
В 2017 году Джеффри Хинтон (один из основоположников подхода обратного распространения ошибки) опубликовал статью, в которой описал капсульные нейронные сети и предложил алгоритм динамической маршрутизации между капсулами для обучения предложенной архитектуры.

У классических свёрточных нейронных сетей есть недостатки. Внутреннее представление данных сверточной нейронной сети не учитывает пространственные иерархии между простыми и сложными объектами. Так, если на изображении в случайном порядке изображены глаза, нос и губы для свёрточной нейронной сети это явный признак наличия лица. А поворот объекта ухудшает качество распознавания, тогда, как человеческий мозг легко решает эту задачу.


Для свёрточной нейронной сети 2 изображения схожи [2]
Читать дальше →
Всего голосов 40: ↑28 и ↓12 +16
Просмотры18.3K
Комментарии 9

Как внедрить технологии машинного обучения у себя в бизнесе

Управление проектамиРазвитие стартапаЧитальный залБизнес-моделиИскусственный интеллект
Согласно Gartner, машинное обучение на пике популярности. Занимаясь разработками и внедрениями решений в области анализа данных и машинном обучении, наша команда DATA4 накопила опыт по ключевым этапам и подводным камням, которым я и поделюсь в статье.


Читать дальше →
Всего голосов 24: ↑12 и ↓12 0
Просмотры6K
Комментарии 2

Принцип работы свёрточной нейронной сети. Просто о сложном

АлгоритмыВизуализация данныхМашинное обучениеЧитальный залИскусственный интеллект
Перевод
Глубокие нейронные сети привели к прорыву во множестве задач распознавания образов, таких как компьютерное зрение и распознавание голоса. Сверточная нейронная сеть один из популярных видов нейронных сетей.

В своей основе сверточную нейронную сеть можно рассматривать как нейронную сеть, использующую множество идентичных копий одного и того же нейрона. Это позволяет сети иметь ограниченное число параметров при вычислении больших моделей.


2D Свёрточная нейронная сеть
Читать дальше →
Всего голосов 33: ↑26 и ↓7 +19
Просмотры30.5K
Комментарии 11

Нейронные сети, фундаментальные принципы работы, многообразие и топология

АлгоритмыМатематикаМашинное обучениеЧитальный залИскусственный интеллект
Нейронные сети совершили революцию в области распознавания образов, но из-за неочевидной интерпретируемости принципа работы, их не используют в таких областях, как медицина и оценка рисков. Требуется наглядное представление работы сети, которое сделает её не чёрным ящиком, а хотя бы «полупрозрачным». Cristopher Olah, в работе «Neural Networks, Manifolds, and Topology» наглядно показал принципы работы нейронной сети и связал их с математической теорией топологии и многообразия, которая послужила основой для данной статьи. Для демонстрации работы нейронной сети используются низкоразмерные глубокие нейронные сети.

Понять поведение глубоких нейронных сетей в целом нетривиальная задача. Проще исследовать низкоразмерные глубокие нейронные сети — сети, в которых есть только несколько нейронов в каждом слое. Для низкоразмерных сетей можно создавать визуализацию, чтобы понять поведение и обучение таких сетей. Эта перспектива позволит получить более глубокое понимание о поведении нейронных сетей и наблюдать связь, объединяющую нейронные сети с областью математики, называемой топологией.

Из этого вытекает ряд интересных вещей, в том числе фундаментальные нижние границы сложности нейронной сети, способной классифицировать определенные наборы данных.

Рассмотрим принцип работы сети на примере
Читать дальше →
Всего голосов 49: ↑42 и ↓7 +35
Просмотры33.5K
Комментарии 40

Улучшение качества изображения с помощью нейронной сети

АлгоритмыОбработка изображенийМашинное обучениеЧитальный зал
Сегодня, хочу рассказать об интересном подходе по улучшению качества изображения. Официальное название подхода Super Resolution. Улучшение качества изображения программными методами известно с начала появления цифровых снимков, но в последние 3 года произошёл качественный скачок, вызванный использованием нейронных сетей.


Пример улучшения качества изображения с использованием технологии Super Resolution.
Читать дальше →
Всего голосов 34: ↑31 и ↓3 +28
Просмотры53.6K
Комментарии 25

Классификация тем обращений в контактный центр

СемантикаData MiningМашинное обучение
Здравствуйте, коллеги! В этой статье я кратко расскажу об особенностях построения решения по классификации тем обращений клиентов в контактный центр, с которыми мы столкнулись при разработке.

Определение тем обращений используется для отслеживания тенденций и прослушивания интересующих записей. Традиционно, эта задача решается путём проставления соответствующего тега оператором, но при данном подходе большую роль играет «человеческий» фактор, и тратится много человеко-часов работы операторов.


Читать дальше →
Всего голосов 12: ↑8 и ↓4 +4
Просмотры3.7K
Комментарии 0

5 принципов ведения технологического бизнеса, или как изменить мир

Профессиональная литератураИстория ITНаучно-популярноеФинансы в IT
Эта статья о том, что отличает успешный бизнес от провального, какие стратегии развития известны и какими наработками стоит воспользоваться. В статье рассматриваются идеи и подходы, которые помогут выбрать правильный вектор развития.

Подрывная технология


Автор книги «Дилемма инноватора» Клейтон М., провёл исследование с целью установить, на основе каких инноваций строится успешный бизнес, а на основе каких – нет. Инновации, условно деляться на 2 типа: подрывные и поддерживающие.

Поддерживающие, это технологии, совершенствующие и усложняющие продукт, направленные на увеличение стоимости. Подрывные, это технологии, упрощающие продукт и демократизирующие рынок. Только подрывные инновации меняют рынок.


Читать дальше →
Всего голосов 10: ↑8 и ↓2 +6
Просмотры6.7K
Комментарии 4

15 когнитивных искажений

Научно-популярноеМозг
Люди сталкиваются с большим объёмом информации, часть из которой достоверна, а часть освещает интересующую область односторонне, а иногда и сознательно искажённо.

Эта статья о том, как отличать достоверную информацию от искажённой, и о том, как правильно подавать информацию, чтобы убедить других людей.



Начнём с того, что люди не всегда мыслят рационально. Это данность, которая обусловлена принципами работы нашего интеллекта, выработанными в процессе эволюции. Условно, представим разум, разделённый на две Системы. Устройство разума не так однозначно, но описанное упрощение позволит понять причины искажений. Первая система генерирует решения и гипотезы быстро «если коснёмся горячего предмета, то отдёрнем руку». Вторая, принимает решения путём логических рассуждений. Первая Система генерирует гипотезы, а вторая принимает их или отвергает. Такой способ мышления медленный и энергозатратный. Логическое рассуждение используется людьми реже и требует больших усилий. Это причина большинства когнитивных искажений.

Так, галочка «по умолчанию согласен» позволила увеличить количество согласных на донорство до 86% в Швеции, тогда как в Дании, где при получении прав нужно самостоятельно ставить согласие, т. е. принимать осознанный выбор, количество согласных на донорство 4%.
Читать дальше →
Всего голосов 63: ↑62 и ↓1 +61
Просмотры119.8K
Комментарии 100

Разработка системы биометрической идентификации по речи

Анализ и проектирование системАлгоритмыМашинное обучение
Из песочницы
Здравствуйте, коллеги! В этой статье я кратко расскажу об особенностях построения систем биометрической верификации/идентификации, с которыми наша команда DATA4 столкнулась, создавая собственное решение.

Задача аутентификации личности используется в областях с необходимостью контроля доступа. Это банки, страховые компании, и другие области где используются конфиденциальная информация.

Традиционно, аутентификация использует принцип знания «ключа», такого как пароль, контрольное слово или номер паспорта. Описанный способ обладает недостатком – подтверждается не личность, а известная личности информация.
Биометрические решения лишены этого недостатка.
Читать дальше →
Всего голосов 21: ↑17 и ↓4 +13
Просмотры4.6K
Комментарии 5

Информация

В рейтинге
5,876-й
Дата рождения
Зарегистрирован
Активность