Pull to refresh
31
0
Алексей Натекин @natekin

Firekeeper, Machine Head

Send message

Интересно откуда берется предубеждение что нету реальных применений в бизнесе? :) Взять хотя-бы несколько видеозаписей с проведенных нами DS кейс-клубов — как и что работает в играх, телекоме, ритейле и тяжелой индустрии. Вдовесок к этому, в ноябре буду презентовать в другом месте архитектурную карту из нескольких десятков кейсов и применений в одном только банкинге (которые тоже будут широко доступны). Применения поискать не сложнее чем писать что их нет :)


Про бум вакансий — опять же — ищущий да обрящет :) За последнюю неделю у нас опубликованы вакансии Одноклассников, EMBL, "МаксимаТелеком", iPavlov, Game Insight, Datalytica и Сколтеха. Если их не искать то действительно ни бума ничего не найти. О том что их раз в 5 больше чем 2 года назад думаю говорить бессмысленно — никто же проверять не будет.


И еще, кажется Вы путаете людей которые "давайте проведем хакатон чтобы прощупать почву" и несколько тысяч видавших виды землекопов этой самой почвы.

Двойка действительно мало на что влияет, кроме исторически сложившегося описания через odds ratio. Даже, вообще говоря, двух обоснований: и через биномиальное лог правдоподобие, и через кросс-энтропию (да, оптимизируем то же самое).


Я хотел подчистую скопипастить оригинальный вывод из Elements of Statistical Learning, там ровно одна страница 346 (365 в pdf), "10.5 Why Exponential Loss?". Но чтото у меня ТеХ в комментах не работает :(


А с инженерной точки зрения, эта двойка ни на что не влияет, кроме сравнения разных реализаций (чтобы числа одинаковые в обучении получались).

Спасибо :)

Мы попробовали пофиксить этот косяк, но к сожалению, на мобильной версии Хабра ломаются \begin{equation} формулы. Сперва думали, что дело в переносах строк, но это не помогло.
Спасибо :)

Да, PDP планируются. И да, настройки H2O GBM тоже разберем. По-крайней мере, основные. H2O просто сильно угарели, и запилили штук 30 дополнительных настроек и небольших твиков. Все настройки перебирать смысла нет, обычно достаточно дергать 3-4 ручки (как именно как раз и будем разбираться).
Как автор грядущей статьи про бустинг, если очень хочется пораньше про него почитать, то (спойлер) за основу я возьму свой же опубликованный tutorial. Он будет сильно укорочен, но при этом расширен кодом и картинками по-свежее. За 3.5 года с его публикации изменились пакеты и их скорость, а математика и trade-off-ы никуда не делись.

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Works in
Date of birth
Registered
Activity