Открыть список
Как стать автором
Обновить
19
Карма
0
Рейтинг
Кирилл Косолапов @kirillkosolapov

CEO DATA4

Что влияет на выдачу кредита. Обзор соревнования Home Credit Default Risk

Ссылки на кернелы добавил в тело статьи, в этом вы правы, так будет более корректно. Из кернелов брались только визуализации (графики и т.д.), чтобы не изобретать велосипед. Содержание текста полностью оригинальное.

Что влияет на выдачу кредита. Обзор соревнования Home Credit Default Risk

Ссылка на источник есть в первом абзаце, во втором предложении. Статья — обзор решений с конкурса, которые каждый может подробно изучить перейдя по указанной ссылке (подсвечена синим). Это именно обзор, который не претендует на новые инсайты, т.е. описывает решения описанные несколькими участниками конкурса, в том числе и указанное вами решение по вашей ссылке.

Что влияет на выдачу кредита. Обзор соревнования Home Credit Default Risk

В решениях на конкурсе Lightgbm показал хорошие результаты. Но разница с другими алгоритмами в основе которых композиция деревьев небольшая. Хотя, конечно, если разница есть, лучше использовать лидирующий алгоритм.

Что влияет на выдачу кредита. Обзор соревнования Home Credit Default Risk

Планирую на эту тему написать еще 1-2 статьи, где рассмотреть тему глубже. Спасибо за идею сделать алгоритм с последовательным исключением ряда признаков, и показать как это влияет на метрики. Обязательно нужно попробовать.

Обзор Kaggle ML & DS Survey 2019. Или сколько зарабатывают ML специалисты

Возможно, там всего несколько респондентов ответили, и назвали «оптимистичные» цифры. Т.к. данные из опроса, есть вероятность искажения реальной картины.

Временные ряды в прогнозировании спроса, нагрузки на КЦ, товарных рекомендациях и поиске аномалий

Указанный вами пост от ODS действительно является качественным изложением про временные ряды. Но текущая статья затрагивает немного другие аспекты, и написана, чтобы люди интересующиеся тематикой могли дополнить свои знания. Если вы ее внимательно прочитаете, общего с указанной вами статьей, только перечень алгоритмов, но это логично, так как обе статьи описывают устоявшиеся подходы к решению задачи. Понимаю, что вам нравится оставлять негативные комментарии, но пожалуйста, не надо это делать для каждой статьи, даже если они вам не нравятся. Конструктивную критику вы всегда можете написать в личные сообщения, и я постараюсь ее учесть в следующих статьях, либо отредактировав текущую. Надеюсь на ваше понимание.

10 лайфхаков разработки рекомендательных систем

Дела с сетями действительно обстоят хорошо, но вычленение смысла из контента нетривиальная задача. Тут вопрос скорее трудозатрат и добавочного эффекта. Добавление каждого следующего процента качества стоит нелинейно дороже. И есть точка, где это становится нецелесообразно. Для научной статьи, такая работа подойдет, а во бизнес заказчик уже может не потянуть бюджет. Не в курсе, какой сейчас алгоритм у Нетфликс, но возможно, там что то подобное.

10 лайфхаков разработки рекомендательных систем

Пример с Google был про нахождение близких товаров по изображению. И там существуют отдельные проблемы из-за разных текстур, форм и т.д… Как правило, каждый кейс имеет много особенностей, и их учет в работе с изображениями занимает больше времени, чем работа с матрицами, а результат работы с матрицей товарных предпочтений получается лучше. Вы правы, сейчас обработка больших матриц не проблема. К сожалению, не у каждого клиента есть достаточно данных для успешного применения нейросетей и т.д.

10 лайфхаков разработки рекомендательных систем

Вы правы, по Лайфхаку №1 можно использовать методы оптимизации для поиска весов, либо подобрать итеративно руками.

По Лайфхаку №8, глубокое понимание необходимо, и нужно выбирать наиболее подходящую метрику, RMSE далеко не всегда подходит, и нужно отталкиваться от кейса, полностью с вами согласен.

Введение в рекомендательные системы

Думаю, сейчас так и есть. Но когда был конкурс (более 10 лет назад), у них могла быть другая бизнес модель, они вообще начинали с проката фильмов на дисках по почте.

Капсульные нейронные сети

Уважаемый roryorangepants, в статье указаны ссылки на источники, на основе которых написана статья, ваш комментарий не совсем корректен. Но буду рад, если вы подробно изложите пожелания по будущим статьям в личном сообщении, я обязательно их учту при написании статей. Конструктивная критика и обратная связь всегда полезны.

Нейронные сети, фундаментальные принципы работы, многообразие и топология

К сожалению, не увидел при создании возможности поменять на перевод, а при редактировании поменять нельзя. Выделил жирным ссылку, чтобы не путать читателей.

Нейронные сети, фундаментальные принципы работы, многообразие и топология

Благодарю за поправку. Это статья носит скорее характер размышления, чем строгого научного изложения и доказательства, я подумаю как лучше изложить обоснование.

Улучшение качества изображения с помощью нейронной сети

Да, как раз в статье [2] описана архитектура такой сети.

Познаём Нирвану – универсальную вычислительную платформу Яндекса

Интересно, для каких задач кроме описанных в статье может быть использован данный инструмент?

15 когнитивных искажений

Если события не равновероятны, но независимы, то разумнее всегда предсказывать наиболее вероятное событие. Так, если вероятности орла 0,7 и 0,3 решки соответственно, и у нас нет других данных, разумно предсказывать что все будущие события будут орлами. Мы получим точность прогноза равную 0,7 при 100% полноте (по орлу).

15 когнитивных искажений

Это было сделано для максимизации количества доноров. Т.е. тут важно не исследование реальной доли согласных, а увеличение количества донорских органов. Вы правы, если нужно оценить реальное настроение, то 2 галочки — правильный подход.

15 когнитивных искажений

Я подразумевал, что результат футболиста складывается из мастерства и удачи в конкретный день. Удача случайна, мастерство нет. Разумно пасовать самому мастеровитому игроку, а не которому «сегодня везёт». Но это вопрос дискуссионный.

Технологии беспилотных автомобилей. Лекция Яндекса

Было бы интересно почитать подборку последних научных статей по этой теме, возможно где то есть ссылка или перечень ресурсов?
1

Информация

В рейтинге
5,884-й
Дата рождения
Зарегистрирован
Активность