Pull to refresh

Comments 25

Помимо призов, морального удовлетворения и повышения скилла что-то ещё принесло вам призовое место?
С материальной точки зрения следует выделить повышенное внимание со стороны работодателей, которое в итоге весьма быстро вылилось в новую работу.
Если это не секрет, то можно подробней и о «внимании» и о последующем.
Точные цифры тут приводить не буду, но количество предложений от рекрутеров выросла и количественно, и качественно. «Рассказать о себе» теперь на собеседовании можно больше и это воспринимается с большим уважением и интересом, чем раньше. Появились новые интересные знакомства с людьми, которым интересен Kaggle и machine learning. В целом, я бы сказал, что такого рода достижение в глазах окружающих выполняет ту роль, которую должен выполнять диплом, то есть является подтверждением того, что человек профессионал в своей области.
количество предложений от рекрутеров выросла и количественно, и качественно

Отечественные рекрутеры или зарубежные?
Во основном проекты зарубежные, а рекрутеры отечественные.
Но было предложение и от зарубежных.
Необязательно, но это самый популярный (судя по скриптах на форуме) язык среди участников.
Захватывающее чтиво. Вітаю з перемогою

А где видео с
>подготовили презентацию и выступили для Kaggle комьюнити в Киеве
?

И где оно собирается — пароли, явки, чатики?
Спасибо.

Есть вот такое сообщество в ФБ
Собственно у администраторов можно получить пароль от видео и прочую полезную информацию касательно встреч.
Но насколько я знаю качество нашего видео оставляет желать лучшего. (не видно презентации)
Если есть презентация и есть плохое видео с аудио их можно совместить в что-то удобоваримое
Под объединением/укрупнением команд имеется ввиду объединение независимых результатов (ensembling) и идей на заключительной стадии? Ваш основной метод построения модели был основан только на xgboost, или Вы использовали и другие пакеты (RF (RandomForest), плюс еще какая-то экзотика на удачу)?
Sorokinv,
Под объединением/укрупнением команд имеется ввиду объединение независимых результатов (ensembling) и идей на заключительной стадии?


Если быть совсем точным, то наше финальное решение это weighted average трех отличных между собой ансамблей, которые отличались между собой кросс-валидацией, количеством и параметрами моделей 1-го уровня и входящими переменными. Добавил визуализацию на картинке ниже.
ensemble2
.
Sorokinv,
Ваш основной метод построения модели был основан только на xgboost, или Вы использовали и другие пакеты (RF (RandomForest), плюс еще какая-то экзотика на удачу)?


В качестве моделей первого уровня использовалось порядка десятка разных моделей с разными наборами параметров. Лучшей отдельной моделью была baggingRegressor(xgbRegressor). Экзотики тоже были. Некоторые из моделей первого уровня приведены на картинке ниже.

image
Спасибо, за ответ. Смотрю Вы даже NN пытались подтянуть через Keras, хотя вряд ли они дают эффект на таких задачах, но интересно. Поздравляю с результатом :)
Спасибо!

Что касается Keras, то такого рода модели показывают хуже точность, но так сам подход очень отличный от других моделей, то в итоге это положительно влияет на качество ансамбля.
Во во. Я даже расстроился когда дочитал до «В заветные 3 часа ночи, после многократных обновлений страницы мы наконец-то увидели свой результат. 4-ое место...», хотя и знал, что в итоге у ребят третье место)
Огромное спасибо за статью! После того как посмотрел рассказ Андрея Кирьясова, который занял 6 место, очень ждал подробностей от вашей команды. Прочитал на одном дыхании! :)
Спасибо) Можно ссылку на рассказ?
Странно, не вставилась ссылка, вот: https://www.youtube.com/watch?v=l2jN471TEQg
А это вообще частое правило в конкурсах что датасеты нельзя модифицировать и нужно указывать все источники данных? Я правильно понимаю что нужно указать даже использованные частотные словари, иначе становишься нарушителем правил? В чем тут вообще логика организаторов?
Sign up to leave a comment.

Articles