Как стать автором
Обновить

Комментарии 15

сейчас на Kaggle запуск ноутбуков на приватных данных осуществляется без доступа к интернету

зависит от competition, во многих можно не только данные подкачать, но и собственные библиотеки скомпилировать (через одно место)

Отличная статья и полезные советы, не только для кэгглеров, но и для преподавателей курсов!

Ещё стоит отметить использование сторонних данных, валидация на сторонних данных, ручная разметка, pseudo labeling основанный на них. Не везде это запрещено правилами

так ждал историю о ppleskov, когда данные скрейпятся и тупо (ок, далеко не тупо) подсовываются в код и дают скор почти 1

Помни, сильный тот, кто играет честно!

Запомнил

Спасибо про интересную статью! Про последний способ читиринга не знал)

Эх, помню былые времена, когда засылал сабмиты только с нулями и только с единичками, чтобы по по формуле Байеса узнавать распределение классов в тесте и делать более точную колибровку засылаемых сабмитов)

Ну, это никогда не помешает )

Хм, кажется так до сих пор можно. Тема годная)

df.shape - это же свойство, а не метод, круглые скобки не нужны. Неужели никто из читающих не заметил ) А так полезная заметка, хотя большинство методов уже встречалось.

Исправил опечатку, спасибо)

А кроме шашешчек зачем учавствовать в соревнованиях?

Призы бывают очень солидные)

В казино тоже на Zero когда ставитшь 1:36 ..

Ну, бывает ещё какой-то новый опыт всё-таки. Когда работаешь, то круг задач ограничен, код видишь только свой и своих коллег, методы уже все рутинные. На соревнованиях бывает можно что-то новое узнать - новые данные, новые методы, а где-то и код новый можно увидеть (где его показывают, конечно).

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории