Как стать автором
Обновить

Комментарии 13

Но точность оставляет желать лучшего.
А цифра какая получилась? Если не секрет, конечно :)
Нет, совсем не секрет! На тестовой выборке, предоставляемой в контесте, МАРЕ получается около 0,2 — до топ 100 не дотягивает. Но с признаками можно поиграться, их тут много — широкий простор для деятельности.
Я пилю своё решение по выходным, пока простой алгоритм анализа данных + простой алгоритм рассчёта коэффициента времени, результат = 0,2302776. Есть ещё несколько идей по улучшению алгоритмов «угадывания», но не уверен на сколько они улучшат результат. Пока удивляюсь как человек в топе 0,0485175 сделал :)

С минимальным опытом в ML за полдня набрал 0.112. Правда на этом и застрял. По ощущениям 0.1 не так уж и круто, вот 0.05 и меньше — впечатляет.


P.S. Странно, что на хабре про конкурс ничего не было. Или я пропустил?

Я имел в виду 0,1 именно в Azure ML, мне кажется в основном используют более стандартные вещи (я вот пользуюсь Python + Panda).

Да, я тоже не видел на хабре ссылок.
Я застрял на 0.66 по public score (хотя CV по тренировочным данным дает ~0.9).
Пытаюсь построить более сложные модели, но пока не особенно успешно получается, думаю, лучше внимательнее данные изучить и их преобразовать.

Да, ссылка была: habrahabr.ru/company/mailru/blog/302674

Ой, ошибся на порядок.
Не 0.66 и 0.9, а 0.066 и 0.09 по CV.

Думаю, неплохой результат без опыта в ML и на первом контесте)
Было, выше поделились ссылочкой. И будет ещё :)
Всегда в постах об аналитических пакетах какая-то магия) Удивился как можно сделать join (add columns) без указания ключа — полез в справку. Оказывается две выборки должны быть равны по мощности для этой операции, но это только половина проблеиы, какие строки окажутся вместе не указано. Предполагаю, что строки будут браться в порядке сортировки исходных данных, но если это правильный способ их склеить, то не ясно зачем было их резать на x и y. Возможно тут есть простор для тюнинга алгоритма :)
Еще непонятно, почему вы обучаете только на 70% обучающих данных, ведь можно обучать на 100%, а проверять на x_test.
Проблема проверки на x_test в том, что ответов нет — надо будет загружать их на сайт, а максимум это можно сделать 5 раз в день.

Я тюнинговал алгоритм на 70% выборки, а в конце обучал на 100% с выбранными параметрами.

Да, хороший подход, спасибо.
я как то пытался построить сеть для функции sin() и получил не очень хорошую точность.
такое чувство, что Azure ML имеет какие то ограничения, которые не позволяют получить очень точный результат (или я просто чего то не понимаю?)
http://gallery.cortanaintelligence.com/Experiment/sanity-sin-360-1
Зарегистрируйтесь на Хабре , чтобы оставить комментарий

Публикации

Истории