Открыть список
Как стать автором
Обновить
1
Карма
0
Рейтинг
Дмитрий @justm57

Пользователь

Почему каждый Data Scientist должен знать Dask

Столкнулся с даском(через swifter), когда нужно было мапить функции к массивам 100млн*50. Для некоторых операций вполне достаточно пандаса, ввиду того, что в даске нет многих полезных функций.

Яндекс открывает технологию машинного обучения CatBoost

Кстати, а как он по скорости обучения. Конечно очень хорошо, что на отдельных задач он превосходит lgb и xgb, но если взять lgb и xgb — многим нравится как раз первый несмотря на чуть худший score, ввиду на порядок быстрой обучаемости

Открытый курс машинного обучения. Тема 8. Обучение на гигабайтах с Vowpal Wabbit

Вот теперь статьи стали ещё лучше, потому что вводные темы закончились и начинается всё самое интересное! Спасибо большое!

Открытый курс машинного обучения. Тема 4. Линейные модели классификации и регрессии

Очередной раз спасибо за замечательную статью. В том моменте, когда мы сказали, что исходных признаков недостаточно и пытались сделать полиномиальные — это разве не ведёт к мультиколлинеарности? Или я чего-то не понимаю

Открытый курс машинного обучения. Тема 2: Визуализация данных c Python

«Еще полезно строить вот такие картинки, где на главной диагонали рисуются распредления признаков, а вне главной диагонали – диаграммы рассеяния для пар признаков. Бывает, что это приводит к каким-то выводам»
А что может быть особенного в них? Откуда берутся выводы?

Открытый курс машинного обучения. Тема 1. Первичный анализ данных с Pandas

Огонь!:) Доволен большим количеством примеров в первом уроке

Информация

В рейтинге
5,883-й
Откуда
Москва, Москва и Московская обл., Россия
Зарегистрирован
Активность