Как стать автором
Обновить
51
0

Пользователь

Отправить сообщение

О линейной регрессии: байесовский подход к курсу рубля

Время на прочтение 9 мин
Количество просмотров 24K


Не секрет, что курс рубля напрямую зависит от стоимости нефти (и от кое-чего еще). Этот факт позволяет строить довольно интересные модели. В своей статье о линейной регрессии я коснулся некоторых вопросов, посвященных диагностике модели, а за кадром остался такой вопрос: есть ли более эффективная, но не слишком сложная альтернатива линейной регрессии? Традиционно используемый метод наименьших квадратов прост и понятен, но есть и другие подходы (не такие понятные).

Читать дальше →
Всего голосов 34: ↑33 и ↓1 +32
Комментарии 24

ANOVA, или кто комментирует?

Время на прочтение 8 мин
Количество просмотров 24K

В комментариях проскальзывала мысль, что люди мало комментируют статьи на Habrahabr, т.к. боятся потерять карму. Получается, что в основном пишут те, у кого карма побольше. Попробуем исследовать эту гипотезу подробнее и получить результаты, подкрепленные не только интуитивно, но и статистически.
Читать дальше →
Всего голосов 25: ↑25 и ↓0 +25
Комментарии 28

Как уменьшить количество измерений и извлечь из этого пользу

Время на прочтение 10 мин
Количество просмотров 50K
Сначала я хотел честно и подробно написать о методах снижения размерности данных — PCA, ICA, NMF, вывалить кучу формул и сказать, какую же важную роль играет SVD во всем этом зоопарке. Потом понял, что получится текст, похожий на вырезки из опусов от Mathgen, поэтому количество формул свел к минимуму, но самое любимое — код и картинки — оставил в полном объеме.
Читать дальше →
Всего голосов 31: ↑28 и ↓3 +25
Комментарии 11

Нефтяные ряды в R

Время на прочтение 6 мин
Количество просмотров 43K
«Графики цен великолепны, чтобы предсказывать прошлое»
Питер Линч



С временными рядами мне как-то не доводилось иметь дело на практике. Я, конечно, читал о них и имел некоторое представление в рамках учебного курса о том, как в общих чертах проводится анализ, но хорошо известно, что то, о чем рассказывают в учебниках по статистике и машинному обучению, не всегда отражает реальное положение дел.
Читать дальше →
Всего голосов 27: ↑25 и ↓2 +23
Комментарии 30

Добыча «тыжпрограммиста»

Время на прочтение 4 мин
Количество просмотров 298K
Недавно мне принесли ноутбук — очень хороший ноутбук — по меркам 2004 года, конечно (за такой в то время можно было и убить ). И со знакомой многим мантрой «тыжпрограммист*ля» попросили разобраться, почему столько лет стабильно работавшее устройство вдруг отказалось загружаться. А я, в общем-то, не электронщик, и даже не совсем программист — так, с R/Matlab/Python балуюсь. Но знакомые были очень хорошие, и пришлось таки взять ноут.
Читать дальше →
Всего голосов 186: ↑152 и ↓34 +118
Комментарии 207

Несколько слов о «линейной» регрессии

Время на прочтение 5 мин
Количество просмотров 54K
Иногда так бывает: задачу можно решить чуть ли не арифметически, а на ум прежде всего приходят всякие интегралы Лебега и функции Бесселя. Вот начинаешь обучать нейронную сеть, потом добавляешь еще парочку скрытых слоев, экспериментируешь с количеством нейронов, функциями активации, потом вспоминаешь о SVM и Random Forest и начинаешь все сначала. И все же, несмотря на прямо таки изобилие занимательных статистических методов обучения, линейная регрессия остается одним из популярных инструментов. И для этого есть свои предпосылки, не последнее месте среди которых занимает интуитивность в интерпретации модели.
Читать дальше →
Всего голосов 38: ↑37 и ↓1 +36
Комментарии 15

R + C + CUDA =…

Время на прочтение 4 мин
Количество просмотров 13K
Иногда возникает необходимость ускорить вычисления, причем желательно сразу в разы. При этом приходится отказываться от удобных, но медленных инструментов и прибегать к чему-то более низкоуровневому и быстрому. R имеет довольно развитые возможности для работы с динамическими бибиотеками, написанными на С/С++, Fortran или даже Java. Я по привычке предпочитаю С/С++.
Читать дальше →
Всего голосов 31: ↑31 и ↓0 +31
Комментарии 3

Анимированные графики в R (и немного про бифуркацию, хаос и аттракторы)

Время на прочтение 4 мин
Количество просмотров 19K
Однажды для презентации мне понадобились анимированные графики. С графиками, собственно, проблем не возникло, а для их анимации пришлось воспользоваться еще одним пакетом animation, который можно установить из CRAN.
Читать дальше →
Всего голосов 33: ↑31 и ↓2 +29
Комментарии 24

Let's fix NAs

Время на прочтение 5 мин
Количество просмотров 7.2K
Довольно часто встречаются неполные наборы данных, в которых некоторые переменные не определены. В языке R содержимое таких переменных задается как «Not Available» — или сокращенно NA. Соответственно, возникает вопрос, как поступать с неопределенными значениям: стоит ли их игнорировать или откорректировать каким-либо образом?
Читать дальше →
Всего голосов 15: ↑14 и ↓1 +13
Комментарии 2

Введение в параллельные вычисления в R

Время на прочтение 5 мин
Количество просмотров 17K
   Эта статья посвящена языку R. Он не так широко распространен на территории ex-USSR, как Matlab и тем более Python, но, безусловно, заслуживает внимания. Нельзя не отметить, что R — фактически стандарт для Data Science (хотя тут хорошо написано, что не R единым живут data scientists). Богатый синтаксис, совместимость с legacy кодом (что весьма важно в научных приложениях), удобная среда разработки RStudio и наличие огромного числа библиотек в CRAN делают R таковым.
Читать дальше →
Всего голосов 29: ↑27 и ↓2 +25
Комментарии 11

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность