Comments / Profile of ratatosk / Habr

Дмитрий Бабаев @ratatosk

‎Data Science and ML Practitioner

Profile Publications 1Comments 32Bookmarks

Байесовские многорукие бандиты против A/B тестов

ratatosk Apr 6 2017 at 14:06

Спасибо за мега полезную статью. Уточняющий вопрос про A/B тесты: мы научились считать n для желаемых величин альфа и бета, но оно зависит от тетта контроля, которое мы не знаем. Мы берем какую то его оценку по предыдущим тестам?

Look

7 кейсов использования технологий Big Data в сфере производства

ratatosk Apr 3 2017 at 21:41

В тегах sap обидели)

Look

Открытый курс машинного обучения. Тема 5. Композиции: бэггинг, случайный лес

ratatosk Mar 27 2017 at 15:09

Только это пока не бустинг, про бустинг наверняка будет отдельная статья.

Look

Data Science Weekend 3-4 марта

ratatosk Feb 27 2017 at 20:21

Наверное "деньги очень нужны")

Look

Базовые принципы машинного обучения на примере линейной регрессии

ratatosk Feb 20 2017 at 22:03

Картинки хороши, особенно начальная

Look

Еще 12 big data кейсов

ratatosk Dec 25 2016 at 16:28

Особенно понравился кейс Билайна: делаем бла бла бла а также бла бла бла и это не полный перечень! Результат: к 2018 г. прогнозируемые доходы от big data составят более 20% выручки компании. Наверное благодаря Spark и scikit-learn). Думаю из-за таких "кейсов" у многих и возникает ощущение что биг дата — это какой-то развод.

Look

«Правда, чистая правда и статистика» или «15 распределений вероятности на все случаи жизни»

ratatosk Sep 30 2016 at 19:03

Вот очень хорошая вводная статья про виды распределений: Common Probability Distributions: The Data Scientist’s Crib Sheet.

Look

Как большим операторам зарабатывать большие деньги на больших данных?

ratatosk Apr 5 2016 at 23:41

А не могли бы вы раскрыть подробнее какой именно опыт в бизнесе телеком операторов есть у специалистов компании Huawei? В статье достаточно общие и очевидные вещи описаны, которые в телекомах делались еще до появления модного термина «Биг Дата».

Look

Потоковая обработка данных при помощи Akka

ratatosk Jul 29 2015 at 14:37

Кстати итоговая архитектура стала чем-то похожа на так называемые Lambda и Kappa архитектуры; radar.oreilly.com/2014/07/questioning-the-lambda-architecture.html

Look

Поиск почти-дубликатов и геометрия

ratatosk Jul 9 2015 at 13:08

Спасибо за интересную статью. Думаю, что можно взять вместо букв n-граммы и использовать Locality Sensitive Hashing. Если его использовать то можно избежать поиска ближайших точек с помощью r-дерева, которое будет плохо работать с n-граммами из-за большой размерности. Про поиск похожих текстов с помощью Locality Sensitive Hashing хорошо рассказывает Ульман в курсе Mining Massive Datasets (вторая неделя) class.coursera.org/mmds-001. Еще есть мысль попробовать понизить размерность n-грамных представлений с помощью Principal Component Analysis.

Look

Инвайт в подарок на день программиста!

ratatosk Sep 13 2014 at 22:05

1da199f3e2bd43f6d60a09c875dcf24c

Look

Багобезопасный код: шаблон проектирования Null Safe

ratatosk Feb 18 2013 at 21:58

Классический выриант решения этой проблемы в Скале — Option:
www.scala-lang.org/api/current/index.html#scala.Option
www.codecommit.com/blog/scala/the-option-pattern

В джаве можно применть тот же подход

Look

Information

Specialization