Как стать автором
Обновить
20
0
Dmitry Kondratiev @dkondratiev

Lead Data Scientist

Отправить сообщение
> Целочисленный логарифм по основанию 2 за O(1)
> Для начала переведем число x в двоичную запись определенной длины.

Смена системы из десятиричной в двоичную — сам по себе алгоритм O(log(n))

> постоянно делить число на два, пока оно не станет равно нулю
А это грозит бесконечным циклом :)
Безусловно, при нормальном ходе эксперимента такой ситуации бы не возникло.

Несбалансированность когорт – одна из предпосылок возникновения описанного эффекта. Мне приходилось сталкиваться с поломанными экспериментами и коллегами, которые не понимали, почему нужно выкидывать несбалансированные дни, поэтому привел как один из примеров.

Кстати, утверждение про сложение процентов звучит довольно спорно.
Добавил определение перед примерами, спасибо!
Во втором примере показывается сломанный в первый день сплиттер. Если с ним что-то не так, такие дни лучше выкидывать из эксперимента.
Гайд по оптимизации SOA

1. Имеем SOA
image

2. Добавляем репликацию и подписываем основной сервис на события по обновлению реплик
image

3. На случай падения сервисов, инкапсулируем их в виде классов внутри основного сервиса
image

4. Удаляем все лишнее
image

Если сервис Order имеет доступность 99,5%, то общая доступность архитектуры будет 99,5*1 = 99,5%

Извините, не удержался. Статья неплохая, и SOA — это хорошо. Но нужно понимать ее области применения и не стрелять из пушки по воробьям.
Статью так и не прочитал, но спасибо за нее!
В самом начале затянуло оригинально видео. Не заметив, посмотрел до конца. В докладе озвучены две очень мощные идеи, с которыми интересно познакомиться. Главное понять, что речь вообще не о коде.

Хорошее замечание, алгоритм правда честно нашел существующую корреляцию. Здесь отлично подходит аналогия алгоритма с ребенком. Если ему нужно было посмотреть на резюме и сказать, будет ли человек принят на работу, то он просто скопировал предвзятость тех, кто просматривал резюме и принимал решения. Научился у "родителей".


Я бы сначала поискал менее радикальное решение, чем полный отказ от исторических данных. Если предположить, что ситуация улучшается, то можно для начала взвесить наблюдения так, чтобы более новые получали больше веса в модели.

Информация

В рейтинге
Не участвует
Работает в
Зарегистрирован
Активность