Комментарии
Есть комментарий к вопросу детекции аномалий во временных рядах. Если порождающий ВР процесс допускает возникновение в некоторые моменты времени сильные всплески (4 сигма и более, если использовать ваш пример), то эти значения вполне могут быть нормальными. Мой пример: раз в день пользователь копирует 1000 файлов вечером, а в остальное время работает с 10-20 файлами. Получится очень хорошая сезонность. Я детектирую аномалии построением модели ВР, где учитываются все возможные регулярные комоненты и средний уровень сигнала. Оставшийся же шум добавляется к каждой точке прогноза в виде доверительного интервала прогноза, и уже доверительный интервал контролируется значением z (или t). Если значение ВР выходит за доверительный интервал прогноза, это статистическая аномалия.
Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.