Pull to refresh

Comments 11

Самый первый график очень не информативен: я лично не могу обнаружить в нем зеленый. Последний в том же духе — серый слился с голубым.
Сейчас все, кроме последнего, вполне прилично выглядят.
Интересно было бы последить за соотношением количества добавлений в избранное к количеству (и, возможно, суммарному/среднему рейтингу) комментариев. Можно предположить, насколько много людей добавляют статью в избранное из-за полезной информации в комментариях.
По одной из статей вот так выглядит соотношение избранного в комментарии. Добавления растут с ростом количества комментариев.
image
Добавлю:
В какой день лучше писать на «Мегамозге»? (и хабре) — megamozg.ru/company/fixico/blog/16516
Как автор не самой лучшей по проценту роста публикации отмечу:
на просмотры в первые 3 часа — на мой взгляд, влияет время публикации!
за 48 часов — подача материала до cut'а (сумеет ли заинтриговать).
после 48 часов — актуальность материала (популярность темы в основном на хабре).
после продолжительного времени — велика ли тематическая аудитория данного поста (не только на хабре).
На добавление в избранное — только полезность материала или примененных в ней каких-то решений: интересные цитаты, схемы, графики, картинки…
… и не забудьте про котиков!
Спасибо за конспект!
Давайте учиться делать статистические исследования.

Во-первых, делать какой-либо вывод на основе 11 публикаций — изначально неправильных подход. Обычно в качестве минимального количества советуют брать 30, а для такого исследования не помешало бы взять хотя бы 100.

Во-вторых, если статья попала в лучшее, это не делает её аномальной. Даже чисто с точки зрения анализа данных. Аномальный — это когда пользователи вводили свой возраст, и кто-то случайно опечатался и написал 266 лет вместо 26. Рост просмотров статьи на 400%+ процентов — это как раз очень полезные данные, которые нужно тщательно изучать, а не отбрасывать.

А вот что нужно отбрасывать, и это в-третьих, это крайние по времени значения — замеры в начале и конце изучаемого интервала. Но именно по времени замеров, а не по проценту роста количества просмотров.

Кстати, общее количество просмотров — это так себе метрика для временных рядов. Ну вот что она сама по себе показывает? Просто какое-то число, которое растёт. Чаще всего исследуется либо количество просмотров за период (например, час) или скорость роста/падения популярности, т.е. производная от кол-ва просмотров за период. И вот график изменения частоты просмотров статьи в зависимости от времени после публикации было бы действительно интересно посмотреть.

В-четвёртых, следущее предложение неверно:

С некоторой вероятностью можно предсказать, что статья через 48 часов получит на 240-250% больше просмотров, чем в первые 3 часа жизни.

Ну, т.е., оно верно, но не больше, чем «с некоторой вероятностью через 48 часов статья получит на 100500% больше просмотров» или «с некоторой вероятностью через 48 часов инопланетяне взорвут землю». С некоторой вероятностью — да, вопрос именно в том, с какой вероятность. И, судя по вашим данным, это вероятность будет не так и велика: стандартное отклонение (сигма) у вас составляет 146.6%. Т.е. если предположить нормальное распределение, то в 95% случаев через 48 часов статья получит 245% плюс-минус 440% прироста, что делает эту метрику (первые 3 часа) практически бесполезной.

Вообще, такие вещи анализируются многомерной регрессией (multivariate regression), обязательно с учётом времени суток, времени публикации, темы публикации, аудитории соответсвущего хаба, попаданием на главную и т.д. Вот тогда можно будет говорить и про анализ тенденций, и про предсказание количества просмотров.

Кстати, дашборд ваш на данный момент тоже не работает — просто пустой текст возвращает.
В списке 10 статей понедельника одна повторяется: «Основы успешной реализации push-уведомлений для мобильных приложений»
Sign up to leave a comment.