Хабрарейтинг 2020: Авторы vs Корпоративные Блоги

System Analysis and DesignData visualizationWeb analyticsPopular scienceSocial networks and communities
Привет, Хабр.

Наверное, практически все постоянные читатели и авторы сайта знают, что статьи здесь на сайте могут публиковаться как индивидуальными авторами, так и корпоративными аккаунтами. Невольно возникает «детский» вопрос — какие лучше? Какие статьи получают больше оценок и комментариев? К чему ближе корпоративные блоги — к надоедливой рекламе, которую можно лишь пролистать, или к полезной информации? Попробуем разобраться.

Для тех кому интересно, продолжение под катом.

Для начала, традиционный disclaimer: все приведенные данные неофициальные, и я не исключаю что нигде не ошибся. Вся информация была собрана парсером с помощью Python и обрабатывалась с помощью Pandas и Matplotlib.

Кто выиграет, авторы или корпоративные блоги? Поехали.

Количество публикаций


Для начала ответим на самый простой вопрос — каких материалов публикуется больше?



За 2020 год на момент написания текста в корпоративных блогах было опубликовано 9066 статей, индивидуальными авторами чуть больше — 9151. Но в принципе, эти числа можно считать более-менее одинаковыми, погрешность порядка 1%.

Пока счет 1:1.

Рейтинг


Посмотрим, как обстоят дела с рейтингом. На графике по горизонтали расположен рейтинг, по вертикали — количество статей с данным рейтингом.



Результат довольно любопытный, и для меня неожиданный. Как можно видеть, статьи в корпоративных блогах в среднем получают более высокие оценки. Особенно это видно по «заминусованным» статьям, имеющим негативный рейтинг, у индивидуальных авторов таких больше. Думаю, причина в том, что для блогов приглашают авторов с уже высокими рейтингами, пишущих более-менее качественные тексты. Плюс у компаний все же больше технических ресурсов создавать интересный материал (например, индивидуальные авторы не будут делать обзоры «железа» т.к. им его никто не оплачивает).

Но есть и другая сторона: если рассматривать правую часть графика, то можно видеть, что среди статей с самым высоким рейтингом (100 и выше) индивидуальных авторов все же больше:



В общем, корпоративные блоги в среднем выдают стабильно-качественный материал, но уникальных материалов у индивидуальных авторов таки больше. Но в среднем, я думаю, и здесь ничья. Общий счет 2:2.

Комментарии


Здесь результат, в принципе, ожидаем, статьи индивидуальных авторов комментируют больше. По горизонтали количество статей, по вертикали количество комментариев:



Ожидаем результат имхо потому, что у индивидуальных авторов больше возможностей писать про что-то необычное, типа катушек Тесла, лазеров или электронных микроскопов, такими темами «корпорации» заниматься не будут. Но разница, честно говоря, незначительная. Больше удивил другой факт — примерно 1100 статей от индивидуальных авторов и 1700 статей корпоративных блогов имеют 0 комментариев, т.е. оказались либо совсем незамеченными, либо комментировать там, увы, нечего. С противоположной стороны распределения самая комментируемая статья автора mrtux набрала 2401 комментарий, а самая комментируемая статья из блога vdsina_m набрала 2028 комментариев.

Так или иначе, по комментируемости индивидуальные авторы впереди, счет 3:2.

Количество просмотров


Аналогичную гистограмму можно сделать по количеству просмотров:



Здесь какой-либо значимой разницы я не вижу вообще, можно предположить, что для читателей несущественно, кому принадлежит статья, отдельному автору или блогу. Опять ничья, окончательный счет 4:3.

Общий итог: по большому счету, победила дружба :) Разница в целом весьма незначительная, обе стороны показали примерно равные результаты. Но формально индивидуальные авторы все же чуть впереди, что меня как автора радует — есть еще немало людей, делающих что-то интересное в плане хобби.

Бонус


Как бонус, пара интересных закономерностей, о которых спрашивали в комментариях и которые мне показались любопытными.

Время публикации

Все вполне очевидно, с корпоративных аккаунтов больше материалов публикуется в рабочее время с 10 до 18, индивидуальные авторы более активны вечером и ночью:



С днями недели ситуация аналогичная:



Неудивительно, что в выходные публикаций от индивидуальных авторов больше.

Заключение


Если честно, результаты для меня оказались несколько удивительными. Я был уверен, что материалы корпоративных блогов окажутся статистически где-то на уровне назойливой рекламы во время фильма, и их оценки будут заметно ниже. Теперь могу честно признать, что ошибался — в обоих случаях публикуется много качественных материалов, однозначно достойных прочтения.

Всем желаю творческих успехов.
Tags:статистикахабррейтинг
Hubs: System Analysis and Design Data visualization Web analytics Popular science Social networks and communities
+84
4.5k 16
Comments 51
Data Scientist
March 9, 2021126,000 ₽Нетология
Data Engineer 8.0
March 10, 202177,000 ₽New Professions Lab
Специалист по Data Science
March 18, 2021104,000 ₽Яндекс.Практикум
Domain Driven Design
March 29, 202137,000 ₽Luxoft Training
Data Science Bootcamp
March 29, 2021250,000 ₽Elbrus Coding Bootcamp

Top of the last 24 hours