Pull to refresh

Comments 35

Классный обзор, всё интересно и познавательно. А не поделитесь, чем парсили — своя разработка или что-то коммерческое?
Воспользовались готовым решением, подошёл бы любой парсер, собирающий код страниц по списку ссылок. На Хабре все публикации имеют хотя бы ссылку типа habrahabr.ru/post/четное_число
Далее обрабатывали в основном в Excel. Основная часть собранных для анализа данных доступна для скачивания в нашей группе в VK

Прямо всегда с чётным числом?

Хороший вопрос! Нашлось habrahabr.ru/post/1 как на машине времени переместился;)
Начиналось с нечетных, сейчас идут только четные.
До разделения с Geektimes был обычный автоинкремент, теперь чётные на хабре, нечётные — там.
более 50% корпоративных блогов. В целом спасибо за подборку.
2592 автора писали статьи только в личные блоги, 1175 авторов только в корпоративные и 67 как в личные блоги, так и в блоги компаний.

Компании берут частотой и периодичностью. Не каждая статья по рабочей обязанности и расписанию получается, так сказать, «от чистого сердца», но авторы постов корпоративных блогов стараются находить баланс интересов читателей и бизнеса.

Интересно, что для 67 авторов, размещающих посты и в личных и в корп блогах, средние показатели для статей примерно равные, но чуть лучше при публикации не в блоге компании.
Из 15 постов в топе только 3 по теме хабрахабра.
В среднем публикация в 2017 году набирала 11500 просмотров и рейтинг +20.


Можете назвать медианные значения для этих параметров? Ведь когда речь идёт о рейтингах, интереснее не средние, а медианные значения.
Медианные значения:
Просмотры 7400,
Рейтинг 14,
«В избранное» 45,
Комментарии 12.

Добавьте их в пост, плиз. Медианы (срединные значения) важнее средних тут, конечно.

Напрашивается лайфхак:

1. Написать интересную статью под псевдонимом на другом языке, опубликуй в мало-мальски интересном источнике
2. Перевести и опубликовать на Хабре/GT под своим именем
3.…
4. PROFIT!
Не так.
1. Написать интересную статью
2. Опубликовать под любым именем
Этого достаточно.

Переводчик выбирает из нескольких статей-кандидатов, этот предварительный личный выбор и то, что у статьи уже есть какой-то успех в оригинальном источнике добавляет шансов переводу на Хабре. Хотя не всегда аудитория «там» и «тут» реагирует одинаково.
Хорошая статистика, но по-моему не хватает самой важной — это соотношение публикаций содержащих код к публикациям без программного кода. Многие наверное заметили, что публикаций на хабре, как-либо рассматривающих программный код стало существенно меньше а их качество — хуже (да и все мы помним разделение на потоки «администрирование», «управление» и т.д.). Разделять публикации на те или другие вполне просто — нужно всего-лишь искать в них вхождение < code />.
Вместо тега <code> на Хабре чаще используются специализированные для конкретного языка <source lang="cpp">.
Кстати, таким же образом можно выделить статьи с математическими формулами по присутствию $$display$$ и $inline$.
Может я и извращенец, но хотелось бы и антирейтинг увидеть — самые заминусованные статьи, комментарии, авторы.
Была такая мысль. На негативном опыте можно многому научиться. Если не заминусуют этот мой комментарий — опубликуем.
Добрый день, скажите пожалуйста какие вы сервисы и программы использовали для создания статьи. Особенно интересны графики, спасибо.
Все графики построены в Excel 2013
Раз уж разговор о статистике, личная просьба, подсчитать процент статей с названиями начинающими со слова «Как». Хочу проверить свои ощущения, что не менее чем каждая десятая статья является «Как-статьей» подбешивает уже. И, кстати, интересно сравнить хабр и гиктаймс, ставлю на то что на хабре «как-фактор» меньше.
ТОП-7 первых слов в публикациях 2017
Как 904
Дайджест 134
Что 126
Почему 94
Создание 75
Обзор 72
Разработка 58
С 1 января по 18:00 22 декабря 2017 года на Хабрахабре было опубликовано 10684 поста
Итого «как-фактор» хабра: 8.46% :)

Интересная статистика, но логичней было бы все же публиковать ее уже после нового года, т.к. 2017 еще не закончился :)

Еще бы стату по ЯП. Интересно узнать что в тренде среди хаброжителей.
жабаскрипт, к гадалке не ходи
Некоторые статьи, опубликованные во второй половине 2017, могут просто не успеть набрать просмотров, а в 2018 они уже не будут учитываться?
Изображение в начале публикации шикарное!
Лучшие комментарии
1 и 2 место перепутаны?
конкретно в этом ТОП нет сортировки
Sign up to leave a comment.