Comments 34
Классный обзор, всё интересно и познавательно. А не поделитесь, чем парсили — своя разработка или что-то коммерческое?
Воспользовались готовым решением, подошёл бы любой парсер, собирающий код страниц по списку ссылок. На Хабре все публикации имеют хотя бы ссылку типа habrahabr.ru/post/четное_число
Далее обрабатывали в основном в Excel. Основная часть собранных для анализа данных доступна для скачивания в нашей группе в VK
Хороший вопрос! Нашлось habrahabr.ru/post/1 как на машине времени переместился;)
Начиналось с нечетных, сейчас идут только четные.
До разделения с Geektimes был обычный автоинкремент, теперь чётные на хабре, нечётные — там.
2592 автора писали статьи только в личные блоги, 1175 авторов только в корпоративные и 67 как в личные блоги, так и в блоги компаний.

Компании берут частотой и периодичностью. Не каждая статья по рабочей обязанности и расписанию получается, так сказать, «от чистого сердца», но авторы постов корпоративных блогов стараются находить баланс интересов читателей и бизнеса.

Интересно, что для 67 авторов, размещающих посты и в личных и в корп блогах, средние показатели для статей примерно равные, но чуть лучше при публикации не в блоге компании.

Пользуясь случаем, передаю привет маме:
мама, привет, я в годовом топе хабра, видишь?! :)

В среднем публикация в 2017 году набирала 11500 просмотров и рейтинг +20.


Можете назвать медианные значения для этих параметров? Ведь когда речь идёт о рейтингах, интереснее не средние, а медианные значения.
Медианные значения:
Просмотры 7400,
Рейтинг 14,
«В избранное» 45,
Комментарии 12.

Добавьте их в пост, плиз. Медианы (срединные значения) важнее средних тут, конечно.

Напрашивается лайфхак:

1. Написать интересную статью под псевдонимом на другом языке, опубликуй в мало-мальски интересном источнике
2. Перевести и опубликовать на Хабре/GT под своим именем
3.…
4. PROFIT!
Не так.
1. Написать интересную статью
2. Опубликовать под любым именем
Этого достаточно.

Переводчик выбирает из нескольких статей-кандидатов, этот предварительный личный выбор и то, что у статьи уже есть какой-то успех в оригинальном источнике добавляет шансов переводу на Хабре. Хотя не всегда аудитория «там» и «тут» реагирует одинаково.
Хорошая статистика, но по-моему не хватает самой важной — это соотношение публикаций содержащих код к публикациям без программного кода. Многие наверное заметили, что публикаций на хабре, как-либо рассматривающих программный код стало существенно меньше а их качество — хуже (да и все мы помним разделение на потоки «администрирование», «управление» и т.д.). Разделять публикации на те или другие вполне просто — нужно всего-лишь искать в них вхождение < code />.
Вместо тега <code> на Хабре чаще используются специализированные для конкретного языка <source lang="cpp">.
Кстати, таким же образом можно выделить статьи с математическими формулами по присутствию $$display$$ и $inline$.
Может я и извращенец, но хотелось бы и антирейтинг увидеть — самые заминусованные статьи, комментарии, авторы.
Была такая мысль. На негативном опыте можно многому научиться. Если не заминусуют этот мой комментарий — опубликуем.
Добрый день, скажите пожалуйста какие вы сервисы и программы использовали для создания статьи. Особенно интересны графики, спасибо.
Раз уж разговор о статистике, личная просьба, подсчитать процент статей с названиями начинающими со слова «Как». Хочу проверить свои ощущения, что не менее чем каждая десятая статья является «Как-статьей» подбешивает уже. И, кстати, интересно сравнить хабр и гиктаймс, ставлю на то что на хабре «как-фактор» меньше.
ТОП-7 первых слов в публикациях 2017
Как 904
Дайджест 134
Что 126
Почему 94
Создание 75
Обзор 72
Разработка 58
С 1 января по 18:00 22 декабря 2017 года на Хабрахабре было опубликовано 10684 поста
Итого «как-фактор» хабра: 8.46% :)
Вот так я спустя лет 8 чтения Хабра узнал, что здесь есть избранное (закладки) :)

Интересная статистика, но логичней было бы все же публиковать ее уже после нового года, т.к. 2017 еще не закончился :)

Еще бы стату по ЯП. Интересно узнать что в тренде среди хаброжителей.
Некоторые статьи, опубликованные во второй половине 2017, могут просто не успеть набрать просмотров, а в 2018 они уже не будут учитываться?
Only those users with full accounts are able to leave comments. Log in, please.

Information

Founded
2009
Location
Россия
Website
www.cloud4y.ru
Employees
31–50 employees
Registered