Comments
34
Классный обзор, всё интересно и познавательно. А не поделитесь, чем парсили — своя разработка или что-то коммерческое?
Воспользовались готовым решением, подошёл бы любой парсер, собирающий код страниц по списку ссылок. На Хабре все публикации имеют хотя бы ссылку типа habrahabr.ru/post/четное_число
Далее обрабатывали в основном в Excel. Основная часть собранных для анализа данных доступна для скачивания в нашей группе в VK
Далее обрабатывали в основном в Excel. Основная часть собранных для анализа данных доступна для скачивания в нашей группе в VK
Прямо всегда с чётным числом?
Хороший вопрос! Нашлось habrahabr.ru/post/1 как на машине времени переместился;)
Начиналось с нечетных, сейчас идут только четные.
Начиналось с нечетных, сейчас идут только четные.
До разделения с Geektimes был обычный автоинкремент, теперь чётные на хабре, нечётные — там.
более 50% корпоративных блогов. В целом спасибо за подборку.
2592 автора писали статьи только в личные блоги, 1175 авторов только в корпоративные и 67 как в личные блоги, так и в блоги компаний.
Компании берут частотой и периодичностью. Не каждая статья по рабочей обязанности и расписанию получается, так сказать, «от чистого сердца», но авторы постов корпоративных блогов стараются находить баланс интересов читателей и бизнеса.
Интересно, что для 67 авторов, размещающих посты и в личных и в корп блогах, средние показатели для статей примерно равные, но чуть лучше при публикации не в блоге компании.
Компании берут частотой и периодичностью. Не каждая статья по рабочей обязанности и расписанию получается, так сказать, «от чистого сердца», но авторы постов корпоративных блогов стараются находить баланс интересов читателей и бизнеса.
Интересно, что для 67 авторов, размещающих посты и в личных и в корп блогах, средние показатели для статей примерно равные, но чуть лучше при публикации не в блоге компании.
Из 15 постов в топе только 3 по теме хабрахабра.
Пользуясь случаем, передаю привет маме:
мама, привет, я в годовом топе хабра, видишь?! :)
В среднем публикация в 2017 году набирала 11500 просмотров и рейтинг +20.
Можете назвать медианные значения для этих параметров? Ведь когда речь идёт о рейтингах, интереснее не средние, а медианные значения.
Медианные значения:
Просмотры 7400,
Рейтинг 14,
«В избранное» 45,
Комментарии 12.
Просмотры 7400,
Рейтинг 14,
«В избранное» 45,
Комментарии 12.
Спасибо!
Добавьте их в пост, плиз. Медианы (срединные значения) важнее средних тут, конечно.
Напрашивается лайфхак:
1. Написать интересную статью под псевдонимом на другом языке, опубликуй в мало-мальски интересном источнике
2. Перевести и опубликовать на Хабре/GT под своим именем
3.…
4. PROFIT!
1. Написать интересную статью под псевдонимом на другом языке, опубликуй в мало-мальски интересном источнике
2. Перевести и опубликовать на Хабре/GT под своим именем
3.…
4. PROFIT!
Не так.
1. Написать интересную статью
2. Опубликовать под любым именем
Этого достаточно.
Переводчик выбирает из нескольких статей-кандидатов, этот предварительный личный выбор и то, что у статьи уже есть какой-то успех в оригинальном источнике добавляет шансов переводу на Хабре. Хотя не всегда аудитория «там» и «тут» реагирует одинаково.
1. Написать интересную статью
2. Опубликовать под любым именем
Этого достаточно.
Переводчик выбирает из нескольких статей-кандидатов, этот предварительный личный выбор и то, что у статьи уже есть какой-то успех в оригинальном источнике добавляет шансов переводу на Хабре. Хотя не всегда аудитория «там» и «тут» реагирует одинаково.
Хорошая статистика, но по-моему не хватает самой важной — это соотношение публикаций содержащих код к публикациям без программного кода. Многие наверное заметили, что публикаций на хабре, как-либо рассматривающих программный код стало существенно меньше а их качество — хуже (да и все мы помним разделение на потоки «администрирование», «управление» и т.д.). Разделять публикации на те или другие вполне просто — нужно всего-лишь искать в них вхождение < code />.
Вместо тега
Кстати, таким же образом можно выделить статьи с математическими формулами по присутствию
<code>
на Хабре чаще используются специализированные для конкретного языка <source lang="cpp">
.Кстати, таким же образом можно выделить статьи с математическими формулами по присутствию
$$display$$
и $inline$
.Реквестирую такую же, но про гт
Может я и извращенец, но хотелось бы и антирейтинг увидеть — самые заминусованные статьи, комментарии, авторы.
Была такая мысль. На негативном опыте можно многому научиться. Если не заминусуют этот мой комментарий — опубликуем.
Добрый день, скажите пожалуйста какие вы сервисы и программы использовали для создания статьи. Особенно интересны графики, спасибо.
Все графики построены в Excel 2013
Раз уж разговор о статистике, личная просьба, подсчитать процент статей с названиями начинающими со слова «Как». Хочу проверить свои ощущения, что не менее чем каждая десятая статья является «Как-статьей» подбешивает уже. И, кстати, интересно сравнить хабр и гиктаймс, ставлю на то что на хабре «как-фактор» меньше.
ТОП-7 первых слов в публикациях 2017
Как 904
Дайджест 134
Что 126
Почему 94
Создание 75
Обзор 72
Разработка 58
Как 904
Дайджест 134
Что 126
Почему 94
Создание 75
Обзор 72
Разработка 58
С 1 января по 18:00 22 декабря 2017 года на Хабрахабре было опубликовано 10684 постаИтого «как-фактор» хабра: 8.46% :)
Промах
Вот так я спустя лет 8 чтения Хабра узнал, что здесь есть избранное (закладки) :)
Интересная статистика, но логичней было бы все же публиковать ее уже после нового года, т.к. 2017 еще не закончился :)
Еще бы стату по ЯП. Интересно узнать что в тренде среди хаброжителей.
жабаскрипт, к гадалке не ходи
Некоторые статьи, опубликованные во второй половине 2017, могут просто не успеть набрать просмотров, а в 2018 они уже не будут учитываться?
Изображение в начале публикации шикарное!
Лучшие комментарии
1 и 2 место перепутаны?
1 и 2 место перепутаны?
конкретно в этом ТОП нет сортировки
Only those users with full accounts are able to leave comments. Log in, please.
Анализ публикаций на Хабрахабре за 2017 год. Статистика, полезные находки и рейтинги