Открыть список
Как стать автором
Обновить

Комментарии 21

Так-так-так, а где детектив про прямые линии на семь, девять и десять часов на первом рисунке? Или я его уже пропустил?

Кажется, вы стали одним из немногих авторов, кого я сперва читаю, потом плюсую и только потом модерирую :-) Классное исследование! На самом деле, корреляции рейтинга и длины поста и правда не ощущается, но есть некоторая связь времени выхода и показателей публикации (но также корелляция слабая). Мы давно проводили опрос и выяснили, что:

  1. читатели первым делом смотрят на заголовок и текст до ката, затем на КДПВ, соотвественно, я бы не советовала делать эти три элемента мегакрутыми, а статью так себе (бывали такие хитрецы) — злость читателей от разочарования вызовет активное минусование;


  2. длина текста не имеет особого значения. На Хабре трудно увидеть фразу «многабукаф ниасилил», лонгриды любят, читают и, что характерно дочитывают, — если они интересные;
  3. точно так же по-настоящему хорошая статья наберёт отличные показатели даже в 00:01 1 января или утром в субботу :-)

Так что главное — писать хорошо об интересном, чтд.

Бывают очень полезные технические статьи, которые в принципе не наберут много плюсов. Просто потому, что статья техническая и там нужно думать, ну или она решает важную, но узкую проблему. Например, мне в свое время очень помогли статьи Boozlachu про Buildroot. Или была отменная серия статей SparF про MIPSfpga. Рейтинги у статей не самые высокие, но написано отлично и все по делу.
А бывает статья ля-ля-траляля, на около технические темы, и такая статья-болтология набирает много, потому что потому. Как пример могу привести свою собственную статью: habr.com/ru/post/310026

И вот когда думаешь «а не написать ли мне?», то первый вопрос самому себе: писать техническую статью или статью болтологию? У второй шансов больше.

Учитывайте также, что часть читателей читают Хабр с мобильного, т.е. используют мобильную версию сайта. А в мобильной версии сайта нет ни КДПВ ни текста до ката, а лишь заголовок и автор.

Да, доля мобильных довольна велика и заголовок выходит на первый план (а вот что кто-то оценивает автора, сильно сомневаюсь — если это не кто-то из легенд). К слову, пока Медиатор был доступным сервисом, я наблюдала за некоторыми лонгридами — на мобильных дочитываний больше, чем на десктопе. Думаю, это связано с тем, что человек читает с мобильного «когда ничего больше не доступно», и в охотку дочитывает. Но версии разные могут быть :-)

Тут вопрос и варианты ответа не совсем корректные, у них слишком широкий смысл, который позволяет делать из результатов любые выводы.


На что вы обращаете внимание перед тем, как начать читать публикацию?

Что это означает:
— по содержанию этих элементов принять решение, стоит читать ли публикацию?
— проверить содержание этих элементов уже после того, как решил прочитать по другим причинам, но еще не начал?
— вообще в принципе обращаете ли внимание или всегда игнорируете, независимо от желания прочитать публикацию?


На ее рейтинг (плюсики)

Почему только плюсики? Тут много вариантов:


— Большой положительный рейтинг может заинтересовать прочитать статью, потому что "наверно интересная статья или полезный материал". Но это не к любой статье относится. Если по тексту до ката понятно, что тема неинтересна, то неважно, какой у нее рейтинг.
— Большой отрицательный рейтинг тоже может заинтересовать прочитать статью, потому что "посмотрим, чего там автор такого написал". При этом это увеличивает число просмотров, но специально делать такие статьи не надо.
— Примерно поровну плюсов и минусов, много комментов — "о, холивар, надо почитать".
— Малое количество плюсов — "ну наверно ничего интересного". Но если недавно опубликована, то наверно еще не успела набрать достаточно голосов, чтобы делать какие-то выводы.


При этом лично для меня рейтинг совершенно не главное. То есть если он небольшой, то это не значит, что я сделаю вывод, что статья неинтересная, и не буду ее читать.
В сочетании с вопросом непонятно, что тут ставить — да или нет.


На количество комментариев

Тут аналогично, в разных ситуациях могут быть разные решения:


— Много комментов — "видимо интересная тема, надо почитать" или наоборот "лень читать". Или опять же "о, холивар".
— Мало комментов, маленький рейтинг — "неинтересно, не буду читать". Но если недавно опубликована, то не считается.
— Мало комментов, большой рейтинг — "наверно хорошая статья, нечего добавить".


На количество просмотров

Ну с учетом формулировки вопроса нельзя сказать, что я совсем не обращаю внимание, иногда обращаю, но и на интерес к статье оно мало влияет. Тоже непонятно, что тут ставить. Наверное нет.


На количество добавлений в закладки

Судя по комментариям, люди используют их по-разному — кто-то как список "отложить почитать на потом", кто-то после прочтения как полезную информацию.


На заголовок

Ну естественно, заголовок же показывает, о чем статья. Непонятно, какие выводы из этого можно сделать — "пишите хорошие заголовки", "хорошие заголовки писать необязательно"? Независимо от того, какой он будет, на него все равно обратят внимание.


На картинку для привлечения внимания

Аналогично, если она есть, на нее обратят внимание, но это не значит, что если ее нет, то статья не заинтересует.


Для меня основное это тематика статьи, которая определяется по заголовку и тексту до ката вместе и списку хабов, потому что по первым двум не всегда понятно. А уже к этому применяются варианты, которые я написал выше.

Кажется, что хабру давно пора делать api для получения такой информации или хотя бы выкладывать статьи с метаинформацией в некоторые сборники раз в месяц, чтобы каждый раз люди не писали свой парсер для сайта.
Хотя тут возможна и частная инициатива.

Что же делать? Писать длинные публикации или короткие заметки? О популярном или об интересном?
Очевидного ответа на этот вопрос нет.

имхо, перевод пункта «Общие сведения» в табличный вид может много пояснить

image

Если обратить внимание, на пункты open source, разработка веб-сайтов и java, то можно увидеть, что пункт «программирование» является собирательным и любая выборка в нем падает на нижние строчки рейтинга. Так можно заметить настоящего лидера — информационную безопасность, где приветствуется много текста, в то время как публикации о конкретном ЯП чаще приветствуются в коротком виде.
НЛО прилетело и опубликовало эту надпись здесь

Уже в планах по годам. Ещё хочу разобрать, есть ли разница между хабами потока Разработка и какого-то другого, вроде Geektimes. Профильные/непрофильные/оффтопик хабы тоже

Интересно выглядит кластертзация нижних частей графика, не анализировали с чем это связано?

Дискретизацией целыми числами в логорифмическом масштабе?

Это из-за логарифмического масштаба. Позволило уместить очень большие значения близко к средним. Но тогда всегда проблемы с малыми значениями. Нижние горизонтали — 1, 2, 3, 4 и т.д.
P.S. В линейных масштабах это всё выглядит ужасно

Теперь понятно про что писать! В топ-5 целых 2 статьи про Мегафон.
Рис. 3. Зависимость количества плюсов публикации от длины текста
С цифрами не поспоришь, но выглядит странно — ожидается, что лонгрид с размышлениями и выдвижением спорных идей раньше утомит читателя, и оценка будет поставлена с учетом приемлемости отдельных деталей без дочитывания. Похоже, превалируют лонгриды с историями реализации, интервью или обзорами, которые читаются как литературное произведение и получают суммарную оценку за интересность. Возможно, разница проявится за пределами хабов «разработки».
Рис. 5. Зависимость количества просмотров от длины текста
Тоже странно — насыщенная подробностями статья откладывается в закладки, в покет, в избранное «потом вдумчиво почитаю», где иногда пылится годами, в отличие от коротких заметок, которые не сложно просмотреть прямо сейчас. Теоретически, короткое должно читаться чаще. Возможно, играет роль то, что для оценки объема приходится заходить в статью или скачивать её, увеличивая счетчик просмотров до реального прочтения. И, увы, не видно способа разделить открывших и прочитавших, даже наличие комментария не гарантирует того, что статья была прочитана.
С другой стороны, лонгрид с обилием мыслей порождает больше комментариев, и каждый возврат на страницу может увеличивать счетчик просмотров. Да, количество комментариев на порядки уступает количеству просмотров, но просмотр свежих комментариев отнюдь не всегда сопровождается добавлением комментария. Возможно, именно просмотр комментариев выравнивает распределение, увеличивая число просмотров для лонгридов.

Смотрю на графики зависимости рейтингов, плюсов и минусов от длины поста, и возникает вопрос, нет ли здесь нормального распределения с максимумом для “оптимальной” длины поста?

Дорогой автор, тэги не только для того, чтобы их читать, а еще и для того, чтобы искать по ним связанные статьи, кликнув на соответствующий тэг. Поиск по тэгам на Хабре работает хуже, чем мог бы, потому что туда суют что попало. Не делайте так, пожалуйста. Заранее спасибо.

Подскажите, пожалуйста, какие именно теги вы считаете некорректными в данной публикации?


Публикация достаточно подробно описывает процесс анализа, который каждый может повторить для проверки или опровержения (DIY). Ещё 3 тега используются на данный момент только мной для связи публикаций этой серии между собой (2 на русском и 1 на английском с замахом на будущее). У тега "никто не читает теги" нет никакой смысловой нагрузки и он на Хабре используется достаточно активно на любую тему, а потому найти что-либо по нему не представляется возможным по определению

«DIY» IMHO больше относиться к чему-то, что можно сделать своими руками, например, автоматизированный туалет для кошки, клавиатура из бука, ноутбук из кластера Z80. Иначе его можно добавить практически к любой статье на Хабре.
Этой публикации больше подошло бы «data science», «анализ данных», «статистика».
Если тэг не несёт смысловой нагрузки — не добавляйте его.

Спасибо, я учту это в следующих публикациях

Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.