Как стать автором
Обновить

Комментарии 134

Хм, я думал везде будет экспонента, тем более с открытием реги. В 2012 по июнь или май?
По апрель, т.к. информацию начал собирать еще в мае + у топиков не окончился срок голосования.
Забыл еще добавить, что read-only пользователи не учитывались при сборе статистики.
А интересно было бы узнать, сколько юзеров было за забором до реги.
Если не секрет, почему в черновики ушла предыдущая публикация, а эта была написана заново?
Предыдущая была случайно опубликована в очень уж черновом варианте: без ссылок и с недописанными частями.
НЛО прилетело и опубликовало эту надпись здесь
Проблема в том, что второй, по количество комментариев, топик, тоже с раздачей инвайтов.
НЛО прилетело и опубликовало эту надпись здесь
Может топик про разрезание фигуры? Тогда было как минимум 600 комментариев и десятоу нервных срывов.
НЛО прилетело и опубликовало эту надпись здесь
по-моему были с большим количеством комментариев, толи к выходу айфонов, толи топики счастья, с котами или просто раздачи кармы, просто они внеформатные были и их потерли, кажется.
> Больше всего комментариев написал VolCh — 19323
OMG
Какое же это «ОМГ»? Довольно скромное число. На иных форумах звание «флудер» дают только на числах порядка «100 000».
Даже не знаю, радоваться или огорчаться в связи с таким сомнительным рекордом.
такими темпами можно и наверстать же
Э-э-э… Что наверстать?
НУ с такими темпами — все что угодно :)
Например, интенсивность. Сейчас всего лишь 1 комментарий в 2 часа с момента вашей регистрации на Хабре.
Таки набил ещё 1к комментов за один день?))
Данные явно не вчерашние :)
Ой, да лааадно тебе, оправдыватся! Все поняли, что ты статистикодрочер! =)
Спалил Ж)
новый вид спорта на хабре? главное засветился!))
> Ответ на вопрос, чем обусловлен такой провал по количеству регистраций начавшийся в августе 2008 и достигший минимума в сентябре (1 регистрация за месяц), я не нашел.

Вроде как именно тогда ввели регистрацию по инвайтам, отсюда и провал
Кстати, взлет регистраций в июле 2009-го связан с акцией, когда для получения инвайта нужно было установить IE8 с хабронадстрокой
НЛО прилетело и опубликовало эту надпись здесь
Но у заблокированных тогда на месте их комментариев появляется надпись про нло прилетевшее и оставившее надпись. Разве не так?
НЛО прилетело и опубликовало эту надпись здесь
Возможно, начиная с какого-то времени решили не превращать старые обсуждения в решето?
Это деактивированные пользователи
А ведь данные о пользователях сейчас закрыли, поэтому Вы, наверное, не смогли получить полные сведения о регистрациях, а только тех посетителей, ссылки на персональные страницы которых нашли на сайте. Верно?
Получены данные всех, кто хотя бы раз написал комментарий или пост и не является заблокированным или переведенным в read-only.
Тогда это, наверное, надо упомянуть под графиком, что данные о регистрациях неполны. (Ещё можно было бы прочитать тех, кого пригласили из страниц пригласивших.)
Ответ на вопрос, чем обусловлен такой провал по количеству регистраций начавшийся в августе 2008 и достигший минимума в сентябре (1 регистрация за месяц), я не нашел.

Утверждать не буду, но тогда, кажется, ввели регистрацию по инвайтам
Эх, новички… Уже и не помнят, что когда-то на хабре никто и знать не знал богомерзкого слова «инвайт»:(
Я ужасен.
Впервые попал на хабр и подумал – а не запостить ли мне все свои подкасты разом? :)
Зато прославился))
Главное чтобы никто не захотел теперь побить рекорд.
Жалко, что нет доступа к базе хабры. Было бы интересно глянуть распределение «кто больше всех плюсует/минусует комментарии/топики/карму» с графиками распределения между «добрыми» и «злыми». :)
P.S. Принимаю предложения по построению интересных графиков на основе полученной информации.

Абсцисса — (количество или суммарный рейтинг) (постов или комментариев), ордината — (карма или рейтинг). Каждый пользователь — точка.
кстати да, было бу интересно увидеть и другие разрезы «облаков», глядишь и кластеризация выявится какая нибудь.
Насчёт пользователей из прошлого:
public class OldUsers
{
public static void main ( String[] args )
{
Date date = new Date ( 0 );
SimpleDateFormat sdf = new SimpleDateFormat ();
System.out.println ( sdf.format ( date ) );
}
}


И на выходе…
01.01.70 3:00


Думаю, это должно навести на мысли ;)
А тэг «code» всё такой же бесполезный :(
3:00, видимо, из-за смещения часового пояса?
НЛО прилетело и опубликовало эту надпись здесь
Ещё один интересный вопрос, ответ на который Вы узнали и сможете выдать страшную тайну.

Вот смотрите, идём на habrahabr.ru/posts/collective/ и нажимаем «Последняя страница». Сейчас там ничего интересного нет, а раньше красовалась надпись Внутреннего Голоса: «Подкаст не может быть хорошим». Сообщения эти не сопровождаются ссылками, поэтому не мог просмотреть страницу и комментарии и получить очень хорошую авторитетную ссылку :). Но, просмотрев пару десятков первых номеров, его не нашёл. Попадалось ли Вам такое сообщение? Каков его номер?
НЛО прилетело и опубликовало эту надпись здесь
Да, такое часто встречал, из за этой аномалии около 4 часов дебажил софтину, не мог разобраться почему он возвращает неправильное количество комментариев.
Я же не вручную 120к постов перебирал:). Хотя таких топиков не встречал.
Извиняюсь, пора бы мне уже запомнить, что работает только «source»…

public class NewTopicPage extends WebPanel
{
    public static void main ( String[] args )
    {
        Date date = new Date ( 0 );
        SimpleDateFormat sdf = new SimpleDateFormat ();
        System.out.println ( sdf.format ( date ) );
    }
}
Ну, вообще-то, code тоже работает, только назначение у него другое.
А подо что он конкретно нужен/работает?
Комментарий к несуществующей статье прям в точку)
НЛО прилетело и опубликовало эту надпись здесь
Поразительно, тоже где то месяц назад пришла идея, а не скачать ли и не проанализировать ли хабр, но руки пока так и не дошли.

Постройте еще график доли пользоателей, голосовавших за топики в каждый конкретный день.

Ну и скаое то интересное — зависимости:
• как влиятет успех предыдущего поста на успех следущего и как это зависит от рейтинга/кармы пользователя
• как заивисит рейтинг топика от времени публикации/хаба/рейтинга пользователя
• как зависит активность пользователя от его рейтинга и даты регистрации
ну и прочее.
> предложения по построению интересных графиков

Точечную диаграмму зависимости: «средняя длина статьи / количество статей» (обе шкалы логарифмические) по каждому автору. И диаметр точки — количество с одинаковыми данными, интервалы по Х подобрать (по Y будут ровные ряды). Авторы — точки, а по их плотности будет видно, каких авторов больше, сколько пишут в среднем.
К сожалению, нет информации по длине статьи.
Распарсить скачанную статью, нет?
В базе нет текста скачанных статей.
А как Вы (не только автор поста, но и пользователи) оцениваете текущее качество контента по сравнению с 2011, 2010, 2009 годами? Хабр развивается или забивается шлаком?
Качество оценить сложно будет. Судя по количественным показателям: развитие достигло пика и стабилизировалось.
Есть раздел «Лучшее за все время». было бы интересно посмотреть на «Худшее за все время».
«Лучшее за все время»: Стив Джобс умер:( O_o
вы смотрите по постам самых заминусованных юзеров :)
БолженОС — думаю самый худший пост за все время
Чем и как парсели, если не секрет?
Написал свою софтинку.
А какой язык использзовали?
C#.
>Как ни грустно, но чуть больше половины пользователей не опубликовало ни одного топика.

Было бы грустно, если бы опубликовали, но при этом не разбирались в теме. Пусть лучше пишут более опытные товарищи…

За обзорность Спасибо. Очень познавательно вышло.
Интересно, сколько из этих не написавших ныли про «желтизну» Alizar :)
Сколько их этих не написавших ныли про то, что хабр уже не тот, и они бы намного лучше бы топики писали.
А топ первонахов реально собрать?
Если честно, я так и не понял, в чем суть претензий к Ализару.

Многие известные мне новости науки и технологий с американских ресурсов в рунете появлялись и появляются первым делом, или вообще исключительно, в его переводе.
Да так, людям заняться нечем, возмущаются его переводами, хотя сами ни разу и не пытались что-либо перевести
Не только Ализар, таких тут несколько. Обычно они переводят желтуху, либо непроверенные данные, либо что-то заурядное, но с зазывающим заголовком. Мн лично не нравится терять кучу времени на отсеивание подобных топиков (не интересно, а для новостей есть специализированные издания) — пришлось писать фильтры для rss. Но это дело вкуса и gtd.)
В основном претензии состоят в том, что:
-Информация первоисточника иногда перевирается\недоговаривается\преподносится однобоко в целях привлечения аудитории
-Из-за большого числа постов некоторые из них теряют важные детали (нюансы перевода, ссылки, комментарии и правки автора оригинала)

В результате читатель получается одним из трёх слепцов, который держит слона то ли за хвост, то ли за ногу, то ли за хобот и пытается делать вывод о том, что такое этот слон.
Но спасибо, ему, конечно, за то, что пытается нести информацию не-англоговорящим читателям.
НЛО прилетело и опубликовало эту надпись здесь
Может ализар это бот — генератор контента? Порою с размахом такой рандом выдает…
0 постов.
Лучше что-то, чем ничего, даже если это что-то только что висело на заборе? Аднака…
Если только чуть больше половины — Парето с его 80/20 вертится в гробу:)
В «Лучшем за все время» отображаются самые заплюсованные посты, а интересно, какой самый заплюсованный комментарий — не со списком порносайтов ли в помощь челу, который жаловался, что что-то где-то заблочили?:)
Это был самый заплюсованый комментарий за всю историю, в теме про закрытый порнолаб. Сейчас самый заплюсованный habrahabr.ru/post/123195/#comment_4043460
Ага, вот его следы. Оказывается, самый заплюсованный не со ссылками, а с комментарием к ним юзверя sedictor:
Если вы видите много ссылок фиолетового цвета, то у меня плохие новости для вас. +622!

habrahabr.ru/post/118370/#comment_3859518

О, и я засветился.
искал тот самый комментарий.
набрал «porno» в поске…
=)

а в самом низу страницы, внутренний голос:
«Эрик, ну сделайте там наконец Google Porno, народ жаждет!»

я уже молчу о «pornohabr», который выпал в search suggestion
НЛО прилетело и опубликовало эту надпись здесь
Так он автор этого комментария.
PS И снова ни одной фиолетовой…
НЛО прилетело и опубликовало эту надпись здесь
Если хотите иметь этот комментарий у себя в избранном, то выполните в консоли:

$.post('/json/favorites/', {tt: '3', ti: '3854405', action: 'add'})
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
Это еще был не слив. Реальный слив был в другом хабрапосте с единственным текстом «Идите нах*й», когда за обычный плюс без всяких комментариев банили на 1000 дней до 2014 года.
Какой приятный ровный график появления топиков по часам!

Интересно, почему вдруг в начале 2010-го случился резкий обвал кол-ва топиков и комментариев, и до сих пор не поднялось до этого уровня?
НЯП, тогда с главной заоффтопили целую кучу блогов (теперь хабов): «Я умный», «Будущее здесь», «Научно-популярное».

Помню, как после этого геноцида специально отслеживал, что новость о разработке в IBM мемристора или какой-то другой потенциально вкусной технологии на хабре так и не появилась, зато наверх повылазили обзоры каких-то быдлосмартфонов для среднего класса нижнего уровня.
Хаброаномалии

Вот еще аномалия — у меня в профиле отмечено, что я работаю в РПЦ, но её уже удалили :(
Учитывая, что с хабра выпилили топ комментариев, очень порадовала бы Ваша версия топа. Особенно в виде периодически обновляемой страницы.
Тоже не можете найти коммент со списком порносайтов?
мать вашу! пошел взглянуть на самые заминусованные топики и опомнился только через два часа(
> Из этой диаграммы следует, что больше всего написали топиков пользователи зарегистрировавшееся до середины 2008 года
Этому есть объяснение. Во-первых, провал графика (и другие его части) схож с графиком количества регистраций пользователей в месяц. Во-вторых, 2006 год столь большой, потому что alizar зарегистрирован 11 июня 2006 в 20:02, а статей сами знаете у него сколько. Таким образом, можно сделать вывод, что много написали потому, что пользователей в этот период зарегистрировано много. С другой стороны логично, пользователи давно на хабре, статей у них и должно быть больше.
Тогда, наверное, стоит делить на количество регистраций. График будет более показательным.
Самые заминусованные пользователи (по карме):
quadregus -641
egorinsk -402
gigawatt -333
Himari -299
almaz -260

Пользователю egorinsk можно официально присудить звание «главный антикармадрочер». На протяжении лет, находясь в глубоком минусе, написать больше 5000 (!) комментариев, многие из которых — огромный развёрнутый грамотный аргументированный троллинг на разнообразные темы. Я восхищён стойкостью этого человека.

Остальные герои топа-задом-наперёд гораздо менее примечательны.

P.S. Хочу статистику по пользователям с самым большим количеством заминусованных комментариев и топиков. Одно дело добиться минусов несколькими «меткими» комментариями и другое дело — постоянно вызывать несогласие собеседников.
… и не подвергнуться при этом абдукции НЛО, как пресловутый karma ака sixapart:)
Ещё можно было бы связать карму и количество голосов за карму (можно вывести график количества голосов в одних координатах с распределением кармы), а также рейтинг комментария и количество голосов за него.
ааа! Меня посчитали! )

Явно виден боковой флэт в жизни ресурса со склонностью к нисходящему тренду. Все это связано с системой голосований. Пользователю не хочется постить, чтобы получить минуса в карму, а подстриваться под непредсказуемые пожелания юзеров — нормальный человек не станет. Вот и сидят с нулевыми кармами, иногда почитывая опусы других. Ресурс, впрочем. крепко занял свою узкую нишу и это устраивает всех, так что пусть все остается как есть. Автору +1, интересная стата собрана, тем более с аномалиями
Больше всего удручает, что карма сама медленно не восстанавливается со временем. В результате каждый интересный, сатирический и может быть спорный комментарий мне приносит чуть-чуть негативной кармы (позитивной конечно тоже, но на 1-2 голоса меньше, чем негативной). Ну скажите, зачем нам скучные комментарии, которые нравятся абсолютно всем? И если я провёл на Хабре 2010-2011 годы под эгидой «не больше 1 комментария в час», то 2012 начался с «не больше 1 комментария в день» (как я понял это -30 кармы), по планам Хабра к 2015 году я стану рид-онли. =T_T=
По большому счету тут гуманитарию и читать нечего и общаться не с кем. Больше техническое сообщество. Так что лично для меня это небольшая потеря. Так, изредко читаю о том о сем. На 95% ресурс не мой.
Ещё забавно видеть забаненными народ с баджами «Легенда». Раз — и топиков не стало.
Да уж, сменилась политика Хабра, сменились и «звезды».
Решение пришло быстро, надо перебрать все опубликованные топики, начиная с 1 и заканчивая 144 400 номером
Оооо, частота нашего ретранслятора :)
Какого ретранслятора?
было бы очень интересно видеть еще такие данные:
* средний рейтинг топиков по часам (по дням есть, но так интереснее)
* среднее количества голосов за топик по часам по времени создания топика
* среднее количество комментариев на топики по часам именно по времени создания топика

такая информация может дать представление о том когда лучше публиковать, чтобы получить максимальную активность.

а вообще интересно было бы еще видеть суммарную статистику по тэгам и хабам, но я так понимаю что парсер придется запускать заново.
Добавил что было.
А просто количество комментариев под часам и дням не сложно будет?
Почему вы скрыли разметку оси ординат на графиках активности?
habrahabr.ru/post/119754/#comment_3918136 -203 (Изображение в комментарии потеряно

Помню этот комментарий, там была картинка, типа саркастичный демотиватор, мужчины с КДПВ.
Пользователи, зарегистрировавшиеся в далеком 1970 году

[CHUCK_NORRIS_MODE]Я пользовался Хабрахабром, когда он ещё даже не существовал.[/CHUCK_NORRIS_MODE]
Да ладно, Хабр не существовал… Взглянем на дату рождения: 1 января 1988 :)
подскажите, пожалуйста, каким в туле строили такие красивые графики?
НЛО прилетело и опубликовало эту надпись здесь
У кого сейчас самая большая карма? А за все время?
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации