12 October 2009

Анализ комментариев

Habr
Хотел опубликовать перед выходными, но я думаю, в понедельник тоже пойдет.
Ниже анализ комментариев к 212 топикам за неделю с 24 сентября по 30 сентября (даты приблизительные). Всего комментариев 14 423, средняя длина комментария 200,8 символов.

Отношение к окружающим


image
Выводы

  • вежливых в 7 раз больше;
  • о себе говорят в 45% случаев.


Самые популярные смайлики


Веселые
:) 2121
;) 316
=) 285
:-) 145
)) 81
))) 58
;-) 54
:)) 50
%) 35
:))) 29
=)) 25
^_^ 11
)))) 11
))))) 8
=))) 8
Не веселые
:( 130
=( 20
:-( 10

Выводы
  • на Хабре весело;
  • классический смайлик :-) теряет свою популярность.

Любимые числа


Место Кол-во Число
1 258 2
2 249 1
3 213 5
4 173 10
5 158 3
6 121 0 (ноль)
7 110 4
8 83 6
9 82 7
10 77 30
11 75 100
14 56 8
22 28 9

Выводы
  • Хабр — ИТ ресурс;
  • 8, и особенно 9 недолюбливают.

Оценки комментариев


Средняя оценка комментария +1,036.
Самые нелюбимые слова (слово встречается больше 50 раз, средняя оценка комментария)

image
Самые любимые слова (слово встречается больше 50 раз, средняя оценка комментария)

image
Выводы
  • Комментарии с картинками или кодом — это плюс.

Сначала я хотел поставить эти графики в начало, для привлечения внимания, но так и не понял, как их трактовать. Обратите внимание: «хабр» +2,57, «хабре» -0,85.

П.С. Базу комментариев можно скачать здесь (формат SQLite, ~8 Мб).
В какой блог лучше поместить? Перенес в блог Статистика
Tags:Юморанализкомментариихабрахабр
Hubs: Habr
+105
1.2k 3
Comments 30
Top of the last 24 hours