Comments 23
Инструментарий который вы разработали можно применить для анализа сообществ?

Специфика будет в том, что там разные авторы постов — то есть нужен будет еще один срез: кто из авторов собирает больше комментов, например. Сами сообщества после последней модификации ЖЖ стали выглядеть очень похоже на обычных юзеров.
Применить — нет, адаптировать — да. Принципиально ничего не меняется если говорить о вышеприведенных параметрах. Конечно надо подправить парсер и сам алгоритм обработки, но суть та же.

Другое дело что сообщества интереснее рассматривать не как ряды для статанализа, как граф для выявления рисунка связей внутри сообщества. Я потихоньку работаю над проблемой выявления неявных сообществ внутри ЖЖ на основе графа взаимной дружбы и анализа локальных сообществ, например, регионального типа. Буду писать об этом, но позже.
Данные интересные, жду гипотез и вообще аналитики по этим данным.
В качестве оффтопика — почитайте Славу Сэ (pesen_net), очень редкий сейчас случай доброго и талантливого человека. У него, кстати, книга есть, продается в магазинах.

… Гитарист был алкоголиком. Басист курил запрещённые растения. Я увлекался грустными женщинами, а это хуже, чем пить и курить. Самой непорочной была вокалистка, единственная в мире латышка-негр Моника. Дочь олимпийского негодяя из Кении. Единственным, невольным её грехом был зад-искуситель. Сильно оттопыренный, в форме сердца, невероятной красоты. Он ломал судьбы и калечил психику. Мало что чёрный, он танцевал отдельно от хозяйки. Из-за него басист не спал ночей, раз в месяц предлагал Монике создать семью, хотя бы на вечер. Моника фыркала, уходила сама и всю красоту уносила с собой...
Я пока не нашел структурного или статистического алгоритма выявления ботов. Мысли есть, но я еще их не проверял.
Чтобы это не было средней температурой по больнице анализировать надо не ЖЖ в целом, а отдельные сообщества (как явные так и неявные). До этого я еще не дошел — отрабатываю инструментарий и подходы.
Подобная аналитика не очень выгодна самим сервисам на мой взгляд. Получается что всю движу организует весьма небольшое количество активных участников. Это не плохо, это просто особенность социальных систем и ее надо понимать, а иначе можно сделать ошибочные выводы (специально или по незнанию). Этим часто грешат СМИ и политически ангажированные персоны в блогах.
Интересен рейтинг комментаторов — кто из пользователей больше всего комментариев в чужих журналах оставляет, и как это кореллирует с его рейтингом.
Рейтинг комментаторов я выкинул чтобы не перегружать первую часть публикации. Подумаю куда включить эти данные.

А что вы понимаете под «коррелирует с его рейтингом» — если выстроить рейтинг по количеству оставленных комментаторов то с чем считать корреляцию? С его позицией в топе ЖЖ по френдам?
Ну френдов можно взять, чтобы не заморачиваться, только это не самый точный показатель. Гораздо важнее количество трастовых комментариев в собственном блоге комментатора.
Чтобы пост оказался для меня полезным, я должен выделить для себя единицу смысла. Скажите пожалуйста, а зачем всё это? К чему вы хотите нас привести?
Это лишь часть целого. Смыслы выделять буду чуть позже.

Хотя для меня понимание законов распределения активности участников социальных сетей подтвержденное экспериментом — это тоже смысл.
Only those users with full accounts are able to leave comments. Log in, please.