Как стать автором
Обновить

«Любовь и ненависть» на карте России, лето 2015: исследование эмоционального состояния 25 млн пользователей социальных медиа

Время на прочтение4 мин
Количество просмотров5.3K
Всего голосов 12: ↑10 и ↓2+8
Комментарии15

Комментарии 15

Вот досада. Я переехал от добрых людей.
Сообщение «я люблю джаз» будет отнесено к положительным, хотя оно абсолютно нейтральное (еще более прикольный вариант — «обожаю насилие»). Аналогично, сообщение «ненавижу, когда обижают маленьких и беззащитных» будет отнесено к отрицательным, хотя оно тоже нейтральное.
В общем, вся методика вызывает большие сомнения.
Позвольте-с, но как фраза «ненавижу, когда обижают маленьких и беззащитных» может быть нейтральной? Как вообще фраза, содержащая слово «ненавижу», может быть нейтральной?
Эта фраза абсолютно нейтральная по отношению к текущему состоянию человека, потому что она говорит о его жизненной позиции вообще, но не о настроении в настоящий момент времени — а именно настроение и пытается измерить данное исследование. Тщательнее. ;)

А, например, фраза «поджарить бы тебя на сковородке» очень даже не нейтральная по отношению с текущим эмоциям. Но она не попадет в подсчет рейтинга, потому что слово «жарить» не относится исследователями в классу «ненависть». И кстати правильно, что не относится. Но отслеживать надо не слова, а смыслы. А для этого нужен некий искуственный интеллект, которого нет.
Когда человек пишет «я люблю джаз/котиков/мороженное/весенний дождь» и тд в социальных медиа публично — он таким образом выплескивает положительные эмоции. Так же, как когда пишет «ненавижу джаз» — выплескивает отрицательные. Очевидно, что эмоции у него в этот момент может вызывать совсем не джаз, но они есть и обретают вот такую слово-форму. Это исследование по сути на стыке социологии, психологии и других наук. И как бы это ни было удивительно, но результаты действительно отражают качество жизни и социальную обстановку в регионе, мы видим этому подтверждения регулярно, исследование проводиться уже в пятый раз, каждые полгода в течении двух последних лет.
«он таким образом выплескивает положительные эмоции» — а по-моему, он банально отвечает на вопрос «какую музыку/еду/животных/и.т.п. ты любишь».

«Так же, как когда пишет «ненавижу джаз» — выплескивает отрицательные» — аналогично, он просто отвечает на вопрос «какую музыку ты не любишь».

И ваше исследование понятия не имеет, сколько процентов слов вы поймали правильно, а сколько неверно выдернули из нейтрального контекста.

«Это исследование по сути на стыке социологии, психологии и других наук.» — да какой стык, какие науки? Написать бота, вылавливающего в сети 2-3-4 десятка ключевых слов и считающего итоги по регионам — это задача для курсовой/семестровой работы 3-курсника.

«результаты действительно отражают качество жизни и социальную обстановку в регионе, мы видим этому подтверждения регулярно» — как именно вы это видите?
Думаю, что после такого многомыслия обсуждать тему дальше смысла просто нет… Глупые дяди из Купертино (Apple) зря выложили $200млн за Топси, а Твиттер немного побольше за Гнип — просто идиоты: надо было всего лишь обратиться к dyadyaSerezha.

Приведенные Вами «лингвистические» примеры утончёны и симпатичны, только вот в них также не много смысла в приложении к миллионам высказываниям миллионов людей. Хотя и про это уже много раз говорили и тратить время для рассказа про ЗБЧ, Бернулли и Муавра-Лапаласа на очередной выплеск не хочется.

Когда найдете полчаса и сделаете свой наколеночный анализ — с удовольствием послушаем.

Кстати, вот прекрасный пример «с другой колокольни» (медийно-журналисткой):
www.klg.aif.ru/society/kaliningradcy_stali_menshe_govorit_o_lyubvi_i_bolshe_rugatsya_v_socsetyah

«Калининград, 11 июня — АиФ-Калининград.
Социологи проанализировали публичные сообщения россиян в Twitter, ВКонтакте, LiveJournal, YouTube, Facebook.
Исследовали просмотрели 320 млн русскоязычных сообщений от 25 млн авторов...»

1. Почему социлоги?
2. Кто-то из технарей может себе представить исследователей, «просматривающих 320 млн сообщений»? Жизни не хватит ))

Журналисткие штампы и подходы ничуть не лучше штампов и подходов технократов
И уж совсем плохо, когда трактовка переворачивается с ног на голову, как сделал достаточно популярный блогер:

philologist.livejournal.com/7605883.html
«Чечня заняла 1 место по уровню ненависти среди российских регионов

Характерно, что в других регионах Северного Кавказа мироощущение жителей не намного лучше. Так, в рейтинге любви 84-е, предпоследнее, место занял Дагестан, 83-е — Ингушетия, 81-е — Кабардино-Балкария, 80-е — Карачаево-Черкесия, 78-е — Северная Осетия. Как отмечает Brand Analytics, в предыдущих рейтингах были похожие результаты.»

Вот так вот и получается, что «социологи» из Brand Analytics, ослепшие от просмотра 320 миллионов текстов якобы узнали, что Кавказ всех ненавидит :(

А в источнике всего-то говорится, что несмотря на все перепетии в стране и мире Любовь все равно побеждает Ненависть. Везде и Всегда.

Понятно. Не ответив по существу ни на один мой вопрос, вы выпустили облако псевдо-научного дыма, заодно зачем-то помянув дядей из Купертино. Ну что же, не дорос так не дорос. 8-)
По существу: ответ на Ваше недоумение наберите «купертино Topsy» в Яндексе — все ссылки будут ответами.
Там есть ответы на мои технико-лингвистические вопросы? А вопрос социальных и исторических различий там тоже рассматривается и вычисляется возвожная погрешность?
Конечно есть. Топси с Твиттером (до продажи Apple) проводили массу публичных «мероприятий», включая прогностику по выборам президента (Обама против не-помню-кого, например).

А ответил Вам еще в позапрошлом веке Артур Конан-Дойль устами своего бессметрного героя:
"— Уинвуд Рид хорошо сказал об этом, — продолжал Холмс. — Он говорит, что отдельный человек — это неразрешимая загадка, зато в совокупности люди представляют собой некое математическое единство и подчинены определенным законам. Разве можно, например, предсказать действия отдельного человека, но поведение целого коллектива можно, оказывается, предсказать с большей точностью. Индивидуумы различаются между собой, но процентное отношение человеческих характеров в любом коллективе остается постоянным. Так говорит статистика. "
Кстати, по лингвистической части Ваших вопросов: ровно три месяца назад IBM купил Алхимиков. За $100млн. А чуть раньше заключил стратегический альянс с Твиттером. И зачем IBM-то это делает? Тем более на фоне своих миллиардных вложений за прошлые десятилетия в лингвистические центры по всему миру… Но и об этом уже много чего написано, в том числе и в наших блогах.
В Чеченской республике наименьший индекс любви.
По камням струится Терек,
Плещет мутный вал;
Злой чечен ползет на берег,
Точит свой кинжал;

М.Ю.Лермонтов.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий