29 октября 2019

Ученые из Перми создали программу для психолингвистического анализа пользователей соцсетей

Машинное обучениеНаучно-популярноеСоциальные сети и сообщества


По информации агентства ТАСС, сотрудники Пермского государственного национального исследовательского университета (ПГНИУ) разработали компьютерную программу, с помощью которой можно составить психологический и лингвистический портрет пользователей на основании опубликованных ими комментариев в различных социальных сетях.

Подобные исследования в России ведутся уже давно, но существующие на текущее время системы оценки поведения пользователей в социальных сетях оценивают в основном только лайки и репосты пользователей. Ученые из Перми решили исследовать комментарии пользователей.

Разработанная лингвистами и математиками из Перми программа называется BFI CNN Detector. На данный момент точность используемого в программе алгоритма определения социальных и поведенческих параметров авторов комментариев составляет 70%.

Проведение данного исследования и написание программы BFI CNN Detector заказало Министерство образования и науки РФ. В настоящее время этот программный продукт уже создан и зарегистрирован Федеральной службой по интеллектуальной собственности РФ. Используемый для создания программы язык программирования — Python.

В процессе разработки алгоритма программы ученые из ПГНИУ изучали, что именно и каким образом пишут пользователи в комментариях в различных социальных сетях. В базу данных BFI CNN Detector внесено более 21 тыс. различных комментариев пользователей, которые проанализировали по стилистике, жанрам, информативности. Алгоритм программы при помощи нейронной сети, включающей в себя сверточные слои, может классифицировать вид и стиль комментариев более чем из 150 разных категорий. Кроме этого, оценивает такие параметры пользователей, как возраст, пол, количество друзей, интенсивность написания комментариев, количество постов и психологические черты, которые исследователи собирали с помощью опросника The Big Five Inventory. На основе полученных данных ученые составили психолингвистические портреты для каждого исследуемого пользователя.

По словам профессора кафедры теоретического и прикладного языкознания ПГНИУ Константина Белоусова, в ходе исследований ученые смогли установить некоторые закономерности:

  • в текстах мужчин почти нет извинений, а у женщин они частотно присутствуют;
  • пользователи-мужчины, для которых характерна недобросовестность, часто в своих текстах используют сарказм и иронию;
  • пользователи, которые часто шутят, проявляют враждебность и признаки интровертности (сосредоточенности на внутреннем мире);
  • пользователи, которые проявляют сочувствие, чаще всего доброжелательны и консервативны.
Теги:наукаBFI CNN DetectorкомментариианализПГНИУ
Хабы: Машинное обучение Научно-популярное Социальные сети и сообщества
+8
5,1k 6
Комментарии 22
Лучшие публикации за сутки

Партнерские материалы

Разместить