Открыть список
Как стать автором
Обновить

Администраторы «ВКонтакте» смогут бороться с угрозами в комментариях с помощью нейросети

Информационная безопасностьМашинное обучениеСоциальные сети и сообщества

«ВКонтакте» внедряет новый инструмент, который поможет администраторам бороться с травлей в комментариях сообществ. Фильтр для отсеивания таких комментариев основан на работе нейросети. Его можно будет включить и отключить в настройках сообщества в любое время.

Пока новая функция доступна владельцам примерно 50% пабликов.

В настоящее время алгоритмы соцсети способны определять прямые угрозы в высказываниях, в том числе — пожелания смерти, обещания причинить вред здоровью и угрозы расправой. Новый фильтр сможет распознавать другие признаки нетерпимости — травлю по национальному признаку или религиозной принадлежности.

При этом администраторы смогут видеть все отфильтрованные публикации, чтобы при необходимости восстановить их.

Для обучения нейросети использовали тексты на русском языке, в том числе субтитры из фильмов, сериалов и видео. Механизм внимания нейросети позволяет ей принимать решения на основе важности слов и их комбинаций. Сейчас разработчики занимаются логикой принятия решений, которая должна учитывать контекст. Нейросеть правильно определяет угрозы в 80% случаев.

Проведенное тестирование показало, что владельцы пабликов восстанавливали всего 1% отфильтрованных комментариев. Тесты запустили в ноябре 2020 года. За эти месяцы новую функцию опробовали около 10% всех сообществ «ВКонтакте» или на 13 млн публичных страниц, групп и мероприятий. Впоследствии фильтр отключили 1,8% сообществ.

Ранее Instagram объявил об ужесточении политики в отношении пользователей, которые в переписке допускают высказывания, разжигающие вражду. Такие аккаунты будут удаляться бессрочно. Ранее на платформе также внедрили инструмент на ИИ, который предупреждает пользователя о том, что он собирается опубликовать оскорбительное сообщение.

Теги:вконтактесоциальная сетьадминистрирование сообществанейросетифильтркомментарииразжигание ненавистиоскорбления
Хабы: Информационная безопасность Машинное обучение Социальные сети и сообщества
Всего голосов 5: ↑5 и ↓0 +5
Просмотры753

Комментарии 0

Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

Похожие публикации

Технический Писатель
от 30 000 до 50 000 ₽ИЦ РЕГИОНАЛЬНЫЕ СИСТЕМЫВолгоград
Системный администратор
до 120 000 ₽ЭкспобанкНовосибирск
AI-разработчик
от 70 000 до 100 000 ₽Университет Искусственного ИнтеллектаМожно удаленно
Инженер-проектировщик систем информационной безопасности
от 30 000 до 60 000 ₽ИЦ РЕГИОНАЛЬНЫЕ СИСТЕМЫВолгоградМожно удаленно
Data Scientist / Machine Learning Engineer
от 150 000 до 250 000 ₽ProfitClicksМожно удаленно

Лучшие публикации за сутки