Как стать автором
Обновить

Комментарии 25

НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь

В нашей стране цензура напрямую запрещана конституцией. Так что нельзя.

Не вполне понятно, как эти инициативы вяжутся с Конституцией. Может быть, считается, что цензура запрещена только в СМИ, но как же тогда быть с п.4 ст. 29?

1. Каждому гарантируется свобода мысли и слова.
2. Не допускаются пропаганда или агитация, возбуждающие социальную, расовую, национальную или религиозную ненависть и вражду. Запрещается пропаганда социального, расового, национального, религиозного или языкового превосходства.
4. Каждый имеет право свободно искать, получать, передавать, производить и распространять информацию любым законным способом. Перечень сведений, составляющих государственную тайну, определяется федеральным законом.
5. Гарантируется свобода массовой информации. Цензура запрещается.

4-й пункт часто трактуется как "я могу писать что угодно и где угодно", а бан или другие ограничения на, например, Хабре воспринимается как цензура и нарушение Конституции.

И в этом есть логика. Токсичность зависит от контекста. На мой взгляд, нужно искать не универсальные фразы, а идти от сообществ, society. Если в обществе принято говорить по делу, то не надо постить котиков (хотя контекст опять-таки может позволить). Если многодетная мама наткнулась на форум childfree, не надо писать, какие там все дураки. Но есть и универсальные сообщества, где пишут что попало.
НЛО прилетело и опубликовало эту надпись здесь

Ну что вы, что вы, ваша работа невероятно ценна и важна, я даже не стал вчитываться в то, что вы сделали, чтобы написать этот комментарий.


/thread.

Да и вся линейка продуктов просто бесподобна, так держать, амиго!

Зачем?
Не кажется ли вам, что нет проблемы унизить человека, будучи предельно вежливым? И как вы думаете, сколько будет ложных срабатываний, если вы натренируете модель по подобным текстам? Нельзя будет вежливо обращаться к людям, ибо "токсично"?


Причём самое смешное – проблема токсичных комментариев значительно менее важна, чем проблема спама. Если вы решили проблему спама – действительно токсичные комментарии уже можно выпилить и вручную, по жалобам пользователей (со старой фидошной системой: за нарушение – [+], три плюса – в r/o на какое-то время).

СПАМ – нежелательная реклама (если совсем грубо). Тут есть некие определённые критерии, позволяющие определить сообщение, как рекламное, соотнести его с ещё некими критериями о соответствии площадке, на которой было опубликовано (условно, реклама VDS на Хабре или реклама майонеза на Хабре). Всё более или менее понятно и определяемо, причём скорее более, чем менее.

Оскорбление – уже сложнее. Кого-то может оскорбить сам факт упоминания названия ОС Wibdows. Но, худо бедно, и тут есть относительно детерминированные критерии.

А вот что такое «токсичный комментарий»? Хоть какое-то определение токсичности в смысле комментариев есть вообще? Вот тут статья есть, название которой начинается со слов «Почему без тимлида не обойтись» – очень даже токсичная статья (на самом деле конечно же нет). Потому что если кому-то там тимлид и нужен, то нам (неким условным нам) и без пастуха прекрасно работается (пример данный не надо воспринимать буквально). Кто и по каким критериям, кроме мнения «тараканов в голове» маркирует комментарии, как токсичные?

Ох и доиграемся мы с этими ИИ когда-нибудь…
Комментарий состоящий большей частью из оскорблений и толстого троллинга, мало относящийся к теме обсуждения, но провоцирующий других участников уйти от темы обсуждения и ввязаться в словесный конфликт.
Вы указываете на оспоримость моего мнения – это очень, очень токсичный комментарий! Более того, вы это делаете открыто, не прибегая к деликатным оборотам речи и эвфемизмам. Ваш комментарий заставляет меня усомниться в моей правоте – Вы очень, очень токсичный человек! И теперь мне остаётся или напиться до беспамятства, чтобы пережить Вашу токсичность, или… Водки нет, магазин закрыт, так что да, кроме как из окна выброситься, мне ничего не остаётся. И в моей смерти, прошу отметить, виноваты Вы и только Вы своим токсичным поведением! Вы очень, просто крайне токсичный человек!

Простите, Bonio, но я надеюсь, что Вы не восприняли эту тираду всерьёз – это лишь иллюстрация к театру абсурда под названием «Токсичность».

Ещё раз простите… И да, я-таки напьюсь – уж очень чаю с бергамотом хочется. И с сахаром. У меня как раз есть.
Есть гораздо более простой и точный способ блокировать токсичных пользователей и не просто токсичных, а неприемлемых конкретно для данного сообщества. Алгоритм следующий:
1. Админ создаёт несколько временных пользователей и от их имени пишет
1.1. Несколько разных Неприемлемых комментариев (оскорблений, бессмысленных картинок, публикуя не логические утверждения можно просто выявлять глупых людей и психически больных)
1.2. Несколько разных полезных комментариев — комментариев которые должны привлечь по вашему мнению целевую аудиторию
2. Тех кто лайкает 25%-50%-75% неприемлемых комментарии (или ещё хуже подписывается на такой аккаунт) и минусует полезные комментарии автоматически банятся/ отправляются на ручную модерацию/ в режим только для течения
3. Полезные комментарии — предназначены для предотвращения «ложных срабатываний» — АвтоБана/ Балансировки и тонкой настройки фильтрации целевой аудитории сообщества
т.о. можно простым скриптом для форума, сервиса комментариев — полуавтоматически выявить неприемлемых для данного сообщества участников.
4. Т.о. фильтруются я не просто комментарии, а модерируется само сообщество неприемлемые для сообщества люди не только не могут оставлять неприемлемые для сообщества комментарии но и влиять на карму/рейтинг других людей в сообществе.
Админ создаёт несколько временных пользователей и от их имени пишет

может получится как в русскоязычном сегменте фейсбука
когда слово «москаль» там не являестя оскорбительным, а слово «хохол» является (хотя банить надо обоих). Просто потому, что админы так решили.
Интересный подход.
А как быть с вечером пятницы, когда люди отправляются в бары расслабиться?
Анекдот
Победитель битвы экстрасенсов, когда напьется, звонит своей будущей.
Спасибо за статью. Довольно интересная.
Если натравить парсер на Pointmd(новостной агрегатор, в основном политический, c комментариями), то сервера растворятся в зашкаливающем pH

А если натравить парсер на Хабр и сравнить оценку комментария и/или карму автора с его токсичностью, корреляция какая должна быть, сильная или нет?

сравнить оценку комментария и/или карму автора с его токсичностью

А кто «токсичность» будет выражать в единицах системы СИ? А то я что-то не слышал, чтобы в Палату мер и весов подвезли 1 токс.


Люди, видите ли, разные. То, что вон той снежинке «токсично» — мне забавно, а то, что мне неприятно (я ненавижу само слово «токсично», кстати, потому что его придумали исключительно в целях легитимизации оправданий сливов по тихому в любой дискуссии) — никого не интересует.


Когда мне бьют в морду, все понятно: я просто могу либо дать в ответ, либо утереться и пройти мимо.


Когда человеку пишут что-то крайне ему неприятное и обидное — то все нормально, так и надо, если по мнению большинства оно «не токсично». А если он по запальчивости отвечает без завуалированного хамства, напрямую — набегает толпа и орет «воу, какой токсичный перец!».


Я уверен, что если бы слово «токсично» существовало 85 лет назад, евреев в Германии просто признали бы «токсичными», и это бы узаконило запреты посещенния баров и публичных мест.

В единицах, в которых описываемая система оценивает. Суть моего предложения в том, чтобы оценить корреляцию "токсичности" (то, что выдаёт описываемая система) с формальными оценками сообщества Хабар тех или иных высказываний и их авторов.

Ну так это напрямую зависит от датасета, на котором тренировали. Скорее всего нет, не будет сильной корреляции. Вряд ли их датасет предусматривает случай, когда на комментарий «Я думаю, vim хуже, чем emacs» прилетает -100500 в карму.

Что же за датасет тогда такой ))

Отвратительно. С чего это вдруг компания MAIL.RU решила, что может вводить цензуру?! «Хотя чего еще ждать от компании, которая поддержала „автономный рунет“?! И вот это был „токсичный комментарий“.

Любое упоминание токсичности токсично само по себе.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий