Как стать автором
Обновить

В МТИ разработали систему ИИ, которая автоматически переписывает устаревшие предложения в «Википедии»

Время на прочтение2 мин
Количество просмотров4.1K
imageФото: news.mit.edu

Исследователи Массачусетского технологического университета разработали систему искусственного интеллекта, которая способна переписывать устаревшие предложения в статьях «Википедии». При этом, как утверждают разработчики, система сохраняет тон человека-редактора.

Например, в этом предложении есть обязательное обновление (выделено жирным): «Фонд А считает, что 28 из 42 их миноритарных пакетов акций в действующих компаниях имеют особое значение для группы». Обновленное предложение может гласить: «Фонд А считает 23 из 43 миноритарных пакетов акций существенными». Система сможет разместить соответствующий текст в интернет-энциклопедии, автоматически удалив устаревшие числа (28 и 42) и заменяет их новыми числами (23 и 43), но сохраняя при этом предложение точно таким же грамматически корректным.

Авторы разработки пояснили, что люди не всегда оперативно редактируют статьи интернет-энциклопедии, а специальные боты отслеживают лишь нарушения правил и работают по шаблонам. Расширение статей, серьезные переписывания или другие рутинные изменения, такие как обновление номеров, дат, имен и местоположений в настоящее время добровольно выполняются пользователями из разных стран.

Систему, основанную на машинном обучении, научили распознавать различия между предложением из статьи и предложением с обновленными фактами. Если она видит какие-либо противоречия между этими двумя высказываниями, то использует «маску нейтральности», чтобы определить те противоречивые слова, которые нужно удалить, и те, которые обязательно нужно сохранить. После этого структура кодера-декодера определяет, как переписать предложение.

Идея состоит в том, что люди-редакторы будут вводить в систему неструктурированное предложение с обновленной информацией, не беспокоясь о стиле или грамматике. Затем система будет находить в «Википедии» соответствующую страницу и устаревшее предложение и переписывать его по-человечески. В будущем, по словам исследователей, существует потенциал для создания полностью автоматизированной системы, которая идентифицирует и использует самую последнюю информацию из Интернета для внесения правок в статьи.

Отмечается, что систему также можно использовать для дополнения наборов данных, предназначенных для обучения детекторов фейкньюс, что потенциально снижает предвзятость и повышает точность информации.
См. также: «В Alphabet разработали инструмент для борьбы с фейковыми фото
Однако пока технология готова не до конца. Люди, оценивающие точность ИИ, дали системе средние оценки 4 из 5 за фактические обновления и 3.85 из 5 за грамматику. Это лучше результатов других систем для генерации текста, но заметить разницу с человеком еще можно.

Исследователи намерены усовершенствовать систему ИИ, которая могла бы использоваться для внесения незначительных правок в «Википедии», а также в редактировании новостных материалов или других документов, когда не требуется редактор-человек.
См. также:

Теги:
Хабы:
+9
Комментарии9

Другие новости

Истории

Ближайшие события

Weekend Offer в AliExpress
Дата20 – 21 апреля
Время10:00 – 20:00
Место
Онлайн
Конференция «Я.Железо»
Дата18 мая
Время14:00 – 23:59
Место
МоскваОнлайн