Как стать автором
Обновить

Комментарии 12

Бывает ли так, что процесс не сходится (мешок M[n+1] = M[n]) и приходится терминировать?
За логику наполнения мешка отвечают правила, которые можно написать так, чтобы процесс наполнения шел бесконечно.
Простейший пример такого правила: если в тексте есть персона -> породи новую персону на том же отрезке текста. При наличии хотя бы одной персоны такое правило должно было бы привести к зацикливанию (т.к. появление каждой новой персоны приводит к новому срабатыванию правила, которое порождает очередную персону), однако на практике такие ситуации отлавливаются специальным механизмом обнаружения циклов и обрываются, поэтому реального зацикливания не происходит.
Ну и, конечно, надо понимать, что такие ситуации свидетельствуют о некорректно написанном правиле и в реальных проектах их быть не должно.
Так точно! А есть ли верификаторы, которые авторы правил используют в работе? Например, даёт ли система правил потенциальные циклы.
Для формирований правил мешков утверждений используются ли корпуса?
Правила, которые наполняют мешок утверждений, пишут онтоинженеры. В нашей системе есть ряд корпусов и есть инструмент для поиска в них примеров вхождений определенных шаблонов. Использование этого инструмента позволяет покрыть большее число случаев и проверить некоторые гипотезы.
Кроме этого, размеченные корпуса используются для оценки качества написанных правил. Специальный компаратор сравнивает полученный RDF-граф с эталонным и выдает диагностику с перечислением всех ошибок.
НЛО прилетело и опубликовало эту надпись здесь
«Все найденные сопоставления помещаются в специальную отсортированную очередь сопоставлений.» — это можно назвать «гипотезы о смысле прочитанного, отсортированные по оценке правдоподобности»?
Очень отдаленно :) В данном случае это скорее технический инструмент.
Не рассматривает альтернативы. Если какое-то сопоставление вошло в противоречие с текущим состоянием мешка утверждений, оно просто отбрасывается.

А как же «Эти типы стали есть на складе» раскрывается, если контекста нет?
При построении дерева разбора гипотезы взвешиваются с использованием, например, статистики встречаемости. В базовом режиме мы работаем с наиболее вероятным деревом разбора.
а получить все варианты интерпретации от движка можно?
НЛО прилетело и опубликовало эту надпись здесь
Зарегистрируйтесь на Хабре, чтобы оставить комментарий