Комментарии 12
НЛО прилетело и опубликовало эту надпись здесь
О, вторая часть, я думал ждатьдолго буду, а тут приятное такое утро
А выделить (хотя бы вероятностно) конец предложения на основе семантического анализ?
В принципе, метод Ratnaparkhi достаточно хорош — настолько, чтобы не приходило в голову пробовать что-то иное. Мне кажется, проще его «дожать» до лучших показателей с помощью более широкого учитываемого контекста.

Даже сейчас если посмотреть где он ошибается, то окажется, что места эти неочевидны и вполне могут быть сочтены концом предложения любой другой системой тоже.
Ну как скажете =) иногда обидно, что работают самые простые вещи (особенно в machine learning) =)
А что с ними не так? :) Как строится дерево? Тут есть разные подходы, например, корнем такого дерева может быть союз «и» (или запятая). Иной приём — перекидывается связь между двумя корневыми глаголами.
В смысле что делать с ними при пропущенной запятой? Как отлавливать ошибку?
ну, в теории с помощью синтаксического анализатора можно определить, что в предложении две пары «подлежащее+сказуемое», а запятой нигде нет, и сообщить об этом юзеру.
Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.