Pull to refresh
0
Content AI
Решения для интеллектуальной обработки информации

Открыта регистрация на конференцию по компьютерной лингвистике «Диалог»

Reading time 2 min
Views 2.9K
image30 мая – 3 июня в подмосковном пансионате «Бекасово» пройдет крупнейшая российская конференция по компьютерной лингвистике «Диалог». Подробно о том, что такое «Диалог» и почему ABBYY организует эту конференцию, мы подробно писали здесь.

В этом году главными темами станут:

Оценка тональности текста (sentiment analysis). Для решения этой проблемы (как понять отношение автора к тому, что он описывает) используются как методы, основанные на лингвистических правилах, так и методы компьютерного обучения на больших тестовых коллекциях документов (в которых эксперты вручную расставили оценки тональности, а компьютер пытается разобраться, какие именно свойста тестового текста связаны с оценкой, чтобы на их основе оценивать новые тексты). Думаю, многие сталкивались с «правильными» оценками тональности статей в российских системах мониторинга СМИ (не будем называть имён), так что тема очень актуальная.

Создание новых корпусов текстов для лингвистических исследований. Что такое корпуса? Корпуса текстов (это могут быть и записи речи) это тот исследовательский материал, на котором компьютерная лингвистика пытается построить модели для автоматической обработки языка. Современные корпуса могут включать миллионы специальным образом отобранных и обработанных текстов. Но даже таких корпусов оказывает недостаточно для работы мощных алгоритмов статистической обработки, которые сегодня используются. Поэтому ставится задача создавать такие корпуса автоматически, используя в качестве практически неограниченного источника Интернет.

Традицией «Диалога» становится проведение соревнований систем автоматического анализа документов. Цель таких состязаний не спортивная, а исследовательская: разработка надежных критериев и методик оценки систем автоматического анализа. В этом году под эгидой «Диалога» проведено два таких соревнования: тестирование систем синтаксического анализа текстов на русском языке (синтаксических парсеров) и тестирование систем, производящих оценку тональности текстов на русском языке. Итоги этих тестов будут подведены на Диалоге (по окончании конференции мы опубликуем их в этом блоге, следите за обновлениями).

Поскольку «Диалог» — международная конференция, традиционно в ней принимают участие специалисты по компьютерной лингвистике мирового масштаба. В этом году – Дэн Молдован (Dan I. Moldovan) – профессор компьютерных наук Техасского Университета в Далласе, США, и Джон Кэрролл (John A. Carroll) – профессор компьютерной лингвистики из Университета Сассекса, Великобритания.

Рабочие языки конференции – русский и английский.

Заявки на участие принимаются до 28 мая по адресу secretary@dialog-21.ru. Всю дополнительную информацию вы можете узнать на сайте конференции «Диалог».
Tags:
Hubs:
+18
Comments 0
Comments Leave a comment

Articles

Information

Website
www.contentai.ru
Registered
Founded
Employees
101–200 employees
Location
Россия