Открыть список
Как стать автором
Обновить

В Москве пройдет хакатон по анализу текстов. Регистрация до 14 декабря

ПрограммированиеХакатоныИскусственный интеллектNatural Language Processing
Приглашаем всех 15 декабря принять участие в очном хакатоне по анализу данных «Новый Год hack 2019» в Москве в Научном парке МГУ.

Хакатон проводят компании Лаборатория Наносемантика и Контакт-центр «Гран» вместе с МФТИ и МГУ.

Под катом — описание задач, критериев оценки, условий участия и призы.

image

Описание и задачи


Участникам соревнования будет предложено 4 задания:

  1. Классификация интентов.
    Интент запроса – это намерение пользователя, цель его обращения к некоторой поисковой системе. Например, в случае с технической поддержкой классификация интентов может помочь автоматически кластеризовать запросы по их тематикам для формирования ответа, либо быстрого перенаправления к нужным специалистам.
  2. Исправление орфографических ошибок.
    Полезная задача как для собственной проверки правописания, так и для исправления возможных опечаток пользователей, к примеру, при обращениях к чат-ботам.
  3. Предсказание оценок в чатах.
    В данной задаче предлагается найти корреляцию между ответами специалистов технической поддержки в чатах и их итоговыми оценками, выставленными пользователями.
  4. Обнаружение фальсификации телефонной статистики.
    Недобросовестные операторы иногда пытаются фальсифицировать статистику звонков своих колл-центров. Ключевой показатель, который стремятся подделать – продолжительность звонка в секундах. Предлагается попытаться определить истинную природу появления цифр в отчётах.

Критерии оценки работ


Участникам соревнования предлагается построить алгоритмы, которые будут для задач 1, 3 и 4 решать задачу классификации, для задачи 2 – возвращать для каждого предложения исправленное. Решения принимаются в формате docker-контейнеров. Метрики качества решений задач 1, 3 и 4 — F1-score, для задачи 2 – также F1-score, но с увеличенными штрафными коэффициентами: за пропуск ошибки штраф увеличивается вдвое (FN с коэффициентом 2), за ложную детекцию – в 30 раз (FP с коэффициентом 30).

Роудмэп хакатона


До 14 декабря 17:59 — подача заявки.
Вы получите доступ к тренировочному датасету.
15 декабря — День Хакатона
10:00 — Выдаем датасеты, начинается разработка.
14:00 — Приезжает обед.
18:59 — Крайний срок сдачи работ.
20:00 — Объявляем победителей.

Условия участия


  • вы можете быть гражданином любой страны
  • вам может быть сколько угодно лет
  • допускаются команды от 1 до 4 человек

Организаторы хакатона: Лаборатория Наносемантика, Контакт-центр «Гран», МФТИ и МГУ.
Операторы площадки: Data Souls + Open Data Science.

→ Подать заявку на участие можно на странице соревнования
Теги:хакатонанализ данныханализ текстаnlp
Хабы: Программирование Хакатоны Искусственный интеллект Natural Language Processing
Всего голосов 7: ↑7 и ↓0 +7
Просмотры1.8K

Комментарии 5

Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

Похожие публикации

Лучшие публикации за сутки