Как стать автором
Обновить

Комментарии 11

Очень интересная статья.
Спасибо!
Судя по описанию алгоритма случаи использования нецензурной лексики или перехода на личности на самом деле не отлавливаются. )
«найти файлы, в которых оператора колл-центра не представлялись клиентам в первые 10 секунд»… а почему не записать представление оператора и не проигрывать его клиенту, когда конкретный оператор берет трубку? Зачем насиловать и Кейпиайить то, что можно автоматизировать?
«найти файлы, в которых оператора колл-центра не представлялись клиентам в первые 10 секунд»

Что дает знание имени оператора для клиента?
Зачем в скрипте операторы спрашивают имя (если идентификация клиента не требуется), если после этого, зачастую ни разу по имени не называют и не обращаются?

Эти и другие бесполезные вещи ради KPI, графиков, отчетов и главное лишений премий сотрудников, а не эффективность решения проблемы/вопроса клиента.

О том и речь. А имя оператора нужно, что-бы на него пожаловаться если что.

Зачем нужна была нейронная сеть для такой задачи я так и не понял.

Похоже у вас что-то не так с Confusion Matrix…
Для настолько несбалансированного класса целевая метрика выглядит, мягко-говоря, не очень. Фактически, из интересуемых 28 подозрительных файлов модель ошиблась более чем в половине случаев — 15. полезность вызывает сомнения :)
Если внимательно посмотреть, то это статья — перевод
То есть можно переводить любой треш, не вникая в вопрос, и постить на хабр? )
ну почему сразу «треш»? Если читатель никогда не работал со звуком, то из статьи можно почерпнуть полезного на эту тему. То есть у этой истории есть польза. При этом вы правы, матрица действительно странная. Как и размер искомого датасета.
Я же не сказал, что вся статья полностью треш) Сам с удовольствием прочитал
Зарегистрируйтесь на Хабре, чтобы оставить комментарий