Комментарии
Немного не по теvе разворачивании в Azure:
А как насчет тональности по объекту?
«Маша хорошая, а Петя дурак».
Это позитивное сообщение или негативное? Для Маши позитивное, а для Пети не очень
В общем случае, должны быть выделены отдельные сущности «Маша» и «Петя», и отдельные оценки для каждой из них.
А конкретно тут это сообщение при разметке будет нейтральным и в дальнейшем оно будет отброшено, так как для обучения не используются нейтральные сообщения. А если подать его на вход, то получим -1, те система посчитает его негативным.
если оно при разметке будет нейтральным, то почему система посчитает его негативным?
Потому что в обучающей выборке было много других предложений со словом «дурак», оценённых негативно :)
Странный результат. Если в предложении два объекта, то должна быть определена тональность относительно каждого из них. Если в словаре (обучающей выборке) есть оба слова («дурак» и «хорошая»), то, как я понял, система выдаст все-таки нейтральный результат независимо от местоположения объекта. Следуя этой логике: если в розетку с постоянным напряжением (позитив и негатив) сунуть два пальца, то состояние сующего останется нейтральным?
>Если в предложении два объекта, то должна быть определена тональность относительно каждого из них.
В какой-то более сложной системе — да. Но в данном случае определяется тональность целиком для всего сообщения.

>Если в словаре (обучающей выборке) есть оба слова («дурак» и «хорошая»), то, как я понял, система выдаст все-таки нейтральный результат независимо от местоположения объекта.
Эти слова присутствуют в обучающей выборке с разной частотой, и в итоге получается, что если текст содержит слово «дурак» и слово «хороший», то он с большей вероятностью принадлежит классу «негативный»
В прошлый раз соревнование по тональности было соревнованием: кто лучше умеет использовать SVM, т.к. практически все участники использовали этот метод для классификации. Вообще, примитивная классификация сообщений в целом на хорошие и плохие мало используется на практике, т.к. не понятно: кому хорошо, а кому плохо.
На этот раз задача вроде бы интересней, но опять поставлена не корректно: смешаны две задачи сентимент-анализа (даже три): оставлена примитивная классификация и добавлена задача aspect-based sentiment analisys, которая почему-то подразумевает и тональность относительно объекта (мониторинга) и одновременно его свойств (аспектов). В мировой практике эти две задачи разнесены по разным классам и решаются разными методами (обычно не SVM). Боюсь, соревнование получится аналогичным предыдущему.
Привет!

Раньше не задумывались, но спасибо за ссылку, обязательно примем участие!
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
Можно ли более конкретно расписать (может картинкой) следующий момент:
Этот баг можно обойти, если загрузить CSV-файл в базу данных, а затем использовать блок Reader из раздела Data Input and Output для загрузки данных.
Имеется в виду, что вместо того, что бы читать данные из csv, данные будут чиаться из базы данных. Но вообще надо проверить как обстоят дела сейчас — Azure Machine Learning получил очень много обновлений с тех пор
в этом и заключается мой вопрос: как именно данные были загружены в базу данных?
просто хотелось бы попробовать этот пример шаг за шагом, но этап загрузки данныз через базу данных не описан.
спасибо.
Можно использовать любой инструмент для работы с SQL Server — SQL Server Management Studio, dbForge Studio или еще что-то
Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.