vladshow Feb 21 2017 at 17:50

Эвристическая сеть — аналог рекуррентной нейронной сети для программы чат бот

5 min

8.9K

Algorithms*Mathematics*Machine learning*

Recovery Mode

+10

Comments 8

ashurkinam Feb 22 2017 at 01:08

Кроме Android где-то можно потестировать?

vladshow Feb 22 2017 at 01:29

Ограниченное по функциям приложение тут:
http://svlaboratory.org/application/chatbot2

SimSonic Feb 22 2017 at 16:08

Немного (сильно) бредовато отвечает. Осмысленного разговора не получилось =(

ServPonomarev Feb 22 2017 at 08:16

Основа описанного алгоритма — «корреляция» между словами, а по факту — их взаимозаменяемость.

Я в своё время делал следующее:

Собирал базу диалогов из художественной литературы, после чего обрабатывал их в вид:

Q_Ты Q_любишь Q_женщин А_Да А_люблю

Пара вопрос-ответ составляет одну строку обучающего файла. На обучающий файл натравливается Word2Vec, который устанавливает взаимозаменяемость и ассоциативность между словами вопроса и ответа. Так, очевидно из примера, что «Q_любишь» и «А_люблю» будут иметь хорошую дистанцию, поскольку в примерах часто фигурируют вместе.

Разумеется, у меня не такой простой способ кодирования был, поскольку я аналогичным образом делал разметку по позиции слова в вопросе/ответе (что позволяет выучивать синтаксис и типовые грамматические конструкции, при наличии достаточной обучающей базы, разумеется).

В целом, результаты забавные именно с точки зрения «болталки». Но я их использовал не в чистом виде, а для ранжирования подготовленных другими методами вариантов ответной реплики. Поскольку предложенный способ позволяет легко вычислять дистанцию между вопросами/ответами и выбирать вариант ответа с наилучшей дистанцией.

Ikors Feb 22 2017 at 16:08

Вот только при чём тут рекурентные сети? Приведённый алгоритм, насколько я могу судить, никакого отношения к ним не имеет.

vladshow Feb 22 2017 at 16:09

Данный алгоритм имитирует поведение рекуррентной нейронной сети для программы чат бот

Ikors Feb 22 2017 at 16:34

Что вы под этим имеете в виду? Вы решаете задачу совершенно другим методом, поэтому мне не понятно, в каком смысле тут вообще можно говорить об имитации.

vladshow Feb 22 2017 at 16:50

Если представить рекуррентную сеть как черный ящик, и проанализировать лишь поведение рекуррентной сети, т.е. то как она отвечает и генерирует новый текст.

Рекуррентная сеть для имитации речевого общения обладает рядом свойств:
статистическая связь вопросов и ответов в базе знаний,
взаимозаменяемость слов,
генерация новых текстов.

Данный алгоритм имитирует поведение рекуррентной нейронной сети, при этом структура алгоритма отличается.

Show the best of all time