Skip to content

Neural conversational model based on DSSM architecture and HNSW.

Notifications You must be signed in to change notification settings

Gaussiandra/Retrieval-based-Neural-Speaker

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

25 Commits
 
 
 
 

Repository files navigation

Диалоговая система, которая на введённое сообщение способна разумным образом подобрать ответ из заданного списка.

Пример работы алгоритма, обёрнутого в чат-бот в телеграме

Снимок

Описание

  • Модель основана на DSSM архитектуре, где каждый возможный ответ и введёный контекст задается своим вектором.
  • Подходящий ответ определяется благодаря косинусной близости и алгоритму HNSW.
  • Энкодеры имеют одинаковую архитектуру: FastText embedding -> LSTM -> mean-max-last pooling -> Linear.
  • Обучение производится на триплетном лоссе.
  • Был использован Hard Negatives Mining как техника для улучшения сходимости.
  • Данными для обучения стали телеграм беседы. Спасибо за парсинг Fulldis.