Google представила диалоговую систему Meena: по словам компании, новый чатбот умеет поддерживать диалог на любые темы, шутить и импровизировать, и в целом он более «адекватен» по сравнению с аналогичными AI-агентами, пишет VentureBeat.
В основе Meena лежит модель seq2seq на 2,6 млрд параметров. Диалоговую систему обучали на 40 млрд слов — или 341 Гб текстовых данных, включающих общедоступные фрагменты бесед пользователей соцсетей. Это в 8,5 раз больше, чем использовала OpenAI для тренировки модели GPT-2.
Также Google создала новую систему Sensibleness and Specificity Average (SSA) для оценки того, насколько уместны и естественны реплики диалоговых агентов в заданном контексте. Живые люди по этой системе набрали около 86%, Meena — 79%. Для сравнения, агент Mitsuku компании Pandora Bots, который последние 4 года получал Премию Лёбнера (приз в конкурсе «AI Loebner», в котором соревнуются программы в прохождении теста Тьюринга), показал 56%, а XiaoIce от Microsoft — 31%.
Разработчики Google пока не открыли Meena для сторонних исследователей. Но могут сделать это в ближайшие месяцы — после того, как убедятся в безопасности и непредвзятости модели, а также оценят потенциальную угрозу и пользу от такого шага. Научная работа о Meena опубликована на arXiv.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.