Mistral AI и Nvidia представили корпоративную ИИ-модель со здравым смыслом и знаниями о мире
Французский стартап Mistral AI и Nvidia представили новую языковую модель Mistral NeMo 12B, которую легко кастомизировать для решения различных корпоративных задач — например, для чат-ботов, обработки данных, программирования и прочего.
Модель насчитывает 12 млрд параметров и обладает контекстным окном в 12 тысяч токенов. Разработчики утверждают, что она отличается точностью, гибкостью, высокой эффективностью, а также качественной поддержкой и безопасностью.
Применение формата данных FP8 для инференса позволило уменьшить размер требуемой памяти и ускорить развёртывание модели без ущерба для точности ответов. Mistral NeMo выпущена под лицензией Apache 2.0. Разработчики уверяют, что на её внедрение потребуются не дни, а минуты.
По их словам, модель отлично справляется с длинными диалогами, математическими задачами и программированием, способна рассуждать на основе здравого смысла и обладает знаниями о мире. Благодаря этому она может иметь очень широкий круг применения.
Читать на dev.by