Mistral выпустил первую мультимодальную нейросеть
Французский стартап выпустил свою первую мультимодальную ИИ-модель Pixtral 12B, которая способна обрабатывать изображения и текст.
Размер модели — около 24 ГБ, она имеет 12 миллиардов параметров. Например, у самой большой ИИ-модели Llama 3.1 405B разработки Meta сейчас 405 миллиардов параметров.
Подобно другим мультимодальным моделям, таким как семейство Claude от Anthropic и GPT-4o от OpenAI, Pixtral 12B может выполнять такие задачи, как подписи к изображениям и подсчет количества объектов на фотографии.
Pixtral 12B создали на основе одной из текстовых нейросетей Nemo 12B. Ее можно загрузить на GitHub и Hugging Face, также она станет доступна в чат-боте Mistral.
Ранее стартап представил Codestral — модель для генерации кода. Компания в 2023 году привлекла 385 миллионов евро инвестиций, в 2024 году — еще 600 миллионов. Среди акционеров стартапа числится Microsoft.
Читать на dev.by