Отдел новостей world 7 апреля 2025, 14:08

Meta выпустила ИИ-модели Llama 4 с «мультиэкспертной» архитектурой

Meta запустила новое семейство опенсорсных ИИ-моделей Llama 4. В него вошли три мультимодальные модели: Scout, Maverick и Behemoth, которые поддерживают не только текстовые запросы, но также обрабатывают изображения, видео и другой контент. Они обучались на огромном количестве немаркированных текстовых, графических и видеоданных.

Оставить комментарий

Meta выпустила ИИ-модели Llama 4 с «мультиэкспертной» архитектурой

Meta запустила новое семейство опенсорсных ИИ-моделей Llama 4. В него вошли три мультимодальные модели: Scout, Maverick и Behemoth, которые поддерживают не только текстовые запросы, но также обрабатывают изображения, видео и другой контент. Они обучались на огромном количестве немаркированных текстовых, графических и видеоданных.

Как отмечает TechCrunch, успех моделей DeepSeek, которые не хуже или даже лучше предыдущих поколений флагманских моделей Llama, заставил Meta ускорить разработку в этом направлении. А её сотрудники изо всех сил пытаются понять, как китайский стартап смог снизить стоимость разработки и запуска моделей R1 и V3.

Llama 4 Scout имеет 109 млрд параметров, включая 17 млрд активных и 16 «экспертных», и контекстное окно в 10 млн токенов. Meta утверждает, что она превосходит Gemma 3, Gemini 2.0 Flash-Lite и Mistral 3.1 в обработке разных типов задач.

Llama 4 Maverick имеет 400 млрд параметров, в том числе 17 млрд активных и 128 «экспертных». Контекстное окно — 1 млн токенов. По словам разработчиков, модель превосходит GPT-4o и Gemini 2.0 Flash на разных бенчмарках, а также сравнима с DeepSeek V3 в рассуждениях и написании кода.

Llama 4 Behemoth имеет около 2 трлн параметров, включая 288 млрд активных и 16 «экспертных». Она обгоняет на бенчмарках GPT-4.5, Claude Sonnet 3.7 и Gemini 2.0 Pro. Модель продолжает обучаться, поэтому пока публично не доступна. Scout и Maverick доступны на сайте llama.com и на Hugging Face.

Помимо этого, на Llama 4 в 40 странах мира переведён фирменный ИИ-помощник Meta AI, интегрированный в WhatsApp, Messenger и Instagram. Но обработка мультимодальных запросов пока ограничена английским языком и доступна только в США.

Llama 4 — первая линейка ИИ-моделей с «мультиэкспертной» архитектурой (mixture-of-experts, MoE), которая более эффективна при обучении и инференсе. Такая архитектура позволяет модели разбивать задачи на подзадачи, а затем делегировать их более мелким и специализированным «экспертным» моделям. При этом ни одна из моделей Llama 4 не является «рассуждающей», как GPT-o1 или GPT-o3-mini от OpenAI, которые перепроверяют свои ответы, прежде чем выдать их пользователю.

Meta выпустила Llama 3 — лучшую среди открытых моделей

Meta начала тестировать первые домашние чипы для тренировки ИИ

OpenAI выпустит модель с открытыми весами чтобы догнать DeepSeek и Meta

Оставить комментарий

Текст: Отдел новостей Фото: Dima Solomin / Unsplash Источник: TechCrunch Теги: llama, meta, искусственный интеллект, модели

Нашли ошибку в тексте-выделите ее и нажмите Ctrl+Enter. Нашли ошибку в тексте-выделите ее и нажмите кнопку «Сообщить об ошибке»."

Сайт компании Вакансии

Размещение рекламы

Пять новых профессиональных сертификаций от Meta на Cousera

Meta расширяет свое партнерство с Coursera, предлагая пять новых профессиональных сертификаций в области разработки ПО. Во время растущего спроса на квалифицированные кадры получение этих сертификатов позволит претендовать на самые востребованные позиции. По прогнозам, только в США к 2030 году сфера разработки ПО вырастет на 22%.Новые программы от Meta предлагают подготовку по следующим специальностям: фронтенд-разработчик, бэкенд-разработчик, Android-разработчик, iOS-разработчик и дата-инженер.

4 комментария