Читатели в 🇵🇱, пожалуйста, поддержите dev.by своими налогами! Это просто и ничего не стоит
Support us

Meta выпустила ИИ-модели Llama 4 с «мультиэкспертной» архитектурой

Meta запустила новое семейство опенсорсных ИИ-моделей Llama 4. В него вошли три мультимодальные модели: Scout, Maverick и Behemoth, которые поддерживают не только текстовые запросы, но также обрабатывают изображения, видео и другой контент. Они обучались на огромном количестве немаркированных текстовых, графических и видеоданных.

Оставить комментарий
Meta выпустила ИИ-модели Llama 4 с «мультиэкспертной» архитектурой

Meta запустила новое семейство опенсорсных ИИ-моделей Llama 4. В него вошли три мультимодальные модели: Scout, Maverick и Behemoth, которые поддерживают не только текстовые запросы, но также обрабатывают изображения, видео и другой контент. Они обучались на огромном количестве немаркированных текстовых, графических и видеоданных.

Как отмечает TechCrunch, успех моделей DeepSeek, которые не хуже или даже лучше предыдущих поколений флагманских моделей Llama, заставил Meta ускорить разработку в этом направлении. А её сотрудники изо всех сил пытаются понять, как китайский стартап смог снизить стоимость разработки и запуска моделей R1 и V3.

Llama 4 Scout имеет 109 млрд параметров, включая 17 млрд активных и 16 «экспертных», и контекстное окно в 10 млн токенов. Meta утверждает, что она превосходит Gemma 3, Gemini 2.0 Flash-Lite и Mistral 3.1 в обработке разных типов задач.

Llama 4 Maverick имеет 400 млрд параметров, в том числе 17 млрд активных и 128 «экспертных». Контекстное окно — 1 млн токенов. По словам разработчиков, модель превосходит GPT-4o и Gemini 2.0 Flash на разных бенчмарках, а также сравнима с DeepSeek V3 в рассуждениях и написании кода.

Llama 4 Behemoth имеет около 2 трлн параметров, включая 288 млрд активных и 16 «экспертных». Она обгоняет на бенчмарках GPT-4.5, Claude Sonnet 3.7 и Gemini 2.0 Pro. Модель продолжает обучаться, поэтому пока публично не доступна. Scout и Maverick доступны на сайте llama.com и на Hugging Face.

Помимо этого, на Llama 4 в 40 странах мира переведён фирменный ИИ-помощник Meta AI, интегрированный в WhatsApp, Messenger и Instagram. Но обработка мультимодальных запросов пока ограничена английским языком и доступна только в США.

Llama 4 — первая линейка ИИ-моделей с «мультиэкспертной» архитектурой (mixture-of-experts, MoE), которая более эффективна при обучении и инференсе. Такая архитектура позволяет модели разбивать задачи на подзадачи, а затем делегировать их более мелким и специализированным «экспертным» моделям. При этом ни одна из моделей Llama 4 не является «рассуждающей», как GPT-o1 или GPT-o3-mini от OpenAI, которые перепроверяют свои ответы, прежде чем выдать их пользователю.

Meta выпустила Llama 3 — лучшую среди открытых моделей
Meta выпустила Llama 3 — лучшую среди открытых моделей
По теме
Meta выпустила Llama 3 — лучшую среди открытых моделей
Meta начала тестировать первые домашние чипы для тренировки ИИ
Meta начала тестировать первые домашние чипы для тренировки ИИ 
По теме
Meta начала тестировать первые домашние чипы для тренировки ИИ
OpenAI выпустит модель с открытыми весами чтобы догнать DeepSeek и Meta
OpenAI выпустит модель с открытыми весами, чтобы догнать DeepSeek и Meta
По теме
OpenAI выпустит модель с открытыми весами, чтобы догнать DeepSeek и Meta
Как поддержать редакцию, если вы в Польше?

Помогите нам делать больше полезного контента

Читайте также
Пять новых профессиональных сертификаций от Meta на Cousera
Пять новых профессиональных сертификаций от Meta на Cousera
Пять новых профессиональных сертификаций от Meta на Cousera
Meta расширяет свое партнерство с Coursera, предлагая пять новых профессиональных сертификаций в области разработки ПО. Во время растущего спроса на квалифицированные кадры получение этих сертификатов позволит претендовать на самые востребованные позиции. По прогнозам, только в США к 2030 году сфера разработки ПО вырастет на 22%.Новые программы от Meta предлагают подготовку по следующим специальностям: фронтенд-разработчик, бэкенд-разработчик, Android-разработчик, iOS-разработчик и дата-инженер.
4 комментария
Нейросеть «оживляет» классические пиксельные игры
Нейросеть «оживляет» классические пиксельные игры
Нейросеть «оживляет» классические пиксельные игры
Meta разработала ИИ для «чтения мыслей»
Meta разработала ИИ для «чтения мыслей»
Meta разработала ИИ для «чтения мыслей»
Соцсеть на мели: Meta хочет больше платных функций в Facebook, WhatsApp и Instagram
Соцсеть на мели: Meta хочет больше платных функций в Facebook, WhatsApp и Instagram
Соцсеть на мели: Meta хочет больше платных функций в Facebook, WhatsApp и Instagram
1 комментарий

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.