Отдел новостей 19 февраля 2025, 18:22

Впечатляет, но не лучше OpenAI: первые отзывы экспертов о новом чат-боте Маска

Вчера стартап xAI Илона Маска выпустил модель Grok 3, которая, по его словам, превосходит флагманскую GPT-4o от OpenAI и не уступает конкурентам от Google, DeepSeek и Anthropic на ключевых бенчмарках с задачами по математике, наукам и программированию. Разработчики также заявили, что она «на порядок способнее» своей предшественницы. Первая реакция экспертов и исследователей ИИ, которые опробовали новинку, оказалась смешанной, пишет Business Insider.

Оставить комментарий

Впечатляет, но не лучше OpenAI: первые отзывы экспертов о новом чат-боте Маска

Вчера стартап xAI Илона Маска выпустил модель Grok 3, которая, по его словам, превосходит флагманскую GPT-4o от OpenAI и не уступает конкурентам от Google, DeepSeek и Anthropic на ключевых бенчмарках с задачами по математике, наукам и программированию. Разработчики также заявили, что она «на порядок способнее» своей предшественницы. Первая реакция экспертов и исследователей ИИ, которые опробовали новинку, оказалась смешанной, пишет Business Insider.

Сооснователь OpenAI и экс-директор по ИИ в Tesla Андрей Карпатый отметил, что Grok 3, например, хорошо справляется с поиском сложной информации в документах, но у него, как и у o1-pro, возникли проблемы со сложными раскладками в игре крестики-нолики. В целом, отмечает Карпатый, Grok 3 примерно на уровне o1-pro и лучше R1 от DeepSeek, но для более точного сравнения нужно больше тестов. По поводу вышедшего вместе с обновлённым чат-ботом инструмента DeepSearch для углубленных исследований Карпатый сказал, что он примерно на уровне своего аналога от Perplexity, но не дотягивает до OpenAI — DeepSearch компании Сэма Альтмана кажется ему более скрупулёзным и надёжным.

I was given early access to Grok 3 earlier today, making me I think one of the first few who could run a quick vibe check.

Thinking
✅ First, Grok 3 clearly has an around state of the art thinking model («Think» button) and did great out of the box on my Settler’s of Catan… pic.twitter.com/qIrUAN1IfD
— Andrej Karpathy (@karpathy) February 18, 2025

ИИ-исследователь и профессор Пенсильванского университета Итан Моллик считает, что xAI очень быстро растёт, но модель Grok 3 пока точно не лучшая на рынке. Он отметил, что Grok 3 превосходит некоторые модели OpenAI на ряде бенчмарков, но не модель o3.

Учёный и основатель компании Geometric Intelligence Гэри Маркус, который критикует хайп вокруг ИИ, настроен к Grok 3 скептично. В посте на Substack он намекнул, что Маск, который обещал «самый умный ИИ на планете», соврал, а релиз назвал компиляцией выпущенных ранее демоверсий. Маркус добавил, что Grok 3 — действительно шаг вперёд по сравнению с прошлой версией, но что по мощности он ничем не лучше моделей OpenAI.

Карпатый был более благосклонен к Grok 3 — он назвал выдающейся способность бота рассуждать и отметил, что бот классно решает сложные задачи по кодингу.

Моллик отметил, что Grok 3 — достойная модель, но OpenAI уверенно лидирует по количеству корпоративных клиентов и масштабам внедрения. Маркус считает, что OpenAI пока может спать спокойно, потому что прорыва не произошло, а также потому, что конкурентам пока не сравниться с ней по масштабам доступа к вычислительным мощностям и проводимых исследований.