Впечатляет, но не лучше OpenAI: первые отзывы экспертов о новом чат-боте Маска

Вчера стартап xAI Илона Маска выпустил модель Grok 3, которая, по его словам, превосходит флагманскую GPT-4o от OpenAI и не уступает конкурентам от Google, DeepSeek и Anthropic на ключевых бенчмарках с задачами по математике, наукам и программированию. Разработчики также заявили, что она «на порядок способнее» своей предшественницы. Первая реакция экспертов и исследователей ИИ, которые опробовали новинку, оказалась смешанной, пишет Business Insider.

Оставить комментарий

Сооснователь OpenAI и экс-директор по ИИ в Tesla Андрей Карпатый отметил, что Grok 3, например, хорошо справляется с поиском сложной информации в документах, но у него, как и у o1-pro, возникли проблемы со сложными раскладками в игре крестики-нолики. В целом, отмечает Карпатый, Grok 3 примерно на уровне o1-pro и лучше R1 от DeepSeek, но для более точного сравнения нужно больше тестов. По поводу вышедшего вместе с обновлённым чат-ботом инструмента DeepSearch для углубленных исследований Карпатый сказал, что он примерно на уровне своего аналога от Perplexity, но не дотягивает до OpenAI — DeepSearch компании Сэма Альтмана кажется ему более скрупулёзным и надёжным.

ИИ-исследователь и профессор Пенсильванского университета Итан Моллик считает, что xAI очень быстро растёт, но модель Grok 3 пока точно не лучшая на рынке. Он отметил, что Grok 3 превосходит некоторые модели OpenAI на ряде бенчмарков, но не модель o3.

Учёный и основатель компании Geometric Intelligence Гэри Маркус, который критикует хайп вокруг ИИ, настроен к Grok 3 скептично. В посте на Substack он намекнул, что Маск, который обещал «самый умный ИИ на планете», соврал, а релиз назвал компиляцией выпущенных ранее демоверсий. Маркус добавил, что Grok 3 — действительно шаг вперёд по сравнению с прошлой версией, но что по мощности он ничем не лучше моделей OpenAI. 

Карпатый был более благосклонен к Grok 3 — он назвал выдающейся способность бота рассуждать и отметил, что бот классно решает сложные задачи по кодингу.

Моллик отметил, что Grok 3 — достойная модель, но OpenAI уверенно лидирует по количеству корпоративных клиентов и масштабам внедрения. Маркус считает, что OpenAI пока может спать спокойно, потому что прорыва не произошло, а также потому, что конкурентам пока не сравниться с ней по масштабам доступа к вычислительным мощностям и проводимых исследований.

Маск завтра представит «самый умный ИИ на Земле»
По теме
Маск завтра представит «самый умный ИИ на Земле»
Почти бесплатный и почти не хуже: Perplexity запустил аналог инструмента OpenAI для углубленных исследований в сети
По теме
Почти бесплатный и почти не хуже: Perplexity запустил аналог инструмента OpenAI для углубленных исследований в сети
Маск хочет купить OpenAI за $100 млрд. Альтман в ответ предложил купить Х в 10 раз дешевле
По теме
Маск хочет купить OpenAI за $100 млрд. Альтман в ответ предложил купить Х в 10 раз дешевле
«‎Маск — обманщик»:‎ на Youtube выложили видео c невыполненными обещаниями главы Tesla
По теме
«‎Маск — обманщик»:‎ на Youtube выложили видео c невыполненными обещаниями главы Tesla

Читать на dev.by