Официальный релиз умнейшего ИИ Grok 3 от xAI

18.02.2025

~ 3 мин

1497

Простой

Новости

Содержание:

Введение
Результаты тестов Grok 3
Новые функции Grok 3
Выводы

Введение

18 февраля 2025 года в 07:00 по МСК состоялся первый показ передового искусственного от компании xAI — Grok 3. На презентации, в которой участвовали члены команды xAI и Илон Маск, были продемонстрированы результаты тестирований Grok 3 в различных бенчмарках, а также показаны новые функции новейшей модели серии Grok. Команда xAI заявляет, что Grok 3 не только способна составить конкуренцию новейшим ИИ западных и китайских разработчиков, но и обходит их по производительности при выполнении различных задач. В этой статье мы разберем все нововведения модели Grok 3 и рассмотрим результаты тестов новой нейросети.

Преимущества и нововведения модели Grok 3. Источник: X.

Результаты тестов Grok 3

Согласно результатам тестирования Grok 3 в различных бенчмарках, новая модель действительно превосходит большинство нейросетей, которые считаются самыми передовыми решениями на рынке. Grok 3 смогла обойти таких ИИ-гигантов, как DeepSeek R1, Qwen 2.5 Max, ChatGPT 4o, Claude 3.5 Sonnet и даже недавно вышедшую ChatGPT-o3 mini в режиме high. Помимо этого, Grok 3 также превосходит различные передовые LLM от Google, включая Gemini Flash Thinking 2.0 и Gemini 2.0 Pro. Причем, Grok 3 превосходит вышеперечисленные ИИ как при решении стандартных операций (написание кода, математические вычисления), так и при выполнении задач, требующих размышления.

Результаты тестов Grok 3 в разных бенчмарках в сравнении с моделями Gemini-2 Pro, DeepSeek-V3, ChatGPT 4o и Claude 3.5 Sonnet. Источник: X.

Конечно, это лишь внутренние тестирования компании xAI, однако, в прямом эфире были наглядно показаны возможности передового чат-бота. Grok 3 написал код для сложнейшего моделирования окна полета шаттла от Земли до Марса и возвращения борта обратно, а также нейросеть за кратчайшее время сгенерировала код мини-игры в стиле тетриса и “три в ряд”. Если сравнивать новейший Grok 3 с предыдущими версиями этого семейства ИИ, то Grok 3 превосходит Grok 2 более чем в 10 раз.

Grok 3 создал код для моделирования окна полета межпланетного шаттла

Grok 3 сгенерировал код для компьютерного моделирования полета космического шаттла с Земли на Марс, с учетом обратного пути и технических нюансов. Источник: X.

Новые функции Grok 3

Grok 3 является размышляющей моделью ИИ — функцию продумывания ответов можно включить или выключить с помощью кнопки “Think” на поле ввода промптов. Благодаря новой возможности включения режима размышления, Grok 3 способна создавать более релевантные, обоснованные и, следовательно, точные ответы, что особенно важно при выполнении широкого спектра операций. Илон Маск также заявляет, что Grok 3 не только имеет выдающиеся способности в области рассуждения, но и демонстрирует “зачатки креативности”. Однако, в данный момент функция размышления полностью вышла только для версии Grok 3 mini — продумывание ответов в полноценной версии Grok 3 находится на этапе бета-теста и будет добавлена в ближайшем будущем.

Результаты тестирования Grok 3 в задачах размышления в сравнении с аналогичными моделями ИИ. Источник: X.

Как и в случае с ChatGPT o3 mini, Grok 3 тоже поддерживает настройку точности ответов — для получения более релевантных и точных результатов при больших затратах времени на генерацию достаточно включить функцию “Big Brain”. Этот режим работы рекомендуется для решения особо сложных задач, вроде генерации кода и математических вычислений.

Позиция модели Grok 3 (по мнению xAI) в сравнении с другими чат-ботами от известных разработчиков. Источник: X.

Также в Grok 3 появилась функция “DeepSearch”, с помощью которой ИИ будет выступать в роли браузера, выдавая релевантные ответы по запросу пользователя. Однако, в отличие от аналогичной возможности у других нейросетей, Grok 3 будет искать информацию по всему интернету, удобно структурируя ее для наиболее комфортного ознакомления. На “DeepSearch” данный момент также можно использовать только в Grok 3 mini. Ранее Илон Маск заявлял, что в Grok 3 будет добавлена возможность голосового ввода промптов, но эту функцию отменили перед запуском Grok 3 в целях доработки, так как голосовой режим пока не стабилен. Маск также пояснил, что Grok 3 будет дорабатываться ежедневно, поэтому функция голосового ввода должна появиться уже на следующей неделе. Среди других заявлений Маска стоит упомянуть, что в скором времени Grok 3 начнет поддерживать работу через API, а в ближайшие несколько месяцев компания xAI выложит исходный код Grok 2 в открытый доступ, благодаря чему модель прошлого поколения можно будет модифицировать и развертывать локально.

Чат-бот Grok 3 провел анализ более 70 веб-страниц за 1 минуту

Всего за минуту чат-бот Grok 3 провел анализ более 70 веб-страниц в поисках релевантной информации с помощью функции DeepSearch. Источник: X.

Пока что получить доступ к передовой модели ИИ Grok 3 могут только подписчики тарифа X Premium+ за $30, но после полноценной доработки нового чат-бота, скорее всего, доступ станет бесплатным для всех пользователей X, хоть и с ограничением по количеству ежедневных запросов.

Выводы

Неудивительно, что модель Grok 3, хоть и по первичным результатам, демонстрирует столь высокие показатели производительности при решении различных операций — нейросеть разрабатывалась на мощностях суперкомпьютера Colossus с использованием 200 000 ИИ-ускорителей Nvidia H100. Но не стоит списывать компании конкурентов со счетов, ведь пока шла завершающая стадия разработки Grok 3, OpenAI уже успела анонсировать новые поколения моделей ChatGPT — GPT-4.5 и GPT-5. Вполне возможно, что эти новости вынудят сотрудников компании xAI подойти к доработке Grok 3 более комплексно, чтобы оставаться конкурентоспособными на фоне других передовых LLM от компаний-конкурентов.

Автор:

Serverflow

Официальный релиз умнейшего ИИ Grok 3 от xAI

Введение

Результаты тестов Grok 3

Новые функции Grok 3

Выводы

Комментарии 0