Презентация Grok 3: функции, тесты и сравнение с конкурентами.
Содержание:
Введение
Результаты тестов Grok 3
Новые функции Grok 3
Выводы
Введение
18 февраля 2025 года в 07:00 по МСК состоялся первый показ передового искусственного от компании xAI — Grok 3. На презентации, в которой участвовали члены команды xAI и Илон Маск, были продемонстрированы результаты тестирований Grok 3 в различных бенчмарках, а также показаны новые функции новейшей модели серии Grok. Команда xAI заявляет, что Grok 3 не только способна составить конкуренцию новейшим ИИ западных и китайских разработчиков, но и обходит их по производительности при выполнении различных задач. В этой статье мы разберем все нововведения модели Grok 3 и рассмотрим результаты тестов новой нейросети.
Преимущества и нововведения модели Grok 3. Источник: X.
Результаты тестов Grok 3
Согласно результатам тестирования Grok 3 в различных бенчмарках, новая модель действительно превосходит большинство нейросетей, которые считаются самыми передовыми решениями на рынке. Grok 3 смогла обойти таких ИИ-гигантов, как DeepSeek R1, Qwen 2.5 Max, ChatGPT 4o, Claude 3.5 Sonnet и даже недавно вышедшую ChatGPT-o3 mini в режиме high. Помимо этого, Grok 3 также превосходит различные передовые LLM от Google, включая Gemini Flash Thinking 2.0 и Gemini 2.0 Pro. Причем, Grok 3 превосходит вышеперечисленные ИИ как при решении стандартных операций (написание кода, математические вычисления), так и при выполнении задач, требующих размышления.
Результаты тестов Grok 3 в разных бенчмарках в сравнении с моделями Gemini-2 Pro, DeepSeek-V3, ChatGPT 4o и Claude 3.5 Sonnet. Источник: X.
Конечно, это лишь внутренние тестирования компании xAI, однако, в прямом эфире были наглядно показаны возможности передового чат-бота. Grok 3 написал код для сложнейшего моделирования окна полета шаттла от Земли до Марса и возвращения борта обратно, а также нейросеть за кратчайшее время сгенерировала код мини-игры в стиле тетриса и “три в ряд”. Если сравнивать новейший Grok 3 с предыдущими версиями этого семейства ИИ, то Grok 3 превосходит Grok 2 более чем в 10 раз.
Grok 3 сгенерировал код для компьютерного моделирования полета космического шаттла с Земли на Марс, с учетом обратного пути и технических нюансов. Источник: X.
Новые функции Grok 3
Grok 3 является размышляющей моделью ИИ — функцию продумывания ответов можно включить или выключить с помощью кнопки “Think” на поле ввода промптов. Благодаря новой возможности включения режима размышления, Grok 3 способна создавать более релевантные, обоснованные и, следовательно, точные ответы, что особенно важно при выполнении широкого спектра операций. Илон Маск также заявляет, что Grok 3 не только имеет выдающиеся способности в области рассуждения, но и демонстрирует “зачатки креативности”. Однако, в данный момент функция размышления полностью вышла только для версии Grok 3 mini — продумывание ответов в полноценной версии Grok 3 находится на этапе бета-теста и будет добавлена в ближайшем будущем.
Результаты тестирования Grok 3 в задачах размышления в сравнении с аналогичными моделями ИИ. Источник: X.
Как и в случае с ChatGPT o3 mini, Grok 3 тоже поддерживает настройку точности ответов — для получения более релевантных и точных результатов при больших затратах времени на генерацию достаточно включить функцию “Big Brain”. Этот режим работы рекомендуется для решения особо сложных задач, вроде генерации кода и математических вычислений.
Позиция модели Grok 3 (по мнению xAI) в сравнении с другими чат-ботами от известных разработчиков. Источник: X.
Также в Grok 3 появилась функция “DeepSearch”, с помощью которой ИИ будет выступать в роли браузера, выдавая релевантные ответы по запросу пользователя. Однако, в отличие от аналогичной возможности у других нейросетей, Grok 3 будет искать информацию по всему интернету, удобно структурируя ее для наиболее комфортного ознакомления. На “DeepSearch” данный момент также можно использовать только в Grok 3 mini. Ранее Илон Маск заявлял, что в Grok 3 будет добавлена возможность голосового ввода промптов, но эту функцию отменили перед запуском Grok 3 в целях доработки, так как голосовой режим пока не стабилен. Маск также пояснил, что Grok 3 будет дорабатываться ежедневно, поэтому функция голосового ввода должна появиться уже на следующей неделе. Среди других заявлений Маска стоит упомянуть, что в скором времени Grok 3 начнет поддерживать работу через API, а в ближайшие несколько месяцев компания xAI выложит исходный код Grok 2 в открытый доступ, благодаря чему модель прошлого поколения можно будет модифицировать и развертывать локально.
Всего за минуту чат-бот Grok 3 провел анализ более 70 веб-страниц в поисках релевантной информации с помощью функции DeepSearch. Источник: X.
Пока что получить доступ к передовой модели ИИ Grok 3 могут только подписчики тарифа X Premium+ за $30, но после полноценной доработки нового чат-бота, скорее всего, доступ станет бесплатным для всех пользователей X, хоть и с ограничением по количеству ежедневных запросов.
Выводы
Неудивительно, что модель Grok 3, хоть и по первичным результатам, демонстрирует столь высокие показатели производительности при решении различных операций — нейросеть разрабатывалась на мощностях суперкомпьютера Colossus с использованием 200 000 ИИ-ускорителей Nvidia H100. Но не стоит списывать компании конкурентов со счетов, ведь пока шла завершающая стадия разработки Grok 3, OpenAI уже успела анонсировать новые поколения моделей ChatGPT — GPT-4.5 и GPT-5. Вполне возможно, что эти новости вынудят сотрудников компании xAI подойти к доработке Grok 3 более комплексно, чтобы оставаться конкурентоспособными на фоне других передовых LLM от компаний-конкурентов.
18 февраля 2025 года в 07:00 по МСК состоялся первый показ передового искусственного от компании xAI — Grok 3. На презентации, в которой участвовали члены команды xAI и Илон Маск, были продемонстрированы результаты тестирований Grok 3 в различных бенчмарках, а также показаны новые функции новейшей модели серии Grok. Команда xAI заявляет, что Grok 3 не только способна составить конкуренцию новейшим ИИ западных и китайских разработчиков, но и обходит их по производительности при выполнении различных задач. В этой статье мы разберем все нововведения модели Grok 3 и рассмотрим результаты тестов новой нейросети.
Преимущества и нововведения модели Grok 3. Источник: X.
Результаты тестов Grok 3
Согласно результатам тестирования Grok 3 в различных бенчмарках, новая модель действительно превосходит большинство нейросетей, которые считаются самыми передовыми решениями на рынке. Grok 3 смогла обойти таких ИИ-гигантов, как DeepSeek R1, Qwen 2.5 Max, ChatGPT 4o, Claude 3.5 Sonnet и даже недавно вышедшую ChatGPT-o3 mini в режиме high. Помимо этого, Grok 3 также превосходит различные передовые LLM от Google, включая Gemini Flash Thinking 2.0 и Gemini 2.0 Pro. Причем, Grok 3 превосходит вышеперечисленные ИИ как при решении стандартных операций (написание кода, математические вычисления), так и при выполнении задач, требующих размышления.
Результаты тестов Grok 3 в разных бенчмарках в сравнении с моделями Gemini-2 Pro, DeepSeek-V3, ChatGPT 4o и Claude 3.5 Sonnet. Источник: X.
Конечно, это лишь внутренние тестирования компании xAI, однако, в прямом эфире были наглядно показаны возможности передового чат-бота. Grok 3 написал код для сложнейшего моделирования окна полета шаттла от Земли до Марса и возвращения борта обратно, а также нейросеть за кратчайшее время сгенерировала код мини-игры в стиле тетриса и “три в ряд”. Если сравнивать новейший Grok 3 с предыдущими версиями этого семейства ИИ, то Grok 3 превосходит Grok 2 более чем в 10 раз.
Grok 3 сгенерировал код для компьютерного моделирования полета космического шаттла с Земли на Марс, с учетом обратного пути и технических нюансов. Источник: X.
Новые функции Grok 3
Grok 3 является размышляющей моделью ИИ — функцию продумывания ответов можно включить или выключить с помощью кнопки “Think” на поле ввода промптов. Благодаря новой возможности включения режима размышления, Grok 3 способна создавать более релевантные, обоснованные и, следовательно, точные ответы, что особенно важно при выполнении широкого спектра операций. Илон Маск также заявляет, что Grok 3 не только имеет выдающиеся способности в области рассуждения, но и демонстрирует “зачатки креативности”. Однако, в данный момент функция размышления полностью вышла только для версии Grok 3 mini — продумывание ответов в полноценной версии Grok 3 находится на этапе бета-теста и будет добавлена в ближайшем будущем.
Результаты тестирования Grok 3 в задачах размышления в сравнении с аналогичными моделями ИИ. Источник: X.
Как и в случае с ChatGPT o3 mini, Grok 3 тоже поддерживает настройку точности ответов — для получения более релевантных и точных результатов при больших затратах времени на генерацию достаточно включить функцию “Big Brain”. Этот режим работы рекомендуется для решения особо сложных задач, вроде генерации кода и математических вычислений.
Позиция модели Grok 3 (по мнению xAI) в сравнении с другими чат-ботами от известных разработчиков. Источник: X.
Также в Grok 3 появилась функция “DeepSearch”, с помощью которой ИИ будет выступать в роли браузера, выдавая релевантные ответы по запросу пользователя. Однако, в отличие от аналогичной возможности у других нейросетей, Grok 3 будет искать информацию по всему интернету, удобно структурируя ее для наиболее комфортного ознакомления. На “DeepSearch” данный момент также можно использовать только в Grok 3 mini. Ранее Илон Маск заявлял, что в Grok 3 будет добавлена возможность голосового ввода промптов, но эту функцию отменили перед запуском Grok 3 в целях доработки, так как голосовой режим пока не стабилен. Маск также пояснил, что Grok 3 будет дорабатываться ежедневно, поэтому функция голосового ввода должна появиться уже на следующей неделе. Среди других заявлений Маска стоит упомянуть, что в скором времени Grok 3 начнет поддерживать работу через API, а в ближайшие несколько месяцев компания xAI выложит исходный код Grok 2 в открытый доступ, благодаря чему модель прошлого поколения можно будет модифицировать и развертывать локально.
Всего за минуту чат-бот Grok 3 провел анализ более 70 веб-страниц в поисках релевантной информации с помощью функции DeepSearch. Источник: X.
Пока что получить доступ к передовой модели ИИ Grok 3 могут только подписчики тарифа X Premium+ за $30, но после полноценной доработки нового чат-бота, скорее всего, доступ станет бесплатным для всех пользователей X, хоть и с ограничением по количеству ежедневных запросов.
Выводы
Неудивительно, что модель Grok 3, хоть и по первичным результатам, демонстрирует столь высокие показатели производительности при решении различных операций — нейросеть разрабатывалась на мощностях суперкомпьютера Colossus с использованием 200 000 ИИ-ускорителей Nvidia H100. Но не стоит списывать компании конкурентов со счетов, ведь пока шла завершающая стадия разработки Grok 3, OpenAI уже успела анонсировать новые поколения моделей ChatGPT — GPT-4.5 и GPT-5. Вполне возможно, что эти новости вынудят сотрудников компании xAI подойти к доработке Grok 3 более комплексно, чтобы оставаться конкурентоспособными на фоне других передовых LLM от компаний-конкурентов.
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Получите скидку 3 000 рублей или бесплатную доставку за подписку на новости*!
* — скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка.
Мы получили ваш отзыв!
Он появится на сайте после модерации.
Мы получили ваш отзыв!
Он появится на сайте после модерации.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.