Презентация Grok 3: функции, тесты и сравнение с конкурентами.
Содержание:
Введение
Результаты тестов Grok 3
Новые функции Grok 3
Выводы
Введение
18 февраля 2025 года в 07:00 по МСК состоялся первый показ передового искусственного от компании xAI — Grok 3. На презентации, в которой участвовали члены команды xAI и Илон Маск, были продемонстрированы результаты тестирований Grok 3 в различных бенчмарках, а также показаны новые функции новейшей модели серии Grok. Команда xAI заявляет, что Grok 3 не только способна составить конкуренцию новейшим ИИ западных и китайских разработчиков, но и обходит их по производительности при выполнении различных задач. В этой статье мы разберем все нововведения модели Grok 3 и рассмотрим результаты тестов новой нейросети.
Преимущества и нововведения модели Grok 3. Источник: X.
Результаты тестов Grok 3
Согласно результатам тестирования Grok 3 в различных бенчмарках, новая модель действительно превосходит большинство нейросетей, которые считаются самыми передовыми решениями на рынке. Grok 3 смогла обойти таких ИИ-гигантов, как DeepSeek R1, Qwen 2.5 Max, ChatGPT 4o, Claude 3.5 Sonnet и даже недавно вышедшую ChatGPT-o3 mini в режиме high. Помимо этого, Grok 3 также превосходит различные передовые LLM от Google, включая Gemini Flash Thinking 2.0 и Gemini 2.0 Pro. Причем, Grok 3 превосходит вышеперечисленные ИИ как при решении стандартных операций (написание кода, математические вычисления), так и при выполнении задач, требующих размышления.
Результаты тестов Grok 3 в разных бенчмарках в сравнении с моделями Gemini-2 Pro, DeepSeek-V3, ChatGPT 4o и Claude 3.5 Sonnet. Источник: X.
Конечно, это лишь внутренние тестирования компании xAI, однако, в прямом эфире были наглядно показаны возможности передового чат-бота. Grok 3 написал код для сложнейшего моделирования окна полета шаттла от Земли до Марса и возвращения борта обратно, а также нейросеть за кратчайшее время сгенерировала код мини-игры в стиле тетриса и “три в ряд”. Если сравнивать новейший Grok 3 с предыдущими версиями этого семейства ИИ, то Grok 3 превосходит Grok 2 более чем в 10 раз.
Grok 3 сгенерировал код для компьютерного моделирования полета космического шаттла с Земли на Марс, с учетом обратного пути и технических нюансов. Источник: X.
Новые функции Grok 3
Grok 3 является размышляющей моделью ИИ — функцию продумывания ответов можно включить или выключить с помощью кнопки “Think” на поле ввода промптов. Благодаря новой возможности включения режима размышления, Grok 3 способна создавать более релевантные, обоснованные и, следовательно, точные ответы, что особенно важно при выполнении широкого спектра операций. Илон Маск также заявляет, что Grok 3 не только имеет выдающиеся способности в области рассуждения, но и демонстрирует “зачатки креативности”. Однако, в данный момент функция размышления полностью вышла только для версии Grok 3 mini — продумывание ответов в полноценной версии Grok 3 находится на этапе бета-теста и будет добавлена в ближайшем будущем.
Результаты тестирования Grok 3 в задачах размышления в сравнении с аналогичными моделями ИИ. Источник: X.
Как и в случае с ChatGPT o3 mini, Grok 3 тоже поддерживает настройку точности ответов — для получения более релевантных и точных результатов при больших затратах времени на генерацию достаточно включить функцию “Big Brain”. Этот режим работы рекомендуется для решения особо сложных задач, вроде генерации кода и математических вычислений.
Позиция модели Grok 3 (по мнению xAI) в сравнении с другими чат-ботами от известных разработчиков. Источник: X.
Также в Grok 3 появилась функция “DeepSearch”, с помощью которой ИИ будет выступать в роли браузера, выдавая релевантные ответы по запросу пользователя. Однако, в отличие от аналогичной возможности у других нейросетей, Grok 3 будет искать информацию по всему интернету, удобно структурируя ее для наиболее комфортного ознакомления. На “DeepSearch” данный момент также можно использовать только в Grok 3 mini. Ранее Илон Маск заявлял, что в Grok 3 будет добавлена возможность голосового ввода промптов, но эту функцию отменили перед запуском Grok 3 в целях доработки, так как голосовой режим пока не стабилен. Маск также пояснил, что Grok 3 будет дорабатываться ежедневно, поэтому функция голосового ввода должна появиться уже на следующей неделе. Среди других заявлений Маска стоит упомянуть, что в скором времени Grok 3 начнет поддерживать работу через API, а в ближайшие несколько месяцев компания xAI выложит исходный код Grok 2 в открытый доступ, благодаря чему модель прошлого поколения можно будет модифицировать и развертывать локально.
Всего за минуту чат-бот Grok 3 провел анализ более 70 веб-страниц в поисках релевантной информации с помощью функции DeepSearch. Источник: X.
Пока что получить доступ к передовой модели ИИ Grok 3 могут только подписчики тарифа X Premium+ за $30, но после полноценной доработки нового чат-бота, скорее всего, доступ станет бесплатным для всех пользователей X, хоть и с ограничением по количеству ежедневных запросов.
Выводы
Неудивительно, что модель Grok 3, хоть и по первичным результатам, демонстрирует столь высокие показатели производительности при решении различных операций — нейросеть разрабатывалась на мощностях суперкомпьютера Colossus с использованием 200 000 ИИ-ускорителей Nvidia H100. Но не стоит списывать компании конкурентов со счетов, ведь пока шла завершающая стадия разработки Grok 3, OpenAI уже успела анонсировать новые поколения моделей ChatGPT — GPT-4.5 и GPT-5. Вполне возможно, что эти новости вынудят сотрудников компании xAI подойти к доработке Grok 3 более комплексно, чтобы оставаться конкурентоспособными на фоне других передовых LLM от компаний-конкурентов.
18 февраля 2025 года в 07:00 по МСК состоялся первый показ передового искусственного от компании xAI — Grok 3. На презентации, в которой участвовали члены команды xAI и Илон Маск, были продемонстрированы результаты тестирований Grok 3 в различных бенчмарках, а также показаны новые функции новейшей модели серии Grok. Команда xAI заявляет, что Grok 3 не только способна составить конкуренцию новейшим ИИ западных и китайских разработчиков, но и обходит их по производительности при выполнении различных задач. В этой статье мы разберем все нововведения модели Grok 3 и рассмотрим результаты тестов новой нейросети.
Преимущества и нововведения модели Grok 3. Источник: X.
Результаты тестов Grok 3
Согласно результатам тестирования Grok 3 в различных бенчмарках, новая модель действительно превосходит большинство нейросетей, которые считаются самыми передовыми решениями на рынке. Grok 3 смогла обойти таких ИИ-гигантов, как DeepSeek R1, Qwen 2.5 Max, ChatGPT 4o, Claude 3.5 Sonnet и даже недавно вышедшую ChatGPT-o3 mini в режиме high. Помимо этого, Grok 3 также превосходит различные передовые LLM от Google, включая Gemini Flash Thinking 2.0 и Gemini 2.0 Pro. Причем, Grok 3 превосходит вышеперечисленные ИИ как при решении стандартных операций (написание кода, математические вычисления), так и при выполнении задач, требующих размышления.
Результаты тестов Grok 3 в разных бенчмарках в сравнении с моделями Gemini-2 Pro, DeepSeek-V3, ChatGPT 4o и Claude 3.5 Sonnet. Источник: X.
Конечно, это лишь внутренние тестирования компании xAI, однако, в прямом эфире были наглядно показаны возможности передового чат-бота. Grok 3 написал код для сложнейшего моделирования окна полета шаттла от Земли до Марса и возвращения борта обратно, а также нейросеть за кратчайшее время сгенерировала код мини-игры в стиле тетриса и “три в ряд”. Если сравнивать новейший Grok 3 с предыдущими версиями этого семейства ИИ, то Grok 3 превосходит Grok 2 более чем в 10 раз.
Grok 3 сгенерировал код для компьютерного моделирования полета космического шаттла с Земли на Марс, с учетом обратного пути и технических нюансов. Источник: X.
Новые функции Grok 3
Grok 3 является размышляющей моделью ИИ — функцию продумывания ответов можно включить или выключить с помощью кнопки “Think” на поле ввода промптов. Благодаря новой возможности включения режима размышления, Grok 3 способна создавать более релевантные, обоснованные и, следовательно, точные ответы, что особенно важно при выполнении широкого спектра операций. Илон Маск также заявляет, что Grok 3 не только имеет выдающиеся способности в области рассуждения, но и демонстрирует “зачатки креативности”. Однако, в данный момент функция размышления полностью вышла только для версии Grok 3 mini — продумывание ответов в полноценной версии Grok 3 находится на этапе бета-теста и будет добавлена в ближайшем будущем.
Результаты тестирования Grok 3 в задачах размышления в сравнении с аналогичными моделями ИИ. Источник: X.
Как и в случае с ChatGPT o3 mini, Grok 3 тоже поддерживает настройку точности ответов — для получения более релевантных и точных результатов при больших затратах времени на генерацию достаточно включить функцию “Big Brain”. Этот режим работы рекомендуется для решения особо сложных задач, вроде генерации кода и математических вычислений.
Позиция модели Grok 3 (по мнению xAI) в сравнении с другими чат-ботами от известных разработчиков. Источник: X.
Также в Grok 3 появилась функция “DeepSearch”, с помощью которой ИИ будет выступать в роли браузера, выдавая релевантные ответы по запросу пользователя. Однако, в отличие от аналогичной возможности у других нейросетей, Grok 3 будет искать информацию по всему интернету, удобно структурируя ее для наиболее комфортного ознакомления. На “DeepSearch” данный момент также можно использовать только в Grok 3 mini. Ранее Илон Маск заявлял, что в Grok 3 будет добавлена возможность голосового ввода промптов, но эту функцию отменили перед запуском Grok 3 в целях доработки, так как голосовой режим пока не стабилен. Маск также пояснил, что Grok 3 будет дорабатываться ежедневно, поэтому функция голосового ввода должна появиться уже на следующей неделе. Среди других заявлений Маска стоит упомянуть, что в скором времени Grok 3 начнет поддерживать работу через API, а в ближайшие несколько месяцев компания xAI выложит исходный код Grok 2 в открытый доступ, благодаря чему модель прошлого поколения можно будет модифицировать и развертывать локально.
Всего за минуту чат-бот Grok 3 провел анализ более 70 веб-страниц в поисках релевантной информации с помощью функции DeepSearch. Источник: X.
Пока что получить доступ к передовой модели ИИ Grok 3 могут только подписчики тарифа X Premium+ за $30, но после полноценной доработки нового чат-бота, скорее всего, доступ станет бесплатным для всех пользователей X, хоть и с ограничением по количеству ежедневных запросов.
Выводы
Неудивительно, что модель Grok 3, хоть и по первичным результатам, демонстрирует столь высокие показатели производительности при решении различных операций — нейросеть разрабатывалась на мощностях суперкомпьютера Colossus с использованием 200 000 ИИ-ускорителей Nvidia H100. Но не стоит списывать компании конкурентов со счетов, ведь пока шла завершающая стадия разработки Grok 3, OpenAI уже успела анонсировать новые поколения моделей ChatGPT — GPT-4.5 и GPT-5. Вполне возможно, что эти новости вынудят сотрудников компании xAI подойти к доработке Grok 3 более комплексно, чтобы оставаться конкурентоспособными на фоне других передовых LLM от компаний-конкурентов.
14.03 2025
Глава OpenAI Сэм Альтман: Путь от стартапа до ChatGPT и мирового лидерства в области ИИ
Статьи
13.03 2025
Gemma 3 27b: Тест Лучшей Локальной ИИ 2024 — Установка, Сравнение с DeepSeek R1, Плюсы и Минусы
Получите скидку 3 000 рублей или бесплатную доставку за подписку на новости*!
* — скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка.
Мы получили ваш отзыв!
Он появится на сайте после модерации.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.