OpenAI представила GPT-5.4: флагман с приростом производительности и новыми режимами работы

06.03.2026

~ 2 мин

115

Простой

Новости

Введение

Компания OpenAI выпустила GPT-5.4 — новую флагманскую модель, которая объединяет в себе функционал универсальной нейросети GPT-5.2 и специализированной LLM GPT-5.3-Codex. Главное нововведение — новый режим computer use, который позволяет GPT-5.4 работать в роли ИИ-агента, взаимодействуя с программами через графический интерфейс, читая скриншоты, заполняя формы и выполняя другие сложные действия. Новая модель уже стала основной по умолчанию в веб-приложении ChatGPT и API, а подписчики Pro получют ранний доступ к более продвинутой модели GPT-5.4-pro.

Подробнее о GPT-5.4

GPT-5.4 получила расширенное контекстное окно в 1,05 миллиона токенов — это примерно в 2,5 раза больше, чем у предыдущей универсальной модели GPT-5.2. При этом флагманская GPT-5.4 расходует значительно меньше токенов на выполнение типовых задач: в API всего $2,5 за миллион входных токенов и $15 за миллион выходных, а для версии Pro — $30 и $180 соответственно. Но ключевая особенность новой модели — режим computer use, позволяющий модели работать с программами компьютера автономно. В дополнение к этому появилась система tool search, которая дает модели возможность динамически использовать инструменты по запросу, а не использовать их все сразу. Это экономит токены и повышает точность выбора нужного инструмента в сложных агентных сценариях.

В отличие от предыдущего релиза “разговорной” модели GPT-5.3, новая модель GPT-5.4 предлагает заметный прирост в агентных сценариях. В бенчмарке OSWorld-Verified точность выросла с 47,3% до 75%, в тесте BrowseComp производительность увеличилась с 65,8% до 82,7%, на GDPval — с 70,9% до 83%. Прирост на SWE-Bench Pro скромнее — с 55,6% до 57,7%. Модель также стала точнее в пользовательских ответах: доля ложных утверждений снизилась на 33%, а ответов с ошибками — на 18%.

Помимо этого, был введен новый уровень рассуждений под названием xhigh — “экстремальное мышление”, при котором модель тратит значительно больше вычислительных ресурсов на сложные задачи, но выполняет их гораздо точнее. Кроме того, GPT-5.4 поддерживает компакцию — сжатие контекста для длительных агентских сессий, чтобы важная информация не терялась в многоэтапных сценариях. Также в ChatGPT добавили функцию предварительного отображения плана действий перед выполнением сложного запроса в версии Thinking: пользователь может скорректировать направление прямо по ходу, не дожидаясь готового ответа.

Производительность GPT-5.4 в сравнении с предыдущими ИИ-моделями OpenAI. Источник: OpenAI.

Выводы

Похоже, что с выходом GPT-5.4 OpenAI делает ставку именно на агентные сценарии использования, выставляя его как на основной вектор развития своей ИИ-экосистемы. Возможность управлять компьютером превращает модель из просто генератора текста и изображений в полноценного исполнителя задач вне API-интеграций, способного работать с любым софтом и любыми задачами. Увеличенный контекст и компакция позволяют разворачивать длительные сессии без потери качества, а новые инструменты выбора функций делают агентов точнее и экономнее. По сути, OpenAI заявляет: будущее ИИ — за агентами, которые не просто отвечают, а действуют.

Автор:

Serverflow