OpenAI представила GPT-5.4: флагман с приростом производительности и новыми режимами работы | Блог Serverflow Скачать
прайс-лист
Бесплатная
доставка по РФ
Бонус за
обратную связь
Временные трудности с загрузкой Корзины. Напишите менеджеру в Онлайн-чат или оставьте заявку через форму.
Интернет-магазин
Серверного оборудования
8 (800) 222-70-01 Консультация IT-специалиста Сравнение

OpenAI представила GPT-5.4: флагман с приростом производительности и новыми режимами работы

~ 2 мин
115
Простой
Новости
OpenAI представила GPT-5.4: флагман с приростом производительности и новыми режимами работы

Введение

Компания OpenAI выпустила GPT-5.4 — новую флагманскую модель, которая объединяет в себе функционал универсальной нейросети GPT-5.2 и специализированной LLM GPT-5.3-Codex. Главное нововведение — новый режим computer use, который позволяет GPT-5.4 работать в роли ИИ-агента, взаимодействуя с программами через графический интерфейс, читая скриншоты, заполняя формы и выполняя другие сложные действия. Новая модель уже стала основной по умолчанию в веб-приложении ChatGPT и API, а подписчики Pro получют ранний доступ к более продвинутой модели GPT-5.4-pro.

Подробнее о GPT-5.4

GPT-5.4 получила расширенное контекстное окно в 1,05 миллиона токенов — это примерно в 2,5 раза больше, чем у предыдущей универсальной модели GPT-5.2. При этом флагманская GPT-5.4 расходует значительно меньше токенов на выполнение типовых задач: в API всего $2,5 за миллион входных токенов и $15 за миллион выходных, а для версии Pro — $30 и $180 соответственно. Но ключевая особенность новой модели — режим computer use, позволяющий модели работать с программами компьютера автономно. В дополнение к этому появилась система tool search, которая дает модели возможность динамически использовать инструменты по запросу, а не использовать их все сразу. Это экономит токены и повышает точность выбора нужного инструмента в сложных агентных сценариях.

В отличие от предыдущего релиза “разговорной” модели GPT-5.3, новая модель GPT-5.4 предлагает заметный прирост в агентных сценариях. В бенчмарке OSWorld-Verified точность выросла с 47,3% до 75%, в тесте BrowseComp производительность увеличилась с 65,8% до 82,7%, на GDPval — с 70,9% до 83%. Прирост на SWE-Bench Pro скромнее — с 55,6% до 57,7%. Модель также стала точнее в пользовательских ответах: доля ложных утверждений снизилась на 33%, а ответов с ошибками — на 18%.

Помимо этого, был введен новый уровень рассуждений под названием xhigh — “экстремальное мышление”, при котором модель тратит значительно больше вычислительных ресурсов на сложные задачи, но выполняет их гораздо точнее. Кроме того, GPT-5.4 поддерживает компакцию — сжатие контекста для длительных агентских сессий, чтобы важная информация не терялась в многоэтапных сценариях. Также в ChatGPT добавили функцию предварительного отображения плана действий перед выполнением сложного запроса в версии Thinking: пользователь может скорректировать направление прямо по ходу, не дожидаясь готового ответа.

Производительность GPT-5.4
Производительность GPT-5.4 в сравнении с предыдущими ИИ-моделями OpenAI. Источник: OpenAI.

Выводы

Похоже, что с выходом GPT-5.4 OpenAI делает ставку именно на агентные сценарии использования, выставляя его как на основной вектор развития своей ИИ-экосистемы. Возможность управлять компьютером превращает модель из просто генератора текста и изображений в полноценного исполнителя задач вне API-интеграций, способного работать с любым софтом и любыми задачами. Увеличенный контекст и компакция позволяют разворачивать длительные сессии без потери качества, а новые инструменты выбора функций делают агентов точнее и экономнее. По сути, OpenAI заявляет: будущее ИИ — за агентами, которые не просто отвечают, а действуют.
Автор: Serverflow Serverflow
Поделиться

Комментарии 0

Написать комментарий
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Написать отзыв
До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Написать комментарий

Комментарий появится на сайте после предварительной модерации

До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Мы свяжемся с вами утром

График работы: Пн-Пт 10:00-18:30 (по МСК)

Обработаем вашу заявку
в ближайший рабочий день

График работы: Пн-Пт 10:00-18:30 (по МСК)