OpenAI представила GPT-5.3-Codex: передовая модель для кодинга и главный конкурент Claude Opus 4.6

05.02.2026

~ 2 мин

858

Простой

Новости

Введение

OpenAI представляет GPT-5.3-Codex — новую флагманскую модель для агентного программирования. Модель обеспечивает качественный прирост эффективности, который трансформирует Codex из инструмента для написания кода в универсального “цифрового сотрудника”, способного выполнять комплексные задачи от начала до конца на уровне профессионального разработчика или аналитика.

Подробнее о GPT-5.3-Codex

GPT-5.3-Codex сочетает в себе возможности программирования от GPT-5.2-Codex и глубину логических рассуждений от GPT-5.2. Эта гибридизация дала модели высочайшую эффективность в области автономных действий. Главное отличие GPT-5.3-Codex от предшественника в лице GPT-5.2-Codex — способность выполнять длительные многоэтапные операции, включающие исследование, использование инструментов и сложное исполнение, при этом сохраняя полный контекст и позволяя пользователю вмешиваться в процесс в реальном времени. Производительность модели выросла примерно на 25%, что обеспечивает более быстрый отклик и высочайшие результаты. В OpenAI отмечают, что GPT-5.3-Codex стала первой моделью, сыгравшей решающую роль в собственном создании. Ее ранние версии использовались командой для отладки процесса обучения, управления развертыванием и глубокого анализа результатов тестирования, что кардинально ускорило цикл разработки. Это практическое доказательство ее агентских способностей.

На SWE-Bench Pro модель GPT-5.3-Codex показывает 56,8% точности, что немного выше GPT-5.2-Codex (56,4 %) и базовой GPT-5.2 (55,6 %), но ключевые улучшения проявляются не в чистом кодинге, а в работе со средой. На Terminal-Bench 2.0 GPT-5.3-Codex достигает 77,3%, заметно опережая GPT-5.2-Codex (64,0 %) и GPT-5.2 (62,2 %), что указывает на резкий рост качества взаимодействия с терминалом и многошаговыми агентными задачами. Аналогичная картина наблюдается в OSWorld-Verified: 64,7% против 38% у предыдущих моделей, то есть почти двукратный разрыв в сложных сценариях управления системой.

Производительность ИИ-модели GPT-5.3-Codex в бенчмарке SWE-Bench Pro. Источник: OpenAI.

В задачах, связанных с профессиональными знаниями и офисной деятельностью, GPT-5.3-Codex сохраняет высокий уровень точности — 70,9% по GDPval (wins or ties), находясь на одном уровне с GPT-5.2, но без деградации при росте агентной сложности. Существенный прогресс также зафиксирован в задачах кибербезопасности: в Capture The Flag-челленджах модель набирает 77,6%, тогда как GPT-5.2-Codex и GPT-5.2 остаются в диапазоне 67%. В инженерно-ориентированном SWE-Lance IC Diamond GPT-5.3-Codex достигает 81,4% точности, улучшая результат GPT-5.2-Codex (78,0%) и значительно опережая GPT-5.2 (74,6%).

Производительность ИИ-модели GPT-5.3-Codex в бенчмарке Terminal-Bench 2.0. Источник: OpenAI.

Способности модели выходят далеко за рамки чистого кодирования. Она предназначена для поддержки полного жизненного цикла ПО: от планирования и отладки до развертывания, мониторинга и написания документации. Ее навыки распространяются на смежные профессиональные области, такие как анализ данных в таблицах, создание презентаций и пользовательские исследования, показывая высокие результаты в комплексном тесте GDPval, измеряющем эффективность в 44 профессиях. Codex теперь действует как штатный сотрудник, который в реальном времени сообщает о ходе работы, объясняет ключевые решения и мгновенно реагирует на обратную связь, позволяя направлять сложные проекты по мере их выполнения.

Особое внимание уделено сфере кибербезопасности. GPT-5.3-Codex — первая модель OpenAI, отнесенная к категории с высокими возможностями в этой области. Она обучена непосредственно для выявления уязвимостей в программном обеспечении. Осознавая двойной потенциал таких технологий, компания внедряет самый полный на сегодня комплекс защитных мер, включая обучение технике безопасности, автоматизированный мониторинг и систему доверенного доступа для исследователей. Параллельно запускаются инициативы по укреплению экосистемы, включая расширение бета-версии агента безопасности Aardvark и выделение 10 миллионов долларов в виде грантов и кредитов API для поддержки защитных исследований, особенно в проектах с открытым исходным кодом.

ИИ-производительность GPT-5.3-Codex, GPT-5.2-Codex и GPT-5.2

Сравнение ИИ-производительности моделей GPT-5.3-Codex, GPT-5.2-Codex и GPT-5.2. Источник: OpenAI.

Выводы

Релиз GPT-5.3-Codex — это переход от умного автодополнения кода к развертыванию полноценного автономного интеллектуального ассистента. Модель не только устанавливает новые стандарты в технических бенчмарках, но и подтверждает свою практическую ценность, ускорив собственную разработку. Ее способность понимать контекст, выполнять многошаговые процессы и взаимодействовать с пользователем в диалоговом режиме открывает новые возможности в построении автономных агентских систем.

Автор:

Serverflow