Top.Mail.Ru
OpenAI представила GPT-5.5: лучшая нейросеть в мире для агентных задач и научных исследований | Блог Serverflow Скачать
прайс-лист
Бесплатная
доставка по РФ
Бонус за
обратную связь
1 мая - выходной. Все заявки будут обработаны 4 мая. С праздником!
Интернет-магазин
Серверного оборудования
8 (800) 222-70-01 Консультация IT-специалиста Сравнение

OpenAI представила GPT-5.5: лучшая нейросеть в мире для агентных задач и научных исследований

~ 2 мин
152
Простой
Новости
OpenAI представила GPT-5.5: лучшая нейросеть в мире для агентных задач и научных исследований

Введение

OpenAI официально выпустила GPT-5.5 — свою самую высокопроизводительную и точную ИИ-модель, которая становится доступна пользователям Plus, Pro, Business и Enterprise в ChatGPT и Codex, а также вскоре появится в API. Новая версия делает особый упор на способность самостоятельно планировать, использовать инструменты, проверять результат и доводить многоэтапные задачи до конца без постоянного контроля со стороны человека, что критически важно для работы с агентными пайплайнами. Модель демонстрирует огромный скачок в агентном кодировании, сценариях computer use, интеллектуальной аналитике и научных исследованиях, при этом сохраняя скорость генерации токенов на уровне предшественницы и расходуя заметно меньше токенов на выполнение тех же задач.

Подробнее о GPT-5.5

Наиболее заметный прогресс достигнут в агентном кодировании. На тесте Terminal-Bench 2.0, проверяющем сложные рабочие процессы с командной строкой, требующие планирования и координации инструментов, модель достигает точности в 82,7% — заметно выше, чем у GPT-5.4 с 75,1%. На SWE-Bench Pro, оценивающем решение реальных задач на GitHub, результат составляет 58,6%, что также превосходит показатели предшествующего поколения. Внутренний тест Expert-SWE, имитирующий задачи, на которые у квалифицированных инженеров уходит в среднем 20 часов, подтверждает превосходство GPT-5.5 над GPT-5.4. Инженеры, участвовавшие в тестировании, отмечали, что модель заранее выявляет потенциальные проблемы, прогнозирует необходимость проверок и почти не требует правок в реализации.

Способности модели к долгосрочному планированию и самопроверке делают ее эффективной не только в кодинге, но и в интеллектуальной работе. На GDPval, оценивающем выполнение задач по 44 профессиям, GPT-5.5 набирает 84,9% побед или ничьих, обходя Opus 4.7 и Gemini 3.1 Pro. В тесте OSWorld, где агенту необходимо самостоятельно управлять реальной компьютерной средой, результат достигает 78,7%. Модель демонстрирует значительные успехи в обработке документов, создании презентаций, финансовом моделировании и генерации отчетов. Внутренние команды OpenAI уже используют GPT-5.5 в Codex для автоматизации анализа налоговых форм, управления рисками и рутинных коммуникаций, экономя до десяти часов в неделю на сотрудника.

ИИ-производительность OpenAI GPT-5.5
ИИ-производительность флагманской модели OpenAI GPT-5.5. Источник: OpenAI.

В научных исследованиях модель GPT-5.5 впервые показывает способность не просто отвечать на вопросы, а выступать в роли полноценного ассистента исследователя. На GeneBench, тестирующем многоэтапный анализ генетических данных, и BixBench для задач биоинформатики, GPT-5.5 устанавливает новые рекорды среди моделей с опубликованными результатами.

Инфраструктурные улучшения, лежащие в основе GPT-5.5, стали возможны благодаря обучению на системах NVIDIA GB200 и GB300 NVL72, которые также позволили снизить стоимость генерации токенов более чем в 35 раз. Сама модель участвовала в оптимизации стека, на котором работает: внедренные ею системы балансировки нагрузки и динамического разделения запросов позволили увеличить скорость генерации токенов более чем на 20 процентов. В Codex модель предлагается в двух режимах — стандартном и ускоренном Fast, который генерирует токены в полтора раза быстрее при повышенной стоимости.

Особое внимание уделено кибербезопасности. OpenAI оценивает возможности GPT-5.5 в кодинге как высокие по своей шкале готовности, отмечая, что кибервозможности модели превышают уровень GPT-5.4. В ответ на это компания внедрила более строгие классификаторы потенциальных рисков, меры контроля для действий с повышенным риском и защиту от повторяющихся случаев неправомерного использования. Впервые вводится программа Trusted Access for Cyber, которая предоставляет проверенным специалистам доступ к расширенным возможностям модели в сфере киберзащиты с меньшим количеством ограничений — подать заявку могут организации, ответственные за защиту критической инфраструктуры.

В ChatGPT модель доступна в двух вариантах: GPT-5.5 с функцией Thinking для пользователей Plus, Pro, Business и Enterprise, и GPT-5.5 Pro для подписчиков Pro, Business и Enterprise, обеспечивающая более высокую точность и глубину ответов. В Codex контекстное окно составляет 400 тысяч токенов. Для разработчиков API скоро станут доступны gpt-5.5 по цене $5 за миллион входных токенов и $30 за миллион выходных при контекстном окне в 1 миллион токенов, а также gpt-5.5-pro за $30 и $180 соответственно. Несмотря на более высокую стоимость по сравнению с GPT-5.4, модель расходует значительно меньше токенов на выполнение тех же задач, что делает ее более экономически эффективной при решении сложных проблем.

Выводы

GPT-5.5 только вышла, но модель уже заняла первую позицию в рейтинге artificial analysis intelligence index, обойдя флагманские нейросети конкурентов, такие как Google Gemini 3.1 и Anthropic Claude Sonnet, что возвращает OpenAI лидерство в сфере проприетарных моделей искусственного интеллекта. Высочайшая производительность в агентных задачах, огромный прирост в следовании инструкциям, улучшения в области программирования, кибербезопасности и научных исследований делает GPT-5.5 лучшей нейросетью в индустрии из всех существующих LLM на данный момент.
Автор: Serverflow Serverflow
Поделиться

Комментарии 0

Написать комментарий
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Написать отзыв
До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Написать комментарий

Комментарий появится на сайте после предварительной модерации

До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Мы свяжемся с вами утром

График работы: Пн-Пт 10:00-18:30 (по МСК)

Обработаем вашу заявку
в ближайший рабочий день

График работы: Пн-Пт 10:00-18:30 (по МСК)