Top.Mail.Ru
Anthropic представила Claude Opus 4.8 — новый флагман с честными ответами и настраиваемым размышлением | Блог Serverflow Скачать
прайс-лист
Бесплатная
доставка по РФ
Бонус за
обратную связь
Интернет-магазин
Серверного оборудования
8 (800) 222-70-01 Консультация IT-специалиста Сравнение

Anthropic представила Claude Opus 4.8 — новый флагман с честными ответами и настраиваемым размышлением

~ 2 мин
67
Простой
Новости
Anthropic представила Claude Opus 4.8 — новый флагман с честными ответами и настраиваемым размышлением

Введение

Anthropic выпустила очередное обновление своего флагманского семейства нейросетей Claude Opus — передовую модель Claude Opus 4.8, которая дорабатывает фундамент, заложенный Opus 4.7, привнося более точное понимание задач, повышенную честность при генерации ответов и новые функции для контроля глубины размышления для пользователей.

Подробнее о Claude Opus 4.8

Главное качественное изменение в Opus 4.8 касается достоверности информации, генерируемой новой моделью. Разработчики обратили внимание на привычку моделей Claude выдавать поспешные выводы, маскируя невозможность выполнить поставленную задачу имитацией прогресса и использованием ложной информации. Новая версия в 4 раза реже галлюцинирует и допускает использование недостоверных данных при генерации кода. Внутренние тесты Anthropic по согласованности поведения показали, что по склонности к честному и просоциальному поведению Opus 4.8 сопоставим с самой грядущей моделью компании Claude Mythos Preview, а уровень нежелательного поведения (вроде галлюцинаций) в ней заметно ниже, чем в Opus 4.7.

В области практических возможностей ключевым нововведением Opus 4.8 стала интеграция функции “динамических рабочих процессов” при использовании Claude Code. В режиме предварительного просмотра модель теперь способна распланировать масштабную задачу, запустить до сотни параллельных субагентов, проконтролировать их выполнение, собрать результаты и предоставить сводный отчет. Например, Claude Opus 4.8 может в одиночку провести миграцию кодовой базы из сотен тысяч строк, включая прогон существующего набора тестов, от старта до слияния изменений. Функция доступна на тарифах Enterprise, Team и Max.

Одновременно с этим пользователи claude.ai и рабочей среды Cowork получили возможность настройки затрат токенов и времени работы рядом с выбором модели. Низкие значения дают быстрые, но менее глубокие ответы, высокие — запускают более тщательный анализ. По умолчанию Opus 4.8 использует высокий уровень, который по потреблению токенов примерно соответствует стандартному поведению Opus 4.7, но с приростом качества. Для самых сложных и длительных задач рекомендуется переключаться на “дополнительный” или “максимальный» уровень, в Claude Code при этом увеличены лимиты скорости, чтобы компенсировать возросший расход токенов.

Разработчики, работающие через API, получили еще одно удобное обновление: системные инструкции теперь можно передавать прямо в массиве сообщений, обновляя настройки, бюджеты или контекст прямо по ходу выполнения задачи без сброса кэша подсказок. Это упрощает построение агентских фреймворков, где окружение и разрешения меняются динамически.

В бенчмарках модель демонстрирует уверенный, хоть и не взрывной рост: улучшения затрагивают как кодирование и агентские навыки, так и логические рассуждения с практическими знаниями. Согласно данным Anthropic, Opus 4.8 набирает 69,2% в бенчмарке агентного программирования SWE-Bench Pro, что превосходит результат предшественника Opus 4.7 (64,3%), а также показатели GPT-5.5 (58,6%) и Gemini 3.1 Pro (54,2%). Модель также лидирует в многопрофильном мышлении с использованием инструментов (57,9% против 54,7% у 4.7-й версии) и в агентном управлении компьютером (83,4%, что выше 82,8% у Opus 4.7), а на тесте OSWorld-Verified показатель улучшился с 82,8% до 83,4%. В бенчмарке Terminal-Bench 2.1 модель набрала 74,6%. Отмечается, что новая версия примерно в 4 раза реже допускает незамеченные ошибки в собственном коде по сравнению с Opus 4.7, а также предлагает «быстрый режим» со скоростью 2,5x при цене втрое дешевле.

ИИ-производительность Claude Opus 4.8
ИИ-производительность модели Claude Opus 4.8. Источник: Anthropic.

Выводы

Claude Opus 4.8 планомерно дорабатывает модельный ряд Anthropic, и на этот раз главный акцент смещен с чистой производительности на качество взаимодействия с пользователем и точность генерируемых данных. Снижение склонности к галлюцинациям, четырехкратное уменьшение пропуска ошибок в коде и прозрачное указание на недостоверную информацию формируют делают из Claude Opus 4.8 не просто мощный, но и надежный инструмент. При этом модель остается доступной в API: цены остались на уровне Claude Opus 4.7: $5 за 1 миллион входных токенов и $25 за 1 миллион выходных токенов в стандартном режиме и $10 за 1 миллион входных токенов и $50 за 1 миллион выходных токенов в быстром режиме.
Автор: Serverflow Serverflow
Поделиться

Комментарии 0

Написать комментарий
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Написать отзыв
До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Написать комментарий

Комментарий появится на сайте после предварительной модерации

До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Мы свяжемся с вами утром

График работы: Пн-Пт 10:00-18:30 (по МСК)

Обработаем вашу заявку
в ближайший рабочий день

График работы: Пн-Пт 10:00-18:30 (по МСК)