Top.Mail.Ru
Anthropic представила Claude Fable 5: безопасная версия ИИ-модели уровня Mythos с рекордной производительностью | Блог Serverflow Скачать
прайс-лист
Бесплатная
доставка по РФ
Бонус за
обратную связь
Интернет-магазин
Серверного оборудования
8 (800) 222-70-01 Консультация IT-специалиста Сравнение

Anthropic представила Claude Fable 5: безопасная версия ИИ-модели уровня Mythos с рекордной производительностью

~ 2 мин
85
Простой
Новости
Anthropic представила Claude Fable 5: безопасная версия ИИ-модели уровня Mythos с рекордной производительностью

Введение

Anthropic открыла публичный доступ к Claude Fable 5 — первой общедоступной модели класса Mythos, которая демонстрирует совершенно иной уровень производительности в кодинге, естественных науках и других сложнейших задач. Параллельно Anthropic выпустила саму модель Claude Mythos 5, которая уже успела прославиться своими феноменальными навыками в кибербезопасности, но доступ открыт только для доверенных партнеров компании. Релиз сопровождается резким снижением цен на старые модели семейства Claude, новыми классификаторами безопасности и обновленной политикой временного хранения данных.

Подробнее о Claude Fable 5 и Claude Mythos 5

Claude Fable 5 демонстрирует рекордные результаты производительности среди всех общедоступных моделей почти по всем ключевым бенчмаркам. Claude Fable 5 показывает на SWE‑Bench Pro результат 80,3%, тогда как Mythos Preview в свое время взяла 77,8%, Opus 4.8 — 69,2%, а GPT‑5.5 довольствуется 58,6%, Gemini 3.1 Pro — 54,2%. Разрыв с самой мощной общедоступной моделью OpenAI составляет почти 22%, поэтому перевес в ИИ-гонке окончательно перешел к Anthropic. Другой тест, FrontierCode Diamond, проверяющий способность генерировать сложный код в непривычных условиях, Fable 5 проходит с 29,3% — вдвое выше, чем Claude Opus 4.8 (13,4%), и впятеро выше, чем GPT‑5.5 (5,7%) Terminal‑Bench 2.1, симулирующий многочасовую работу в терминале с дебагом и деплоем, модель закрывает на 88,0% — Mythos Preview отставала на 5,3%, а Opus 4.8 держится на 83,4%, а Codex CLI от GPT‑5.5 проваливается до 70,7%. В общем, Claude Fable 5 сделала огромный скачок в эффективности, и это даже не говоря о более нишевых бенчмарках, где модель Anthropic также лидирует. Чем длиннее и сложнее задача, тем сильнее отрыв Claude Fable 5 от предыдущих версий Claude.
ИИ-производительность Claude Fable 5
ИИ-производительность Claude Fable 5 в ключевых ИИ-бенчмарках. Источник: Anthropic.

Аналитические способности также на новом уровне. В тесте Hebbia на логическое мышление для руководителей модель заняла первое место, обойдя конкурентов по работе с документами, интерпретации графиков и таблиц. В оценке IMC навыков анализа торговых операций Fable 5 превзошла оппонентов по поиску фактов, концептуальному мышлению, анализу первопричин и ожидаемой стоимости. Компьютерное зрение — еще одна сильная сторона Claude Fable 5. Передовая модель восстанавливает исходный код веб-приложения только по скриншотам и извлекает точные данные из детальных научных отчетов. Примечательно, что для прохождения игры Pokemon Fire ей хватило минимального набора инструментов, тогда как предыдущие версии Claude не справлялись даже с дополнительными средствами.

ИИ-производительность Claude Fable 5 в агентном кодинге
ИИ-производительность Claude Fable 5 в агентном кодинге. Источник: Anthropic.

Mythos 5 (и, соответственно, лежащая в ее основе Fable 5, за исключением защитных ограничений) показала прорывные результаты в биологических дисциплинах. В разработке белковых препаратов она ускорила отдельные этапы примерно в десять раз. Девять из 14 белковых мишеней, обнаруженных моделью в ходе автономного прогона с инструментами для белкового дизайна, признаны перспективными кандидатами для лекарств, и заинтересованные компании уже изучает их. Mythos 5 стала первой моделью Anthropic, которая последовательно генерирует новые убедительные научные гипотезы: в слепом тесте ученые в 80% случаев предпочли ее гипотезы в области молекулярной биологии, а одна из них — о новом механизме белка E. coli — независимо подтвердилась в сторонней лаборатории. Кроме того, Mythos 5 за неделю автономной работы собрала данные об отдельных клетках 138 видов животных и обучила специализированную ML-модель, которая при стократно меньшем размере превзошла недавнюю публикацию в Science.

Чтобы столь мощная модель не стала инструментом злоумышленников, Anthropic внедрила в Fable 5 сложнейшую систему классификаторов безопасности. Если запрос пользователя затрагивает кибербезопасность, биологию, химию или дистилляцию, ответ генерирует не Fable 5, а предыдущая флагманская модель Opus 4.8 — это значительно уменьшает вероятность взлома с помощью промпт-инъекций. Срабатывает защита в среднем менее чем в 5% сессий, но в компании признают, что иногда ложные срабатывания случаются на безобидные запросы — в ближайшие месяцы их обещают сократить. За 1000 с лишним часов внешней программы Bug Bounty не нашли универсального джейлбрейка, что делает Fable 5 одной из самых устойчивых моделей к вредоносным запросам среди всех протестированных моделей.

Еще одно новшество: 30-дневное хранение данных трафика для моделей класса Mythos. Anthropic подчеркивает, что эти данные не пойдут на обучение и будут удаляться через 30 дней, а доступ к ним регистрируется. Это нужно для выявления сложных атак и ложных срабатываний.

Цена на обе модели снижена более чем вдвое по сравнению с предварительной версией Mythos: $10 за миллион входных токенов и $50 за миллион выходных. Fable 5 уже работает через Claude API и корпоративные планы Anthropic. В подписках Pro, Max, Team и Enterprise модель доступна бесплатно до 22 июня. Mythos 5 в данный момент развернута только для партнеров проекта Glasswing и отдельных биологов. В сотрудничестве с правительством США готовится программа доверенного доступа, которая расширит круг пользователей.

Выводы

Релиз Claude Fable 5 и Claude Mythos 5 от Anthropic по праву можно назвать новой вехой развития искусственного интеллекта, ведь компании удалось создать не просто эффективный инструмент для разных задач, а технологию, которые многие всерьез боялись до ее выхода. Теперь, когда передовые возможности Claude Fable 5 доступны всем желающим, а партнеры Anthropic активно работают с Claude Mythos 5, конкурентам будет крайне сложно сопоставить столь же эффективное решение, или хотя бы сократить огромный разрыв в бенчмарках по кодингу, агентным действиям, математике и нишевых сценариях.
Автор: Serverflow Serverflow
Поделиться

Комментарии 0

Написать комментарий
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Написать отзыв
До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Написать комментарий

Комментарий появится на сайте после предварительной модерации

До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Мы свяжемся с вами утром

График работы: Пн-Пт 10:00-18:30 (по МСК)

Обработаем вашу заявку
в ближайший рабочий день

График работы: Пн-Пт 10:00-18:30 (по МСК)