Top.Mail.Ru
DeepSeekMath-V2: новый прорыв DeepSeek в математических задачах | Блог Serverflow Скачать
прайс-лист
Бесплатная
доставка по РФ
Скидка
за отзыв!
Из-за нестабильности цен RAM фактическая стоимость может отличаться. Цена подтверждается после оформления заказа, работаем над обновлением цен!
Distribution of
Server Components
8 (800) 222-70-01 Консультация IT-специалиста Сравнение

DeepSeekMath-V2: новый прорыв DeepSeek в математических задачах

~ 2 мин
135
Простой
Новости
DeepSeekMath-V2: новый прорыв DeepSeek в математических задачах

Введение

Компания DeepSeek вновь решила перевернуть ИИ-индустрию с ног на голову, но теперь не в оптимизации бюджета разработки моделей, а в эффективности выполнения математических операций. Локомотивом этого прорыва стала инновационная ИИ-модель DeepSeekMath-V2 объемом 685 миллиардов параметров, которая сменила парадигму обучения LLM для математики, концентрируясь не на точности ответа и достижения большего балла в бенчмарках, а на интеллектуальности рассуждений и самокорректировке ошибок.

Подробнее о DeepSeekMath-V2

При создании DeepSeekMath-V2, взяв в основу более ранее представленную ИИ-модель DeepSeekV3.2-Exp-Base, китайские разработчики представили концепцию самопроверяемых математических рассуждений. Основная идея заключается в обучении двух взаимосвязанных компонентов, представляющих из себя отдельные нейросети: верификатора и генератора доказательств. Верификатор оценивает полноту и точность рассуждений, а генератор использует его как модель вознаграждения, что мотивирует его выявлять и исправлять ошибки в собственных доказательствах до их завершения. Чтобы генератор продолжал улучшаться, верификатор масштабируется для обработки более сложных доказательств, создавая новые обучающие данные и повышая производительность системы. Такой подход позволяет постепенно уменьшать разрыв между генерацией и проверкой ответов, обеспечивая устойчивый рост точности и сложности математических рассуждений модели. 

Результаты тестов DeepSeekMath-V2
Результаты тестов DeepSeekMath-V2 в тестах IMO 2025, CMO 2024 и Putnam 2024. Источник: GitHub.

DeepSeekMath-V2 была протестирована на крупных международных математических конкурсах. Модель продемонстрировала высокий уровень точности, завоевав золото на IMO 2025 и CMO 2024, а также почти высший балл 118/120 на Putnam 2024. Эти достижения подтверждают, что подход самопроверяемых рассуждений способен обеспечить глубину и точность ответов, недостижимую традиционными методами, ориентированными исключительно на финальный ответ. В сравнении с другими ИИ-моделями, DeepSeekMath-V2 также держит первенство, превосходя таких серьезных конкурентов, как Claude Sonnet 4, Gemini 2.5 Pro, GPT-5, Grok 4 и Qwen3-235b.

Производительность DeepSeekMath-V2
Производительность DeepSeekMath-V2 в сравнении с другими ИИ-моделями. Источник: GitHub.

Выводы

DeepSeekMath-V2 демонстрирует, что самопроверяемые математические рассуждения — это новое, перспективное направление в развитии искусственного интеллекта. Использование верификатора в качестве внутреннего механизма контроля качества рассуждений позволяет создавать более надежные и масштабируемые модели. Эти результаты открывают возможности для разработки ИИ, способного решать сложные математические задачи, доказывать теоремы и закладывают основу для будущих исследований в этой области.
Автор: Serverflow Serverflow
Поделиться

Комментарии 0

Написать комментарий
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Написать отзыв
До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Написать комментарий

Комментарий появится на сайте после предварительной модерации

До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Мы свяжемся с вами утром

График работы: Пн-Пт 10:00-18:30 (по МСК)

Обработаем вашу заявку
в ближайший рабочий день

График работы: Пн-Пт 10:00-18:30 (по МСК)