Top.Mail.Ru
DeepSeek V3 неожиданно обновился, обеспечив значительный прирост производительности в программировании | Блог Serverflow Скачать
прайс-лист
Бесплатная
доставка по РФ
Distribution of
Server Components
8 (800) 222-70-01 Консультация IT-специалиста Сравнение

DeepSeek V3 неожиданно обновился, обеспечив значительный прирост производительности в программировании

~ 2 мин
2126
Простой
Новости
DeepSeek V3 неожиданно обновился, обеспечив значительный прирост производительности в программировании

Введение

23 марта 2025 года компания DeepSeek внезапно выпустила обновленную версию модели DeepSeek V3-0324 на платформе Hugging Face. Несмотря на то, что модель DeepSeek V3-0324 не имеет функции рассуждения, она продемонстрировала значительный прирост производительности в задачах программирования.

Особенности DeepSeek V3-0324

Как заявляют разработчики, улучшенная модель DeepSeek V3-0324 на архитектуре Mixture-of-Experts (MoE) стала значительно эффективнее справляться с математическими вычислениями и задачами программирования, в частности, Backend-разработкой. Эта информация подтверждается результатами бенчмарков, выложенных в профиле разработчиков на Hugging Face.

Результаты бенчмарков DeepSeek V3
Результаты бенчмарков обновленной модели DeepSeek V3-0324. Источник: Hugging Face.

Согласно результатам тестирования, по сравнению с ванильной версией DeepSeek V3, языковая модель V3-0324 показала прирост в MMLU-Pro с 75,9 до 81,2, GPQA с 59,1 до 68,4, AIME с 39,6 до 59,4 и LiveCodeBench с 39,2 до 49,2. При этом, DeepSeek V3-0324 удалось обойти такие передовые модели, как GPT-4.5Qwen-Max, а также LLM Claude Sonnet 3.7, которые специализируются на задачах программирования. 

Также пользователи, уже успевшие протестировать обновленную модель, отметили оптимизацию чистоты кода, уменьшение количества ошибок и улучшение визуального оформления запущенных веб-страниц/интерфейсов. Еще несколько нововведений — улучшение опции Function Calling для вызова инструментов в API, ускорение обработки файлов и поиска информации в сети. Стоит отметить, что новая модель получила 685 миллиардов параметров, в то время как стандартная версия DeepSeek V3 имеет 671 миллиарда параметров. Несмотря на относительно небольшой прирост количества параметров, размер обновления DeepSeek V3-0324 составил 800 ГБ.

Выводы

Выход DeepSeek V3-0324 был весьма неожиданным, поскольку многие пользователи ожидали анонса новой версии именно рассуждающей модели DeepSeek R1, а не обновления старой LLM DeepSeek V3. Тем не менее, улучшенная DeepSeek V3 продемонстрировала впечатляющие результаты в бенчмарках, обойдя передовые нейросети от западных разработчиков. Это говорит о том, что Китай все еще не потратил свой потенциал в сфере создания передовых LLM, поэтому в ближайшем будущем мы можем ожидать новые нейросети, которые снова потрясут весь мир своей эффективностью.
Автор: Serverflow Serverflow
Поделиться

Комментарии 3

Написать комментарий
Miks
Надеюсь, они уберут ограничение на сообщения, это ужасно
Serverflow
Вы имеете ввиду ограничения когда он пишет "Server is busy" или когда он забывает контекст диалога? Но конечно оба эти нюанса не делают опыт использования лучше, так что согласны с Вами, их устранение пошло бы дипсику на руку :)
Александр У.
Отличная новость, ждем новые нейронки способные удивить мир!
Дед Максим
В этом мире есть только одна надежда, что дипсик перестанет сообщать мне: server is busy. Черт его побери, если делаете нейронку, сделайте ее хорошо. Почему я должен уходить в GPT всякий раз когда Дипсик снова перегружен.
Serverflow
Понимаем Вашу боль, сами не раз с этим сталкивались, могу порекомендовать временно Grok в телеграме. Достойная альтернатива, если не хочется "танцевать с бубном")
Написать отзыв
До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Написать комментарий

Комментарий появится на сайте после предварительной модерации

До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Мы свяжемся с вами утром

График работы: Пн-Пт 10:00-19:00 (по МСК)

Обработаем вашу заявку
в ближайший рабочий день

График работы: Пн-Пт 10:00-19:00 (по МСК)