Бесплатная
доставка по РФ
Distribution of
Server Components
8 (800) 222-70-01 Консультация IT-специалиста Сравнение
DeepSeek V3 неожиданно обновился, обеспечив значительный прирост производительности в программировании

Автор:

DeepSeek V3 неожиданно обновился, обеспечив значительный прирост производительности в программировании

Обновленный DeepSeek V3-0324 лучше справляется с написанием кода и математикой, чем Claude Sonnet 3.7 и GPT-4.5.

Введение 23 марта 2025 года компания DeepSeek внезапно выпустила обновленную версию модели DeepSeek V3-0324 на платформе Hugging Face. Несмотря на то, что модель DeepSeek V3-0324 не имеет функции рассуждения, она продемонстрировала значительный прирост производительности в задачах программирования. Особенности DeepSeek V3-0324 Как заявляют разработчики, улучшенная модель DeepSeek V3-0324 на архитектуре Mixture-of-Experts (MoE) стала значительно эффективнее справляться с математическими вычислениями и задачами программирования, в частности, Backend-разработкой. Эта информация подтверждается результатами бенчмарков, выложенных в профиле разработчиков на Hugging Face. Результаты бенчмарков обновленной модели DeepSeek V3-0324. Источник: Hugging Face. Согласно результатам тестирования, по сравнению с ванильной версией DeepSeek V3, языковая модель V3-0324 показала прирост в MMLU-Pro с 75,9 до 81,2, GPQA с 59,1 до 68,4, AIME с 39,6 до 59,4 и LiveCodeBench с 39,2 до 49,2. При этом, DeepSeek V3-0324 удалось обойти такие передовые модели, как GPT-4.5, Qwen-Max, а также LLM Claude Sonnet 3.7, которые специализируются на задачах программирования.  Также пользователи, уже успевшие протестировать обновленную модель, отметили оптимизацию чистоты кода, уменьшение количества ошибок и улучшение визуального оформления запущенных веб-страниц/интерфейсов. Еще несколько нововведений — улучшение опции Function Calling для вызова инструментов в API, ускорение обработки файлов и поиска информации в сети. Стоит отметить, что новая модель получила 685 миллиардов параметров, в то время как стандартная версия DeepSeek V3 имеет 671 миллиарда параметров. Несмотря на относительно небольшой прирост количества параметров, размер обновления DeepSeek V3-0324 составил 800 ГБ. Выводы Выход DeepSeek V3-0324 был весьма неожиданным, поскольку многие пользователи ожидали анонса новой версии именно рассуждающей модели DeepSeek R1, а не обновления старой LLM DeepSeek V3. Тем не менее, улучшенная DeepSeek V3 продемонстрировала впечатляющие результаты в бенчмарках, обойдя передовые нейросети от западных разработчиков. Это говорит о том, что Китай все еще не потратил свой потенциал в сфере создания передовых LLM, поэтому в ближайшем будущем мы можем ожидать новые нейросети, которые снова потрясут весь мир своей эффективностью.

DeepSeek V3 неожиданно обновился, обеспечив значительный прирост производительности в программировании

~ 2 мин
157
Простой
Новости
DeepSeek V3 неожиданно обновился, обеспечив значительный прирост производительности в программировании

Введение

23 марта 2025 года компания DeepSeek внезапно выпустила обновленную версию модели DeepSeek V3-0324 на платформе Hugging Face. Несмотря на то, что модель DeepSeek V3-0324 не имеет функции рассуждения, она продемонстрировала значительный прирост производительности в задачах программирования.

Особенности DeepSeek V3-0324

Как заявляют разработчики, улучшенная модель DeepSeek V3-0324 на архитектуре Mixture-of-Experts (MoE) стала значительно эффективнее справляться с математическими вычислениями и задачами программирования, в частности, Backend-разработкой. Эта информация подтверждается результатами бенчмарков, выложенных в профиле разработчиков на Hugging Face.

Результаты бенчмарков DeepSeek V3
Результаты бенчмарков обновленной модели DeepSeek V3-0324. Источник: Hugging Face.

Согласно результатам тестирования, по сравнению с ванильной версией DeepSeek V3, языковая модель V3-0324 показала прирост в MMLU-Pro с 75,9 до 81,2, GPQA с 59,1 до 68,4, AIME с 39,6 до 59,4 и LiveCodeBench с 39,2 до 49,2. При этом, DeepSeek V3-0324 удалось обойти такие передовые модели, как GPT-4.5Qwen-Max, а также LLM Claude Sonnet 3.7, которые специализируются на задачах программирования. 

Также пользователи, уже успевшие протестировать обновленную модель, отметили оптимизацию чистоты кода, уменьшение количества ошибок и улучшение визуального оформления запущенных веб-страниц/интерфейсов. Еще несколько нововведений — улучшение опции Function Calling для вызова инструментов в API, ускорение обработки файлов и поиска информации в сети. Стоит отметить, что новая модель получила 685 миллиардов параметров, в то время как стандартная версия DeepSeek V3 имеет 671 миллиарда параметров. Несмотря на относительно небольшой прирост количества параметров, размер обновления DeepSeek V3-0324 составил 800 ГБ.

Выводы

Выход DeepSeek V3-0324 был весьма неожиданным, поскольку многие пользователи ожидали анонса новой версии именно рассуждающей модели DeepSeek R1, а не обновления старой LLM DeepSeek V3. Тем не менее, улучшенная DeepSeek V3 продемонстрировала впечатляющие результаты в бенчмарках, обойдя передовые нейросети от западных разработчиков. Это говорит о том, что Китай все еще не потратил свой потенциал в сфере создания передовых LLM, поэтому в ближайшем будущем мы можем ожидать новые нейросети, которые снова потрясут весь мир своей эффективностью.
Автор: Serverflow Serverflow
Поделиться

Комментарии 2

Написать комментарий
Александр У.
Отличная новость, ждем новые нейронки способные удивить мир!
Дед Максим
В этом мире есть только одна надежда, что дипсик перестанет сообщать мне: server is busy. Черт его побери, если делаете нейронку, сделайте ее хорошо. Почему я должен уходить в GPT всякий раз когда Дипсик снова перегружен.
Serverflow
Понимаем Вашу боль, сами не раз с этим сталкивались, могу порекомендовать временно Grok в телеграме. Достойная альтернатива, если не хочется "танцевать с бубном")

Написать отзыв

До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Написать комментарий

Комментарий появится на сайте после предварительной модерации

До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Мы свяжемся с вами утром

График работы: Пн-Пт 10:00-19:00 (по МСК)

Обработаем вашу заявку
в ближайший рабочий день

График работы: Пн-Пт 10:00-19:00 (по МСК)