Релиз DeepSeek V3.1 — расширенный контекст до 128 тысяч токенов

20.08.2025

~ 2 мин

2157

Простой

Новости

Введение

Компания DeepSeek представила обновленную версию модели искусственного интеллекта без функции размышления — DeepSeek V3.1. Апдейт уже доступен для тестирования, а ключевым улучшением стало расширение контекстного окна с 64 до 128 тысяч токенов, что позволяет обрабатывать более объемные и сложные запросы, что полезно в кодинге и математических вычислениях.

Подробнее о DeepSeek V3.1

Согласно официальному сообщению компании DeepSeek в китайской соцсети WeChat, DeepSeek V3.1 способна работать с увеличенным объемом контекста до 128 тысяч токенов, что позволяет нейросети лучше анализировать большие массивы данных в рамках одного пользовательского запроса, дольше вести диалоги в одном чате и эффективнее сохранять в памяти предыдущие взаимодействия с пользователем. Дополнительные технические детали и результаты бенчмарков пока не раскрываются. DeepSeek V3.1 уже доступна в веб-версии при отключении функции размышления, через официальный API DeepSeek и на платформе Huggingface для локального инференса. Напомним, что предыдущая версия модели DeepSeek V3, обучение которой обошлось всего в $5,5 миллионов долларов, стала первой успешной китайской нейросетью и стала основой для последующего бума ИИ-моделей из КНР, которые демонстрируют высочайшую эффективность при низкой стоимости. Также пользователи высказывают, что DeepSeek V3.1 является лишь базовой версией и позднее команда DeepSeek также добавит этой нейросети гибридный режим с функцией размышления.

Выводы

Релиз новой версии DeepSeek V3.1 свидетельствует о том, что ведущий китайский разработчик ИИ-моделей все еще активен и продолжает совершенствовать свои передовые решения, параллельно разрабатывая новую версию своей флагманской нейросети DeepSeek R2. ИИ-сообщество давно ожидало выход модели DeepSeek R2, однако впоследствии релиз был задержан из-за проблем с поставками ИИ-ускорителей H20, вследствие чего разработчикам пришлось переходить на использование местных решений от Huawei с меньшей эффективностью. Также на задержку выхода DeepSeek R2 влияет перфекционизм CEO компании Лян Вэньфэна, который стремится довести свое решение до идеала и повторить успех нейросети DeepSeek R1.

Автор:

Serverflow