Компания DeepSeek представила обновленную версию модели искусственного интеллекта без функции размышления — DeepSeek V3.1. Апдейт уже доступен для тестирования, а ключевым улучшением стало расширение контекстного окна с 64 до 128 тысяч токенов, что позволяет обрабатывать более объемные и сложные запросы, что полезно в кодинге и математических вычислениях.
Подробнее о DeepSeek V3.1
Согласно официальному сообщению компании DeepSeek в китайской соцсети WeChat, DeepSeek V3.1 способна работать с увеличенным объемом контекста до 128 тысяч токенов, что позволяет нейросети лучше анализировать большие массивы данных в рамках одного пользовательского запроса, дольше вести диалоги в одном чате и эффективнее сохранять в памяти предыдущие взаимодействия с пользователем. Дополнительные технические детали и результаты бенчмарков пока не раскрываются. DeepSeek V3.1 уже доступна в веб-версии при отключении функции размышления, через официальный API DeepSeek и на платформе Huggingface для локального инференса. Напомним, что предыдущая версия модели DeepSeek V3, обучение которой обошлось всего в $5,5 миллионов долларов, стала первой успешной китайской нейросетью и стала основой для последующего бума ИИ-моделей из КНР, которые демонстрируют высочайшую эффективность при низкой стоимости. Также пользователи высказывают, что DeepSeek V3.1 является лишь базовой версией и позднее команда DeepSeek также добавит этой нейросети гибридный режим с функцией размышления.
Выводы
Релиз новой версии DeepSeek V3.1 свидетельствует о том, что ведущий китайский разработчик ИИ-моделей все еще активен и продолжает совершенствовать свои передовые решения, параллельно разрабатывая новую версию своей флагманской нейросети DeepSeek R2. ИИ-сообщество давно ожидало выход модели DeepSeek R2, однако впоследствии релиз был задержан из-за проблем с поставками ИИ-ускорителей H20, вследствие чего разработчикам пришлось переходить на использование местных решений от Huawei с меньшей эффективностью. Также на задержку выхода DeepSeek R2 влияет перфекционизм CEO компании Лян Вэньфэна, который стремится довести свое решение до идеала и повторить успех нейросети DeepSeek R1.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.