Top.Mail.Ru
Релиз DeepSeek V3.1 — расширенный контекст до 128 тысяч токенов | Блог Serverflow Скачать
прайс-лист
Бесплатная
доставка по РФ
Distribution of
Server Components
8 (800) 222-70-01 Консультация IT-специалиста Сравнение

Релиз DeepSeek V3.1 — расширенный контекст до 128 тысяч токенов

~ 2 мин
416
Простой
Новости
Релиз DeepSeek V3.1 — расширенный контекст до 128 тысяч токенов

Введение

Компания DeepSeek представила обновленную версию модели искусственного интеллекта без функции размышления — DeepSeek V3.1. Апдейт уже доступен для тестирования, а ключевым улучшением стало расширение контекстного окна с 64 до 128 тысяч токенов, что позволяет обрабатывать более объемные и сложные запросы, что полезно в кодинге и математических вычислениях.

Подробнее о DeepSeek V3.1

Согласно официальному сообщению компании DeepSeek в китайской соцсети WeChat, DeepSeek V3.1 способна работать с увеличенным объемом контекста до 128 тысяч токенов, что позволяет нейросети лучше анализировать большие массивы данных в рамках одного пользовательского запроса, дольше вести диалоги в одном чате и эффективнее сохранять в памяти предыдущие взаимодействия с пользователем. Дополнительные технические детали и результаты бенчмарков пока не раскрываются. DeepSeek V3.1 уже доступна в веб-версии при отключении функции размышления, через официальный API DeepSeek и на платформе Huggingface для локального инференса. Напомним, что предыдущая версия модели DeepSeek V3, обучение которой обошлось всего в $5,5 миллионов долларов, стала первой успешной китайской нейросетью и стала основой для последующего бума ИИ-моделей из КНР, которые демонстрируют высочайшую эффективность при низкой стоимости. Также пользователи высказывают, что DeepSeek V3.1 является лишь базовой версией и позднее команда DeepSeek также добавит этой нейросети гибридный режим с функцией размышления.

Выводы

Релиз новой версии DeepSeek V3.1 свидетельствует о том, что ведущий китайский разработчик ИИ-моделей все еще активен и продолжает совершенствовать свои передовые решения, параллельно разрабатывая новую версию своей флагманской нейросети DeepSeek R2. ИИ-сообщество давно ожидало выход модели DeepSeek R2, однако впоследствии релиз был задержан из-за проблем с поставками ИИ-ускорителей H20, вследствие чего разработчикам пришлось переходить на использование местных решений от Huawei с меньшей эффективностью. Также на задержку выхода DeepSeek R2 влияет перфекционизм CEO компании Лян Вэньфэна, который стремится довести свое решение до идеала и повторить успех нейросети DeepSeek R1.
Автор: Serverflow Serverflow
Поделиться

Комментарии 0

Написать комментарий
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Написать отзыв
До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Написать комментарий

Комментарий появится на сайте после предварительной модерации

До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Мы свяжемся с вами утром

График работы: Пн-Пт 10:00-19:00 (по МСК)

Обработаем вашу заявку
в ближайший рабочий день

График работы: Пн-Пт 10:00-19:00 (по МСК)