Компания DeepSeek представила обновленную версию модели искусственного интеллекта без функции размышления — DeepSeek V3.1. Апдейт уже доступен для тестирования, а ключевым улучшением стало расширение контекстного окна с 64 до 128 тысяч токенов, что позволяет обрабатывать более объемные и сложные запросы, что полезно в кодинге и математических вычислениях.
Подробнее о DeepSeek V3.1
Согласно официальному сообщению компании DeepSeek в китайской соцсети WeChat, DeepSeek V3.1 способна работать с увеличенным объемом контекста до 128 тысяч токенов, что позволяет нейросети лучше анализировать большие массивы данных в рамках одного пользовательского запроса, дольше вести диалоги в одном чате и эффективнее сохранять в памяти предыдущие взаимодействия с пользователем. Дополнительные технические детали и результаты бенчмарков пока не раскрываются. DeepSeek V3.1 уже доступна в веб-версии при отключении функции размышления, через официальный API DeepSeek и на платформе Huggingface для локального инференса. Напомним, что предыдущая версия модели DeepSeek V3, обучение которой обошлось всего в $5,5 миллионов долларов, стала первой успешной китайской нейросетью и стала основой для последующего бума ИИ-моделей из КНР, которые демонстрируют высочайшую эффективность при низкой стоимости. Также пользователи высказывают, что DeepSeek V3.1 является лишь базовой версией и позднее команда DeepSeek также добавит этой нейросети гибридный режим с функцией размышления.
Выводы
Релиз новой версии DeepSeek V3.1 свидетельствует о том, что ведущий китайский разработчик ИИ-моделей все еще активен и продолжает совершенствовать свои передовые решения, параллельно разрабатывая новую версию своей флагманской нейросети DeepSeek R2. ИИ-сообщество давно ожидало выход модели DeepSeek R2, однако впоследствии релиз был задержан из-за проблем с поставками ИИ-ускорителей H20, вследствие чего разработчикам пришлось переходить на использование местных решений от Huawei с меньшей эффективностью. Также на задержку выхода DeepSeek R2 влияет перфекционизм CEO компании Лян Вэньфэна, который стремится довести свое решение до идеала и повторить успех нейросети DeepSeek R1.
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Получите скидку 3 000 рублей или бесплатную доставку за подписку на новости*!
* — скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка.
Мы получили ваш отзыв!
Он появится на сайте после модерации.
Мы получили ваш отзыв!
Он появится на сайте после модерации.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.