Top.Mail.Ru
Nvidia выпустила TensorRT LLM 1.0 — открытый фреймворк для ускорения языковых моделей | Новости Serverflow Скачать
прайс-лист
Бесплатная
доставка по РФ
Скидка
за отзыв!
Distribution of
Server Components
8 (800) 222-70-01 Консультация IT-специалиста Сравнение

Релиз TensorRT LLM 1.0: ускорение LLM на открытом фреймворке

~ 2 мин
194
Простой
Новости
Релиз TensorRT LLM 1.0: ускорение LLM на открытом фреймворке

Введение

Компания Nvidia представила TensorRT LLM 1.0 — первую стабильную версию нового ИИ-фреймворка для ускорения больших языковых моделей. Главная особенность TensorRT LLM 1.0 — это полностью открытое решение от Nvidia, исходный код которого уже доступен на GitHub.

Подробнее о TensorRT LLM 1.0

TensorRT LLM 1.0 создан на базе технологии TensorRT и открывает разработчикам доступ к оптимизированному инференсу различных современных моделей LLM, вроде Mistral, Qwen и других нейросетей, причем, с низкой задержкой и стоимостью за счет поддержки широкого спектра форматов точности: FP8, INT4, INT8, FP16 и FP32. TensorRT LLM 1.0 оптимизирован как для проектирования онлайн-приложений, так и офлайн-сценариев использования больших языковых моделей. Также ИИ-фреймворк поддерживает ряд готовых пайпланов и доступных API для удобной интеграции в приложения. Компания подчеркивает, что TensorRT LLM 1.0 демонстрирует лучшие показатели производительности при работе в системах на базе GPU от Nvidia.

Выводы

Проект TensorRT LLM разрабатывается уже давно, но выход первой стабильной версии знаменует переход проекта в стадию полной коммерческой готовности. TensorRT LLM 1.0 не только прочно войдет в экосистему ИИ-фреймворков Nvidia, но и позволит компании составить значительную конкуренцию открытым движкам инференса LLM, таким как llama.cpp и vLLM.
Автор: Serverflow Serverflow
Поделиться

Комментарии 0

Написать комментарий
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Написать отзыв
До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Написать комментарий

Комментарий появится на сайте после предварительной модерации

До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Мы свяжемся с вами утром

График работы: Пн-Пт 10:00-19:00 (по МСК)

Обработаем вашу заявку
в ближайший рабочий день

График работы: Пн-Пт 10:00-19:00 (по МСК)