Компания Nvidia представила TensorRT LLM 1.0 — первую стабильную версию нового ИИ-фреймворка для ускорения больших языковых моделей. Главная особенность TensorRT LLM 1.0 — это полностью открытое решение от Nvidia, исходный код которого уже доступен на GitHub.
Подробнее о TensorRT LLM 1.0
TensorRT LLM 1.0 создан на базе технологии TensorRT и открывает разработчикам доступ к оптимизированному инференсу различных современных моделей LLM, вроде Mistral, Qwen и других нейросетей, причем, с низкой задержкой и стоимостью за счет поддержки широкого спектра форматов точности: FP8, INT4, INT8, FP16 и FP32. TensorRT LLM 1.0 оптимизирован как для проектирования онлайн-приложений, так и офлайн-сценариев использования больших языковых моделей. Также ИИ-фреймворк поддерживает ряд готовых пайпланов и доступных API для удобной интеграции в приложения. Компания подчеркивает, что TensorRT LLM 1.0 демонстрирует лучшие показатели производительности при работе в системах на базе GPU от Nvidia.
Выводы
Проект TensorRT LLM разрабатывается уже давно, но выход первой стабильной версии знаменует переход проекта в стадию полной коммерческой готовности. TensorRT LLM 1.0 не только прочно войдет в экосистему ИИ-фреймворков Nvidia, но и позволит компании составить значительную конкуренцию открытым движкам инференса LLM, таким как llama.cpp и vLLM.
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Скидка 1 500 ₽ или бесплатная доставка - уже сейчас 🔥
Мы ценим обратную связь от клиентов. При оформлении заказа вы можете сообщить о своём намерении поделиться впечатлением о работе ServerFlow после получения товара.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка до ПВЗ СДЭК.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.
При оформлении заказа в ServerFlow вы можете сообщить о намерении оставить отзыв о нашей работе после получения товара.
Нам важно ваше честное мнение. Оно помогает развивать сервис и даёт другим клиентам представление о нашей работе.
Вы можете оставить отзыв на удобной для вас платформе:
Google Maps
2GIS
Яндекс Карты
Как работает акция
Применяя промокод, вы подтверждаете намерение поделиться впечатлением о работе ServerFlow после получения заказа. Мы применяем бонус уже к текущему заказу в знак благодарности за обратную связь.
Условия акции:
скидка 1 500 ₽ при заказе от 30 000 ₽
или бесплатная доставка* при заказе до 30 000 ₽
* Бесплатная доставка заказа осуществляется до ПВЗ СДЭК.