Автор и ведущий разработчик проекта llama.cpp опубликовал на своей странице GitHub результаты тестов производительности различных ИИ-моделей на новой вычислительной платформе NVIDIA DGX Spark — мини-ПК с потрясающей ИИ-производительностью.
Подробнее о событии
На GitHub Герганова были представлены данные о скорости работы популярных открытых языковых моделей — Gemma 3 4B QAT, Qwen3 Coder 30B, Qwen2.5 Coder 7B, GLM 4.5 Air, gpt-oss-20B и gpt-oss-120B при запуске через llama.cpp. Наилучшие результаты показала Gemma 3 4B QAT, которая обеспечила самую высокую скорость обработки текста и генерации ответов. Более крупные модели, такие как gpt-oss-120B и Qwen3 Coder 30B, ожидаемо работают медленнее, однако тесты демонстрируют стабильную производительность даже при больших объемах данных. Герганов отметил, что это первые измерения работы llama.cpp на DGX Spark, и пригласил сообщество к дальнейшему сравнительному тестированию моделей и различных режимов квантования.
Выводы
Это тестирование показывает, что DGX Spark является отличной платформой для инференса больших языковых моделей через открытые ИИ-движки, такие как llama.cpp, а также vLLM, разработчики которой уже подтвердили совместимость с новейшими, компактными ИИ-станциями. Пользователи GitHub уже предложили Герганову расширить список протестированных конфигураций, включая популярную китайскую нейросеть GLM-4.5-Air-FP8.
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Скидка 1 500 ₽ или бесплатная доставка - уже сейчас 🔥
Мы ценим обратную связь от клиентов. При оформлении заказа вы можете сообщить о своём намерении поделиться впечатлением о работе ServerFlow после получения товара.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка до ПВЗ СДЭК.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.
При оформлении заказа в ServerFlow вы можете сообщить о намерении оставить отзыв о нашей работе после получения товара.
Нам важно ваше честное мнение. Оно помогает развивать сервис и даёт другим клиентам представление о нашей работе.
Вы можете оставить отзыв на удобной для вас платформе:
Google Maps
2GIS
Яндекс Карты
Как работает акция
Применяя промокод, вы подтверждаете намерение поделиться впечатлением о работе ServerFlow после получения заказа. Мы применяем бонус уже к текущему заказу в знак благодарности за обратную связь.
Условия акции:
скидка 1 500 ₽ при заказе от 30 000 ₽
или бесплатная доставка* при заказе до 30 000 ₽
* Бесплатная доставка заказа осуществляется до ПВЗ СДЭК.