12 августа 2025 года Intel представила обновленную версию проекта Project Battlematrix, который ранее был анонсирован мае на выставке Computex 2025. Проект направлен на создание масштабируемых и экономичных рабочих станций для задач инференса искусственного интеллекта. Цель инициативы — ускорить реализацию стратегии Intel в области ИИ за счет упрощения интеграции графических процессоров Intel Arc Pro серии Battlemage с проприетарным программным стеком Intel.
Подробнее о программном стеке Battlematrix
Новый стек делает приоритет на удобстве конечного пользователя и строгом соблюдении отраслевых стандартов. Он основан на контейнерном решении, адаптированном для сред Linux, гарантируя выдающийся уровень производительности при выводе данных с поддержкой масштабирования на несколько GPU. Кроме того, Battlematrix включает функции обеспечения надежности корпоративного уровня: поддержку памяти ECC, виртуализацию ввода-вывода с одним корневым узлом (SR-IOV), мониторинг телеметрии и возможность удаленного обновления прошивки. Эти улучшения призваны сделать высокопроизводительные ИИ-нагрузки более доступными и эффективными как для разработчиков, так и для корпоративных сред.
Roadmap развития программного стека Intel Battlematrix. Источник: Intel.
Важным элементом обновления стал выпуск первой версии контейнера LLM Scaler 1.0, обеспечивающей корпоративным пользователям возможности раннего внедрения и тестирования. Это обновление построено на платформе vLLM и демонстрирует существенный прирост производительности. Оно обеспечивает до 1,8-кратного увеличения количества токенов на вывод в секунду (TPOP) для длинных входных последовательностей, превышающих 4K, на моделях с 32B KPI, а также впечатляющее 4,2-кратное увеличение показателя TPOP для моделей с 70B KPI при длине последовательности 40K. Оптимизация дает примерно на 10% более высокую пропускную способность для моделей KPI размером от 8 до 32 бит по сравнению с предыдущими версиями. LLM Scaler 1.0 также включает функционал для минимизации использования памяти GPU через послойное квантование, экспериментальную поддержку конвейерного параллелизма (PP), интеграцию с torch.compile и спекулятивное декодирование.
Релиз также расширяет совместимость моделей, добавляя поддержку моделей для встраиваемых систем и повторного ранжирования, улучшенную мультимодальную поддержку, автоматическое определение максимальной длины последовательности, параллелизм данных и инструменты тестирования OneCCL. Дополнительно, XPU Manager предоставляет возможности для управления питанием GPU, обновления встроенного ПО, диагностики и мониторинга пропускной способности памяти.
Выводы
Intel подтверждает, что выпуск решения строго соответствует графику, намеченному в мае 2025 году. Компания планирует представить улучшенную версию LLM Scaler с дополнительными функциями к концу третьего квартала 2025 года. Ожидается, что в четвертом квартале последует полнофункциональный релиз, который еще больше укрепит позиции Intel в сфере искусственного интеллекта. Однако будет ли это решение востребованным, особенно в условиях доминации программных ИИ-стеков от Nvidia и активной экспансии AMD на этот рынок, станет ясно только после полноценного релиза Battlematrix.
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Получите скидку 3 000 рублей или бесплатную доставку за подписку на новости*!
* — скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка.
Мы получили ваш отзыв!
Он появится на сайте после модерации.
Мы получили ваш отзыв!
Он появится на сайте после модерации.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.