12 августа 2025 года Intel представила обновленную версию проекта Project Battlematrix, который ранее был анонсирован мае на выставке Computex 2025. Проект направлен на создание масштабируемых и экономичных рабочих станций для задач инференса искусственного интеллекта. Цель инициативы — ускорить реализацию стратегии Intel в области ИИ за счет упрощения интеграции графических процессоров Intel Arc Pro серии Battlemage с проприетарным программным стеком Intel.
Подробнее о программном стеке Battlematrix
Новый стек делает приоритет на удобстве конечного пользователя и строгом соблюдении отраслевых стандартов. Он основан на контейнерном решении, адаптированном для сред Linux, гарантируя выдающийся уровень производительности при выводе данных с поддержкой масштабирования на несколько GPU. Кроме того, Battlematrix включает функции обеспечения надежности корпоративного уровня: поддержку памяти ECC, виртуализацию ввода-вывода с одним корневым узлом (SR-IOV), мониторинг телеметрии и возможность удаленного обновления прошивки. Эти улучшения призваны сделать высокопроизводительные ИИ-нагрузки более доступными и эффективными как для разработчиков, так и для корпоративных сред.
Roadmap развития программного стека Intel Battlematrix. Источник: .
Важным элементом обновления стал выпуск первой версии контейнера LLM Scaler 1.0, обеспечивающей корпоративным пользователям возможности раннего внедрения и тестирования. Это обновление построено на платформе vLLM и демонстрирует существенный прирост производительности. Оно обеспечивает до 1,8-кратного увеличения количества токенов на вывод в секунду (TPOP) для длинных входных последовательностей, превышающих 4K, на моделях с 32B KPI, а также впечатляющее 4,2-кратное увеличение показателя TPOP для моделей с 70B KPI при длине последовательности 40K. Оптимизация дает примерно на 10% более высокую пропускную способность для моделей KPI размером от 8 до 32 бит по сравнению с предыдущими версиями. LLM Scaler 1.0 также включает функционал для минимизации использования памяти GPU через послойное квантование, экспериментальную поддержку конвейерного параллелизма (PP), интеграцию с torch.compile и спекулятивное декодирование.
Релиз также расширяет совместимость моделей, добавляя поддержку моделей для встраиваемых систем и повторного ранжирования, улучшенную мультимодальную поддержку, автоматическое определение максимальной длины последовательности, параллелизм данных и инструменты тестирования OneCCL. Дополнительно, XPU Manager предоставляет возможности для управления питанием GPU, обновления встроенного ПО, диагностики и мониторинга пропускной способности памяти.
Выводы
Intel подтверждает, что выпуск решения строго соответствует графику, намеченному в мае 2025 году. Компания планирует представить улучшенную версию LLM Scaler с дополнительными функциями к концу третьего квартала 2025 года. Ожидается, что в четвертом квартале последует полнофункциональный релиз, который еще больше укрепит позиции Intel в сфере искусственного интеллекта. Однако будет ли это решение востребованным, особенно в условиях доминации программных ИИ-стеков от Nvidia и активной экспансии AMD на этот рынок, станет ясно только после полноценного релиза Battlematrix.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.