Meta* представила четыре новых ИИ-ускорителя: MTIA 300, MTIA 400, MTIA 450 и MTIA 500

13.03.2026

~ 2 мин

Простой

Новости

Введение

Компания Meta* анонсировала сразу четыре новых поколения собственный NPU-чипов для инференса и обучения, которые вошли в семейство MTIA (Meta* Training and Inference Accelerator) — модели 300, 400, 450 и 500. Часть из них уже работает в облачной инфраструктуре компании, другие находятся на стадии внедрения или запланированы к развертыванию до 2028 года.

Подробнее о ИИ-чипах MTIA

Самый младший ИИ-ускоритель MTIA 300 построен на одном вычислительном чиплете с матрицей процессорных элементов на базе векторных ядер RISC-V. Он оснащен 216 ГБ памяти HBM3 с пропускной способностью 6,1 ТБ/с и обеспечивает до 1,2 PFLOPS производительности в операциях FP8/МХ8 при энергопотреблении в 800 Вт. Ускоритель уже применяется в инфраструктуре Meta* для обучения моделей искусственного интеллекта по методике Rephrase and Respond. Чипы MTIA 300 объединяются в кластеры до 16 штук.

MTIA 400 — это универсальное решение с двумя вычислительными чиплетами, 288 ГБ HBM3 (9,2 ТБ/с) и производительностью до 6 PFLOPS. TDP вырос до 1200 Вт, а для объединения 72 таких ускорителей в единой стойке используется коммутируемая объединительная плата на базе интерфейса PCIe Gen5, создающая единый масштабируемый домен. Тестирование MTIA 400 уже завершено, сейчас ИИ-ускоритель постепенно внедряется в облачную инфраструктуру компании.

Следующая модель MTIA 450 с 4 чиплетами, оптимизирована для инференса в генеративных приложениях. При том же объеме памяти 288 ГБ ее пропускная способность удвоена до 18,4 ТБ/с за счет использования памяти HBM4, а пиковая производительность достигает 7 PFLOPS в FP8/МХ8 и 21 PFLOPS в режиме МХ4. Энергопотребление составляет 1400 Вт. Начало внедрения запланировано на первый квартал 2027 года.

Флагман линейки — MTIA 500, также предназначенный для ИИ-инференса. Он использует компоновку из 6 вычислительных чиплетов, от 384 до 512 ГБ HBM4 с пропускной способностью до 27,6 ТБ/с и обеспечивает до 10 PFLOPS в FP8/МХ8 и до 30 PFLOPS в МХ4. TDP составляет 1700 Вт. Массовое развертывание намечено на 2027 год.

Все три старшие модели — MTIA 400, 450 и 500 — используют унифицированное шасси, стойки и сетевую инфраструктуру, что позволяет заменять ускорители на более новые без масштабной модернизации всей системы. Известно, что для межузлового соединения ускорителей используются технологии RoCE v2. Поскольку фреймворк PyTorch был создан компанией Meta*, все ИИ-ускорители будут поддерживать эту платформы для работы с LLM.

Характеристики NPU-чипов Meta* MTIA. Источник: Meta*.

Выводы

Новая линейка MTIA демонстрирует последовательную стратегию Meta* по развитию собственных аппаратных решений для ИИ, охватывающих как обучение, так и инференс. Рост производительности от модели к модели впечатляет: от 1,2 до 10 PFLOPS, при этом объем и пропускная способность памяти также кратно увеличиваются. Унификация платформы для поколений 400–500 позволяет гибко наращивать мощность без замены инфраструктуры. Эти ускорители позволят Meta* эффективнее обслуживать свои гипермасштабируемые ИИ-нагрузки, включая генеративные сервисы, и снизить зависимость от сторонних поставщиков, таких как Nvidia.

*Деятельность Meta Platforms Inc. в России признана экстремистской и запрещена

Автор:

Serverflow