Компания Meta* анонсировала сразу четыре новых поколения собственный NPU-чипов для инференса и обучения, которые вошли в семейство MTIA (Meta* Training and Inference Accelerator) — модели 300, 400, 450 и 500. Часть из них уже работает в облачной инфраструктуре компании, другие находятся на стадии внедрения или запланированы к развертыванию до 2028 года.
Подробнее о ИИ-чипах MTIA
Самый младший ИИ-ускоритель MTIA 300 построен на одном вычислительном чиплете с матрицей процессорных элементов на базе векторных ядер RISC-V. Он оснащен 216 ГБ памяти HBM3 с пропускной способностью 6,1 ТБ/с и обеспечивает до 1,2 PFLOPS производительности в операциях FP8/МХ8 при энергопотреблении в 800 Вт. Ускоритель уже применяется в инфраструктуре Meta* для обучения моделей искусственного интеллекта по методике Rephrase and Respond. Чипы MTIA 300 объединяются в кластеры до 16 штук.
MTIA 400 — это универсальное решение с двумя вычислительными чиплетами, 288 ГБ HBM3 (9,2 ТБ/с) и производительностью до 6 PFLOPS. TDP вырос до 1200 Вт, а для объединения 72 таких ускорителей в единой стойке используется коммутируемая объединительная плата на базе интерфейса PCIe Gen5, создающая единый масштабируемый домен. Тестирование MTIA 400 уже завершено, сейчас ИИ-ускоритель постепенно внедряется в облачную инфраструктуру компании.
Следующая модель MTIA 450 с 4 чиплетами, оптимизирована для инференса в генеративных приложениях. При том же объеме памяти 288 ГБ ее пропускная способность удвоена до 18,4 ТБ/с за счет использования памяти HBM4, а пиковая производительность достигает 7 PFLOPS в FP8/МХ8 и 21 PFLOPS в режиме МХ4. Энергопотребление составляет 1400 Вт. Начало внедрения запланировано на первый квартал 2027 года.
Флагман линейки — MTIA 500, также предназначенный для ИИ-инференса. Он использует компоновку из 6 вычислительных чиплетов, от 384 до 512 ГБ HBM4 с пропускной способностью до 27,6 ТБ/с и обеспечивает до 10 PFLOPS в FP8/МХ8 и до 30 PFLOPS в МХ4. TDP составляет 1700 Вт. Массовое развертывание намечено на 2027 год.
Все три старшие модели — MTIA 400, 450 и 500 — используют унифицированное шасси, стойки и сетевую инфраструктуру, что позволяет заменять ускорители на более новые без масштабной модернизации всей системы. Известно, что для межузлового соединения ускорителей используются технологии RoCE v2. Поскольку фреймворк PyTorch был создан компанией Meta*, все ИИ-ускорители будут поддерживать эту платформы для работы с LLM.
Характеристики NPU-чипов Meta* MTIA. Источник: .
Выводы
Новая линейка MTIA демонстрирует последовательную стратегию Meta* по развитию собственных аппаратных решений для ИИ, охватывающих как обучение, так и инференс. Рост производительности от модели к модели впечатляет: от 1,2 до 10 PFLOPS, при этом объем и пропускная способность памяти также кратно увеличиваются. Унификация платформы для поколений 400–500 позволяет гибко наращивать мощность без замены инфраструктуры. Эти ускорители позволят Meta* эффективнее обслуживать свои гипермасштабируемые ИИ-нагрузки, включая генеративные сервисы, и снизить зависимость от сторонних поставщиков, таких как Nvidia.
*Деятельность Meta Platforms Inc. в России признана экстремистской и запрещена
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Скидка 1 500 ₽ или бесплатная доставка - уже сейчас 🔥
Мы ценим обратную связь от клиентов. При оформлении заказа вы можете сообщить о своём намерении поделиться впечатлением о работе ServerFlow после получения товара.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка до ПВЗ СДЭК.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.
При оформлении заказа в ServerFlow вы можете сообщить о намерении оставить отзыв о нашей работе после получения товара.
Нам важно ваше честное мнение. Оно помогает развивать сервис и даёт другим клиентам представление о нашей работе.
Вы можете оставить отзыв на удобной для вас платформе:
Google Maps
2GIS
Яндекс Карты
Как работает акция
Применяя промокод, вы подтверждаете намерение поделиться впечатлением о работе ServerFlow после получения заказа. Мы применяем бонус уже к текущему заказу в знак благодарности за обратную связь.
Условия акции:
скидка 1 500 ₽ при заказе от 30 000 ₽
или бесплатная доставка* при заказе до 30 000 ₽
* Бесплатная доставка заказа осуществляется до ПВЗ СДЭК.