AMD официально представила Instinct MI350X и MI355X

12.06.2025

~ 2 мин

1063

Простой

Новости

Введение

12 июня 2025 года на ежегодной конференции Advenced AI, компания AMD официально анонсировала выход передовых ИИ-ускорителей четвертного поколения Instinct MI350X и MI355X. Компания заявляет, что новейшие графические решения будут обеспечивать кратный прирост в производительности, выводе и обучении искусственного интеллекта.

Лиза Су демонстрирует чип Instinct MI350

Лиза Су презентует чип ускорителей серии AMD Instinct MI350. Источник: YouTube.

Подробнее о AMD Instinct MI350X и MI355X

AMD Instinct MI350X и MI355X базируются на идентичной аппаратной конфигурации, ввиду чего оба решения поддерживают до 288 ГБ памяти HBM3E с пропускной способностью до 8 ТБ/с. Также AMD ввела новые форматы вычислений с плавающей запятой, в числе которых FP4 и FP6. AMD делает особый акцент на добавлении режима FP4 и называет это главной особенностью архитектуры CDNA4, которая обеспечивает производительность в 20,1 PFLOPS для этих режимов вычислений (MI355X). Производительность в режимах FP8 и FP16 была также увеличена до 10,1 PFLOPS и 5 FLOPS соответственно (MI355X).

Характеристики ИИ-ускорителей серии Instinct MI350. Источник: AMD.

Ключевое различие между Instinct MI350X и MI355X заключается в том, что ускоритель Instinct MI350X оптимизирован для систем с воздушным охлаждением и высокими требованиями к низкому энергопотреблению вследствие чего имеет 1000 Вт TDP. В свою очередь, Instinct MI355X рассчитан на повышенное энергопотребление в системах с жидкостным охлаждением для достижения максимальной производительности, благодаря чему его TDP увеличен до 1400 Вт. Чипы также оснащены UBB8 — новым стандартом для быстрого развертывания инфраструктуры ИИ, который позволяет быстрее создавать вычислительные узлы с воздушным и жидкостным охлаждением. Интересно, что в отличие от предыдущего поколения в лице MI300, AMD не планирует выпускать APU версии ускорителей MI350A и MI355A с CPU и GPU ядрами на одном кристалле. Еще одно преимущество четвертого поколения Instinct MI355A — эти решения обеспечивают 40% прирост токенов за 1$.

Архитектура чипов Instinct MI350X и MI355X также претерпела значительные изменения в сравнении с предыдущим поколением ИИ-ускорителей. К примеру, AMD сократила количество модулей IOD с четырех до двух, чтобы упростить конструкцию процессора для интеграции удвоенной шины памяти Infinity Fabric. Это позволило увеличить пропускную способность интерфейса до 5,5 ТБ/с, а также снизить энергопотребление за счет уменьшения частоты шины и напряжения, оптимизируя энергоэффективность. Процессоры подключаются к хосту через интерфейс PCIe 5.0 x16 и определяются системой как единое логическое устройство. Графический чип взаимодействует с другими чипами на подложке через семь каналов Infinity Fabric, обеспечивая общую пропускную способность до 1075 ГБ/с.

Однако некоторые элементы остаются неизменными. Как и в случае с серией MI300, кэш расположен перед HBM3E (32 МБ кэша на стек HBM), а также используются технологии 2,5D и 3D упаковки чипов.

Архитектура графических процессоров Instinct MI350X и MI355X. Источник: AMD.

AMD заявляет, что обеспечивают Instinct MI350X и MI355X 3-кратный прирост производительности в сравнении с решениями предыдущего поколения линейки MI300X. Кроме того, новейшие ускорители превосходят ИИ-решения компании NVIDIA, в частности, в задачах инференса DeepSeek R1 ускоритель Instinct MI355X обеспечил 1,2-кратный прирост эффективности в сравнении с B200, а при выводе Llama* 3.1 405b решение AMD обходит конкурента в 1,3 раза (инференс в режиме FP4). При этом, Instinct MI355X оказался эквивалентен по производительности передовым ускорителям Nvidia GB200 в выводе большой языковой модели Llama* 3.1 405b. Помимо этого, AMD также сообщила о 4-кратном увеличении производительности ИИ-вычислений и 35-кратном росте производительности логического вывода по сравнению с предыдущим поколением ускорителей AMD Instinct MI300X. Такой значительный прирост обуславливается использованием передовой вычислительной архитектуры CDNA 4 и применением более компактного 3-нм техпроцесса для восьми чиплетов с 32 ядрами на каждом (256 ядер суммарно). При этом, модуль ввода/вывода остался на 5-нм техпроцессе.

Сравнение Instinct MI355X с Nvidia GB200 и B200

Превосходство ускорителей Instinct MI355X над решениями Nvidia GB200 и B200. Источник: AMD.

Оба решения будут использоваться в стоечных системах AMD до конца 2025 года и в 2026 году, после чего их заменят новейшие ИИ-ускорители серии Instinct MI400.

ИИ-ускорители Instinct MI400 будут анонсированы в 2026 году. Источник: AMD.

Объем памяти HBM3E в MI355X от AMD 1,6-кратно превышает показатели конкурирующих GPU NVIDIA GB200 и B200, при этом имея эквивалентную пропускной способности 8 ТБ/с. AMD также заявляет о 2-кратном преимуществе MI355X над ускорителями Nvidia в пиковой производительности в режимах FP64 и FP32 (по 79 TFLOPS) над чипами NVIDIA, однако это совсем неудивительно ввиду фокуса Nvidia на масштабировании производительности режимах вычислений с повышенной точность.

Выводы

Релиз ИИ-ускорителей Instinct MI350X и MI355X ожидался всем мировым IT-сообществом, и компании AMD удалось представить действительно интересное решение, которое определенно будет пользоваться спросом в секторе ИИ. Особое внимание стоит уделить Instinct MI355X, которому удалось не просто сравняться с передовыми решениями Blackwell компании Nvidia, но и превзойти их по производительности по некоторым параметрам и количеству высокоскоростной памяти HBM. Это может стать решающим фактором выбора владельцев многих ИИ-ориентированных дата-центров, и уже к концу 2025 года количество крупнейших клиентов AMD кратно увеличится.

*LLAMA — проект Meta Platforms Inc.**, деятельность которой в России признана экстремистской и запрещена

**Деятельность Meta Platforms Inc. в России признана экстремистской и запрещена

Автор:

Serverflow