AMD официально представила Instinct MI350X и MI355X
Автор: ServerFlow
Компания AMD официально представила ИИ-ускорители четвертого поколения Instinct MI350.
Введение
12 июня 2025 года на ежегодной конференции Advenced AI, компания AMD официально анонсировала выход передовых ИИ-ускорителей четвертного поколения Instinct MI350X и MI355X. Компания заявляет, что новейшие графические решения будут обеспечивать кратный прирост в производительности, выводе и обучении искусственного интеллекта.
Лиза Су презентует чип ускорителей серии AMD Instinct MI350. Источник: YouTube.
Подробнее о AMD Instinct MI350X и MI355X
AMD Instinct MI350X и MI355X базируются на идентичной аппаратной конфигурации, ввиду чего оба решения поддерживают до 288 ГБ памяти HBM3E с пропускной способностью до 8 ТБ/с. Также AMD ввела новые форматы вычислений с плавающей запятой, в числе которых FP4 и FP6. AMD делает особый акцент на добавлении режима FP4 и называет это главной особенностью архитектуры CDNA4, которая обеспечивает производительность в 20,1 PFLOPS для этих режимов вычислений (MI355X). Производительность в режимах FP8 и FP16 была также увеличена до 10,1 PFLOPS и 5 FLOPS соответственно (MI355X).
Характеристики ИИ-ускорителей серии Instinct MI350. Источник: AMD.
Ключевое различие между Instinct MI350X и MI355X заключается в том, что ускоритель Instinct MI350X оптимизирован для систем с воздушным охлаждением и высокими требованиями к низкому энергопотреблению вследствие чего имеет 1000 Вт TDP. В свою очередь, Instinct MI355X рассчитан на повышенное энергопотребление в системах с жидкостным охлаждением для достижения максимальной производительности, благодаря чему его TDP увеличен до 1400 Вт. Чипы также оснащены UBB8 — новым стандартом для быстрого развертывания инфраструктуры ИИ, который позволяет быстрее создавать вычислительные узлы с воздушным и жидкостным охлаждением. Интересно, что в отличие от предыдущего поколения в лице MI300, AMD не планирует выпускать APU версии ускорителей MI350A и MI355A с CPU и GPU ядрами на одном кристалле. Еще одно преимущество четвертого поколения Instinct MI355A — эти решения обеспечивают 40% прирост токенов за 1$.
Архитектура чипов Instinct MI350X и MI355X также претерпела значительные изменения в сравнении с предыдущим поколением ИИ-ускорителей. К примеру, AMD сократила количество модулей IOD с четырех до двух, чтобы упростить конструкцию процессора для интеграции удвоенной шины памяти Infinity Fabric. Это позволило увеличить пропускную способность интерфейса до 5,5 ТБ/с, а также снизить энергопотребление за счет уменьшения частоты шины и напряжения, оптимизируя энергоэффективность. Процессоры подключаются к хосту через интерфейс PCIe 5.0 x16 и определяются системой как единое логическое устройство. Графический чип взаимодействует с другими чипами на подложке через семь каналов Infinity Fabric, обеспечивая общую пропускную способность до 1075 ГБ/с.
Однако некоторые элементы остаются неизменными. Как и в случае с серией MI300, кэш расположен перед HBM3E (32 МБ кэша на стек HBM), а также используются технологии 2,5D и 3D упаковки чипов.
Архитектура графических процессоров Instinct MI350X и MI355X. Источник: AMD.
AMD заявляет, что обеспечивают Instinct MI350X и MI355X 3-кратный прирост производительности в сравнении с решениями предыдущего поколения линейки MI300X. Кроме того, новейшие ускорители превосходят ИИ-решения компании NVIDIA, в частности, в задачах инференса DeepSeek R1 ускоритель Instinct MI355X обеспечил 1,2-кратный прирост эффективности в сравнении с B200, а при выводе Llama* 3.1 405b решение AMD обходит конкурента в 1,3 раза (инференс в режиме FP4). При этом, Instinct MI355X оказался эквивалентен по производительности передовым ускорителям Nvidia GB200 в выводе большой языковой модели Llama* 3.1 405b. Помимо этого, AMD также сообщила о 4-кратном увеличении производительности ИИ-вычислений и 35-кратном росте производительности логического вывода по сравнению с предыдущим поколением ускорителей AMD Instinct MI300X. Такой значительный прирост обуславливается использованием передовой вычислительной архитектуры CDNA 4 и применением более компактного 3-нм техпроцесса для восьми чиплетов с 32 ядрами на каждом (256 ядер суммарно). При этом, модуль ввода/вывода остался на 5-нм техпроцессе.
Превосходство ускорителей Instinct MI355X над решениями Nvidia GB200 и B200. Источник: AMD.
Оба решения будут использоваться в стоечных системах AMD до конца 2025 года и в 2026 году, после чего их заменят новейшие ИИ-ускорители серии Instinct MI400.
ИИ-ускорители Instinct MI400 будут анонсированы в 2026 году. Источник: AMD.
Объем памяти HBM3E в MI355X от AMD 1,6-кратно превышает показатели конкурирующих GPU NVIDIA GB200 и B200, при этом имея эквивалентную пропускной способности 8 ТБ/с. AMD также заявляет о 2-кратном преимуществе MI355X над ускорителями Nvidia в пиковой производительности в режимах FP64 и FP32 (по 79 TFLOPS) над чипами NVIDIA, однако это совсем неудивительно ввиду фокуса Nvidia на масштабировании производительности режимах вычислений с повышенной точность.
Выводы
Релиз ИИ-ускорителей Instinct MI350X и MI355X ожидался всем мировым IT-сообществом, и компании AMD удалось представить действительно интересное решение, которое определенно будет пользоваться спросом в секторе ИИ. Особое внимание стоит уделить Instinct MI355X, которому удалось не просто сравняться с передовыми решениями Blackwell компании Nvidia, но и превзойти их по производительности по некоторым параметрам и количеству высокоскоростной памяти HBM. Это может стать решающим фактором выбора владельцев многих ИИ-ориентированных дата-центров, и уже к концу 2025 года количество крупнейших клиентов AMD кратно увеличится.
*LLAMA — проект Meta Platforms Inc.**, деятельность которой в России признана экстремистской и запрещена
**Деятельность Meta Platforms Inc. в России признана экстремистской и запрещена
AMD официально представила Instinct MI350X и MI355X
12 июня 2025 года на ежегодной конференции Advenced AI, компания AMD официально анонсировала выход передовых ИИ-ускорителей четвертного поколения Instinct MI350X и MI355X. Компания заявляет, что новейшие графические решения будут обеспечивать кратный прирост в производительности, выводе и обучении искусственного интеллекта.
Лиза Су презентует чип ускорителей серии AMD Instinct MI350. Источник: YouTube.
Подробнее о AMD Instinct MI350X и MI355X
AMD Instinct MI350X и MI355X базируются на идентичной аппаратной конфигурации, ввиду чего оба решения поддерживают до 288 ГБ памяти HBM3E с пропускной способностью до 8 ТБ/с. Также AMD ввела новые форматы вычислений с плавающей запятой, в числе которых FP4 и FP6. AMD делает особый акцент на добавлении режима FP4 и называет это главной особенностью архитектуры CDNA4, которая обеспечивает производительность в 20,1 PFLOPS для этих режимов вычислений (MI355X). Производительность в режимах FP8 и FP16 была также увеличена до 10,1 PFLOPS и 5 FLOPS соответственно (MI355X).
Характеристики ИИ-ускорителей серии Instinct MI350. Источник: AMD.
Ключевое различие между Instinct MI350X и MI355X заключается в том, что ускоритель Instinct MI350X оптимизирован для систем с воздушным охлаждением и высокими требованиями к низкому энергопотреблению вследствие чего имеет 1000 Вт TDP. В свою очередь, Instinct MI355X рассчитан на повышенное энергопотребление в системах с жидкостным охлаждением для достижения максимальной производительности, благодаря чему его TDP увеличен до 1400 Вт. Чипы также оснащены UBB8 — новым стандартом для быстрого развертывания инфраструктуры ИИ, который позволяет быстрее создавать вычислительные узлы с воздушным и жидкостным охлаждением. Интересно, что в отличие от предыдущего поколения в лице MI300, AMD не планирует выпускать APU версии ускорителей MI350A и MI355A с CPU и GPU ядрами на одном кристалле. Еще одно преимущество четвертого поколения Instinct MI355A — эти решения обеспечивают 40% прирост токенов за 1$.
Архитектура чипов Instinct MI350X и MI355X также претерпела значительные изменения в сравнении с предыдущим поколением ИИ-ускорителей. К примеру, AMD сократила количество модулей IOD с четырех до двух, чтобы упростить конструкцию процессора для интеграции удвоенной шины памяти Infinity Fabric. Это позволило увеличить пропускную способность интерфейса до 5,5 ТБ/с, а также снизить энергопотребление за счет уменьшения частоты шины и напряжения, оптимизируя энергоэффективность. Процессоры подключаются к хосту через интерфейс PCIe 5.0 x16 и определяются системой как единое логическое устройство. Графический чип взаимодействует с другими чипами на подложке через семь каналов Infinity Fabric, обеспечивая общую пропускную способность до 1075 ГБ/с.
Однако некоторые элементы остаются неизменными. Как и в случае с серией MI300, кэш расположен перед HBM3E (32 МБ кэша на стек HBM), а также используются технологии 2,5D и 3D упаковки чипов.
Архитектура графических процессоров Instinct MI350X и MI355X. Источник: AMD.
AMD заявляет, что обеспечивают Instinct MI350X и MI355X 3-кратный прирост производительности в сравнении с решениями предыдущего поколения линейки MI300X. Кроме того, новейшие ускорители превосходят ИИ-решения компании NVIDIA, в частности, в задачах инференса DeepSeek R1 ускоритель Instinct MI355X обеспечил 1,2-кратный прирост эффективности в сравнении с B200, а при выводе Llama* 3.1 405b решение AMD обходит конкурента в 1,3 раза (инференс в режиме FP4). При этом, Instinct MI355X оказался эквивалентен по производительности передовым ускорителям Nvidia GB200 в выводе большой языковой модели Llama* 3.1 405b. Помимо этого, AMD также сообщила о 4-кратном увеличении производительности ИИ-вычислений и 35-кратном росте производительности логического вывода по сравнению с предыдущим поколением ускорителей AMD Instinct MI300X. Такой значительный прирост обуславливается использованием передовой вычислительной архитектуры CDNA 4 и применением более компактного 3-нм техпроцесса для восьми чиплетов с 32 ядрами на каждом (256 ядер суммарно). При этом, модуль ввода/вывода остался на 5-нм техпроцессе.
Превосходство ускорителей Instinct MI355X над решениями Nvidia GB200 и B200. Источник: AMD.
Оба решения будут использоваться в стоечных системах AMD до конца 2025 года и в 2026 году, после чего их заменят новейшие ИИ-ускорители серии Instinct MI400.
ИИ-ускорители Instinct MI400 будут анонсированы в 2026 году. Источник: AMD.
Объем памяти HBM3E в MI355X от AMD 1,6-кратно превышает показатели конкурирующих GPU NVIDIA GB200 и B200, при этом имея эквивалентную пропускной способности 8 ТБ/с. AMD также заявляет о 2-кратном преимуществе MI355X над ускорителями Nvidia в пиковой производительности в режимах FP64 и FP32 (по 79 TFLOPS) над чипами NVIDIA, однако это совсем неудивительно ввиду фокуса Nvidia на масштабировании производительности режимах вычислений с повышенной точность.
Выводы
Релиз ИИ-ускорителей Instinct MI350X и MI355X ожидался всем мировым IT-сообществом, и компании AMD удалось представить действительно интересное решение, которое определенно будет пользоваться спросом в секторе ИИ. Особое внимание стоит уделить Instinct MI355X, которому удалось не просто сравняться с передовыми решениями Blackwell компании Nvidia, но и превзойти их по производительности по некоторым параметрам и количеству высокоскоростной памяти HBM. Это может стать решающим фактором выбора владельцев многих ИИ-ориентированных дата-центров, и уже к концу 2025 года количество крупнейших клиентов AMD кратно увеличится.
*LLAMA — проект Meta Platforms Inc.**, деятельность которой в России признана экстремистской и запрещена
**Деятельность Meta Platforms Inc. в России признана экстремистской и запрещена
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Получите скидку 3 000 рублей или бесплатную доставку за подписку на новости*!
* — скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка.
Мы получили ваш отзыв!
Он появится на сайте после модерации.
Мы получили ваш отзыв!
Он появится на сайте после модерации.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.