Radeon AI PRO R9700 AI TOP 32GB: обзор и тесты видеокарты для нейросетей от AMD в исполнении GIGABYTE

12.03.2026

~ 17 мин

1711

Простой

Статьи

Введение: Дитя маркетолога

На рынке GPU произошло кое-что необычное. AMD выпустила карту, в названии которой чётко фигурирует приставка «AI». Адаптировавшись под новые веяния рынка, “красная компания” пошла на поводу у тренда и выпустила первый в своей истории ускоритель с прямым упоминанием AI в названии.

И действительно, новоиспеченная видеокарта взаправду заточена под работу с нейросетевыми моделями. По крайней мере на бумаге. А соответствует ли это действительности мы выясним в этой статье, на примере GIGABYTE AI TOP Radeon AI PRO R9700, в названии которой аж дважды фигурирует упоминание «AI», что пока является рекордом по количеству упоминаний маркетинговых приставок на квадратный сантиметр коробки.

Характеристики видеокарты AMD AI PRO R9700

В отличие от своих суперкомпьютерных собратьев, которые в первую очередь и предназначены для эксплуатации с нейросетевыми моделями, R9700 построена на микроархитектуре RDNA 4.0. Напомним, что с 2020 года AMD развивает две отдельные архитектурные линии. В первой: игровые и профессиональные GPU с микроархитектурой RDNA. А во второй на серверные и суперкомьпьютерные ускорители, базированные на микроархитектуре CDNA.

Для AI PRO R9700 это означает уступающую в развитии поддержку ROCm, весь стек которой изначально выстраивался под CDNA. Однако это нисколько не мешает занять её своё место в своей ценовой категории. Ведь окинув рынок потребительских видеокарт взглядом, можно приметить, что только RTX 5090 предлагает сопоставимый объём видеопамяти, стоимость которой на голову выше.

Характеристики AI PRO R9700. Источник: AMD.

32 гигабайта GDDR6 – основной аргумент R9700 в конкурентной борьбе. Именно объём памяти позволяет ей называться “ИИ-ускорителем”. Объём памяти напрямую определяет, что можно запускать локально. Больше VRAM – значит больше параметров модели помещается целиком на карте, без свопа в RAM.

Объём видеопамяти определяет три параметра сразу: какие модели доступны, насколько длинный контекст можно обслуживать и какой размер пакетов тянет карта в многопользовательском инференсе. К примеру, на 16 ГБ модель вроде Llama* 3.1 32B в Q4_K_M уже не влезает без компромиссов, на 32 ГБ – влезают. Больший объём VRAM напрямую влияет на ассортимент доступных LLM.

В остальном AI PRO R9700 – идентична RX 9070 XT. Карта сочетает 32 ГБ GDDR6 с 256‑битной шиной и пропускной способностью памяти 640 ГБ/с, 64 вычислительных блока (CU) и 4096 потоковых процессоров. Дополнительно задействованы 128 специализированных AI‑ускорителей второго поколения и 64 блока трассировки лучей, что позволяет эффективно работать с форматами FP32, FP16 и INT8 в матричных операциях. Отдельно стоит отметить поддержку FP8 и INT4 – именно наличие этих форматов позволяет демонстрировать высокую производительность при работе с современными LLM.

Однако давайте оставим теоретическую производительность в покое и рассмотрим новинку поближе. Начнём – с её компоновки.

Компоновка и охлаждение видеокарты GIGABYTE AI TOP Radeon AI PRO R9700

Radeon AI PRO R9700 построена в компактном двухслотовом форм-факторе. Карта создана специально для конфигураций с несколькими GPU в ограниченном пространстве. Турбинное охлаждение позволяет устанавливать карты плотно друг к другу без перегрева, что критично для рабочих станций с 2–4 GPU для обучения крупных локальных моделей.

На презентации AI PRO R9700 AMD демонстрируют, как турбинное охлаждение позволяет ставить видеокарты практически вплотную друг к другу. Упрощая проектирования схем продува и теплораспределения.

Видеоадаптер обладает единственным разъёмом питания 12V-2x6 вместо традиционных 6 и 8-pin. Энергопотребление составляет 300W. Рекомендованный блок питания: от 750 Ватт.

Переходник с двух 8-pin на 12V-2x6 входит в комплект видеокарты.

Что любопытно: GIGABYTE AI TOP AI PRO R9700 оснащена 3-мя портами DisplayPort 2.1a, и лишь одним HDMI 2.1b. Референсный же дизайн вообще не подразумевает наличие HDMI, все четыре порта – DisplayPort 2.1a.

На этом из выдающегося – всё. В остальном печатная плата полностью совпадает с обычной RX 9070 XT. Теперь давайте взглянем: готовы ли ИИ-движки к появлению такого принципиально нового типа ускорителя?

Готовы ли ИИ-движки к AMD AI PRO R9700: llama.cpp, vLLM, SGLang

llama.cpp работает с R9700 через HIP-бэкенд (ROCm) и через Vulkan. Разница в производительности колоссальная: ROCm во множество раз производительнее Vulkan. Посему ROCm здесь приоритет, а Vulkan – запасной вариант.

vLLM получил официальную поддержку RDNA3/RDNA4 в версии 0.15.0, вышедшей 29 января 2026 года. До этого поддержка исходила только через патчи от комьюнити. Нативная поддержка FP8 для RDNA4 в основную ветку пока не интегрирована и остаётся в стадии отдельного патча.

SGLang – обособленная история. В документации отсутствуют даже упоминания RDNA. Поддерживаются только карты AMD Instinct серии MI300X. Тратить время на SGLang с R9700 на данный момент не стоит.

Почему это так? Потому что AMD традиционно уделяет приоритет Instinct-серии (CDNA-архитектуре) в своём ROCm-стеке. RDNA4 – это новинка, под которую только-только начала выравниваться экосистема. Документация, официальные примеры, ответы комьюнити – всё это скорее заточено под Instinct, нежели под профессиональные Radeon. Но это больше скоротечный недостаток R9700, чем фундаментальный изъян. Пройдёт немного времени: и сама AMD, и комьюнити подтянут оптимизацию экосистемы под новую линейку.

Установка видеокарты AMD AI PRO R9700 AI TOP в систему и запуск на Linux

Как было указано выше, единственным полноценным движком, поддерживающим PRO R9700 в полной мере – является llama.cpp. Именно на него мы и будем делать упор при тестировании.

А в качестве системы будет использоваться самый распространённый дистрибутив Linux – Ubuntu 24.04.4 LTS. В отличии от “инстинктов” AI PRO R9700 умеет работать как на Linux, так и на Windows. Однако именно Linux является основной средой обитания R9700. Поскольку там функционирует полноценный стек: ROCm поддерживается официально, HIP-бэкенд работает, ECC-память активна. Использование Windows – нестандартный сценарий, который заслуживает собственной, отдельной статьи. А на нашем ютуб канале мы протестировали AI PRO R9700 в ComfyUI, Kandinsky и Wan2.2.

Установка и настройка ROCm на R9700 аналогична установке на любой Instinct, в нашем случае будет использоваться версия 7.1.1.

Покончив с настройкой, давайте оценим производительность AI PRO R9700 в популярных LLM.

Тест видеокарты AMD AI PRO R9700 в популярных LLM на Linux

Подборка состоит из нескольких сегментов: популярные, крупные модели, модели для кодинга и недавно появившиеся на свет LLM. Набор тестируемых моделей во многом совпадает со списком из обзоров AMD Instinct MI100 и NVIDIA Tesla V100.

Тестирование LLM на AMD Radeon AI PRO R9700

Модель	Форматы квантизации	Скорость (т/сек)	До первого токена	Длина контекста	Примечания
Базовые популярные модели
Qwen 2.5 7B-Instruct	Q4_K_M	80.80 т/сек	0.07 сек.	4096	Разумная, провереная временем модель.
Llama 3.1 8B-Instruct*	Q4_K_M	67.05 т/сек	0.06 сек.	4096	Немногословна, но дает только верные ответы.
Mistral 7B v0.3	Q4_K_M	73.31 т/сек	0.05 сек.	4096	Самая среднестатистическая из представленных, ничем не выделяется.
gpt-oss-20b	MXFP4	109.68 т/сек Лучшая	0.13 сек.	4096	Одна из лучших нейросетевых моделей, выдаёт подробные и быстрые ответы.
Mistralai/Devstral-small-2-2512 24B	Q4_K_M	72.28 т/сек	0.05 сек.	4096	Типовая Dense модель, пришедшая на замену Mixtral 8x7B. Дает добротные ответы.
Крупные языковые модели
Qwen 2.5 14B-Instruct	Q4_K_M	41.57 т/сек	0.13 сек.	4096	Иногда спотыкается на сложных предложениях, задумываясь на доли секунды.
Qwen3 14B	Q4_K_M	38.19 т/сек	0.12 сек.	4096	Лишена изъянов версии 2.5
Gemma 3 27B-IT-QAT	Q4_O	30.81 т/сек	0.22 сек.	4096	Грамотно и логично строит ответы, никогда не плутает в словах и не допускает ошибок
Qwen3 32B	Q4_K_M	27.61 т/сек Медленно	0.26 сек.	4096	Чрезвычайно подробные ответы, ловко жонглирует грамотными словосочетаниями как на русском, так и на английском языке.
Kimi Linear 48B A3B Instruct	Q4_K_M	16.81 т/сек Медленно	1.40 сек.	4096	Грань возможностей PRO R9700. Модель с трудом помещается в память, но выдаёт приемлимые и развёрнутые ответы.
Кодовые модели
Deepseek Coder 7B	Q4_K_M	66.55 т/сек	0.05 сек.	4096	Легко пишет простенькие программы и скрипты
Code Llama 7B*	Q4_K_M	80.54 т/сек Быстро	0.04 сек.	4096	Самый шустрый из кодеров
Granite Code 8B	Q4_K_M	68.27 т/сек	0.07 сек.	4096	Добротный кодер, но плохо понимает запросы на русском.
Недавние релизы
DeepSeek-R1 Distilled 14B	Q4_K_M	56.37 т/сек	0.16 сек.	4096	Не очень хорошо дружит с русским языком.
DeepSeek-R1 Distilled 32B	Q4_K_M	27.63 т/сек Медленно	0.26 сек.	4096	Немногим лучше версии на 14млрд параметров
Ministral 3 14B-Instruct	Q4_K_M	57.10 т/сек	0.11 сек.	4096	Дает чрезвычайно развернутые и подробные ответы
Ministral 3 14B-Reasoning	Q4_K_M	55.20 т/сек	0.12 сек.	4096	Прекрасная модель, может тягаться с gpt-oss-20b
Qwen3.5 9B	Q4_K_M	51.57 т/сек	0.57 сек.	4096	Самая свежая модель Qwen, вышедшая 2 марта 2026 года. Очень масштабно и подробно мыслит для своих небольших «габаритов»
Qwen3.5 35B A3B	Q4_K_M	60.06 т/сек Быстро	0.32 сек.	4096	Ещё одна свежая модель Qwen, вышедшая 24.02.2026. Даёт лучшие и самые подробные ответы. Прекрасно развита логика и отлично строит причино-следственные связи

Все модели протестированы на AMD Radeon AI PRO R9700 с контекстом 4096 токенов. Скорость генерации измеряется в токенах в секунду (т/сек). «До первого токена» показывает время ответа системы с момента начала запроса.

По завершению тестирования можно приметить одну деталь: помимо значительно более долгой загрузки модели в память, на крупных моделях AI PRO R9700 сильно теряет в производительности – сказывается присутствие GDDR6 памяти а не многослойной HBM, как на многих серверных ускорителях.

Это рисует интересную картину: на некрупных моделях R9700 идёт вровень с той же AMD Instinct MI100, или вовсе опережает её. Но на моделях вес которых превышает отметку 8-10 гигабайт, “прошка” начинает существенно отставать, вплоть до 30% на некоторых моделях.

Но несмотря на это, есть аспект, в котором AI PRO R9700 AI TOP существенно превосходит своего серверного собрата.

Температуры видеокарты AMD AI PRO R9700

AI PRO R9700 получилась достаточно холодной видеокартой, особенно в сопоставлении с серверными чудовищами. Её средние температуры не переступают отметку 70 градусов по Цельсию. А хотспот лишь изредка превышает это значение. Нагрев памяти тоже останавливается вблизи 70 °C – на 71-73 градусах. По крайней мере в реальной нагрузке.

Получасовой прогон в реальной нагрузке на крупных языковых моделях.

Бенчмарк немного корректирует показатели, но не разительно: средняя температура едва превышает 70 °C. Разогревается только память – до ~85 градусов. И хотспот, он прыгает выше прочих: до 90-95 °C.

Температуры AMD AI PRO R9700 в бенчмарке

Часовая нагрузка во встроенном в ROCm бенчмарке.

Итак, в полной мере ознакомившись со всеми положительными и отрицательными гранями нового ускорителя от AMD, можно сформировать итог.

Новый

Supermicro AS-2025HS-TNR (2× Radeon AI PRO R9700 32GB, 2× EPYC 9124, RAM 128GB)

Платформа 2U с 2 видеокартами GIGABYTE Radeon AI PRO R9700 AI TOP 32GB GDDR6

1 718 800 руб.

Цена включает НДС 7%

В корзину Сконфигурировать

Есть в наличии

Сравнить

Гарантия 1 год с заменой компонентов

Б/У

Supermicro 2029GP-TR (4× Radeon AI PRO R9700 32GB, 2× Xeon Gold 6248, RAM 384GB)

Платформа 2U с 4 видеокартами GIGABYTE Radeon AI PRO R9700 AI TOP 32GB GDDR6

1 616 000 руб.

Цена включает НДС 7%

В корзину Сконфигурировать

Под заказ

Сравнить

Гарантия 1 год с заменой компонентов

Б/У

Supermicro 747BTQ-R2K04B (4× Radeon AI PRO R9700 32GB, 1× EPYC 7502, RAM 128GB)

Платформа 4U с 4 видеокартами GIGABYTE Radeon AI PRO R9700 AI TOP 32GB GDDR6

1 374 900 руб.

Цена включает НДС 7%

В корзину

Под заказ

Сравнить

Гарантия 1 год с заменой компонентов

Новый

Deepcool MATREXX 55 MESH (1× Radeon AI PRO R9700 32GB, 1× Ryzen 9 9950X, RAM 64GB)

Платформа Tower с 1 видеокартой GIGABYTE Radeon AI PRO R9700 AI TOP 32GB GDDR6

612 200 руб.

Цена включает НДС 7%

В корзину

Под заказ

Сравнить

Гарантия 1 год с заменой компонентов

Новый

Phanteks Enthoo Pro 2 Server Edition (4× Radeon AI PRO R9700 32GB, 1× Xeon Platinum 8341C, RAM 128GB)

Платформа Tower с 4 видеокартами GIGABYTE Radeon AI PRO R9700 AI TOP 32GB GDDR6

1 338 900 руб.

Цена включает НДС 7%

В корзину

Под заказ

Сравнить

Гарантия 1 год с заменой компонентов

Б/У

Supermicro 4028GR-TR (6× Radeon AI PRO R9700 32GB, 2× Xeon E5 2697Av4 RAM 128GB)

Платформа 4U с 6 видеокартами GIGABYTE Radeon AI PRO R9700 AI TOP 32GB GDDR6

1 858 800 руб.

Цена включает НДС 7%

В корзину Сконфигурировать

Есть в наличии

Сравнить

Гарантия 1 год с заменой компонентов

Заключение: универсальность за недорого

AMD AI PRO R9700 AI TOP – видеокарта, явно преуспевшая в своей нише. Если вам необходим “ИИ-ускоритель” за относительно некрупные деньги (по меркам конкурентов). И при этом вы не готовы мириться с ограниченностью линейки Instinct, желая сохранить весь функционал и поддержку Windows в одной видеокарте. Она – практически безальтернативный выбор в текущей конъюнктуре рынка.

*LLAMA — проект Meta Platforms Inc.**, деятельность которой в России признана экстремистской и запрещена

**Деятельность Meta Platforms Inc. в России признана экстремистской и запрещена

Автор:

Serverflow

Radeon AI PRO R9700 AI TOP 32GB: обзор и тесты видеокарты для нейросетей от AMD в исполнении GIGABYTE

Введение: Дитя маркетолога

Характеристики видеокарты AMD AI PRO R9700

Компоновка и охлаждение видеокарты GIGABYTE AI TOP Radeon AI PRO R9700

Готовы ли ИИ-движки к AMD AI PRO R9700: llama.cpp, vLLM, SGLang

Установка видеокарты AMD AI PRO R9700 AI TOP в систему и запуск на Linux

Тест видеокарты AMD AI PRO R9700 в популярных LLM на Linux

Тестирование LLM на AMD Radeon AI PRO R9700

Температуры видеокарты AMD AI PRO R9700

Заключение: универсальность за недорого

Комментарии 0