На рынке GPU произошло кое-что необычное. AMD выпустила карту, в названии которой чётко фигурирует приставка «AI». Адаптировавшись под новые веяния рынка, “красная компания” пошла на поводу у тренда и выпустила первый в своей истории ускоритель с прямым упоминанием AI в названии.
И действительно, новоиспеченная видеокарта взаправду заточена под работу с нейросетевыми моделями. По крайней мере на бумаге. А соответствует ли это действительности мы выясним в этой статье, на примере GIGABYTE AI TOP Radeon AI PRO R9700, в названии которой аж дважды фигурирует упоминание «AI», что пока является рекордом по количеству упоминаний маркетинговых приставок на квадратный сантиметр коробки.
Характеристики видеокарты AMD AI PRO R9700
В отличие от своих суперкомпьютерных собратьев, которые в первую очередь и предназначены для эксплуатации с нейросетевыми моделями, R9700 построена на микроархитектуре RDNA 4.0. Напомним, что с 2020 года AMD развивает две отдельные архитектурные линии. В первой: игровые и профессиональные GPU с микроархитектурой RDNA. А во второй на серверные и суперкомьпьютерные ускорители, базированные на микроархитектуре CDNA.
Для AI PRO R9700 это означает уступающую в развитии поддержку ROCm, весь стек которой изначально выстраивался под CDNA. Однако это нисколько не мешает занять её своё место в своей ценовой категории. Ведь окинув рынок потребительских видеокарт взглядом, можно приметить, что только RTX 5090 предлагает сопоставимый объём видеопамяти, стоимость которой на голову выше.
Характеристики AI PRO R9700. Источник: .
32 гигабайта GDDR6 – основной аргумент R9700 в конкурентной борьбе. Именно объём памяти позволяет ей называться “ИИ-ускорителем”. Объём памяти напрямую определяет, что можно запускать локально. Больше VRAM – значит больше параметров модели помещается целиком на карте, без свопа в RAM.
Объём видеопамяти определяет три параметра сразу: какие модели доступны, насколько длинный контекст можно обслуживать и какой размер пакетов тянет карта в многопользовательском инференсе. К примеру, на 16 ГБ модель вроде Llama* 3.1 32B в Q4_K_M уже не влезает без компромиссов, на 32 ГБ – влезают. Больший объём VRAM напрямую влияет на ассортимент доступных LLM.
В остальном AI PRO R9700 – идентична RX 9070 XT. Карта сочетает 32 ГБ GDDR6 с 256‑битной шиной и пропускной способностью памяти 640 ГБ/с, 64 вычислительных блока (CU) и 4096 потоковых процессоров. Дополнительно задействованы 128 специализированных AI‑ускорителей второго поколения и 64 блока трассировки лучей, что позволяет эффективно работать с форматами FP32, FP16 и INT8 в матричных операциях. Отдельно стоит отметить поддержку FP8 и INT4 – именно наличие этих форматов позволяет демонстрировать высокую производительность при работе с современными LLM.
Однако давайте оставим теоретическую производительность в покое и рассмотрим новинку поближе. Начнём – с её компоновки.
Компоновка и охлаждение видеокарты GIGABYTE AI TOP Radeon AI PRO R9700
Radeon AI PRO R9700 построена в компактном двухслотовом форм-факторе. Карта создана специально для конфигураций с несколькими GPU в ограниченном пространстве. Турбинное охлаждение позволяет устанавливать карты плотно друг к другу без перегрева, что критично для рабочих станций с 2–4 GPU для обучения крупных локальных моделей.
На презентации AI PRO R9700 AMD демонстрируют, как турбинное охлаждение позволяет ставить видеокарты практически вплотную друг к другу. Упрощая проектирования схем продува и теплораспределения.
Видеоадаптер обладает единственным разъёмом питания 12V-2x6 вместо традиционных 6 и 8-pin. Энергопотребление составляет 300W. Рекомендованный блок питания: от 750 Ватт.
Переходник с двух 8-pin на 12V-2x6 входит в комплект видеокарты.
Что любопытно: GIGABYTE AI TOP AI PRO R9700 оснащена 3-мя портами DisplayPort 2.1a, и лишь одним HDMI 2.1b. Референсный же дизайн вообще не подразумевает наличие HDMI, все четыре порта – DisplayPort 2.1a.
На этом из выдающегося – всё. В остальном печатная плата полностью совпадает с обычной RX 9070 XT. Теперь давайте взглянем: готовы ли ИИ-движки к появлению такого принципиально нового типа ускорителя?
Готовы ли ИИ-движки к AMD AI PRO R9700: llama.cpp, vLLM, SGLang
llama.cpp работает с R9700 через HIP-бэкенд (ROCm) и через Vulkan. Разница в производительности колоссальная: ROCm во множество раз производительнее Vulkan. Посему ROCm здесь приоритет, а Vulkan – запасной вариант.
vLLM получил официальную поддержку RDNA3/RDNA4 в версии 0.15.0, вышедшей 29 января 2026 года. До этого поддержка исходила только через патчи от комьюнити. Нативная поддержка FP8 для RDNA4 в основную ветку пока не интегрирована и остаётся в стадии отдельного патча.
SGLang – обособленная история. В документации отсутствуют даже упоминания RDNA. Поддерживаются только карты AMD Instinct серии MI300X. Тратить время на SGLang с R9700 на данный момент не стоит.
Почему это так? Потому что AMD традиционно уделяет приоритет Instinct-серии (CDNA-архитектуре) в своём ROCm-стеке. RDNA4 – это новинка, под которую только-только начала выравниваться экосистема. Документация, официальные примеры, ответы комьюнити – всё это скорее заточено под Instinct, нежели под профессиональные Radeon. Но это больше скоротечный недостаток R9700, чем фундаментальный изъян. Пройдёт немного времени: и сама AMD, и комьюнити подтянут оптимизацию экосистемы под новую линейку.
Установка видеокарты AMD AI PRO R9700 AI TOP в систему и запуск на Linux
Как было указано выше, единственным полноценным движком, поддерживающим PRO R9700 в полной мере – является llama.cpp. Именно на него мы и будем делать упор при тестировании.
А в качестве системы будет использоваться самый распространённый дистрибутив Linux – Ubuntu 24.04.4 LTS. В отличии от “инстинктов” AI PRO R9700 умеет работать как на Linux, так и на Windows. Однако именно Linux является основной средой обитания R9700. Поскольку там функционирует полноценный стек: ROCm поддерживается официально, HIP-бэкенд работает, ECC-память активна. Использование Windows – нестандартный сценарий, который заслуживает собственной, отдельной статьи. А на нашем ютуб канале мы протестировали AI PRO R9700 в ComfyUI, Kandinsky и Wan2.2.
Установка и настройка ROCm на R9700 аналогична установке на любой Instinct, в нашем случае будет использоваться версия 7.1.1.
Покончив с настройкой, давайте оценим производительность AI PRO R9700 в популярных LLM.
Тест видеокарты AMD AI PRO R9700 в популярных LLM на Linux
Подборка состоит из нескольких сегментов: популярные, крупные модели, модели для кодинга и недавно появившиеся на свет LLM. Набор тестируемых моделей во многом совпадает со списком из обзоров AMD Instinct MI100 и NVIDIA Tesla V100.
Тестирование LLM на AMD Radeon AI PRO R9700
Модель
Форматы квантизации
Скорость (т/сек)
До первого токена
Длина контекста
Примечания
Базовые популярные модели
Qwen 2.5 7B-Instruct
Q4_K_M
80.80 т/сек
0.07 сек.
4096
Разумная, провереная временем модель.
Llama 3.1 8B-Instruct*
Q4_K_M
67.05 т/сек
0.06 сек.
4096
Немногословна, но дает только верные ответы.
Mistral 7B v0.3
Q4_K_M
73.31 т/сек
0.05 сек.
4096
Самая среднестатистическая из представленных, ничем не выделяется.
gpt-oss-20b
MXFP4
109.68 т/сек Лучшая
0.13 сек.
4096
Одна из лучших нейросетевых моделей, выдаёт подробные и быстрые ответы.
Mistralai/Devstral-small-2-2512 24B
Q4_K_M
72.28 т/сек
0.05 сек.
4096
Типовая Dense модель, пришедшая на замену Mixtral 8x7B. Дает добротные ответы.
Крупные языковые модели
Qwen 2.5 14B-Instruct
Q4_K_M
41.57 т/сек
0.13 сек.
4096
Иногда спотыкается на сложных предложениях, задумываясь на доли секунды.
Qwen3 14B
Q4_K_M
38.19 т/сек
0.12 сек.
4096
Лишена изъянов версии 2.5
Gemma 3 27B-IT-QAT
Q4_O
30.81 т/сек
0.22 сек.
4096
Грамотно и логично строит ответы, никогда не плутает в словах и не допускает ошибок
Qwen3 32B
Q4_K_M
27.61 т/сек Медленно
0.26 сек.
4096
Чрезвычайно подробные ответы, ловко жонглирует грамотными словосочетаниями как на русском, так и на английском языке.
Kimi Linear 48B A3B Instruct
Q4_K_M
16.81 т/сек Медленно
1.40 сек.
4096
Грань возможностей PRO R9700. Модель с трудом помещается в память, но выдаёт приемлимые и развёрнутые ответы.
Кодовые модели
Deepseek Coder 7B
Q4_K_M
66.55 т/сек
0.05 сек.
4096
Легко пишет простенькие программы и скрипты
Code Llama 7B*
Q4_K_M
80.54 т/сек Быстро
0.04 сек.
4096
Самый шустрый из кодеров
Granite Code 8B
Q4_K_M
68.27 т/сек
0.07 сек.
4096
Добротный кодер, но плохо понимает запросы на русском.
Недавние релизы
DeepSeek-R1 Distilled 14B
Q4_K_M
56.37 т/сек
0.16 сек.
4096
Не очень хорошо дружит с русским языком.
DeepSeek-R1 Distilled 32B
Q4_K_M
27.63 т/сек Медленно
0.26 сек.
4096
Немногим лучше версии на 14млрд параметров
Ministral 3 14B-Instruct
Q4_K_M
57.10 т/сек
0.11 сек.
4096
Дает чрезвычайно развернутые и подробные ответы
Ministral 3 14B-Reasoning
Q4_K_M
55.20 т/сек
0.12 сек.
4096
Прекрасная модель, может тягаться с gpt-oss-20b
Qwen3.5 9B
Q4_K_M
51.57 т/сек
0.57 сек.
4096
Самая свежая модель Qwen, вышедшая 2 марта 2026 года. Очень масштабно и подробно мыслит для своих небольших «габаритов»
Qwen3.5 35B A3B
Q4_K_M
60.06 т/сек Быстро
0.32 сек.
4096
Ещё одна свежая модель Qwen, вышедшая 24.02.2026. Даёт лучшие и самые подробные ответы. Прекрасно развита логика и отлично строит причино-следственные связи
Все модели протестированы на AMD Radeon AI PRO R9700 с контекстом 4096 токенов. Скорость генерации измеряется в токенах в секунду (т/сек). «До первого токена» показывает время ответа системы с момента начала запроса.
По завершению тестирования можно приметить одну деталь: помимо значительно более долгой загрузки модели в память, на крупных моделях AI PRO R9700 сильно теряет в производительности – сказывается присутствие GDDR6 памяти а не многослойной HBM, как на многих серверных ускорителях.
Это рисует интересную картину: на некрупных моделях R9700 идёт вровень с той же AMD Instinct MI100, или вовсе опережает её. Но на моделях вес которых превышает отметку 8-10 гигабайт, “прошка” начинает существенно отставать, вплоть до 30% на некоторых моделях.
Но несмотря на это, есть аспект, в котором AI PRO R9700 AI TOP существенно превосходит своего серверного собрата.
Температуры видеокарты AMD AI PRO R9700
AI PRO R9700 получилась достаточно холодной видеокартой, особенно в сопоставлении с серверными чудовищами. Её средние температуры не переступают отметку 70 градусов по Цельсию. А хотспот лишь изредка превышает это значение. Нагрев памяти тоже останавливается вблизи 70 °C – на 71-73 градусах. По крайней мере в реальной нагрузке.
Получасовой прогон в реальной нагрузке на крупных языковых моделях.
Бенчмарк немного корректирует показатели, но не разительно: средняя температура едва превышает 70 °C. Разогревается только память – до ~85 градусов. И хотспот, он прыгает выше прочих: до 90-95 °C.
Часовая нагрузка во встроенном в ROCm бенчмарке.
Итак, в полной мере ознакомившись со всеми положительными и отрицательными гранями нового ускорителя от AMD, можно сформировать итог.
Новый
Supermicro AS-2025HS-TNR (2× Radeon AI PRO R9700 32GB, 2× EPYC 9124, RAM 128GB)
Платформа 2U с 2 видеокартами GIGABYTE Radeon AI PRO R9700 AI TOP 32GB GDDR6
AMD AI PRO R9700 AI TOP – видеокарта, явно преуспевшая в своей нише. Если вам необходим “ИИ-ускоритель” за относительно некрупные деньги (по меркам конкурентов). И при этом вы не готовы мириться с ограниченностью линейки Instinct, желая сохранить весь функционал и поддержку Windows в одной видеокарте. Она – практически безальтернативный выбор в текущей конъюнктуре рынка.
*LLAMA — проект Meta Platforms Inc.**, деятельность которой в России признана экстремистской и запрещена
**Деятельность Meta Platforms Inc. в России признана экстремистской и запрещена
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Скидка 1 500 ₽ или бесплатная доставка - уже сейчас 🔥
Мы ценим обратную связь от клиентов. При оформлении заказа вы можете сообщить о своём намерении поделиться впечатлением о работе ServerFlow после получения товара.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка до ПВЗ СДЭК.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.
При оформлении заказа в ServerFlow вы можете сообщить о намерении оставить отзыв о нашей работе после получения товара.
Нам важно ваше честное мнение. Оно помогает развивать сервис и даёт другим клиентам представление о нашей работе.
Вы можете оставить отзыв на удобной для вас платформе:
Google Maps
2GIS
Яндекс Карты
Как работает акция
Применяя промокод, вы подтверждаете намерение поделиться впечатлением о работе ServerFlow после получения заказа. Мы применяем бонус уже к текущему заказу в знак благодарности за обратную связь.
Условия акции:
скидка 1 500 ₽ при заказе от 30 000 ₽
или бесплатная доставка* при заказе до 30 000 ₽
* Бесплатная доставка заказа осуществляется до ПВЗ СДЭК.