GIGABYTE G494-ZB1-AAP2 (8x H200 NVL 141GB)

Name: GIGABYTE G494-ZB1-AAP2 (8x H200 NVL 141GB)
Brand: GIGABYTE
Price: 49282300 RUB
Availability: PreOrder

GIGABYTE G494-ZB1-AAP2 (8x H200 NVL 141GB) 1

GIGABYTE G494-ZB1-AAP2 (8x H200 NVL 141GB) 2

GIGABYTE G494-ZB1-AAP2 (8x H200 NVL 141GB) 3

GIGABYTE G494-ZB1-AAP2 (8x H200 NVL 141GB) 4

Новый

+200 ₽

Цена с учетом расширенной гарантии

Цена включает НДС 7%

49 282 300 руб.

Под заказ

Узнать сроки доставки

Получить спец. цену Получить КП за час Отправить КП себе на почту

добавить В корзину

Сравнить

Гарантия 1 год с заменой компонентов

Доставка СДЭК и ведущими службами доставки

Тестируем оборудование
перед отправкой

Гарантия 1 год с заменой компонентов

Подробнее

Условия доставки и самовывоза

Подробнее

Помощь в вопросе выбора и совместимости

Подробнее

Характеристики Доставка и оплата Гарантия Отзывы Trade In

Тип	Новые
Основная задача	Обучение моделей / Инференс / Дообучение моделей / RAG-системы / Анализ данных / Научные расчеты (HPC)
Процессор (CPU)	AMD EPYC
Видеокарта (GPU)	NVIDIA H200
Количество GPU, шт	8
Общий объем видеопамяти (VRAM), ГБ	1128
Тип памяти GPU	HBM3e
Объем оперативной памяти (RAM), ГБ	12288
Тип оперативной памяти	DDR5 ECC REG
Форм-фактор	4U

Подробные характеристики

Подробное описание

GIGABYTE G494-ZB1-AAP2 в конфигурации с 8x NVIDIA H200 NVL 141GB - это 4U HPC/AI-сервер для Обучения моделей (Training), Дообучения моделей (Fine-tuning), Инференса / Развертывания (Inference), RAG-систем и HPC / Научных расчётов. Официально платформа поддерживает до 10 двухслотовых PCIe Gen5 GPU, а для H200 NVL у GIGABYTE отдельно указана конфигурация 8 GPU с двумя группами по 4 GPU, каждая со своим 4-way NVLink bridge, при этом сама система построена на двух AMD EPYC 9005/9004 и поддерживает 48 DIMM DDR5.

Суммарный объём видеопамяти здесь составляет 1128 GB HBM3e, то есть примерно 1.1 TB VRAM. NVIDIA указывает для H200 NVL 141 GB HBM3e на карту, пропускную способность памяти 4.8 TB/s, а также позиционирует H200 NVL как ускоритель для generative AI, LLM inference, training и HPC. Это даёт платформе большой запас под крупные модели, длинный контекст, batch inference и multi-GPU serving без агрессивной экономии памяти.

Важно, что это не MGX-сервер с выделенной сетевой фабрикой ConnectX-8, а классический 4U GPU-сервер. В официальных спецификациях у G494-ZB1-AAP2 указаны 2 x 1GbE LAN, а H200 NVL здесь объединяются внутри узла через две 4-GPU NVLink-группы. Для ServerFlow это значит, что конфигурация особенно сильна как крупный локальный AI/HPC-узел, а не как платформа, где основной акцент сделан на встроенный межузловой 400Gb fabric.

Производительность GPU

Тип точности	Совокупная мощность восьми H200
FP64 Tensor Core	480 TFLOPS
TF32 Tensor Core	6680 TFLOPS
BF16/FP16 Tensor Core	13368 TFLOPS
FP8 Tensor Core	26728 TFLOPS
INT8 Tensor Core	26728 TOPS

Совместимость с LLM-моделями

Модель	Тип квантизации	Требуется VRAM	Совместимость	Примечание
DeepSeek-V4-Pro	Нет	Примерно 865GB	✅	Уверенно запускается на 8 x H200 NVL и оставляет заметный запас под длинный контекст, KV-cache и стабильный multi-GPU serving внутри одного мощного 8-GPU узла.
Qwen3.5-397B-A17B / Qwen3.6-35B-A3B	Нет	Примерно 807GB / 71.9 GB	✅	Хорошо подходит для reasoning, аналитики и RAG на одном сервере без жёстких ограничений по памяти и с большим запасом под служебные буферы.
gpt-oss-120b	Нет	Примерно 196GB	✅	Легко размещается и позволяет держать большие батчи, длинные диалоги и несколько параллельных сервисов с очень большим запасом VRAM.
GigaChat3.5-432B-A28B-bf16	Нет	Примерно 868GB	✅	Комфортно работает на 8 x H200 NVL без квантизации и подходит для крупных ассистентов с длинным контекстом, сохраняя запас под serving и служебные буферы.
Mistral-Large-3-675B-Instruct-251	Нет	Примерно 682GB	✅	Хороший вариант для reasoning, агентных сценариев и RAG с большим запасом памяти под serving-нагрузку на одном узле.
GLM-5.2-FP8	Нет	Примерно 756GB	✅	В 4-битном формате остаётся очень большой запас VRAM под контекст, батчи и параллельные запросы, поэтому конфигурация хорошо подходит для высоконагруженного inference.
gemma-4-31B-it	нет	Примерно 62.6GB	✅	Очень лёгкая модель для этой конфигурации и удобна для нескольких одновременных инстансов, длинного контекста или высоконагруженного inference.
Kimi-K2.7-Code	Нет	Примерно 595GB	✅	Полноразмерная версия для мощных GPU-серверов; подходит для reasoning-задач, RAG, агентных рабочих процессов и производственного инференса с высоким запасом качества.
MiniMax-M3	Нет	Примерно 854GB	✅	Полноразмерная версия для серверов с большим запасом памяти; подходит для reasoning-задач, RAG, агентных сценариев и стабильного production-инференса без агрессивной квантизации.
MiMo-V2.5-Pro	Нет	Примерно 1.03TB	✅	Крупная Pro-версия для серверов с большим объёмом GPU-памяти; подходит для сложных reasoning-задач, RAG, агентных сценариев и production-инференса с высоким запасом качества.

Совместимость с диффузионными моделями

Модель	Тип	Совместимость	Примечание
Stable Diffusion XL 1.0	Текст в изображение	✅	Уверенно подходит для high-res генерации, крупных батчей и параллельных пайплайнов на нескольких GPU.
FLUX.2-dev	Текст в изображение	✅	Требовательная модель, но на 8 x H200 NVL удобно запускать её с большим запасом под разрешение, батчи и очередь задач внутри одного мощного сервера.
SD Turbo	Быстрые предпросмотры	✅	Отлично подходит для быстрых итераций, массовой генерации и высокой плотности параллельных задач.
Kandinsky-5.0-T2I-Lite-sft-Diffusers	Текст в изображение	✅	Лёгкая версия Kandinsky 5.0 и на этой конфигурации остаётся очень большой запас видеопамяти под высокое разрешение, батчи и параллельную работу пользователей.
Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers	Текст в видео	✅	Подходит для пакетной генерации коротких роликов и хорошо масштабируется по нескольким GPU внутри одного сервера.

Технические характеристики

Платформа	GIGABYTE G494-ZB1-AAP2
Видеокарта	8x NVIDIA H200 NVL
Процессор	2x AMD EPYC 9004/9005 серии
Оперативная память	48 DIMM, до 12TB DDR5 ECC REG
SSD накопитель	8x 2.5" Gen5 NVMe/SATA/SAS-4, 4x 2.5" Gen5 SATA/SAS-4, 2x M.2 (2280/22110), PCIe Gen3 x4

Задать вопрос

Наличие на складах (0 шт.)

Санкт-Петербург, ул. Заозёрная, 8, корп. 2Л

Временно нет в наличии

Доступно бесплатное перемещение с другого склада в течении 1-2 рабочих дней

Москва, 2-я Брестская ул., 39 с4

Временно нет в наличии

Доступно бесплатное перемещение с другого склада в течении 1-2 рабочих дней

Мы отправляем заказы ведущими транспортными компаниями:

CDEK
Деловые линии
ПЭК

Все отправления тщательно упаковываются и скорейшие сроки передаются в ТК.

Ориентировочные сроки сборки заказов:

Серверные комплектующие: 1-2 раб. дня.
Серверы: 1-4 раб. дня.
Перемещение между офисами (МСК-СПБ): 1-2 раб. дня.

В случае если оборудование требуется в срочном порядке сообщите менеджеру и мы организуем приоритетную обработку вашего заказа с учетом выбора тарифа “Экспресс” со стороны ТК.

Оплата заказа доступна после подтверждения менеджером посредством следующих способов оплаты:

Безналичная оплата по счету (для организаций)
Онлайн оплата банковской картой ЮКасса (SberPay, T-Pay, СБП)

Узнать больше

ServerFlow — это интернет магазин специализирующийся на продаже Б/У и новой серверной техники. Все наше оборудование проходит строгий процесс предпродажной подготовки. Мы уделяем большое внимание тестированию всех компонентов, чтобы минимизировать вероятность возникновения гарантийных случаев и обеспечить высокое качество продукции.

Также мы можем предложить расширенный срок гарантийных отношений:

Стандартная гарантия 1 год

входит в стоимость

Расширенная гарантия на 2 года

4 928 230 ₽

Расширенная гарантия на 3 года

7 392 345 ₽

Расширенная гарантия на 4 года

9 856 460 ₽

Расширенная гарантия на 5 лет

12 320 575 ₽

Мы верим, что сможем обеспечить наилучший пользовательский опыт и ценим ваше доверие. Если у вас остались дополнительные вопросы, вы можете адресовать их в онлайн чате на сайте или задать в Telegram @serverflow.

Подробнее об условиях гарантии ServerFlow

ServerFlow активно занимается б/у оборудованием, поэтому мы готовы рассмотреть ваше оборудование в качестве основания для предоставления скидки в рамках “Trade-in”. Чтобы произвести оценку оборудования обратитесь в онлайн чат на сайте или в Telegram @serverflow.

Почему Trade-in в ServerFlow — это удобно:

Оперативная оценка оборудования. Оператор онлайн чата постарается в течении 30 минут дать оценку оборудованию.
Конструктивный диалог. Если вы не согласны с предложенной стоимостью мы постараемся найти компромисс.
Забор оборудования. После согласования Trade-in мы согласуем курьерскую доставку от двери, а если вам удобно лично посетить наш офис в Москве или Санкт-Петербурге.
Тестирование и подтверждение скидки. Технические инженеры ServerFlow проверяет стабильность вашего оборудования. В случае подтверждения стабильности мы утвердим скидку на оборудование.

Скидка 1 500 ₽ за обратную связь

Поделитесь впечатлением о работе ServerFlow после получения заказа.

* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена
бесплатная доставка до ПВЗ СДЭК.

копироватьскопировано

Новый

+200 ₽

Цена с учетом расширенной гарантии

Цена включает НДС 7%

49 282 300 руб.

Под заказ

Узнать сроки доставки

Получить спец. цену Получить КП за час Отправить КП себе на почту