Цена с учетом расширенной гарантии
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
| Тип | Новые |
| Основная задача | Обучение моделей / Инференс / Дообучение моделей / RAG-системы / Анализ данных / Научные расчеты (HPC) |
| Процессор (CPU) | AMD EPYC |
| Видеокарта (GPU) | NVIDIA H200 |
| Количество GPU, шт | 8 |
| Общий объем видеопамяти (VRAM), ГБ | 1128 |
| Тип памяти GPU | HBM3e |
| Объем оперативной памяти (RAM), ГБ | 12288 |
| Тип оперативной памяти | DDR5 ECC REG |
| Форм-фактор | 4U |
GIGABYTE G494-ZB1-AAP2 в конфигурации с 8x NVIDIA H200 NVL 141GB - это 4U HPC/AI-сервер для Обучения моделей (Training), Дообучения моделей (Fine-tuning), Инференса / Развертывания (Inference), RAG-систем и HPC / Научных расчётов. Официально платформа поддерживает до 10 двухслотовых PCIe Gen5 GPU, а для H200 NVL у GIGABYTE отдельно указана конфигурация 8 GPU с двумя группами по 4 GPU, каждая со своим 4-way NVLink bridge, при этом сама система построена на двух AMD EPYC 9005/9004 и поддерживает 48 DIMM DDR5.
Суммарный объём видеопамяти здесь составляет 1128 GB HBM3e, то есть примерно 1.1 TB VRAM. NVIDIA указывает для H200 NVL 141 GB HBM3e на карту, пропускную способность памяти 4.8 TB/s, а также позиционирует H200 NVL как ускоритель для generative AI, LLM inference, training и HPC. Это даёт платформе большой запас под крупные модели, длинный контекст, batch inference и multi-GPU serving без агрессивной экономии памяти.
Важно, что это не MGX-сервер с выделенной сетевой фабрикой ConnectX-8, а классический 4U GPU-сервер. В официальных спецификациях у G494-ZB1-AAP2 указаны 2 x 1GbE LAN, а H200 NVL здесь объединяются внутри узла через две 4-GPU NVLink-группы. Для ServerFlow это значит, что конфигурация особенно сильна как крупный локальный AI/HPC-узел, а не как платформа, где основной акцент сделан на встроенный межузловой 400Gb fabric.
| Тип точности | Совокупная мощность восьми H200 |
| FP64 Tensor Core | 480 TFLOPS |
| TF32 Tensor Core | 6680 TFLOPS |
| BF16/FP16 Tensor Core | 13368 TFLOPS |
| FP8 Tensor Core | 26728 TFLOPS |
| INT8 Tensor Core | 26728 TOPS |
| Модель | Тип квантизации | Требуется VRAM | Совместимость | Примечание |
| DeepSeek-V4-Pro | Нет | Примерно 865GB | ✅ | Уверенно запускается на 8 x H200 NVL и оставляет заметный запас под длинный контекст, KV-cache и стабильный multi-GPU serving внутри одного мощного 8-GPU узла. |
| Qwen3.5-397B-A17B | Нет | Примерно 807GB | ✅ | Хорошо подходит для reasoning, аналитики и RAG на одном сервере без жёстких ограничений по памяти и с большим запасом под служебные буферы. |
| gpt-oss-120b | Нет | Примерно 196GB | ✅ | Легко размещается и позволяет держать большие батчи, длинные диалоги и несколько параллельных сервисов с очень большим запасом VRAM. |
| GigaChat3.1-702B-A36B | Нет | Примерно 720GB | ✅ | Комфортно работает на 8 x H200 NVL без квантизации и подходит для крупных ассистентов с длинным контекстом, сохраняя запас под serving и служебные буферы. |
| Mistral-Large-3-675B-Instruct-251 | Нет | Примерно 682GB | ✅ | Хороший вариант для reasoning, агентных сценариев и RAG с большим запасом памяти под serving-нагрузку на одном узле. |
| GLM-5.1-GGUF | UD-Q4_K_M | Примерно 465GB | ✅ | В 4-битном формате остаётся очень большой запас VRAM под контекст, батчи и параллельные запросы, поэтому конфигурация хорошо подходит для высоконагруженного inference. |
| gemma-4-31B-it | нет | Примерно 62.6GB | ✅ | Очень лёгкая модель для этой конфигурации и удобна для нескольких одновременных инстансов, длинного контекста или высоконагруженного inference. |
| Модель | Тип | Совместимость | Примечание |
| Stable Diffusion XL 1.0 | Текст в изображение | ✅ | Уверенно подходит для high-res генерации, крупных батчей и параллельных пайплайнов на нескольких GPU. |
| FLUX.2-dev | Текст в изображение | ✅ | Требовательная модель, но на 8 x H200 NVL удобно запускать её с большим запасом под разрешение, батчи и очередь задач внутри одного мощного сервера. |
| SD Turbo | Быстрые предпросмотры | ✅ | Отлично подходит для быстрых итераций, массовой генерации и высокой плотности параллельных задач. |
| Kandinsky-5.0-T2I-Lite-sft-Diffusers | Текст в изображение | ✅ | Лёгкая версия Kandinsky 5.0 и на этой конфигурации остаётся очень большой запас видеопамяти под высокое разрешение, батчи и параллельную работу пользователей. |
| Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers | Текст в видео | ✅ | Подходит для пакетной генерации коротких роликов и хорошо масштабируется по нескольким GPU внутри одного сервера. |
| Платформа | GIGABYTE G494-ZB1-AAP2 |
| Видеокарта | 8x NVIDIA H200 NVL |
| Процессор | 2x AMD EPYC 9004/9005 серии |
| Оперативная память | 48 DIMM, до 12TB DDR5 ECC REG |
| SSD накопитель | 8x 2.5" Gen5 NVMe/SATA/SAS-4, 4x 2.5" Gen5 SATA/SAS-4, 2x M.2 (2280/22110), PCIe Gen3 x4 |
Мы отправляем заказы ведущими транспортными компаниями:
Все отправления тщательно упаковываются и скорейшие сроки передаются в ТК.
Ориентировочные сроки сборки заказов:
В случае если оборудование требуется в срочном порядке сообщите менеджеру и мы организуем приоритетную обработку вашего заказа с учетом выбора тарифа “Экспресс” со стороны ТК.
Оплата заказа доступна после подтверждения менеджером посредством следующих способов оплаты:
ServerFlow — это интернет магазин специализирующийся на продаже Б/У и новой серверной техники. Все наше оборудование проходит строгий процесс предпродажной подготовки. Мы уделяем большое внимание тестированию всех компонентов, чтобы минимизировать вероятность возникновения гарантийных случаев и обеспечить высокое качество продукции.
Также мы можем предложить расширенный срок гарантийных отношений:
Мы верим, что сможем обеспечить наилучший пользовательский опыт и ценим ваше доверие. Если у вас остались дополнительные вопросы, вы можете адресовать их в онлайн чате на сайте или задать в Telegram @serverflow.
ServerFlow активно занимается б/у оборудованием, поэтому мы готовы рассмотреть ваше оборудование в качестве основания для предоставления скидки в рамках “Trade-in”. Чтобы произвести оценку оборудования обратитесь в онлайн чат на сайте или в Telegram @serverflow.
Почему Trade-in в ServerFlow — это удобно:
Поделитесь впечатлением о работе ServerFlow после получения заказа.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена
бесплатная доставка до ПВЗ СДЭК.
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
Мы ценим обратную связь от клиентов. При оформлении заказа вы можете сообщить о своём намерении поделиться впечатлением о работе ServerFlow после получения товара.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка до ПВЗ СДЭК.