Цена с учетом расширенной гарантии
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
| Тип | Новые |
| Основная задача | Обучение моделей / Инференс / Дообучение моделей / RAG-системы / Анализ данных / Научные расчеты (HPC) |
| Процессор (CPU) | AMD EPYC |
| Видеокарта (GPU) | NVIDIA H200 |
| Количество GPU, шт | 8 |
| Общий объем видеопамяти (VRAM), ГБ | 1128 |
| Тип памяти GPU | HBM3e |
| Объем оперативной памяти (RAM), ГБ | 6144 |
| Тип оперативной памяти | DDR5 ECC REG |
| Форм-фактор | 4U |
GIGABYTE XL43-ZX2-AAS1 - это 4U NVIDIA MGX-сервер на двух AMD EPYC 9005, и его ключевая особенность - не только высокая плотность GPU, но и встроенная сетевая фабрика. Для этого SKU GIGABYTE указывает ConnectX-8 SuperNIC switch, 1x NVIDIA BlueField-3 DPU и встроенные QSFP-порты 400 Gb/s InfiniBand/Ethernet; в портфельном PDF по линейке ZX2 для XL43-ZX2-AAS1 отдельно указаны 8 x 400Gb/s QSFP, а также примечание, что связь идёт через NVIDIA ConnectX-8 SuperNIC switch board.
В данной конфигурации - 8x H200 NVL 141GB, сервер получает суммарно 1128 GB HBM3e, то есть примерно 1.1 TB видеопамяти. H200 NVL построена на архитектуре Hopper и даёт 141 GB HBM3e на GPU при 4.8 TB/s пропускной способности памяти, а сама линейка H200 нацелена на generative AI, LLM и HPC. Для такой конфигурации логично делать акцент на Обучение моделей (Training), Дообучение моделей (Fine-tuning), Инференс / Развертывание (Inference), RAG-системы и HPC / Научные расчёты.
Главная практическая ценность этой версии - сочетание очень большого локального объёма HBM3e с платформой MGX и встроенным сетевым контуром 8 x 400 Gb/s QSFP. Это делает сервер интересным не только как мощный 8-GPU узел, но и как основу для scale-out сценариев, где важны быстрые межузловые связи для распределённого serving, кластерного inference и больших reasoning-контуров. NVIDIA описывает ConnectX-8 SuperNIC как решение для 800G networking в AI-инфраструктуре, а GIGABYTE прямо указывает Gen6 switching для пикового GPU-to-GPU performance.
| Тип точности | Совокупная мощность восьми H200 |
| FP64 Tensor Core | 480 TFLOPS |
| TF32 Tensor Core | 6680 TFLOPS |
| BF16/FP16 Tensor Core | 13368 TFLOPS |
| FP8 Tensor Core | 26728 TFLOPS |
| INT8 Tensor Core | 26728 TOPS |
| Модель | Тип квантизации | Требуется VRAM | Совместимость | Примечание |
| DeepSeek-V4-Pro | Нет | Примерно 865GB | ✅ | Уверенно запускается на 8 x H200 NVL и оставляет заметный запас под длинный контекст, KV-cache и стабильный multi-GPU serving, а встроенный QSFP 400Gb/s контур делает платформу удобной и для scale-out сценариев. |
| Qwen3.5-397B-A17B | Нет | Примерно 807GB | ✅ | Хорошо подходит для reasoning, аналитики и RAG на одном узле без жёстких ограничений по памяти, а при кластерной работе выигрывает от встроенной 400Gb/s сетевой фабрики. |
| gpt-oss-120b | Нет | Примерно 196GB | ✅ | Легко размещается и позволяет держать большие батчи, длинные диалоги и несколько параллельных сервисов с очень большим запасом VRAM. |
| GigaChat3.1-702B-A36B | Нет | Примерно 720GB | ✅ | Комфортно работает на 8 x H200 NVL без квантизации и подходит для крупных ассистентов с длинным контекстом, сохраняя запас под serving и служебные буферы. |
| Mistral-Large-3-675B-Instruct-251 | Нет | Примерно 682GB | ✅ | Хороший вариант для reasoning, агентных сценариев и RAG с большим запасом памяти под serving-нагрузку, а сетевой контур удобен для дальнейшего расширения за пределы одного узла. |
| GLM-5.1-GGUF | UD-Q4_K_M | Примерно 465GB | ✅ | В 4-битном формате остаётся очень большой запас VRAM под контекст, батчи и параллельные запросы, поэтому конфигурация хорошо подходит для высоконагруженного inference. |
| gemma-4-31B-it | нет | Примерно 62.6GB | ✅ | Очень лёгкая модель для этой конфигурации и удобна для нескольких одновременных инстансов, длинного контекста или высоконагруженного inference. |
| Модель | Тип | Совместимость | Примечание |
| Stable Diffusion XL 1.0 | Текст в изображение | ✅ | Уверенно подходит для high-res генерации, крупных батчей и параллельных пайплайнов на нескольких GPU. |
| FLUX.2-dev | Текст в изображение | ✅ | Требовательная модель, но на 8 x H200 NVL удобно запускать её с большим запасом под разрешение, батчи и очередь задач, а также масштабировать за пределы одного узла через 400Gb/s сеть. |
| SD Turbo | Быстрые предпросмотры | ✅ | Отлично подходит для быстрых итераций, массовой генерации и высокой плотности параллельных задач. |
| Kandinsky-5.0-T2I-Lite-sft-Diffusers | Текст в изображение | ✅ | Лёгкая версия Kandinsky 5.0 и на этой конфигурации остаётся очень большой запас видеопамяти под высокое разрешение, батчи и параллельную работу пользователей. |
| Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers | Текст в видео | ✅ | Подходит для пакетной генерации коротких роликов и хорошо масштабируется по нескольким GPU, а при необходимости и по нескольким узлам. |
| Платформа | GIGABYTE XL43-ZX2-AAS1 |
| Видеокарта | 8x NVIDIA H200 NVL |
| Процессор | 2x AMD EPYC 9005 серии/td> |
| Оперативная память | 24 DIMM, до 6TB DDR5 ECC REG |
| Сетевые порты | Плата коммутатора NVIDIA ConnectX-8 PCIe (8 портов QSFP по 400Gbs) |
| SSD накопитель | 8x 2.5" Gen5 NVMe, 1x M.2 (2280/22110), PCIe Gen3 x2, 1x M.2 (2280/22110), PCIe Gen3 x1 |
Мы отправляем заказы ведущими транспортными компаниями:
Все отправления тщательно упаковываются и скорейшие сроки передаются в ТК.
Ориентировочные сроки сборки заказов:
В случае если оборудование требуется в срочном порядке сообщите менеджеру и мы организуем приоритетную обработку вашего заказа с учетом выбора тарифа “Экспресс” со стороны ТК.
Оплата заказа доступна после подтверждения менеджером посредством следующих способов оплаты:
ServerFlow — это интернет магазин специализирующийся на продаже Б/У и новой серверной техники. Все наше оборудование проходит строгий процесс предпродажной подготовки. Мы уделяем большое внимание тестированию всех компонентов, чтобы минимизировать вероятность возникновения гарантийных случаев и обеспечить высокое качество продукции.
Также мы можем предложить расширенный срок гарантийных отношений:
Мы верим, что сможем обеспечить наилучший пользовательский опыт и ценим ваше доверие. Если у вас остались дополнительные вопросы, вы можете адресовать их в онлайн чате на сайте или задать в Telegram @serverflow.
ServerFlow активно занимается б/у оборудованием, поэтому мы готовы рассмотреть ваше оборудование в качестве основания для предоставления скидки в рамках “Trade-in”. Чтобы произвести оценку оборудования обратитесь в онлайн чат на сайте или в Telegram @serverflow.
Почему Trade-in в ServerFlow — это удобно:
Поделитесь впечатлением о работе ServerFlow после получения заказа.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена
бесплатная доставка до ПВЗ СДЭК.
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
Мы ценим обратную связь от клиентов. При оформлении заказа вы можете сообщить о своём намерении поделиться впечатлением о работе ServerFlow после получения товара.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка до ПВЗ СДЭК.