Цена с учетом расширенной гарантии
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
| Тип | Новые |
| Основная задача | Обучение моделей / Инференс / Дообучение моделей / RAG-системы / Анализ данных / Научные расчеты (HPC) |
| Процессор (CPU) | Intel Xeon 6-series |
| Видеокарта (GPU) | NVIDIA H200 |
| Количество GPU, шт | 8 |
| Общий объем видеопамяти (VRAM), ГБ | 1128 |
| Тип памяти GPU | HBM3e |
| Объем оперативной памяти (RAM), ГБ | 4096 |
| Тип оперативной памяти | DDR5 ECC REG |
| Форм-фактор | 4U |
GIGABYTE XL44-SX0-AAS2 в конфигурации с 8x NVIDIA H200 NVL 141GB и суммарными 1128 GB HBM3e - это 4U сервер под самые тяжёлые AI- и HPC-нагрузки. Сама платформа рассчитана на до 8 двухслотовых Gen5 GPU, построена на двух Intel Xeon 6700/6500, поддерживает 32 слота DDR5, 4 горячезаменяемых Gen5 NVMe и 4 резервируемых блока питания по 3200 Вт.
H200 NVL основана на архитектуре Hopper и ориентирована на Обучение моделей (Training), Дообучение моделей (Fine-tuning), Инференс / Развертывание (Inference), RAG-системы и HPC / Научные расчёты. NVIDIA указывает для H200 141 GB памяти, 4.8 TB/s пропускной способности и прямо относит такие решения к MGX H200 NVL systems с числом GPU до 8; в отдельном материале NVIDIA также подчёркивает, что H200 - это первая GPU компании с HBM3e, а H200 NVL рассчитана на воздушно-охлаждаемые корпоративные стойки и даёт до 1.7x более быстрый inference LLM и до 1.3x больше производительности в HPC по сравнению с H100 NVL.
Для такой конфигурации акцент логично делать именно на запуске очень крупных LLM без жёсткой экономии памяти, длинных контекстах, высокой плотности запросов и распределённом multi-GPU serving. По профилю это уже не универсальная GPU-система под графику, а сервер для тяжёлых AI- и HPC-сценариев, где решают объём HBM3e, пропускная способность памяти и масштабирование на 8 ускорителей.
| Тип точности | Совокупная мощность четырех H200 NVL |
| FP64 Tensor Core | 240 TFLOPS |
| TF32 Tensor Core | 3340 TFLOPS |
| BF16/FP16 Tensor Core | 6685 TFLOPS |
| FP8 Tensor Core | 13364 TFLOPS |
| INT8 Tensor Core | 13364 TOPS |
| Модель | Тип квантизации | Требуется VRAM | Совместимость | Примечание |
| DeepSeek-V4-Pro | Нет | Примерно 865GB | ✅ | Уверенно запускается на 8 GPU и оставляет большой запас под KV-cache, длинный контекст, высокую плотность запросов и стабильный distributed serving. |
| Qwen3.5-397B-A17B | Нет | Примерно 807GB | ✅ | Идёт на этой конфигурации очень комфортно и сохраняет очень крупный запас памяти без offload под reasoning, аналитику, batch inference и параллельные сценарии. |
| gpt-oss-120b | Нет | Примерно 196GB | ✅ | Очень лёгкая нагрузка для 8 x H200 NVL и хорошо подходит для RAG, многопоточного inference, длинных диалогов и одновременного запуска нескольких сервисов. |
| GigaChat3.1-702B-A36B | Нет | Примерно 720GB | ✅ | Уверенно укладывается в 8 x H200 NVL без квантизации и оставляет очень заметный запас под сложных русскоязычных ассистентов, длинный контекст и стабильный serving. |
| Mistral-Large-3-675B-Instruct-251 | Нет | Примерно 682GB | ✅ | Стабильно работает без квантизации и подходит для крупных reasoning-задач, RAG-сценариев, аналитики и multi-GPU inference с очень хорошим запасом памяти. |
| GLM-5.1-FP8 | FP8 | Примерно 756GB | ✅ | В формате FP8 на этой платформе остаётся огромный запас VRAM, что удобно для сложных ассистентов, reasoning, RAG и очень высокой плотности параллельных запросов. |
| Gemma-4-31B-IT | Нет | Примерно 62.6GB | ✅ | Очень лёгкая модель для этой конфигурации и удобна для множества одновременных инстансов, длинного контекста и экстремально высокой плотности запросов. |
| Модель | Тип | Совместимость | Примечание |
| Stable Diffusion 3 Medium | Текст в изображение | ✅ | Легко справляется с высоким разрешением, крупными батчами и несколькими параллельными пайплайнами без какого-либо дефицита видеопамяти. |
| FLUX.2-dev | Текст в изображение | ✅ | Требовательная модель, но для 8 x H200 NVL это комфортная нагрузка с огромным запасом под высокое разрешение, batch generation и несколько одновременных задач. |
| Stable Video Diffusion 1.1 | Видео(img2vid) | ✅ | Хорошо подходит для генерации роликов, пакетного рендера и одновременной обработки нескольких видео-пайплайнов на разных GPU. |
| Kandinsky-5.0-T2I-Lite-sft-Diffusers | Текст в изображение | ✅ | Лёгкая версия Kandinsky 5.0 и на этой конфигурации остаётся огромный запас по видеопамяти для высокого разрешения, батчей и параллельной работы пользователей. |
| Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers | Текст в видео | ✅ | Подходит для продакшн-пайплайнов, пакетной генерации коротких роликов и уверенно масштабируется по нескольким GPU. |
| Платформа | GIGABYTE XL44-SX0-AAS2 |
| Видеокарта | 8x NVIDIA H200 NVL 141GB HBM3e |
| Процессор | 2x Intel Xeon 6500/6700 серии |
| Оперативная память | 32 DIMM, до 4TB DDR5 ECC REG |
| SSD накопитель | 4x 2.5" Gen5 NVMe, 2x M.2 (2280/22110) |
Мы отправляем заказы ведущими транспортными компаниями:
Все отправления тщательно упаковываются и скорейшие сроки передаются в ТК.
Ориентировочные сроки сборки заказов:
В случае если оборудование требуется в срочном порядке сообщите менеджеру и мы организуем приоритетную обработку вашего заказа с учетом выбора тарифа “Экспресс” со стороны ТК.
Оплата заказа доступна после подтверждения менеджером посредством следующих способов оплаты:
ServerFlow — это интернет магазин специализирующийся на продаже Б/У и новой серверной техники. Все наше оборудование проходит строгий процесс предпродажной подготовки. Мы уделяем большое внимание тестированию всех компонентов, чтобы минимизировать вероятность возникновения гарантийных случаев и обеспечить высокое качество продукции.
Также мы можем предложить расширенный срок гарантийных отношений:
Мы верим, что сможем обеспечить наилучший пользовательский опыт и ценим ваше доверие. Если у вас остались дополнительные вопросы, вы можете адресовать их в онлайн чате на сайте или задать в Telegram @serverflow.
ServerFlow активно занимается б/у оборудованием, поэтому мы готовы рассмотреть ваше оборудование в качестве основания для предоставления скидки в рамках “Trade-in”. Чтобы произвести оценку оборудования обратитесь в онлайн чат на сайте или в Telegram @serverflow.
Почему Trade-in в ServerFlow — это удобно:
Поделитесь впечатлением о работе ServerFlow после получения заказа.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена
бесплатная доставка до ПВЗ СДЭК.
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
Мы ценим обратную связь от клиентов. При оформлении заказа вы можете сообщить о своём намерении поделиться впечатлением о работе ServerFlow после получения товара.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка до ПВЗ СДЭК.