Цена с учетом расширенной гарантии
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
| Тип | Новые |
| Основная задача | Обучение моделей / Инференс / Дообучение моделей / RAG-системы / Анализ данных / Научные расчеты (HPC) |
| Процессор (CPU) | Intel Xeon |
| Видеокарта (GPU) | NVIDIA H200 |
| Количество GPU, шт | 8 |
| Общий объем видеопамяти (VRAM), ГБ | 1128 |
| Тип памяти GPU | HBM3e |
| Объем оперативной памяти (RAM), ГБ | 8192 |
| Тип оперативной памяти | DDR5 ECC REG |
| Форм-фактор | 5U |
Платформа с HGX H200 (8×SXM) рассчитана на Обучение моделей (Training), Дообучение моделей (Fine-tuning), Инференс / Развертывание (Inference), RAG-системы (Retrieval-Augmented Generation) и HPC / Научные расчёты - когда критичны масштабирование по 8 GPU и высокая пропускная способность.
H200 (Hopper) поддерживает FP16/FP8/INT8 и использует HBM3e; в данной сборке суммарно 1128GB VRAM (~1.1TB) (8×141GB). Между GPU - NVLink + NVSwitch, что полезно для распределённого обучения и тяжёлого serving с длинным контекстом.
Из ограничений: при установке только 1 CPU часть ресурсов платформы может быть недоступна, поэтому для максимальной пропускной способности и расширяемости обычно подразумевается dual-socket конфигурация.
Платформа поддерживает 2× LGA4677 и процессоры Intel Xeon Scalable 4/5-го поколения, а также Intel Xeon CPU Max Series (dual CPU). Память - DDR5 RDIMM, 32 DIMM, при этом на каждый процессор приходится 8-канальная подсистема памяти; скорости зависят от поколения CPU и заполнения: 5th Gen Xeon - до 5600 MT/s (1DPC), 4400 MT/s (2DPC); 4th Gen Xeon - до 4800 MT/s (1DPC), 4400 MT/s (2DPC); Xeon Max Series - до 4800 MT/s (1DPC), 4400 MT/s (2DPC). Максимальный объём памяти в карточке - 8TB. Для накопителей доступны 8× 2.5" hot-swap Gen5 NVMe/SATA/SAS-4, а для SAS требуется SAS-карта.
| Тип точности | Совокупная мощность восьми H200 SXM |
| FP64 Tensor Core | 536 TFLOPS |
| FP8 Tensor Core | 31 664 TFLOPS |
| BF16 / FP16 Tensor Core | 15 832TFLOPS |
| TF32 Tensor Core | 7 912 TFLOPS |
| INT8 Tensor Core | 31 664 TOPS |
| Модель | Тип квантизации | Требуется VRAM | Совместимость | Примечание |
| DeepSeek-R1 685B | Нет | Примерно 700–900GB | ✅ | Запускать распределённо на 8 GPU: удобно для длинного контекста и высокой нагрузки inference. |
| Qwen3-235B-A22B-Instruct | Нет | Примерно 471GB | ✅ | Работает без квантизации; оптимально распараллеливать по 2–8 GPU для serving и RAG. |
| Gpt-oss:120b | Нет | Примерно 196GB | ✅ | Комфортно держать на 2–4 GPU с большим запасом под KV-cache и батчи. |
| GigaChat3-702B-A36B-preview | Нет | Примерно 720GB | ✅ | Лучше использовать TP на 8 GPU для стабильного serving и длинных контекстов. |
| Mistral-Large-3-675B-Instruct-251 | Нет | Примерно 680–750GB | ✅ | Хороша для reasoning-задач; уверенно работает на 8 GPU и масштабируется под батчи. |
| GLM-4.7 | Нет | Примерно 717GB | ✅ | Стабильный продакшн-serving на 8 GPU с упором на длинный контекст и параллельные запросы. |
| Модель | Тип | Совместимость | Примечание |
| Stable Diffusion XL 1.0 | Текст в изображение | ✅ | Легко держит высокие разрешения и крупные батчи; удобно параллелить генерацию по GPU. |
| Flux.2-dev | Текст в изображение | ✅ | Требует ~178GB VRAM: оптимально запускать распределённо по 2+ GPU или с offload/оптимизациями. |
| SD Turbo | Быстрые предпросмотры | ✅ | Максимальный throughput предпросмотров; хорошо держит высокий concurrency. |
| Kandinsky-5.0-T2I-Lite-sft-Diffusers | Текст в изображение | ✅ | ~35GB VRAM: большой запас под разрешение и batch даже на одном GPU. |
| Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers | Текст в видео | ✅ | ~29GB VRAM для роликов до ~5 секунд; удобно распараллеливать очереди по GPU. |
| Видеокарта | 8x Nvidia H200 SXM 141GB HBM3e |
| Процессор | 2x LGA4677 и процессоры Intel Xeon Scalable 4/5-го поколения, а также Intel Xeon CPU Max Series |
| Оперативная память | до 8TB DDR5 RDIMM, 32 DIMM, при этом на каждый процессор приходится 8-канальная подсистема памяти |
| SSD накопители | 8× 2.5" hot-swap Gen5 NVMe/SATA/SAS-4, а для SAS требуется SAS-карта |
Если нужна конфигурация на эту платформу под ваши задачи - свяжитесь с менеджером, и мы предложим подходящий вариант под бюджет и требования.
Мы отправляем заказы ведущими транспортными компаниями:
Все отправления тщательно упаковываются и скорейшие сроки передаются в ТК.
Ориентировочные сроки сборки заказов:
В случае если оборудование требуется в срочном порядке сообщите менеджеру и мы организуем приоритетную обработку вашего заказа с учетом выбора тарифа “Экспресс” со стороны ТК.
Оплата заказа доступна после подтверждения менеджером посредством следующих способов оплаты:
ServerFlow — это интернет магазин специализирующийся на продаже Б/У и новой серверной техники. Все наше оборудование проходит строгий процесс предпродажной подготовки. Мы уделяем большое внимание тестированию всех компонентов, чтобы минимизировать вероятность возникновения гарантийных случаев и обеспечить высокое качество продукции.
Также мы можем предложить расширенный срок гарантийных отношений:
Мы верим, что сможем обеспечить наилучший пользовательский опыт и ценим ваше доверие. Если у вас остались дополнительные вопросы, вы можете адресовать их в онлайн чате на сайте или задать в Telegram @serverflow.
ServerFlow активно занимается б/у оборудованием, поэтому мы готовы рассмотреть ваше оборудование в качестве основания для предоставления скидки в рамках “Trade-in”. Чтобы произвести оценку оборудования обратитесь в онлайн чат на сайте или в Telegram @serverflow.
Почему Trade-in в ServerFlow — это удобно:
Оставьте отзыв о ServerFlow на Яндексе и условия акции будут исполнены
* скидка предоставляется при покупке от 30 000 рублей,
в ином случае предусмотрена бесплатная доставка.
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
Мы ценим вашу обратную связь.
После покупки оставьте отзыв о ServerFlow на Яндексе и условия акции будут исполнены.
* — скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка.