Цена с учетом расширенной гарантии
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
| Тип | Новые |
| Основная задача | Обучение моделей / Инференс / Дообучение моделей / RAG-системы / Анализ данных / Научные расчеты (HPC) |
| Процессор (CPU) | Intel Xeon |
| Видеокарта (GPU) | NVIDIA H100 |
| Количество GPU, шт | 8 |
| Общий объем видеопамяти (VRAM), ГБ | 1128 |
| Тип памяти GPU | HBM3e |
| Объем оперативной памяти (RAM), ГБ | 8192 |
| Тип оперативной памяти | DDR5 ECC REG |
| Форм-фактор | 6U |
Конфигурация рассчитана на Инференс / Развертывание (Inference) и RAG-системы (Retrieval-Augmented Generation) с длинным контекстом и высоким QPS, а также закрывает Обучение моделей (Training), Дообучение моделей (Fine-tuning) и HPC / Научные расчёты при масштабировании на 8 GPU.
В основе - NVIDIA HGX H200 8-GPU с NVSwitch и 8× H200 SXM по 141GB HBM3e, суммарно 1128GB VRAM (≈ 1.1TB). Такой объём удобен для больших батчей и длинного контекста, а также оставляет запас под KV-cache при высокой параллельности запросов.
Особенность версии SYN - оптимизация тракта GPU-to-CPU, а также GPUDirect RDMA и GPUDirect Storage через PCIe Switch Synthetic Mode, что полезно для стабильного multi-GPU serving и тяжёлых пайплайнов обучения.
Платформа - Dual Socket E (LGA 4677) и поддержка 4-го и 5-го поколения Intel Xeon Scalable, память - 16+16 DIMM слотов (2DPC) под DDR5 RDIMM и RDIMM-3DS, максимум - до 8TB. Для накопителей доступны 8 hot-swap 2.5" NVMe (PCIe 5.0 x4), ещё 2 hot-swap 2.5" NVMe (PCIe 4.0 x4) или SATA и 2 hot-swap 2.5" SATA, плюс 2 слота M.2 (PCIe 3.0 x4, один также поддерживает SATA 6Gb/s).
| Тип точности | Совокупная мощность восьми H200 SXM |
| FP64 Tensor Core | 536 TFLOPS |
| FP8 Tensor Core | 31 664 TFLOPS |
| BF16 / FP16 Tensor Core | 15 832TFLOPS |
| TF32 Tensor Core | 7 912 TFLOPS |
| INT8 Tensor Core | 31 664 TOPS |
| Модель | Тип квантизации | Требуется VRAM | Совместимость | Примечание |
| DeepSeek-R1 685B | Нет | Примерно 700–900GB | ✅ | Запуск в распределённом режиме на 8 GPU, при длинном контексте держите лимиты батча и сессий из-за KV-cache. |
| Qwen3-235B-A22B-Instruct | Нет | Примерно 471GB | ✅ | Комфортный serving без квантизации с распараллеливанием по 2 - 8 GPU и запасом VRAM под длинный контекст. |
| Gpt-oss:120b | Нет | Примерно 196GB | ✅ | Удобно держать на 1 - 2 GPU и масштабировать throughput батчами, сохраняя большой запас памяти под KV-cache. |
| GigaChat3-702B-A36B-preview | Нет | Примерно 720GB | ✅ | Оптимально распределять по 8 GPU, чтобы держать высокую параллельность запросов и стабильную меж-GPU коммуникацию. |
| Mistral-Large-3-675B-Instruct-251 | Нет | Примерно 680–750GB | ✅ | Хорошо работает на 8 GPU, запас VRAM лучше отдавать под контекст и рост batch size в пиковые часы. |
| GLM-4.7 | Нет | Примерно 717GB | ✅ | Стабильный продакшн-запуск при распределении по 8 GPU, удобно повышать QPS за счёт батчирования. |
| Модель | Тип | Совместимость | Примечание |
| Stable Diffusion XL 1.0 | Текст в изображение | ✅ | Высокие разрешения и большие батчи, генерацию удобно распараллеливать по нескольким GPU. |
| Flux.2-dev | Текст в изображение | ✅ | Оптимально запускать распределённо по 2 GPU или держать стабильный throughput, раскидывая задачи по 8 GPU. |
| SD Turbo | Быстрые предпросмотры | ✅ | Максимальная скорость предпросмотров, высокая параллельность генераций на одном узле. |
| Kandinsky-5.0-T2I-Lite-sft-Diffusers | Текст в изображение | ✅ | Можно держать несколько пайплайнов одновременно и повышать batch size без упора в VRAM. |
| Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers | Текст в видео | ✅ | Пакетную генерацию коротких роликов удобно параллелить по GPU для стабильной очереди. |
| Видеокарта | 8x Nvidia H200 SXM 141GB HBM3e |
| Процессор | 2× Intel Xeon Scalable 4th и 5th Gen в сокетах LGA 4677 |
| Оперативная память | до 8TB DDR5 ECC RDIMM, 32 DIMM-слотах |
| SSD накопители | 8x hot-swap 2.5" NVMe (PCIe 5.0 x4), ещё 2x hot-swap 2.5" NVMe (PCIe 4.0 x4) или SATA и 2x hot-swap 2.5" SATA, плюс 2 слота M.2 (PCIe 3.0 x4, один также поддерживает SATA 6Gb/s). |
Если нужна конфигурация на эту платформу под ваши задачи - свяжитесь с менеджером, и мы предложим подходящий вариант под бюджет и требования.
Мы отправляем заказы ведущими транспортными компаниями:
Все отправления тщательно упаковываются и скорейшие сроки передаются в ТК.
Ориентировочные сроки сборки заказов:
В случае если оборудование требуется в срочном порядке сообщите менеджеру и мы организуем приоритетную обработку вашего заказа с учетом выбора тарифа “Экспресс” со стороны ТК.
Оплата заказа доступна после подтверждения менеджером посредством следующих способов оплаты:
ServerFlow — это интернет магазин специализирующийся на продаже Б/У и новой серверной техники. Все наше оборудование проходит строгий процесс предпродажной подготовки. Мы уделяем большое внимание тестированию всех компонентов, чтобы минимизировать вероятность возникновения гарантийных случаев и обеспечить высокое качество продукции.
Также мы можем предложить расширенный срок гарантийных отношений:
Мы верим, что сможем обеспечить наилучший пользовательский опыт и ценим ваше доверие. Если у вас остались дополнительные вопросы, вы можете адресовать их в онлайн чате на сайте или задать в Telegram @serverflow.
ServerFlow активно занимается б/у оборудованием, поэтому мы готовы рассмотреть ваше оборудование в качестве основания для предоставления скидки в рамках “Trade-in”. Чтобы произвести оценку оборудования обратитесь в онлайн чат на сайте или в Telegram @serverflow.
Почему Trade-in в ServerFlow — это удобно:
Поделитесь впечатлением о работе ServerFlow после получения заказа.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена
бесплатная доставка до ПВЗ СДЭК.
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
Мы ценим обратную связь от клиентов. При оформлении заказа вы можете сообщить о своём намерении поделиться впечатлением о работе ServerFlow после получения товара.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка до ПВЗ СДЭК.