Цена с учетом расширенной гарантии
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
| Тип | Новые |
| Основная задача | Обучение моделей / Инференс / Дообучение моделей / RAG-системы / Анализ данных / Научные расчеты (HPC) / Визуализация и рендеринг |
| Процессор (CPU) | Intel Xeon 6-series |
| Видеокарта (GPU) | NVIDIA B200 SXM |
| Количество GPU, шт | 8 |
| Общий объем видеопамяти (VRAM), ГБ | 1440 |
| Тип памяти GPU | HBM3e |
| Объем оперативной памяти (RAM), ГБ | 4096 |
| Тип оперативной памяти | DDR5 ECC REG |
| Форм-фактор | 8U |
Данная сборка на NVIDIA HGX B200 ориентирована на Обучение моделей (Training), Дообучение моделей (Fine-tuning), Инференс / Развертывание (Inference), RAG-системы (Retrieval-Augmented Generation) и HPC / Научные расчёты - за счёт 8× SXM-GPU, высокой межGPU-связности NVLink/NVSwitch и большого суммарного пула видеопамяти.
GPU-часть: HGX B200 (HBM3e), суммарно 1.44TB VRAM (1440GB); это удобно для крупных LLM в распределённом режиме, длинного контекста (KV-cache) и высокого throughput при serving (батчи/параллельные запросы).
По межGPU-обмену заявлено до 1.8TB/s GPU-to-GPU bandwidth (NVLink/NVSwitch), поэтому платформа хорошо “раскрывается” в multi-GPU сценариях (TP/PP/DP, NCCL).
Платформа: поддерживает 2× Intel Xeon 6 (серии 6700/6500, сокет LGA4710 / Socket E2, TDP до 350W); память - 32 слота DDR5 RDIMM/MRDIMM (максимальный объём до 4TB); по накопителям - 8× 2.5" Gen5 NVMe hot-swap и 2× M.2 2280/22110 (PCIe Gen5 x4 и x2).
| Тип точности | Совокупная мощность HGX B200 8-GPU |
| FP64 Tensor core | 296 TFLOPS |
| FP32 Tensor core | 600 TFLOPS |
| BF16/FP16 Tensor core | 36 PFLOPS |
| INT8 Tensor core | 72 POPS |
| FP8/FP6 Tensor core | 72 PFLOPS |
| FP4 Tensor core | 144 PFLOPS |
| Модель | Тип квантизации | Требуется VRAM | Совместимость | Примечание |
| DeepSeek-R1 685B | Нет | Примерно 689GB | ✅ | Уверенно запускается распределённо на 8 GPU; остаётся запас под длинный контекст (KV-cache) и высокий serving-throughput. |
| Qwen3-235B-A22B-Instruct | Нет | Примерно 471GB | ✅ | Комфортно работает без квантизации; для serving обычно достаточно 2–4 GPU, остальное — под батчи/параллельные инстансы. |
| Gpt-oss:120b | Нет | Примерно 196GB | ✅ | Лёгкий профиль для этой платформы: удобно держать на 1–2 GPU с большим запасом под KV-cache и высокий concurrency. |
| GigaChat3-702B-A36B-preview | Нет | Примерно 720GB | ✅ | Оптимальный кейс для 8×B200: стабильный продакшн-serving с длинным контекстом и хорошей масштабируемостью по NCCL. |
| Mistral-Large-3-675B-Instruct-251 | Нет | Примерно 682GB | ✅ | Запускается на 8 GPU без квантизации; удобно для аналитики/агентов и RAG при высоких батчах. | GLM-4.7 | Нет | Примерно 717GB | ✅ | Хорошо подходит под распределённый inference на 8 GPU: можно держать длинный контекст и высокую параллельность запросов. |
| Модель | Тип | Совместимость | Примечание |
| Stable Diffusion XL 1.0 | Текст в изображение | ✅ | Можно держать высокие разрешения и крупные батчи; удобно масштабировать генерацию параллельно по нескольким GPU. |
| Flux.2-dev | Текст в изображение | ✅ | Требует ~178GB VRAM: комфортно идёт в multi-GPU режиме, оставляя запас под большие батчи и высокое разрешение. |
| SD Turbo | Быстрые предпросмотры | ✅ | Отличен для больших очередей: можно разнести генерацию по GPU для максимального throughput. |
| Kandinsky-5.0-T2I-Lite-sft-Diffusers | Текст в изображение | ✅ | ~35GB VRAM: большой запас по памяти под высокое разрешение, батчи и несколько пайплайнов одновременно. |
| Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers | Текст в видео | ✅ | ~29GB VRAM: удобно параллелить задачи по GPU и собирать продакшн-очереди генерации видео. |
| Видеокарта | 8x Nvidia B200 SXM 180GB HBM3e |
| Процессор | 2× Intel Xeon 6 (серии 6700/6500, сокет LGA4710 / Socket E2, TDP до 350W) |
| Оперативная память | 32 слота DDR5 RDIMM/MRDIMM (максимальный объём до 4TB) |
| SSD накопители | 8× 2.5" Gen5 NVMe hot-swap и 2× M.2 2280/22110 (PCIe Gen5 x4 и x2) |
Если нужна конфигурация на эту платформу под ваши задачи - свяжитесь с менеджером, и мы предложим подходящий вариант под бюджет и требования.
Мы отправляем заказы ведущими транспортными компаниями:
Все отправления тщательно упаковываются и скорейшие сроки передаются в ТК.
Ориентировочные сроки сборки заказов:
В случае если оборудование требуется в срочном порядке сообщите менеджеру и мы организуем приоритетную обработку вашего заказа с учетом выбора тарифа “Экспресс” со стороны ТК.
Оплата заказа доступна после подтверждения менеджером посредством следующих способов оплаты:
ServerFlow — это интернет магазин специализирующийся на продаже Б/У и новой серверной техники. Все наше оборудование проходит строгий процесс предпродажной подготовки. Мы уделяем большое внимание тестированию всех компонентов, чтобы минимизировать вероятность возникновения гарантийных случаев и обеспечить высокое качество продукции.
Также мы можем предложить расширенный срок гарантийных отношений:
Мы верим, что сможем обеспечить наилучший пользовательский опыт и ценим ваше доверие. Если у вас остались дополнительные вопросы, вы можете адресовать их в онлайн чате на сайте или задать в Telegram @serverflow.
ServerFlow активно занимается б/у оборудованием, поэтому мы готовы рассмотреть ваше оборудование в качестве основания для предоставления скидки в рамках “Trade-in”. Чтобы произвести оценку оборудования обратитесь в онлайн чат на сайте или в Telegram @serverflow.
Почему Trade-in в ServerFlow — это удобно:
Оставьте отзыв о ServerFlow на Яндексе и условия акции будут исполнены
* скидка предоставляется при покупке от 30 000 рублей,
в ином случае предусмотрена бесплатная доставка.
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
Мы ценим вашу обратную связь.
После покупки оставьте отзыв о ServerFlow на Яндексе и условия акции будут исполнены.
* — скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка.