Цена с учетом расширенной гарантии
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
| Основная задача | Обучение моделей / Инференс / Дообучение моделей / RAG-системы / Анализ данных / Научные расчеты (HPC) |
| Процессор (CPU) | Intel Xeon |
| Видеокарта (GPU) | NVIDIA H100 |
| Количество GPU, шт | 8 |
| Общий объем видеопамяти (VRAM), ГБ | 640 |
| Тип памяти GPU | HBM3 |
Конфигурация на NVIDIA HGX H100 80GB (8× SXM5) рассчитана на Обучение моделей (Training), Дообучение моделей (Fine-tuning), Инференс / Развертывание (Inference), RAG-системы (Retrieval-Augmented Generation) и HPC / Научные расчёты - это плотная 8-GPU платформа для тяжёлых ML/DL-нагрузок и распределённого запуска больших моделей.
GPU-профиль H100 (Hopper) с ускорением FP16/FP8/INT8 и HBM3 удобен для serving и обучения: суммарно 640GB VRAM, что даёт хороший запас под KV-cache, длинный контекст и рост batch/concurrency.
Платформа поддерживает HGX H100 8-GPU SXM5 (PCIe Gen5) и рассчитана на интенсивные межGPU-обмены; для стабильной производительности в продакшне обычно важны корректные настройки распараллеливания (TP/PP) и управление контекстом/батчами.
Платформа: поддержка 4th/5th Gen Intel Xeon Scalable, память DDR5 RDIMM - 32 слота и максимум 4 TB. По накопителям доступны варианты: до 8× 2.5" NVMe/SAS/SATA (до 122.88 TB) либо до 16× E3.S NVMe direct (до 122.88 TB).
| Тип точности | Совокупная мощность восьми H200 SXM |
| FP64 Tensor Core | 536 TFLOPS |
| FP8 Tensor Core | 31 664 TFLOPS |
| BF16 / FP16 Tensor Core | 15 832TFLOPS |
| TF32 Tensor Core | 7 912 TFLOPS |
| INT8 Tensor Core | 31 664 TOPS |
| Модель | Тип квантизации | Требуется VRAM | Совместимость | Примечание |
| DeepSeek-R1-GGUF 685B | Q4_K_M | Примерно 404GB | ✅ | Рекомендован 4-бит и TP на 4–8 GPU; запас VRAM держите под KV-cache при длинном контексте. |
| Qwen3-235B-A22B-Instruct | Нет | Примерно 471GB | ✅ | Без квантизации помещается на 8 GPU; TP/PP подбирайте под требуемую latency и batch. |
| Gpt-oss:120b | Нет | Примерно 196GB | ✅ | Комфортно на 2–4 GPU, оставляя VRAM под большие батчи и высокий concurrency. |
| ai-sage_GigaChat3-702B-A36B-preview-GGUF | Q4_K_M | Примерно 472GB | ✅ | 4-бит + TP на 8 GPU для стабильного serving и длинного контекста. |
| Mistral-Large-3-675B-Instruct-2512-GGUF | Q4_K_M | Примерно 407GB | ✅ | 4-бит с запасом под KV-cache; хорошо держит высокий throughput при батчах. |
| GLM-4.7-GGUF | Q4_K_M | Примерно 216GB | ✅ | Запуск на 2–4 GPU; увеличивайте batch и контекст, контролируя рост KV-cache. |
| Модель | Тип | Совместимость | Примечание |
| Stable Diffusion XL 1.0 | Текст в изображение | ✅ | Высокие разрешения и крупные батчи; генерацию легко распараллеливать по GPU. |
| Flux.2-dev | Текст в изображение | ⚠️ | Обычно нужен multi-GPU/offload; итог зависит от пайплайна и настроек памяти. |
| SD Turbo | Быстрые предпросмотры | ✅ | Быстрые превью и серийная генерация при высокой параллельности очереди. |
| Kandinsky-5.0-T2I-Lite-sft-Diffusers | Текст в изображение | ✅ | Большой запас VRAM позволяет повышать разрешение и батчи без упора в память. |
| Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers | Текст в видео | ✅ | Параллельные задачи по нескольким GPU для стабильных продакшн-очередей. |
| Видеокарта | 8x Nvidia H100 SXM 80GB HBM3 |
| Процессор | 2× Intel Xeon Scalable 4-го/5-го поколения (до 64C/350W на 5-м поколении |
| Оперативная память | до 4TB DDR5 ECC RDIMM, 32 DIMM-слотах |
| SSD накопители | до 8× 2.5" NVMe/SAS/SATA (до 122.88 TB) либо до 16× E3.S NVMe (до 122.88 TB) |
Если нужна конфигурация на эту платформу под ваши задачи - свяжитесь с менеджером, и мы предложим подходящий вариант под бюджет и требования.
Мы отправляем заказы ведущими транспортными компаниями:
Все отправления тщательно упаковываются и скорейшие сроки передаются в ТК.
Ориентировочные сроки сборки заказов:
В случае если оборудование требуется в срочном порядке сообщите менеджеру и мы организуем приоритетную обработку вашего заказа с учетом выбора тарифа “Экспресс” со стороны ТК.
Оплата заказа доступна после подтверждения менеджером посредством следующих способов оплаты:
ServerFlow — это интернет магазин специализирующийся на продаже Б/У и новой серверной техники. Все наше оборудование проходит строгий процесс предпродажной подготовки. Мы уделяем большое внимание тестированию всех компонентов, чтобы минимизировать вероятность возникновения гарантийных случаев и обеспечить высокое качество продукции.
Также мы можем предложить расширенный срок гарантийных отношений:
Мы верим, что сможем обеспечить наилучший пользовательский опыт и ценим ваше доверие. Если у вас остались дополнительные вопросы, вы можете адресовать их в онлайн чате на сайте или задать в Telegram @serverflow.
ServerFlow активно занимается б/у оборудованием, поэтому мы готовы рассмотреть ваше оборудование в качестве основания для предоставления скидки в рамках “Trade-in”. Чтобы произвести оценку оборудования обратитесь в онлайн чат на сайте или в Telegram @serverflow.
Почему Trade-in в ServerFlow — это удобно:
Оставьте отзыв о ServerFlow на Яндексе и условия акции будут исполнены
* скидка предоставляется при покупке от 30 000 рублей,
в ином случае предусмотрена бесплатная доставка.
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
Мы ценим вашу обратную связь.
После покупки оставьте отзыв о ServerFlow на Яндексе и условия акции будут исполнены.
* — скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка.