Цена с учетом расширенной гарантии
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
| Тип | Новые |
| Основная задача | Обучение моделей / Инференс / Дообучение моделей / RAG-системы / Анализ данных / Научные расчеты (HPC) / Визуализация и рендеринг |
| Процессор (CPU) | Intel Xeon |
| Видеокарта (GPU) | NVIDIA H100 |
| Количество GPU, шт | 8 |
| Общий объем видеопамяти (VRAM), ГБ | 640 |
| Тип памяти GPU | HBM3 |
| Объем оперативной памяти (RAM), ГБ | 2000 |
| Тип оперативной памяти | DDR5 ECC REG |
| Форм-фактор | 8U |
NVIDIA DGX H100 - это датацентровая платформа для тяжёлых AI-нагрузок, рассчитанная на Обучение моделей (Training), Дообучение моделей (Fine-tuning) и высоконагруженный Инференс / Развертывание (Inference). Суммарно здесь ≈640 GB VRAM (8×80 GB), поэтому сервер уверенно держит большие батчи, длинный контекст и параллельные пайплайны, где важны стабильность и пропускная способность.
Внутри - восемь H100 SXM 80GB (профиль Hopper, HBM3), объединённых через NVLink / NVSwitch в единый высокоскоростной домен. Ускорители H100 поддерживают FP16/FP8/INT8 и экосистему CUDA, поэтому DGX H100 особенно силён в масштабируемом обучении, дообучении и продакшн-сервисах (включая RAG-системы (Retrieval-Augmented Generation) и агентные сценарии).
| Тип точности | Совокупная мощность восьми H100 SXM |
| FP64 Tensor Core | 536 TFLOPS |
| FP8 Tensor Core | 31 664 TFLOPS |
| BF16 / FP16 Tensor Core | 15 832TFLOPS |
| TF32 Tensor Core | 7 912 TFLOPS |
| INT8 Tensor Core | 31 664 TOPS |
| Модель | Тип квантизации | Требуется VRAM | Совместимость | Примечание |
| DeepSeek-R1-GGUF 685B | Q4_K_M | Примерно 404GB | ✅ | Силен в рассуждениях; на DGX H100 комфортнее запускать в 4-бит (или с частичным offload), чтобы уложиться в VRAM с учётом KV-cache и оверхеда. |
| Qwen3-235B-A22B-Instruct | Нет | Примерно 471GB | ✅ | Уверенно помещается на 8×H100; легко масштабируется по 2–8 GPU, подходит для продакшн-чатов, RAG и агентов. |
| Gpt-oss:120b | Нет | Примерно 196GB | ✅ | Комфортная работа при распараллеливании по 2–4 GPU; удобно для больших батчей, длинных диалогов и высокой пропускной способности. |
| ai-sage_GigaChat3-702B-A36B-preview-GGUF | Q4_K_M | Примерно 472GB | ✅ | На 8×H100 устойчиво запускается в 4-бит; хорошо подходит для крупных ассистентов и длинных контекстов при правильных настройках serving. |
| Mistral-Large-3-675B-Instruct-2512-GGUF | Q4_K_M | Примерно 407GB | ✅ | Оптимальна для reasoning- и аналитических задач; на DGX H100 лучше держать в 4-бит, чтобы сохранить запас под KV-cache/контекст. |
| GLM-4.7-GGUF | Q4_K_M | Примерно 216GB | ✅ | Стабильный продакшн-запуск при распределении по 4–8 GPU; в 4-бит остаётся запас по VRAM под длинный контекст и батчи. |
| Модель | Тип | Совместимость | Примечание |
| Stable Diffusion XL 1.0 | Текст в изображение | ✅ | Надёжное качество; множество готовых пайплайнов и оптимизаций. На H100 легко держит высокие разрешения и большие батчи. |
| Flux.2-dev | Текст в изображение | ⚠️ | Требует ~178GB VRAM: на 80GB GPU обычно нужен multi-GPU режим/распараллеливание или offloading/оптимизации. На 8×H100 это решаемо, но зависит от пайплайна. |
| SD Turbo | Быстрые предпросмотры | ✅ | Максимальная скорость для итераций и серийных кадров; отлично подходит для параллельных очередей генерации. |
| Kandinsky-5.0-T2I-Lite-sft-Diffusers | Текст в изображение | ✅ | Лёгкая версия Kandinsky 5.0; требует ~35GB VRAM — на DGX H100 большой запас под высокое разрешение и батчи. |
| Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers | Текст в видео | ✅ | T2V (~29GB VRAM) для роликов до ~5 секунд; хорошо масштабируется по нескольким GPU и подходит для продакшн-пайплайнов. |
| Видеокарта | 8x Nvidia H100 SXM 80GB HBM3 |
| Процессор | 2x Intel Xeon Platinum 8480C (56c/112t, 2GHz-3.8GHz, 350W) |
| Оперативная память | 2TB DDR5 ECC REG |
| SSD накопители | 2x 1.92TB NVMe M.2
8x 3.84TB NVMe U.2 |
| Сетевые карты | 4 порта OSFP, обслуживающие 8 однопортовых модулей NVIDIA ConnectX-7 VPI, InfiniBand/Ethernet до 400 Гбит/с
2x dual-port QSFP112 400Gbe NVIDIA ConnectX-7 VPI |
Мы отправляем заказы ведущими транспортными компаниями:
Все отправления тщательно упаковываются и скорейшие сроки передаются в ТК.
Ориентировочные сроки сборки заказов:
В случае если оборудование требуется в срочном порядке сообщите менеджеру и мы организуем приоритетную обработку вашего заказа с учетом выбора тарифа “Экспресс” со стороны ТК.
Оплата заказа доступна после подтверждения менеджером посредством следующих способов оплаты:
ServerFlow — это интернет магазин специализирующийся на продаже Б/У и новой серверной техники. Все наше оборудование проходит строгий процесс предпродажной подготовки. Мы уделяем большое внимание тестированию всех компонентов, чтобы минимизировать вероятность возникновения гарантийных случаев и обеспечить высокое качество продукции.
Также мы можем предложить расширенный срок гарантийных отношений:
Мы верим, что сможем обеспечить наилучший пользовательский опыт и ценим ваше доверие. Если у вас остались дополнительные вопросы, вы можете адресовать их в онлайн чате на сайте или задать в Telegram @serverflow.
ServerFlow активно занимается б/у оборудованием, поэтому мы готовы рассмотреть ваше оборудование в качестве основания для предоставления скидки в рамках “Trade-in”. Чтобы произвести оценку оборудования обратитесь в онлайн чат на сайте или в Telegram @serverflow.
Почему Trade-in в ServerFlow — это удобно:
Оставьте отзыв о ServerFlow на Яндексе и условия акции будут исполнены
* скидка предоставляется при покупке от 30 000 рублей,
в ином случае предусмотрена бесплатная доставка.
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
Мы ценим вашу обратную связь.
После покупки оставьте отзыв о ServerFlow на Яндексе и условия акции будут исполнены.
* — скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка.