Цена с учетом расширенной гарантии
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
| Тип | Новые |
| Основная задача | Обучение моделей / Инференс / Дообучение моделей / RAG-системы / Анализ данных / Научные расчеты (HPC) |
| Процессор (CPU) | Intel Xeon |
| Видеокарта (GPU) | NVIDIA H100 |
| Количество GPU, шт | 4 |
| Общий объем видеопамяти (VRAM), ГБ | 376 |
| Тип памяти GPU | HBM3 |
| Объем оперативной памяти (RAM), ГБ | 8192 |
| Тип оперативной памяти | DDR5 ECC REG |
| Форм-фактор | 2U |
Supermicro SYS-221GE-NR в конфигурации с 4x NVIDIA H100 NVL 94GB и суммарными 376 GB HBM3 - это серверный узел для задач уровня дата-центра, где важны максимальная плотность вычислений, высокая пропускная способность памяти и стабильная работа под длительной нагрузкой. Такая система особенно хорошо подходит для Обучения моделей (Training), Дообучения моделей (Fine-tuning), Инференса / Развертывания (Inference), RAG-систем и HPC / Научных расчётов.
GPU NVIDIA H100 NVL построены на архитектуре Hopper и ориентированы на современные AI-нагрузки с поддержкой FP16, FP8 и INT8, что делает платформу эффективной как для тяжёлых LLM, так и для ускорения инференса в production-среде. Большой суммарный объём HBM3 позволяет запускать крупные модели с более высоким качеством квантизации, увеличенным контекстом, большим batch size и несколькими параллельными пайплайнами без жёсткой экономии видеопамяти.
За счёт такого запаса VRAM сервер уверенно чувствует себя в сценариях обучения и дообучения больших языковых моделей, генеративных систем и сложных вычислительных задач. Платформа хорошо сочетается с экосистемой CUDA, современными версиями PyTorch, TensorRT, vLLM и другими AI-фреймворками, где H100 раскрывает преимущество по пропускной способности и ускорению матричных операций.
| Тип точности | Совокупная мощность четырех H100 NVL |
| FP64 Tensor Core | 240 TFLOPS |
| FP32 Tensor Core | 3 340 TFLOPS |
| BF16/FP16 Tensor Core | 6 684 TFLOPS |
| FP8 Tensor Core | 13 364 TFLOPS |
| INT8 Tensor Core | 9 984 TOPS |
| Модель | Тип квантизации | Требуется VRAM | Совместимость | Примечание |
| DeepSeek-R1-Distill-Llama-70B | Нет | Примерно 141GB | ✅ | Уверенно распределяется между 2 GPU и оставляет большой запас под длинный контекст, KV-cache и несколько параллельных сценариев inference. |
| Qwen3-235B-A22B-Thinking-2507-FP8 | FP8 | Примерно 236GB | ✅ | Хорошо подходит для крупного inference на одном узле и сохраняет заметный запас памяти под контекст, батчи и стабильную multi-user нагрузку. |
| gpt-oss:120b | Нет (FP16) | Примерно 260GB | ✅ | Комфортно работает на 4 GPU и даёт хороший запас под KV-cache, высокий throughput и параллельное обслуживание нескольких запросов. |
| Mistral-Large-3-675B-Instruct-2512-GGUF | IQ4_XS | Примерно 360GB | ⚠️ | Запуск возможен на 4x H100 NVL 94GB, но запас по памяти уже минимальный, поэтому важны аккуратные настройки контекста, batch size и KV-cache. |
| GLM-4.7-FP8 | FP8 | Примерно 362GB | ⚠️ | Модель близка к пределу по VRAM для этой конфигурации, поэтому для стабильного serving нужны умеренный контекст и точная настройка multi-GPU распределения. |
| ai-sage_GigaChat3-702B-A36B-preview-GGUF | IQ4_XS | Примерно 376GB | ⚠️ | Работает практически на пределе доступной памяти, поэтому подходит только при строгом контроле контекста, KV-cache и количества одновременных сессий. |
| gemma-4-31B-it | нет | Примерно 62.6GB | ✅ | Очень лёгкая модель для 4x H100 NVL и удобна для нескольких одновременных инстансов, длинного контекста и высокой плотности запросов. |
| Модель | Тип | Совместимость | Примечание |
| Stable Diffusion XL 1.0 | Текст в изображение | ✅ | Уверенно подходит для high-res генерации, крупных батчей и параллельных пайплайнов на нескольких GPU. |
| FLUX.2-dev | Текст в изображение | ✅ | Требовательная модель, но на 4x H100 NVL её удобно распределять по GPU и держать серьёзную очередь задач с хорошим запасом по памяти. |
| SD Turbo | Быстрые предпросмотры | ✅ | Отлично подходит для быстрых итераций, массовой генерации и высокой плотности параллельных задач. |
| Kandinsky-5.0-T2I-Lite-sft-Diffusers | Текст в изображение | ✅ | Лёгкая версия Kandinsky 5.0 и на этой конфигурации остаётся большой запас видеопамяти под высокое разрешение, батчи и параллельные задания. |
| Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers | Текст в видео | ✅ | Подходит для пакетной генерации коротких роликов и хорошо масштабируется на нескольких GPU с высоким запасом по производительности. |
| Платформа | Supermicro SYS-221GE-NR |
| Видеокарта | 4x NVIDIA H100 NVL 94GB HBM3 |
| Процессор | 2x Intel Xeon Scalable 4th и 5th Gen в сокетах LGA 4677 |
| Оперативная память | 32 DIMM, до 8TB DDR5 ECC RDIMM |
| SSD накопитель | 8x E1.S NVMe, 2x M.2 NVMe/SATA slots (M-key) |
Мы отправляем заказы ведущими транспортными компаниями:
Все отправления тщательно упаковываются и скорейшие сроки передаются в ТК.
Ориентировочные сроки сборки заказов:
В случае если оборудование требуется в срочном порядке сообщите менеджеру и мы организуем приоритетную обработку вашего заказа с учетом выбора тарифа “Экспресс” со стороны ТК.
Оплата заказа доступна после подтверждения менеджером посредством следующих способов оплаты:
ServerFlow — это интернет магазин специализирующийся на продаже Б/У и новой серверной техники. Все наше оборудование проходит строгий процесс предпродажной подготовки. Мы уделяем большое внимание тестированию всех компонентов, чтобы минимизировать вероятность возникновения гарантийных случаев и обеспечить высокое качество продукции.
Также мы можем предложить расширенный срок гарантийных отношений:
Мы верим, что сможем обеспечить наилучший пользовательский опыт и ценим ваше доверие. Если у вас остались дополнительные вопросы, вы можете адресовать их в онлайн чате на сайте или задать в Telegram @serverflow.
ServerFlow активно занимается б/у оборудованием, поэтому мы готовы рассмотреть ваше оборудование в качестве основания для предоставления скидки в рамках “Trade-in”. Чтобы произвести оценку оборудования обратитесь в онлайн чат на сайте или в Telegram @serverflow.
Почему Trade-in в ServerFlow — это удобно:
Поделитесь впечатлением о работе ServerFlow после получения заказа.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена
бесплатная доставка до ПВЗ СДЭК.
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
Мы ценим обратную связь от клиентов. При оформлении заказа вы можете сообщить о своём намерении поделиться впечатлением о работе ServerFlow после получения товара.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка до ПВЗ СДЭК.