Supermicro SYS-221GE-NR (4x NVIDIA H100 NVL 94GB)

Name: Supermicro SYS-221GE-NR (4x NVIDIA H100 NVL 94GB)
Brand: Supermicro
Price: 16661700 RUB
Availability: PreOrder

Новый

+200 ₽

Цена с учетом расширенной гарантии

Цена включает НДС 7%

16 661 700 руб.

Под заказ

Узнать сроки доставки

Получить спец. цену Получить КП за час Отправить КП себе на почту

добавить В корзину

Сравнить

Гарантия 1 год с заменой компонентов

Доставка СДЭК и ведущими службами доставки

Тестируем оборудование
перед отправкой

Гарантия 1 год с заменой компонентов

Подробнее

Условия доставки и самовывоза

Подробнее

Помощь в вопросе выбора и совместимости

Подробнее

Характеристики Доставка и оплата Гарантия Отзывы Trade In

Тип	Новые
Основная задача	Обучение моделей / Инференс / Дообучение моделей / RAG-системы / Анализ данных / Научные расчеты (HPC)
Процессор (CPU)	Intel Xeon
Видеокарта (GPU)	NVIDIA H100
Количество GPU, шт	4
Общий объем видеопамяти (VRAM), ГБ	376
Тип памяти GPU	HBM3
Объем оперативной памяти (RAM), ГБ	8192
Тип оперативной памяти	DDR5 ECC REG
Форм-фактор	2U

Подробные характеристики

Подробное описание

Supermicro SYS-221GE-NR в конфигурации с 4x NVIDIA H100 NVL 94GB и суммарными 376 GB HBM3 - это серверный узел для задач уровня дата-центра, где важны максимальная плотность вычислений, высокая пропускная способность памяти и стабильная работа под длительной нагрузкой. Такая система особенно хорошо подходит для Обучения моделей (Training), Дообучения моделей (Fine-tuning), Инференса / Развертывания (Inference), RAG-систем и HPC / Научных расчётов.

GPU NVIDIA H100 NVL построены на архитектуре Hopper и ориентированы на современные AI-нагрузки с поддержкой FP16, FP8 и INT8, что делает платформу эффективной как для тяжёлых LLM, так и для ускорения инференса в production-среде. Большой суммарный объём HBM3 позволяет запускать крупные модели с более высоким качеством квантизации, увеличенным контекстом, большим batch size и несколькими параллельными пайплайнами без жёсткой экономии видеопамяти.

За счёт такого запаса VRAM сервер уверенно чувствует себя в сценариях обучения и дообучения больших языковых моделей, генеративных систем и сложных вычислительных задач. Платформа хорошо сочетается с экосистемой CUDA, современными версиями PyTorch, TensorRT, vLLM и другими AI-фреймворками, где H100 раскрывает преимущество по пропускной способности и ускорению матричных операций.

Производительность GPU

Тип точности	Совокупная мощность четырех H100 NVL
FP64 Tensor Core	240 TFLOPS
FP32 Tensor Core	3 340 TFLOPS
BF16/FP16 Tensor Core	6 684 TFLOPS
FP8 Tensor Core	13 364 TFLOPS
INT8 Tensor Core	9 984 TOPS

Совместимость с LLM-моделями

Модель	Тип квантизации	Требуется VRAM	Совместимость	Примечание
DeepSeek-R1-Distill-Llama-70B	Нет	Примерно 141GB	✅	Уверенно распределяется между 2 GPU и оставляет большой запас под длинный контекст, KV-cache и несколько параллельных сценариев inference.
Qwen3-235B-A22B-Thinking-2507-FP8	FP8	Примерно 236GB	✅	Хорошо подходит для крупного inference на одном узле и сохраняет заметный запас памяти под контекст, батчи и стабильную multi-user нагрузку.
gpt-oss:120b	Нет (FP16)	Примерно 260GB	✅	Комфортно работает на 4 GPU и даёт хороший запас под KV-cache, высокий throughput и параллельное обслуживание нескольких запросов.
Mistral-Large-3-675B-Instruct-2512-GGUF	IQ4_XS	Примерно 360GB	⚠️	Запуск возможен на 4x H100 NVL 94GB, но запас по памяти уже минимальный, поэтому важны аккуратные настройки контекста, batch size и KV-cache.
GLM-4.7-FP8	FP8	Примерно 362GB	⚠️	Модель близка к пределу по VRAM для этой конфигурации, поэтому для стабильного serving нужны умеренный контекст и точная настройка multi-GPU распределения.
GigaChat3.5-432B-A28B-GGUF	Q4_K_M	Примерно 262GB	✅	Отлично подходит для reasoning, кода, анализа текста и ассистентских задач.
gemma-4-31B-it	нет	Примерно 62.6GB	✅	Очень лёгкая модель для 4x H100 NVL и удобна для нескольких одновременных инстансов, длинного контекста и высокой плотности запросов.
MiniMax-M3	UD-Q4_K_M	Примерно 264GB	✅	Квантизированная версия с заметно меньшим объёмом; удобна для серверов с ограниченным запасом памяти, RAG-сценариев, ассистентов и локальных LLM-сервисов.
MiMo-V2.5	Нет	Примерно 316GB	✅	Базовая версия среднего объёма для серверов с хорошим запасом памяти; подходит для RAG, корпоративных ассистентов, генерации текста и стабильного инференса без квантизации.

Совместимость с диффузионными моделями

Модель	Тип	Совместимость	Примечание
Stable Diffusion XL 1.0	Текст в изображение	✅	Уверенно подходит для high-res генерации, крупных батчей и параллельных пайплайнов на нескольких GPU.
FLUX.2-dev	Текст в изображение	✅	Требовательная модель, но на 4x H100 NVL её удобно распределять по GPU и держать серьёзную очередь задач с хорошим запасом по памяти.
SD Turbo	Быстрые предпросмотры	✅	Отлично подходит для быстрых итераций, массовой генерации и высокой плотности параллельных задач.
Kandinsky-5.0-T2I-Lite-sft-Diffusers	Текст в изображение	✅	Лёгкая версия Kandinsky 5.0 и на этой конфигурации остаётся большой запас видеопамяти под высокое разрешение, батчи и параллельные задания.
Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers	Текст в видео	✅	Подходит для пакетной генерации коротких роликов и хорошо масштабируется на нескольких GPU с высоким запасом по производительности.

Технические характеристики

Платформа	Supermicro SYS-221GE-NR
Видеокарта	4x NVIDIA H100 NVL 94GB HBM3
Процессор	2x Intel Xeon Scalable 4th и 5th Gen в сокетах LGA 4677
Оперативная память	32 DIMM, до 8TB DDR5 ECC RDIMM
SSD накопитель	8x E1.S NVMe, 2x M.2 NVMe/SATA slots (M-key)

Задать вопрос

Наличие на складах (0 шт.)

Санкт-Петербург, ул. Заозёрная, 8, корп. 2Л

Временно нет в наличии

Доступно бесплатное перемещение с другого склада в течении 1-2 рабочих дней

Москва, 2-я Брестская ул., 39 с4

Временно нет в наличии

Доступно бесплатное перемещение с другого склада в течении 1-2 рабочих дней

Мы отправляем заказы ведущими транспортными компаниями:

CDEK
Деловые линии
ПЭК

Все отправления тщательно упаковываются и скорейшие сроки передаются в ТК.

Ориентировочные сроки сборки заказов:

Серверные комплектующие: 1-2 раб. дня.
Серверы: 1-4 раб. дня.
Перемещение между офисами (МСК-СПБ): 1-2 раб. дня.

В случае если оборудование требуется в срочном порядке сообщите менеджеру и мы организуем приоритетную обработку вашего заказа с учетом выбора тарифа “Экспресс” со стороны ТК.

Оплата заказа доступна после подтверждения менеджером посредством следующих способов оплаты:

Безналичная оплата по счету (для организаций)
Онлайн оплата банковской картой ЮКасса (SberPay, T-Pay, СБП)

Узнать больше

ServerFlow — это интернет магазин специализирующийся на продаже Б/У и новой серверной техники. Все наше оборудование проходит строгий процесс предпродажной подготовки. Мы уделяем большое внимание тестированию всех компонентов, чтобы минимизировать вероятность возникновения гарантийных случаев и обеспечить высокое качество продукции.

Также мы можем предложить расширенный срок гарантийных отношений:

Стандартная гарантия 1 год

входит в стоимость

Расширенная гарантия на 2 года

1 666 170 ₽

Расширенная гарантия на 3 года

2 499 255 ₽

Расширенная гарантия на 4 года

3 332 340 ₽

Расширенная гарантия на 5 лет

4 165 425 ₽

Мы верим, что сможем обеспечить наилучший пользовательский опыт и ценим ваше доверие. Если у вас остались дополнительные вопросы, вы можете адресовать их в онлайн чате на сайте или задать в Telegram @serverflow.

Подробнее об условиях гарантии ServerFlow

ServerFlow активно занимается б/у оборудованием, поэтому мы готовы рассмотреть ваше оборудование в качестве основания для предоставления скидки в рамках “Trade-in”. Чтобы произвести оценку оборудования обратитесь в онлайн чат на сайте или в Telegram @serverflow.

Почему Trade-in в ServerFlow — это удобно:

Оперативная оценка оборудования. Оператор онлайн чата постарается в течении 30 минут дать оценку оборудованию.
Конструктивный диалог. Если вы не согласны с предложенной стоимостью мы постараемся найти компромисс.
Забор оборудования. После согласования Trade-in мы согласуем курьерскую доставку от двери, а если вам удобно лично посетить наш офис в Москве или Санкт-Петербурге.
Тестирование и подтверждение скидки. Технические инженеры ServerFlow проверяет стабильность вашего оборудования. В случае подтверждения стабильности мы утвердим скидку на оборудование.

Скидка 1 500 ₽ за обратную связь

Поделитесь впечатлением о работе ServerFlow после получения заказа.

* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена
бесплатная доставка до ПВЗ СДЭК.

копироватьскопировано

Новый

+200 ₽

Цена с учетом расширенной гарантии

Цена включает НДС 7%

16 661 700 руб.

Под заказ

Узнать сроки доставки

Получить спец. цену Получить КП за час Отправить КП себе на почту