Supermicro NVIDIA GB300 NVL72 (72x GB300 Grace Blackwell Ultra) [SRS-GB300-NVL72]

Name: Supermicro NVIDIA GB300 NVL72 (72x GB300 Grace Blackwell Ultra) [SRS-GB300-NVL72]
Brand: Supermicro
Price: 463087100 RUB
Availability: PreOrder

Новый

+200 ₽

Цена с учетом расширенной гарантии

Цена включает НДС 7%

463 087 100 руб.

Под заказ

Узнать сроки доставки

Получить спец. цену Получить КП за час Отправить КП себе на почту

добавить В корзину

Сравнить

Гарантия 1 год с заменой компонентов

Доставка СДЭК и ведущими службами доставки

Тестируем оборудование
перед отправкой

Гарантия 1 год с заменой компонентов

Подробнее

Условия доставки и самовывоза

Подробнее

Помощь в вопросе выбора и совместимости

Подробнее

Характеристики Доставка и оплата Гарантия Отзывы Trade In

Тип	Новые
Парт.№	SRS-GB300-NVL72
Основная задача	Обучение моделей / Инференс / Дообучение моделей / RAG-системы / Анализ данных / Научные расчеты (HPC) / Визуализация и рендеринг
Процессор (CPU)	NVIDIA GB300 (Grace)
Видеокарта (GPU)	NVIDIA GB300 (Blackwell Ultra)
Количество GPU, шт	72
Общий объем видеопамяти (VRAM), ГБ	20088
Тип памяти GPU	HBM3e
Объем оперативной памяти (RAM), ГБ	17856
Тип оперативной памяти	LPDDR5x
Форм-фактор	48U

Подробные характеристики

Подробное описание

Supermicro NVIDIA GB300 NVL72 SRS-GB300-NVL72 - это жидкостно-охлаждаемая стоечная AI-система на базе 72 ускорителей NVIDIA B300 Blackwell Ultra и 36 процессоров NVIDIA Grace. Платформа предназначена для Обучения моделей (Training), Дообучения моделей (Fine-tuning), Инференса / Развертывания (Inference), RAG-систем (Retrieval-Augmented Generation), Анализа данных (Data Science) и HPC / Научных расчётов, включая работу с крупнейшими языковыми и reasoning-моделями.

Система оснащается до 20 ТБ памяти HBM3e и до 17 ТБ LPDDR5X, а высокоскоростной контур NVLink обеспечивает эффективную совместную работу всех GPU при длинном контексте, больших батчах и высоком числе параллельных запросов. Архитектура Blackwell Ultra поддерживает современные режимы вычислений FP4, FP8/FP6, FP16/BF16 и INT8, поэтому Supermicro GB300 NVL72 ориентирована на дата-центры и AI-фабрики, где требуется максимальная производительность для масштабного обучения и обслуживания моделей.

Производительность GPU

Тип точности	Совокупная мощность системы
FP4 Tensor core	1440 PFLOPS
FP8 Tensor core	720 PFLOPS
FP6 Tensor core	720 PFLOPS
FP16 Tensor core	360 PFLOPS
BF16 Tensor core	360 PFLOPS
FP32	6 PFLOPS
TF32 Tensor core	180 PFLOPS
FP64 Tensor core	100 TFLOPS
INT8	24 POPS

Совместимость с LLM-моделями

Модель	Тип квантизации	Требуется VRAM	Совместимость	Примечание
DeepSeek-V4-Pro	Нет	Примерно 865GB	✅	Supermicro SRS-GB300-NVL72 уверенно запускает модель с огромным запасом GPU-памяти под длинный контекст, KV-cache, крупные батчи и высокий параллелизм запросов.
Qwen3.5-397B-A17B / Qwen3.6-35B-A3B	Нет	Примерно 807GB / 71.9GB	✅	Обе модели комфортно работают без квантизации: крупная версия подходит для тяжёлого корпоративного инференса и RAG, а компактная - для множества параллельных инстансов и высокой плотности запросов.
Gpt-oss:120b	Нет	Примерно 196GB	✅	Для этой rack-scale системы модель требует лишь небольшую часть доступной GPU-памяти, что позволяет держать множество одновременных инстансов, длинный контекст и высокий поток запросов.
GigaChat3.1-702B-A36B	Нет	Примерно 720GB	✅	SRS-GB300-NVL72 подходит для крупномасштабного развёртывания модели с длинным контекстом, большими батчами и параллельным обслуживанием большого числа пользователей.
Mistral-Large-3-675B-Instruct-251	Нет	Примерно 682GB	✅	Платформа обеспечивает большой резерв для корпоративного инференса, расширенных контекстных окон, крупных батчей и одновременной работы множества запросов.
GLM-5.2	Нет	Примерно 1.51TB	✅	Даже для модели такого класса Supermicro SRS-GB300-NVL72 оставляет значительный запас под KV-cache, большие контексты, параллельные сессии и высоконагруженный инференс.
Gemma-4-31B-IT-NVFP4	NVFP4 (FP4 для NVIDIA)	Примерно 32.7GB	✅	Модель в формате NVFP4 хорошо соответствует архитектуре Blackwell Ultra, а для SRS-GB300-NVL72 она подходит для массового параллельного запуска, длинного контекста и максимальной плотности обслуживания запросов.
NVIDIA-Nemotron-3-Super-120B-A12B-NVFP4	NVFP4 (FP4 для NVIDIA)	Примерно 80.4GB	✅	NVFP4-модель эффективно использует возможности Blackwell Ultra, а система позволяет одновременно разворачивать большое число инстансов для длинного контекста и высоконагруженного обслуживания запросов.
Kimi-K2.7-Code	Нет	Примерно 595GB	✅	Полноразмерная версия для мощных GPU-серверов; подходит для reasoning-задач, RAG, агентных рабочих процессов и производственного инференса с высоким запасом качества.
MiniMax-M3	Нет	Примерно 854GB	✅	Полноразмерная версия для серверов с большим запасом памяти; подходит для reasoning-задач, RAG, агентных сценариев и стабильного production-инференса без агрессивной квантизации.
MiMo-V2.5-Pro	Нет	Примерно 1.03TB	✅	Крупная Pro-версия для серверов с большим объёмом GPU-памяти; подходит для сложных reasoning-задач, RAG, агентных сценариев и production-инференса с высоким запасом качества.

Совместимость с диффузионными моделями

Модель	Тип	Совместимость	Примечание
Stable Diffusion XL 1.0	Текст в изображение	✅	Supermicro SRS-GB300-NVL72 легко справляется с генерацией высокого разрешения, крупными батчами и массовым параллельным запуском графических пайплайнов.
Flux.2-dev	Текст в изображение	✅	Большой объём HBM3e и масштаб rack-scale платформы позволяют повышать разрешение, ускорять пакетную генерацию и одновременно обслуживать множество очередей.
SD Turbo	Быстрые предпросмотры	✅	Подходит для создания большого количества быстрых предпросмотров и параллельной обработки множества пользовательских заданий.
Kandinsky-5.0-T2I-Lite-sft-Diffusers	Текст в изображение	✅	Платформа позволяет одновременно запускать множество независимых пайплайнов генерации изображений с большим запасом по GPU-памяти и производительности.
Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers	Текст в видео	✅	Система подходит для параллельной генерации коротких видеороликов, пакетной обработки заданий и ускорения ресурсоёмких видеодиффузионных сценариев.

Задать вопрос

Наличие на складах (0 шт.)

Санкт-Петербург, ул. Заозёрная, 8, корп. 2Л

Временно нет в наличии

Доступно бесплатное перемещение с другого склада в течении 1-2 рабочих дней

Москва, 2-я Брестская ул., 39 с4

Временно нет в наличии

Доступно бесплатное перемещение с другого склада в течении 1-2 рабочих дней

Мы отправляем заказы ведущими транспортными компаниями:

CDEK
Деловые линии
ПЭК

Все отправления тщательно упаковываются и скорейшие сроки передаются в ТК.

Ориентировочные сроки сборки заказов:

Серверные комплектующие: 1-2 раб. дня.
Серверы: 1-4 раб. дня.
Перемещение между офисами (МСК-СПБ): 1-2 раб. дня.

В случае если оборудование требуется в срочном порядке сообщите менеджеру и мы организуем приоритетную обработку вашего заказа с учетом выбора тарифа “Экспресс” со стороны ТК.

Оплата заказа доступна после подтверждения менеджером посредством следующих способов оплаты:

Безналичная оплата по счету (для организаций)
Онлайн оплата банковской картой ЮКасса (SberPay, T-Pay, СБП)

Узнать больше

ServerFlow — это интернет магазин специализирующийся на продаже Б/У и новой серверной техники. Все наше оборудование проходит строгий процесс предпродажной подготовки. Мы уделяем большое внимание тестированию всех компонентов, чтобы минимизировать вероятность возникновения гарантийных случаев и обеспечить высокое качество продукции.

Также мы можем предложить расширенный срок гарантийных отношений:

Стандартная гарантия 1 год

входит в стоимость

Расширенная гарантия на 2 года

46 308 710 ₽

Расширенная гарантия на 3 года

69 463 065 ₽

Расширенная гарантия на 4 года

92 617 420 ₽

Расширенная гарантия на 5 лет

115 771 775 ₽

Мы верим, что сможем обеспечить наилучший пользовательский опыт и ценим ваше доверие. Если у вас остались дополнительные вопросы, вы можете адресовать их в онлайн чате на сайте или задать в Telegram @serverflow.

Подробнее об условиях гарантии ServerFlow

ServerFlow активно занимается б/у оборудованием, поэтому мы готовы рассмотреть ваше оборудование в качестве основания для предоставления скидки в рамках “Trade-in”. Чтобы произвести оценку оборудования обратитесь в онлайн чат на сайте или в Telegram @serverflow.

Почему Trade-in в ServerFlow — это удобно:

Оперативная оценка оборудования. Оператор онлайн чата постарается в течении 30 минут дать оценку оборудованию.
Конструктивный диалог. Если вы не согласны с предложенной стоимостью мы постараемся найти компромисс.
Забор оборудования. После согласования Trade-in мы согласуем курьерскую доставку от двери, а если вам удобно лично посетить наш офис в Москве или Санкт-Петербурге.
Тестирование и подтверждение скидки. Технические инженеры ServerFlow проверяет стабильность вашего оборудования. В случае подтверждения стабильности мы утвердим скидку на оборудование.

Скидка 1 500 ₽ за обратную связь

Поделитесь впечатлением о работе ServerFlow после получения заказа.

* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена
бесплатная доставка до ПВЗ СДЭК.

копироватьскопировано

Новый

+200 ₽

Цена с учетом расширенной гарантии

Цена включает НДС 7%

463 087 100 руб.

Под заказ

Узнать сроки доставки

Получить спец. цену Получить КП за час Отправить КП себе на почту