Цена с учетом расширенной гарантии
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
| Тип | Новые |
| Парт.№ | SRS-GB300-NVL72 |
| Основная задача | Обучение моделей / Инференс / Дообучение моделей / RAG-системы / Анализ данных / Научные расчеты (HPC) / Визуализация и рендеринг |
| Процессор (CPU) | NVIDIA GB300 (Grace) |
| Видеокарта (GPU) | NVIDIA GB300 (Blackwell Ultra) |
| Количество GPU, шт | 72 |
| Общий объем видеопамяти (VRAM), ГБ | 20088 |
| Тип памяти GPU | HBM3e |
| Объем оперативной памяти (RAM), ГБ | 17856 |
| Тип оперативной памяти | LPDDR5x |
| Форм-фактор | 48U |
Supermicro NVIDIA GB300 NVL72 SRS-GB300-NVL72 - это жидкостно-охлаждаемая стоечная AI-система на базе 72 ускорителей NVIDIA B300 Blackwell Ultra и 36 процессоров NVIDIA Grace. Платформа предназначена для Обучения моделей (Training), Дообучения моделей (Fine-tuning), Инференса / Развертывания (Inference), RAG-систем (Retrieval-Augmented Generation), Анализа данных (Data Science) и HPC / Научных расчётов, включая работу с крупнейшими языковыми и reasoning-моделями.
Система оснащается до 20 ТБ памяти HBM3e и до 17 ТБ LPDDR5X, а высокоскоростной контур NVLink обеспечивает эффективную совместную работу всех GPU при длинном контексте, больших батчах и высоком числе параллельных запросов. Архитектура Blackwell Ultra поддерживает современные режимы вычислений FP4, FP8/FP6, FP16/BF16 и INT8, поэтому Supermicro GB300 NVL72 ориентирована на дата-центры и AI-фабрики, где требуется максимальная производительность для масштабного обучения и обслуживания моделей.
| Тип точности | Совокупная мощность системы |
| FP4 Tensor core | 1440 PFLOPS |
| FP8 Tensor core | 720 PFLOPS |
| FP6 Tensor core | 720 PFLOPS |
| FP16 Tensor core | 360 PFLOPS |
| BF16 Tensor core | 360 PFLOPS |
| FP32 | 6 PFLOPS |
| TF32 Tensor core | 180 PFLOPS |
| FP64 Tensor core | 100 TFLOPS |
| INT8 | 24 POPS |
| Модель | Тип квантизации | Требуется VRAM | Совместимость | Примечание |
| DeepSeek-V4-Pro | Нет | Примерно 865GB | ✅ | Supermicro SRS-GB300-NVL72 уверенно запускает модель с огромным запасом GPU-памяти под длинный контекст, KV-cache, крупные батчи и высокий параллелизм запросов. |
| Qwen3.5-397B-A17B / Qwen3.6-35B-A3B | Нет | Примерно 807GB / 71.9GB | ✅ | Обе модели комфортно работают без квантизации: крупная версия подходит для тяжёлого корпоративного инференса и RAG, а компактная - для множества параллельных инстансов и высокой плотности запросов. |
| Gpt-oss:120b | Нет | Примерно 196GB | ✅ | Для этой rack-scale системы модель требует лишь небольшую часть доступной GPU-памяти, что позволяет держать множество одновременных инстансов, длинный контекст и высокий поток запросов. |
| GigaChat3.1-702B-A36B | Нет | Примерно 720GB | ✅ | SRS-GB300-NVL72 подходит для крупномасштабного развёртывания модели с длинным контекстом, большими батчами и параллельным обслуживанием большого числа пользователей. |
| Mistral-Large-3-675B-Instruct-251 | Нет | Примерно 682GB | ✅ | Платформа обеспечивает большой резерв для корпоративного инференса, расширенных контекстных окон, крупных батчей и одновременной работы множества запросов. |
| GLM-5.1 | Нет | Примерно 1.51TB | ✅ | Даже для модели такого класса Supermicro SRS-GB300-NVL72 оставляет значительный запас под KV-cache, большие контексты, параллельные сессии и высоконагруженный инференс. |
| Gemma-4-31B-IT-NVFP4 | NVFP4 (FP4 для NVIDIA) | Примерно 32.7GB | ✅ | Модель в формате NVFP4 хорошо соответствует архитектуре Blackwell Ultra, а для SRS-GB300-NVL72 она подходит для массового параллельного запуска, длинного контекста и максимальной плотности обслуживания запросов. |
| NVIDIA-Nemotron-3-Super-120B-A12B-NVFP4 | NVFP4 (FP4 для NVIDIA) | Примерно 80.4GB | ✅ | NVFP4-модель эффективно использует возможности Blackwell Ultra, а система позволяет одновременно разворачивать большое число инстансов для длинного контекста и высоконагруженного обслуживания запросов. |
| Модель | Тип | Совместимость | Примечание |
| Stable Diffusion XL 1.0 | Текст в изображение | ✅ | Supermicro SRS-GB300-NVL72 легко справляется с генерацией высокого разрешения, крупными батчами и массовым параллельным запуском графических пайплайнов. |
| Flux.2-dev | Текст в изображение | ✅ | Большой объём HBM3e и масштаб rack-scale платформы позволяют повышать разрешение, ускорять пакетную генерацию и одновременно обслуживать множество очередей. |
| SD Turbo | Быстрые предпросмотры | ✅ | Подходит для создания большого количества быстрых предпросмотров и параллельной обработки множества пользовательских заданий. |
| Kandinsky-5.0-T2I-Lite-sft-Diffusers | Текст в изображение | ✅ | Платформа позволяет одновременно запускать множество независимых пайплайнов генерации изображений с большим запасом по GPU-памяти и производительности. |
| Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers | Текст в видео | ✅ | Система подходит для параллельной генерации коротких видеороликов, пакетной обработки заданий и ускорения ресурсоёмких видеодиффузионных сценариев. |
Мы отправляем заказы ведущими транспортными компаниями:
Все отправления тщательно упаковываются и скорейшие сроки передаются в ТК.
Ориентировочные сроки сборки заказов:
В случае если оборудование требуется в срочном порядке сообщите менеджеру и мы организуем приоритетную обработку вашего заказа с учетом выбора тарифа “Экспресс” со стороны ТК.
Оплата заказа доступна после подтверждения менеджером посредством следующих способов оплаты:
ServerFlow — это интернет магазин специализирующийся на продаже Б/У и новой серверной техники. Все наше оборудование проходит строгий процесс предпродажной подготовки. Мы уделяем большое внимание тестированию всех компонентов, чтобы минимизировать вероятность возникновения гарантийных случаев и обеспечить высокое качество продукции.
Также мы можем предложить расширенный срок гарантийных отношений:
Мы верим, что сможем обеспечить наилучший пользовательский опыт и ценим ваше доверие. Если у вас остались дополнительные вопросы, вы можете адресовать их в онлайн чате на сайте или задать в Telegram @serverflow.
ServerFlow активно занимается б/у оборудованием, поэтому мы готовы рассмотреть ваше оборудование в качестве основания для предоставления скидки в рамках “Trade-in”. Чтобы произвести оценку оборудования обратитесь в онлайн чат на сайте или в Telegram @serverflow.
Почему Trade-in в ServerFlow — это удобно:
Поделитесь впечатлением о работе ServerFlow после получения заказа.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена
бесплатная доставка до ПВЗ СДЭК.
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
Мы ценим обратную связь от клиентов. При оформлении заказа вы можете сообщить о своём намерении поделиться впечатлением о работе ServerFlow после получения товара.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка до ПВЗ СДЭК.