Цена с учетом расширенной гарантии
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
| Тип | Новые |
| Основная задача | Обучение моделей / Инференс / Дообучение моделей / RAG-системы / Анализ данных / Научные расчеты (HPC) / Визуализация и рендеринг |
| Процессор (CPU) | NVIDIA GB200 (Grace) |
| Видеокарта (GPU) | NVIDIA GB200 (Blackwell) |
| Количество GPU, шт | 72 |
| Общий объем видеопамяти (VRAM), ГБ | 13392 |
| Тип памяти GPU | HBM3e |
| Объем оперативной памяти (RAM), ГБ | 17856 |
| Тип оперативной памяти | LPDDR5x |
| Форм-фактор | 48U |
ASUS NVIDIA GB200 NVL72 ESC NM2N721-E1 - это стоечная AI-система класса rack-scale, построенная на архитектуре NVIDIA GB200 Grace Blackwell. Платформа объединяет 72 NVIDIA Blackwell GPU и 36 NVIDIA Grace CPU в единую инфраструктуру для Обучения моделей (Training), Дообучения моделей (Fine-tuning), Инференса / Развертывания (Inference), RAG-систем (Retrieval-Augmented Generation), Анализа данных (Data Science) и HPC / Научных расчётов.
Система рассчитана на запуск крупнейших LLM, reasoning-моделей и AI-сервисов с высокой параллельной нагрузкой. В конфигурации используется до 13,4 ТБ HBM3e GPU-памяти и до 17 ТБ LPDDR5X ECC, а пятое поколение NVIDIA NVLink объединяет ускорители в единый высокоскоростной домен. Благодаря этому ESC NM2N721-E1 подходит для длинного контекста, больших batch-нагрузок, распределённого инференса, обучения и обслуживания множества пользователей.
ASUS ESC NM2N721-E1 поддерживает жидкостное охлаждение и относится к инфраструктурным решениям для AI-фабрик, облачных платформ, исследовательских центров и крупных корпоративных кластеров. Платформа избыточна для обычной визуализации, локального рендеринга или классического видеонаблюдения: её основной профиль - масштабные нейросетевые вычисления, обучение LLM, real-time inference, RAG и HPC-задачи.
| Тип точности | Совокупная мощность системы |
| FP4 (NVFP4) Tensor core | 1440 PFLOPS |
| FP8 Tensor core | 720 PFLOPS |
| FP6 Tensor core | 720 PFLOPS |
| FP16 Tensor core | 360 PFLOPS |
| BF16 Tensor core | 360 PFLOPS |
| FP32 | 6 PFLOPS |
| TF32 Tensor core | 180 PFLOPS |
| FP64 Tensor core | 3 PFLOPS |
| INT8 | 720 POPS |
| Модель | Тип квантизации | Требуется VRAM | Совместимость | Примечание |
| DeepSeek-V4-Pro | Нет | Примерно 865GB | ✅ | ASUS ESC NM2N721-E1 уверенно запускает модель с большим запасом под длинный контекст, KV-cache, крупные батчи и высокий параллелизм запросов. |
| Qwen3.5-397B-A17B / Qwen3.6-35B-A3B | Нет | Примерно 807GB / 71.9 GB | ✅ | Первая модель подходит для тяжёлого распределённого serving и RAG-нагрузок, а вторую удобно разворачивать в большом числе параллельных инстансов на этой rack-scale платформе. |
| Gpt-oss:120b | Нет | Примерно 196GB | ✅ | Для ESC NM2N721-E1 это сравнительно лёгкая модель, поэтому система позволяет обслуживать множество одновременных запросов, длинный контекст и плотное размещение инстансов. |
| GigaChat3.1-702B-A36B | Нет | Примерно 720GB | ✅ | Система подходит для крупномасштабного инференса модели, включая длинный контекст, большие батчи и параллельную работу корпоративных пользователей. |
| Mistral-Large-3-675B-Instruct-251 | Нет | Примерно 682GB | ✅ | ESC NM2N721-E1 даёт значительный резерв для длинных контекстных окон, крупных батчей и производительного корпоративного обслуживания модели. |
| GLM-5.2 | Нет | Примерно 1.51TB | ✅ | Платформа рассчитана на модели такого класса и оставляет большой резерв под KV-cache, параллельные сессии, длинный контекст и масштабный инференс. |
| Gemma-4-31B-IT-NVFP4 | NVFP4 (FP4 для NVIDIA) | Примерно 32.7GB | ✅ | Для ASUS ESC NM2N721-E1 это очень лёгкая модель, которую удобно разворачивать в большом числе параллельных инстансов с длинным контекстом и высокой плотностью запросов. |
| NVIDIA-Nemotron-3-Super-120B-A12B-NVFP4 | NVFP4 (FP4 для NVIDIA) | Примерно 80.4GB | ✅ | ESC NM2N721-E1 запускает модель с огромным запасом по памяти и производительности, что удобно для длинного контекста, множества инстансов и высоконагруженного serving. |
| Kimi-K2.7-Code | Нет | Примерно 595GB | ✅ | Полноразмерная версия комфортно размещается на ESC NM2N721-E1 и подходит для reasoning-задач, RAG, агентных рабочих процессов и производственного инференса с большим запасом по памяти. |
| MiniMax-M3 | Нет | Примерно 854GB | ✅ | ASUS ESC NM2N721-E1 подходит для запуска модели без агрессивной квантизации, оставляя резерв под KV-cache, длинные контексты, параллельные запросы и production-serving. |
| MiMo-V2.5-Pro | Нет | Примерно 1.03TB | ✅ | Крупная Pro-версия хорошо подходит для этой платформы: NVLink-домен и большой объём HBM3e дают запас для сложных reasoning-задач, RAG, агентных сценариев и масштабного инференса. |
| Модель | Тип | Совместимость | Примечание |
| Stable Diffusion XL 1.0 | Текст в изображение | ✅ | ASUS ESC NM2N721-E1 легко справляется с генерацией изображений высокого разрешения, крупными батчами и массовым параллельным запуском генеративных пайплайнов. |
| Flux.2-dev | Текст в изображение | ✅ | Масштаб rack-scale системы позволяет повышать разрешение, ускорять обработку и одновременно обслуживать большое число генеративных очередей. |
| SD Turbo | Быстрые предпросмотры | ✅ | Подходит для очень высокой параллельности и быстрого создания большого количества превью в продуктивных рабочих процессах. |
| Kandinsky-5.0-T2I-Lite-sft-Diffusers | Текст в изображение | ✅ | Система позволяет одновременно запускать множество независимых генеративных пайплайнов с большим запасом по памяти и вычислительным ресурсам. |
| Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers | Текст в видео | ✅ | Платформа хорошо подходит для параллельной генерации коротких видеороликов и ускорения тяжёлых видеодиффузионных сценариев. |
| NVIDIA-Cosmos3-Super | Генерации, анализа и симуляции физического мира, которая может работать с текстом, изображениями, видео и действиями | ✅ | Модель объёмом 133GB хорошо подходит для ESC NM2N721-E1: система даёт большой запас под мультимодальные сценарии, видео, действия, симуляцию физического мира и параллельный запуск сложных пайплайнов. |
Мы отправляем заказы ведущими транспортными компаниями:
Все отправления тщательно упаковываются и скорейшие сроки передаются в ТК.
Ориентировочные сроки сборки заказов:
В случае если оборудование требуется в срочном порядке сообщите менеджеру и мы организуем приоритетную обработку вашего заказа с учетом выбора тарифа “Экспресс” со стороны ТК.
Оплата заказа доступна после подтверждения менеджером посредством следующих способов оплаты:
ServerFlow — это интернет магазин специализирующийся на продаже Б/У и новой серверной техники. Все наше оборудование проходит строгий процесс предпродажной подготовки. Мы уделяем большое внимание тестированию всех компонентов, чтобы минимизировать вероятность возникновения гарантийных случаев и обеспечить высокое качество продукции.
Также мы можем предложить расширенный срок гарантийных отношений:
Мы верим, что сможем обеспечить наилучший пользовательский опыт и ценим ваше доверие. Если у вас остались дополнительные вопросы, вы можете адресовать их в онлайн чате на сайте или задать в Telegram @serverflow.
ServerFlow активно занимается б/у оборудованием, поэтому мы готовы рассмотреть ваше оборудование в качестве основания для предоставления скидки в рамках “Trade-in”. Чтобы произвести оценку оборудования обратитесь в онлайн чат на сайте или в Telegram @serverflow.
Почему Trade-in в ServerFlow — это удобно:
Поделитесь впечатлением о работе ServerFlow после получения заказа.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена
бесплатная доставка до ПВЗ СДЭК.
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
Мы ценим обратную связь от клиентов. При оформлении заказа вы можете сообщить о своём намерении поделиться впечатлением о работе ServerFlow после получения товара.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка до ПВЗ СДЭК.