Подробное описание
<p>ASUS NVIDIA GB300 NVL72 XA GB721-E2 - это полноразмерная стоечная AI-система с жидкостным охлаждением, построенная на архитектуре NVIDIA Grace Blackwell Ultra. Платформа объединяет 72 GPU NVIDIA Blackwell Ultra и 36 CPU NVIDIA Grace в единый вычислительный домен и предназначена для Обучения моделей (Training), Дообучения моделей (Fine-tuning), Инференса / Развертывания (Inference), RAG-систем (Retrieval-Augmented Generation), Анализа данных (Data Science) и HPC / Научных расчётов.</p>
<p>Система располагает 20 ТБ памяти HBM3e с пропускной способностью до 576 ТБ/с и 17 ТБ LPDDR5X с пропускной способностью до 14 ТБ/с. Пятое поколение NVIDIA NVLink формирует единый 72-GPU домен с пропускной способностью до 130 ТБ/с, что позволяет эффективно запускать крупнейшие LLM, reasoning-модели, длинные контексты и высоконагруженные сценарии обслуживания пользователей.</p>
<p>Архитектура Blackwell Ultra поддерживает современные AI-режимы вычислений - FP4, FP8/FP6, INT8, FP16/BF16 и TF32. Для всей платформы NVIDIA заявляет до 1440 PFLOPS FP4 Tensor Core, 720 PFLOPS FP8/FP6 Tensor Core и 360 PFLOPS FP16/BF16 Tensor Core в режимах с разреженностью. ASUS дополняет систему поддержкой NVIDIA ConnectX-8 SuperNIC, BlueField-3 DPU, сетей Spectrum-X Ethernet и Quantum-X800 InfiniBand, а также полностью жидкостной системой охлаждения.</p>
<br>
<h3>Производительность GPU</h3>
<div>
<table border="0" cellpadding="0" cellspacing="0" style="border-collapse: collapse;">
<tbody>
<tr><td style="border-image: initial;"><b>Тип точности</b><td style="border-image: initial;"><b>Совокупная мощность системы</b></td></tr>
<tr><td style="border-image: initial;">FP4 Tensor core</td><td style="border-image: initial;">1440 PFLOPS</td></tr>
<tr><td style="border-image: initial;">FP8 Tensor core</td><td style="border-image: initial;">720 PFLOPS</td></tr>
<tr><td style="border-image: initial;">FP6 Tensor core</td><td style="border-image: initial;">720 PFLOPS</td></tr>
<tr><td style="border-image: initial;">FP16 Tensor core</td><td style="border-image: initial;">360 PFLOPS</td></tr>
<tr><td style="border-image: initial;">BF16 Tensor core</td><td style="border-image: initial;">360 PFLOPS</td></tr>
<tr><td style="border-image: initial;">FP32</td><td style="border-image: initial;">6 PFLOPS</td></tr>
<tr><td style="border-image: initial;">TF32 Tensor core</td><td style="border-image: initial;">180 PFLOPS</td></tr>
<tr><td style="border-image: initial;">FP64 Tensor core</td><td style="border-image: initial;">100 TFLOPS</td></tr>
<tr><td style="border-image: initial;">INT8</td><td style="border-image: initial;">24 POPS</td></tr>
</tbody>
</table>
</div>
<br>
<h3>Совместимость с LLM-моделями</h3>
<div>
<table border="0" cellpadding="0" cellspacing="0" style="border-collapse: collapse;">
<tbody>
<tr>
<td style="border-image: initial;"><b>Модель</b></td>
<td style="border-image: initial;"><b>Тип квантизации</b></td>
<td style="border-image: initial;"><b>Требуется VRAM</b></td>
<td style="border-image: initial;"><b>Совместимость</b></td>
<td style="border-image: initial;"><b>Примечание</b></td>
</tr>
<tr>
<td style="border-image: initial;">DeepSeek-V4-Pro</td>
<td style="border-image: initial;">Нет</td>
<td style="border-image: initial;">Примерно 865GB</td>
<td style="border-image: initial;">✅</td>
<td style="border-image: initial;">ASUS XA GB721-E2 уверенно запускает модель с большим запасом под длинный контекст, KV-cache, крупные батчи и высокий параллелизм запросов.</td>
</tr>
<tr>
<td style="border-image: initial;">Qwen3.5-397B-A17B / Qwen3.6-35B-A3B</td>
<td style="border-image: initial;">Нет</td>
<td style="border-image: initial;">Примерно 807GB / 71.9 GB</td>
<td style="border-image: initial;">✅</td>
<td style="border-image: initial;">Первая модель подходит для тяжёлого распределённого serving и RAG-нагрузок, а вторую удобно масштабировать на большое число параллельных инстансов.</td>
</tr>
<tr>
<td style="border-image: initial;">Gpt-oss:120b</td>
<td style="border-image: initial;">Нет</td>
<td style="border-image: initial;">Примерно 196GB</td>
<td style="border-image: initial;">✅</td>
<td style="border-image: initial;">Для ASUS XA GB721-E2 это сравнительно лёгкая модель, поэтому система позволяет обслуживать множество одновременных запросов с большим запасом под длинный контекст.</td>
</tr>
<tr>
<td style="border-image: initial;">GigaChat3.1-702B-A36B</td>
<td style="border-image: initial;">Нет</td>
<td style="border-image: initial;">Примерно 720GB</td>
<td style="border-image: initial;">✅</td>
<td style="border-image: initial;">Платформа подходит для крупномасштабного инференса модели, включая длинный контекст, большие батчи и параллельную работу корпоративных пользователей.</td>
</tr>
<tr>
<td style="border-image: initial;">Mistral-Large-3-675B-Instruct-251</td>
<td style="border-image: initial;">Нет</td>
<td style="border-image: initial;">Примерно 682GB</td>
<td style="border-image: initial;">✅</td>
<td style="border-image: initial;">XA GB721-E2 даёт большой резерв для длинных контекстных окон, крупных батчей и производительного корпоративного обслуживания модели.</td>
</tr>
<tr>
<td style="border-image: initial;">GLM-5.1</td>
<td style="border-image: initial;">Нет</td>
<td style="border-image: initial;">Примерно 1.51TB</td>
<td style="border-image: initial;">✅</td>
<td style="border-image: initial;">Система рассчитана на модели такого класса и сохраняет крупный резерв под KV-cache, параллельные сессии, большие контексты и масштабный инференс.</td>
</tr>
<tr>
<td style="border-image: initial;">Gemma-4-31B-IT-NVFP4</td>
<td style="border-image: initial;">NVFP4 (FP4 для NVIDIA)</td>
<td style="border-image: initial;">Примерно 32.7GB</td>
<td style="border-image: initial;">✅</td>
<td style="border-image: initial;">Для ASUS XA GB721-E2 это очень лёгкая модель, которую удобно разворачивать в большом числе параллельных инстансов с длинным контекстом и высокой плотностью запросов.</td>
</tr>
<tr>
<td style="border-image: initial;">NVIDIA-Nemotron-3-Super-120B-A12B-NVFP4</td>
<td style="border-image: initial;">NVFP4 (FP4 для NVIDIA)</td>
<td style="border-image: initial;">Примерно 80.4GB</td>
<td style="border-image: initial;">✅</td>
<td style="border-image: initial;">XA GB721-E2 запускает модель с огромным запасом по памяти и производительности, что удобно для длинного контекста, множества одновременных инстансов и высоконагруженного serving.</td>
</tr>
</tbody>
</table>
</div>
<br>
<h3>Совместимость с диффузионными моделями</h3>
<div>
<table border="0" cellpadding="0" cellspacing="0" style="border-collapse: collapse;">
<tbody>
<tr>
<td style="border-image: initial;"><b>Модель</b></td>
<td style="border-image: initial;"><b>Тип</b></td>
<td style="border-image: initial;"><b>Совместимость</b></td>
<td style="border-image: initial;"><b>Примечание</b></td>
</tr>
<tr>
<td style="border-image: initial;">Stable Diffusion XL 1.0</td>
<td style="border-image: initial;">Текст в изображение</td>
<td style="border-image: initial;">✅</td>
<td style="border-image: initial;">ASUS XA GB721-E2 легко справляется с генерацией изображений высокого разрешения, крупными батчами и массовым параллельным запуском пайплайнов.</td>
</tr>
<tr>
<td style="border-image: initial;">Flux.2-dev</td>
<td style="border-image: initial;">Текст в изображение</td>
<td style="border-image: initial;">✅</td>
<td style="border-image: initial;">Масштаб rack-scale системы позволяет повышать разрешение, ускорять обработку и одновременно обслуживать большое число генеративных очередей.</td>
</tr>
<tr>
<td style="border-image: initial;">SD Turbo</td>
<td style="border-image: initial;">Быстрые предпросмотры</td>
<td style="border-image: initial;">✅</td>
<td style="border-image: initial;">Подходит для очень высокой параллельности и быстрого создания большого количества превью в продуктивных рабочих процессах.</td>
</tr>
<tr>
<td style="border-image: initial;">Kandinsky-5.0-T2I-Lite-sft-Diffusers</td>
<td style="border-image: initial;">Текст в изображение</td>
<td style="border-image: initial;">✅</td>
<td style="border-image: initial;">Платформа позволяет одновременно запускать множество независимых генеративных пайплайнов с большим запасом по памяти и вычислительным ресурсам.</td>
</tr>
<tr>
<td style="border-image: initial;">Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers</td>
<td style="border-image: initial;">Текст в видео</td>
<td style="border-image: initial;">✅</td>
<td style="border-image: initial;">Система хорошо подходит для параллельной генерации коротких видеороликов и ускорения тяжёлых видеодиффузионных сценариев.</td>
</tr>
</tbody>
</table>
</div>
Задать вопрос