<p>Supermicro SYS-422GL-NR в конфигурации с 8× NVIDIA RTX PRO 6000 Blackwell Server Edition - это 4U MGX Dual-Root PCIe GPU платформа для Инференса / Развертывания, Дообучения моделей, RAG-систем и Визуализации и рендеринга. Сервер рассчитан на установку до восьми двухслотовых GPU по 600 W, поэтому хорошо подходит для плотных multi-GPU конфигураций, где нужны и большой суммарный объём видеопамяти, и серверная платформа верхнего сегмента.</p>
<p>Главная сильная сторона этой сборки - сочетание 768 GB суммарной GPU-памяти и универсального профиля самих ускорителей. RTX PRO 6000 Blackwell Server Edition построена на архитектуре NVIDIA Blackwell, даёт 96 GB GDDR7 с ECC на карту, поддерживает FP4, FP8, FP16/BF16, обеспечивает до 4 PFLOPS FP4, до 2 PFLOPS FP8 и пропускную способность памяти 1597 GB/s на GPU. Поэтому такая система особенно логична для distributed inference, агентных и мультимодальных сценариев, больших batch-нагрузок, а также для задач, где AI-ускорение сочетается с рендерингом, 3D и видео.</p>
<p>Платформа поддерживает два процессора Intel Xeon 6900 series с P-cores в сокете LGA-7529 с TDP до 500 W, память 24 DIMM DDR5 с максимальным объёмом до 6.0 TB в вариантах ECC DDR5 RDIMM 6400 или ECC DDR5 MRDIMM 8800, а для накопителей доступны до 8 front hot-swap E1.S NVMe и 2 M.2 PCIe 4.0 x4 NVMe. Дополнительно у системы есть 4× PCIe 5.0 x16 для NIC и ещё 1× PCIe 5.0 x16 для NIC/DPU, что полезно для сетевых и кластерных сценариев.</p>
<br>
<h3>Производительность GPU</h3>
<div>
<table border="0" cellpadding="0" cellspacing="0" style="border-collapse: collapse;">
<tbody>
<tr><td style="border-image: initial;"><b>Тип точности</b><td style="border-image: initial;"><b>Совокупная мощность восьми RTX PRO 6000 BSE</b></td></tr>
<tr><td style="border-image: initial;">FP32</td><td style="border-image: initial;">960 TFLOPS</td></tr>
<tr><td style="border-image: initial;">FP4 </td><td style="border-image: initial;">32 PFLOPS</td></tr>
<tr><td style="border-image: initial;">RT Core performance*</td><td style="border-image: initial;">2840 TFLOPS</td></tr>
</tbody>
</table>
<p>*-RT Core performance - это пиковая производительность специализированных RT-ядер (Ray Tracing Cores), которые аппаратно ускоряют операции трассировки лучей (поиск пересечений луча с геометрией и обход BVH). Показатель важен для визуализации/рендеринга и некоторых графических/3D-пайплайнов, но не является прямым аналогом FP32/AI-производительности.</p>
</div>
<br>
<h3>Совместимость с LLM-моделями</h3>
<div>
<table border="0" cellpadding="0" cellspacing="0" style="border-collapse: collapse;">
<tbody>
<tr>
<td style="border-image: initial;"><b>Модель</b></td>
<td style="border-image: initial;"><b>Тип квантизации</b></td>
<td style="border-image: initial;"><b>Требуется VRAM</b></td>
<td style="border-image: initial;"><b>Совместимость</b></td>
<td style="border-image: initial;"><b>Примечание</b></td>
</tr>
<tr>
<td style="border-image: initial;">DeepSeek-R1 685B</td>
<td style="border-image: initial;">Нет</td>
<td style="border-image: initial;">Примерно 689GB</td>
<td style="border-image: initial;">✅</td>
<td style="border-image: initial;">Запускается на 8 GPU в распределённом режиме и для этой конфигурации оставляет умеренный запас под KV-cache, контекст и стабильный multi-GPU serving.</td>
</tr>
<tr>
<td style="border-image: initial;">Qwen3.5-397B-A17B-NVFP4 / Qwen3.6-35B-A3B</td>
<td style="border-image: initial;">NVFP4 (FP4 для NVIDIA) / Нет</td>
<td style="border-image: initial;">Примерно 251GB / 71.9 GB</td>
<td style="border-image: initial;">✅</td>
<td style="border-image: initial;">Очень комфортно чувствует себя на этой конфигурации и оставляет большой запас памяти под serving, RAG, агентные сценарии и высокую плотность параллельных запросов.</td>
</tr>
<tr>
<td style="border-image: initial;">Gpt-oss:120b</td>
<td style="border-image: initial;">Нет</td>
<td style="border-image: initial;">Примерно 196GB</td>
<td style="border-image: initial;">✅</td>
<td style="border-image: initial;">Комфортно размещается и позволяет держать несколько сервисов, длинные диалоги, крупные батчи и высокий throughput без дефицита VRAM.</td>
</tr>
<tr>
<td style="border-image: initial;">GigaChat3.1-702B-A36B</td>
<td style="border-image: initial;">Нет</td>
<td style="border-image: initial;">Примерно 720GB</td>
<td style="border-image: initial;">✅</td>
<td style="border-image: initial;">Помещается на 8×96GB, но работает уже близко к пределу по памяти, поэтому требует точной настройки multi-GPU serving, длины контекста и KV-cache.</td>
</tr>
<tr>
<td style="border-image: initial;">Mistral-Large-3-675B-Instruct-251</td>
<td style="border-image: initial;">Нет</td>
<td style="border-image: initial;">Примерно 682GB</td>
<td style="border-image: initial;">✅</td>
<td style="border-image: initial;">Хорошо подходит для крупных reasoning- и RAG-сценариев при распределении нагрузки между всеми GPU и контроле batch size, контекста и служебных буферов.</td>
</tr>
<tr>
<td style="border-image: initial;">GLM-5.1-NVFP4</td>
<td style="border-image: initial;">NVFP4 (FP4 для NVIDIA)</td>
<td style="border-image: initial;">Примерно 466GB</td>
<td style="border-image: initial;">✅</td>
<td style="border-image: initial;">В NVFP4 остаётся большой запас памяти под длинный контекст, батчи, параллельные инстансы и стабильную работу под высокой нагрузкой.</td>
</tr>
<tr>
<td style="border-image: initial;">Gemma-4-31B-IT-NVFP4</td>
<td style="border-image: initial;">NVFP4 (FP4 для NVIDIA)</td>
<td style="border-image: initial;">Примерно 32.7GB</td>
<td style="border-image: initial;">✅</td>
<td style="border-image: initial;">Лёгкая модель для этой конфигурации - остаётся большой запас памяти под контекст, параллельные задачи и несколько одновременных инстансов.</td>
</tr>
<tr>
<td style="border-image: initial;">NVIDIA-Nemotron-3-Super-120B-A12B-NVFP4</td>
<td style="border-image: initial;">NVFP4 (FP4 для NVIDIA)</td>
<td style="border-image: initial;">Примерно 80.4GB</td>
<td style="border-image: initial;">✅</td>
<td style="border-image: initial;">Удобна для параллельного запуска нескольких инстансов, работы с длинным контекстом и высокой плотности запросов.</td>
</tr>
</tbody>
</table>
</div>
<h3>Совместимость с диффузионными моделями</h3>
<div>
<table border="0" cellpadding="0" cellspacing="0" style="border-collapse: collapse;">
<tbody>
<tr>
<td style="border-image: initial;"><b>Модель</b></td>
<td style="border-image: initial;"><b>Тип</b></td>
<td style="border-image: initial;"><b>Совместимость</b></td>
<td style="border-image: initial;"><b>Примечание</b></td>
</tr>
<tr>
<td style="border-image: initial;">Stable Diffusion XL 1.0</td>
<td style="border-image: initial;">Текст в изображение</td>
<td style="border-image: initial;">✅</td>
<td style="border-image: initial;">Уверенно подходит для high-res генерации, параллельных пайплайнов и больших очередей задач на нескольких GPU.</td>
</tr>
<tr>
<td style="border-image: initial;">Flux.2-dev</td>
<td style="border-image: initial;">Текст в изображение</td>
<td style="border-image: initial;">✅</td>
<td style="border-image: initial;">Требовательная модель, но на этой конфигурации удобно распределять нагрузку по GPU и держать крупные батчи.</td>
</tr>
<tr>
<td style="border-image: initial;">SD Turbo</td>
<td style="border-image: initial;">Быстрые предпросмотры</td>
<td style="border-image: initial;">✅</td>
<td style="border-image: initial;">Хорошо подходит для быстрых итераций, массовой генерации и одновременной обработки нескольких задач.</td>
</tr>
<tr>
<td style="border-image: initial;">Kandinsky-5.0-T2I-Lite-sft-Diffusers</td>
<td style="border-image: initial;">Текст в изображение</td>
<td style="border-image: initial;">✅</td>
<td style="border-image: initial;">Лёгкая модель с большим запасом памяти под высокое разрешение, батчи и параллельную работу пользователей.</td>
</tr>
<tr>
<td style="border-image: initial;">Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers</td>
<td style="border-image: initial;">Текст в видео</td>
<td style="border-image: initial;">✅</td>
<td style="border-image: initial;">Удобна для пакетной генерации коротких роликов и хорошо масштабируется по нескольким GPU.</td>
</tr>
</tbody>
</table>
</div>
<br>
<h3>Технические характеристики</h3>
<div>
<table border="0" cellpadding="0" cellspacing="0" style="border-collapse: collapse;">
<tbody>
<tr><td style="border-image: initial;">Платформа</td><td style="border-image: initial;">Supermicro SYS-422GL-NR</td></tr>
<tr><td style="border-image: initial;">Видеокарта</td><td style="border-image: initial;">8x <a href="
https://serverflow.ru/catalog/komplektuyushchie/videokarty/videokarta-nvidia-rtx-pro-6000-blackwell-server-edition-96gb-gddr7/" target="_blank">NVIDIA RTX PRO 6000 Blackwell Server Edition 96GB GDDR7</a></td></tr>
<tr><td style="border-image: initial;">Процессор</td><td style="border-image: initial;">2x Intel Xeon серии 6900 с P-ядрами</td></tr>
<tr><td style="border-image: initial;">Оперативная память</td><td style="border-image: initial;">24 DIMM, до 6TB DDR5 ECC REG</td></tr>
<tr><td style="border-image: initial;">SSD накопитель</td><td style="border-image: initial;">8x E1.S NVMe, 2x M.2 PCIe 4.0 x4 NVMe (M-key 2280)</td></tr>
</tbody>
</table>
</div>