Цена с учетом расширенной гарантии
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
| Тип | Новые |
| Основная задача | Обучение моделей / Инференс / Дообучение моделей / RAG-системы / Визуализация и рендеринг |
| Процессор (CPU) | Intel Xeon 6-series |
| Видеокарта (GPU) | NVIDIA RTX PRO 6000 Blackwell |
| Количество GPU, шт | 8 |
| Общий объем видеопамяти (VRAM), ГБ | 768 |
| Тип памяти GPU | GDDR7 |
| Объем оперативной памяти (RAM), ГБ | 4096 |
| Тип оперативной памяти | DDR5 ECC REG |
| Форм-фактор | 4U |
GIGABYTE XL44-SX0-AAS2 — это 4U MGX-платформа на двух Intel Xeon 6700/6500, рассчитанная на до 8 двухслотовых PCIe Gen5 GPU, с 32 слотами DDR5, 4 горячезаменяемыми Gen5 NVMe и 4 резервируемыми БП по 3200 Вт. Сам GIGABYTE относит эту модель к задачам AI, Visual Computing, HPC, AI Training и AI Inference.
В конфигурации с 8x NVIDIA RTX PRO 6000 Blackwell Server Edition 96GB сервер получает суммарно 768 GB GDDR7. NVIDIA указывает для этой карты архитектуру Blackwell, 96 GB GDDR7, пропускную способность памяти 1597 GB/s, а также производительность FP4 / FP8 / FP16-BF16 / FP32; сама карта позиционируется как универсальный датацентровый GPU для inference, fine-tuning, distributed rendering, HPC и virtual workstations.
Для такой системы логично делать акцент на Дообучение моделей (Fine-tuning), Инференс / Развертывание (Inference), RAG-системы, Анализ данных, HPC / Научные расчёты, Визуализация и рендеринг и Видеоаналитика / Видеонаблюдение. В отличие от конфигураций на H200 NVL, здесь профиль более универсальный — сильный для больших inference-нагрузок, мультимодальных пайплайнов, графики, рендеринга и видео, но для самых тяжёлых LLM на пределе памяти уже важнее аккуратная настройка multi-GPU, контекста и offload. Это следует из позиционирования самой платформы и RTX PRO 6000 BSE.
| Тип точности | Совокупная мощность восьми RTX PRO 6000 BSE |
| FP32 | 960 TFLOPS |
| FP4 | 32 PFLOPS |
| RT Core performance* | 2840 TFLOPS |
*-RT Core performance - это пиковая производительность специализированных RT-ядер (Ray Tracing Cores), которые аппаратно ускоряют операции трассировки лучей (поиск пересечений луча с геометрией и обход BVH). Показатель важен для визуализации/рендеринга и некоторых графических/3D-пайплайнов, но не является прямым аналогом FP32/AI-производительности.
| Модель | Тип квантизации | Требуется VRAM | Совместимость | Примечание |
| DeepSeek-R1 685B | Нет | Примерно 689GB | ✅ | Запускается на 8 x RTX PRO 6000 BSE в распределённом режиме и оставляет умеренный запас под KV-cache, контекст и стабильный multi-GPU serving. |
| Qwen3.5-397B-A17B-NVFP4 | NVFP4 (FP4 для NVIDIA) | Примерно 251GB | ✅ | Очень комфортно чувствует себя на этой конфигурации и оставляет большой запас памяти под serving, RAG, агентные сценарии и высокую плотность параллельных запросов. |
| Gpt-oss:120b | Нет | Примерно 196GB | ✅ | Комфортно размещается и позволяет держать несколько сервисов, длинные диалоги, крупные батчи и высокий throughput без дефицита VRAM. |
| GigaChat3.1-702B-A36B | Нет | Примерно 720GB | ✅ | Помещается в 8 x 96GB, но работает уже близко к пределу по памяти, поэтому требует аккуратной настройки multi-GPU serving, длины контекста и KV-cache. |
| Mistral-Large-3-675B-Instruct-251 | Нет | Примерно 682GB | ✅ | Хорошо подходит для крупных reasoning- и RAG-сценариев, но при такой загрузке VRAM лучше внимательно контролировать batch size, контекст и служебные буферы. |
| GLM-5.1-NVFP4 | NVFP4 (FP4 для NVIDIA) | Примерно 466GB | ✅ | В NVFP4 остаётся очень хороший запас памяти под длинный контекст, батчи, параллельные инстансы и стабильную работу под высокой нагрузкой. |
| Gemma-4-31B-IT-NVFP4 | NVFP4 (FP4 для NVIDIA) | Примерно 32.7GB | ✅ | Очень лёгкая модель для этой конфигурации и удобна для множества одновременных инстансов, длинного контекста и высокой плотности запросов. |
| Модель | Тип | Совместимость | Примечание |
| Stable Diffusion XL 1.0 | Текст в изображение | ✅ | Уверенно подходит для high-res генерации, параллельных пайплайнов и больших очередей задач на нескольких GPU. |
| Flux.2-dev | Текст в изображение | ✅ | Требовательная модель, но на этой конфигурации удобно распределять нагрузку по GPU, держать крупные батчи и обслуживать несколько тяжёлых пайплайнов одновременно. |
| SD Turbo | Быстрые предпросмотры | ✅ | Хорошо подходит для быстрых итераций, массовой генерации и одновременной обработки нескольких задач. |
| Kandinsky-5.0-T2I-Lite-sft-Diffusers | Текст в изображение | ✅ | Лёгкая модель с большим запасом памяти под высокое разрешение, батчи и параллельную работу пользователей. |
| Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers | Текст в видео | ✅ | Удобна для пакетной генерации коротких роликов и хорошо масштабируется по нескольким GPU. |
| Модель | Тип | Совместимость | Примечание |
| Stable Diffusion 3 Medium | Текст в изображение | ✅ | Легко справляется с высоким разрешением, крупными батчами и несколькими параллельными пайплайнами без какого-либо дефицита видеопамяти. |
| FLUX.2-dev | Текст в изображение | ✅ | Требовательная модель, но для 8 x H200 NVL это комфортная нагрузка с огромным запасом под высокое разрешение, batch generation и несколько одновременных задач. |
| Stable Video Diffusion 1.1 | Видео(img2vid) | ✅ | Хорошо подходит для генерации роликов, пакетного рендера и одновременной обработки нескольких видео-пайплайнов на разных GPU. |
| Kandinsky-5.0-T2I-Lite-sft-Diffusers | Текст в изображение | ✅ | Лёгкая версия Kandinsky 5.0 и на этой конфигурации остаётся огромный запас по видеопамяти для высокого разрешения, батчей и параллельной работы пользователей. |
| Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers | Текст в видео | ✅ | Подходит для продакшн-пайплайнов, пакетной генерации коротких роликов и уверенно масштабируется по нескольким GPU. |
| Платформа | GIGABYTE XL44-SX0-AAS2 |
| Видеокарта | 8x NVIDIA RTX PRO 6000 Blackwell Server Edition 96GB GDDR7 |
| Процессор | 2x Intel Xeon 6500/6700 серии |
| Оперативная память | 32 DIMM, до 4TB DDR5 ECC REG |
| SSD накопитель | 4x 2.5" Gen5 NVMe, 2x M.2 (2280/22110) |
Мы отправляем заказы ведущими транспортными компаниями:
Все отправления тщательно упаковываются и скорейшие сроки передаются в ТК.
Ориентировочные сроки сборки заказов:
В случае если оборудование требуется в срочном порядке сообщите менеджеру и мы организуем приоритетную обработку вашего заказа с учетом выбора тарифа “Экспресс” со стороны ТК.
Оплата заказа доступна после подтверждения менеджером посредством следующих способов оплаты:
ServerFlow — это интернет магазин специализирующийся на продаже Б/У и новой серверной техники. Все наше оборудование проходит строгий процесс предпродажной подготовки. Мы уделяем большое внимание тестированию всех компонентов, чтобы минимизировать вероятность возникновения гарантийных случаев и обеспечить высокое качество продукции.
Также мы можем предложить расширенный срок гарантийных отношений:
Мы верим, что сможем обеспечить наилучший пользовательский опыт и ценим ваше доверие. Если у вас остались дополнительные вопросы, вы можете адресовать их в онлайн чате на сайте или задать в Telegram @serverflow.
ServerFlow активно занимается б/у оборудованием, поэтому мы готовы рассмотреть ваше оборудование в качестве основания для предоставления скидки в рамках “Trade-in”. Чтобы произвести оценку оборудования обратитесь в онлайн чат на сайте или в Telegram @serverflow.
Почему Trade-in в ServerFlow — это удобно:
Поделитесь впечатлением о работе ServerFlow после получения заказа.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена
бесплатная доставка до ПВЗ СДЭК.
Цена включает НДС 7%
Узнать сроки доставки
40-60 раб. дней —
Мы ценим обратную связь от клиентов. При оформлении заказа вы можете сообщить о своём намерении поделиться впечатлением о работе ServerFlow после получения товара.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка до ПВЗ СДЭК.