GIGABYTE XL44-SX0-AAS2 (8x RTX PRO 6000 BSE 96GB)

Name: GIGABYTE XL44-SX0-AAS2 (8x RTX PRO 6000 BSE 96GB)
Brand: GIGABYTE
Price: 14938100 RUB
Availability: PreOrder

GIGABYTE XL44-SX0-AAS2 (8x RTX PRO 6000 BSE 96GB) 1

GIGABYTE XL44-SX0-AAS2 (8x RTX PRO 6000 BSE 96GB) 2

GIGABYTE XL44-SX0-AAS2 (8x RTX PRO 6000 BSE 96GB) 3

Новый

+200 ₽

Цена с учетом расширенной гарантии

Цена включает НДС 7%

14 938 100 руб.

Под заказ

Узнать сроки доставки

Получить спец. цену Получить КП за час Отправить КП себе на почту

добавить В корзину

Сравнить

Гарантия 1 год с заменой компонентов

Доставка СДЭК и ведущими службами доставки

Тестируем оборудование
перед отправкой

Гарантия 1 год с заменой компонентов

Подробнее

Условия доставки и самовывоза

Подробнее

Помощь в вопросе выбора и совместимости

Подробнее

Характеристики Доставка и оплата Гарантия Отзывы Trade In

Тип	Новые
Основная задача	Обучение моделей / Инференс / Дообучение моделей / RAG-системы / Визуализация и рендеринг
Процессор (CPU)	Intel Xeon 6-series
Видеокарта (GPU)	NVIDIA RTX PRO 6000 Blackwell
Количество GPU, шт	8
Общий объем видеопамяти (VRAM), ГБ	768
Тип памяти GPU	GDDR7
Объем оперативной памяти (RAM), ГБ	4096
Тип оперативной памяти	DDR5 ECC REG
Форм-фактор	4U

Подробные характеристики

Подробное описание

GIGABYTE XL44-SX0-AAS2 — это 4U MGX-платформа на двух Intel Xeon 6700/6500, рассчитанная на до 8 двухслотовых PCIe Gen5 GPU, с 32 слотами DDR5, 4 горячезаменяемыми Gen5 NVMe и 4 резервируемыми БП по 3200 Вт. Сам GIGABYTE относит эту модель к задачам AI, Visual Computing, HPC, AI Training и AI Inference.

В конфигурации с 8x NVIDIA RTX PRO 6000 Blackwell Server Edition 96GB сервер получает суммарно 768 GB GDDR7. NVIDIA указывает для этой карты архитектуру Blackwell, 96 GB GDDR7, пропускную способность памяти 1597 GB/s, а также производительность FP4 / FP8 / FP16-BF16 / FP32; сама карта позиционируется как универсальный датацентровый GPU для inference, fine-tuning, distributed rendering, HPC и virtual workstations.

Для такой системы логично делать акцент на Дообучение моделей (Fine-tuning), Инференс / Развертывание (Inference), RAG-системы, Анализ данных, HPC / Научные расчёты, Визуализация и рендеринг и Видеоаналитика / Видеонаблюдение. В отличие от конфигураций на H200 NVL, здесь профиль более универсальный — сильный для больших inference-нагрузок, мультимодальных пайплайнов, графики, рендеринга и видео, но для самых тяжёлых LLM на пределе памяти уже важнее аккуратная настройка multi-GPU, контекста и offload. Это следует из позиционирования самой платформы и RTX PRO 6000 BSE.

Производительность GPU

Тип точности	Совокупная мощность восьми RTX PRO 6000 BSE
FP32	960 TFLOPS
FP4	32 PFLOPS
RT Core performance*	2840 TFLOPS

*-RT Core performance - это пиковая производительность специализированных RT-ядер (Ray Tracing Cores), которые аппаратно ускоряют операции трассировки лучей (поиск пересечений луча с геометрией и обход BVH). Показатель важен для визуализации/рендеринга и некоторых графических/3D-пайплайнов, но не является прямым аналогом FP32/AI-производительности.

Совместимость с LLM-моделями

Модель	Тип квантизации	Требуется VRAM	Совместимость	Примечание
DeepSeek-R1 685B	Нет	Примерно 689GB	✅	Запускается на 8 x RTX PRO 6000 BSE в распределённом режиме и оставляет умеренный запас под KV-cache, контекст и стабильный multi-GPU serving.
Qwen3.5-397B-A17B-NVFP4 / Qwen3.6-35B-A3B	NVFP4 (FP4 для NVIDIA) / Нет	Примерно 251GB / 71.9 GB	✅	Очень комфортно чувствует себя на этой конфигурации и оставляет большой запас памяти под serving, RAG, агентные сценарии и высокую плотность параллельных запросов.
Gpt-oss:120b	Нет	Примерно 196GB	✅	Комфортно размещается и позволяет держать несколько сервисов, длинные диалоги, крупные батчи и высокий throughput без дефицита VRAM.
GigaChat3.5-432B-A28B	Нет	Примерно 438GB	✅	Помещается в 8 x 96GB, но работает уже близко к пределу по памяти, поэтому требует аккуратной настройки multi-GPU serving, длины контекста и KV-cache.
Mistral-Large-3-675B-Instruct-251	Нет	Примерно 682GB	✅	Хорошо подходит для крупных reasoning- и RAG-сценариев, но при такой загрузке VRAM лучше внимательно контролировать batch size, контекст и служебные буферы.
GLM-5.2-NVFP4	NVFP4 (FP4 для NVIDIA)	Примерно 492GB	✅	В NVFP4 остаётся очень хороший запас памяти под длинный контекст, батчи, параллельные инстансы и стабильную работу под высокой нагрузкой.
Gemma-4-31B-IT-NVFP4	NVFP4 (FP4 для NVIDIA)	Примерно 32.7GB	✅	Очень лёгкая модель для этой конфигурации и удобна для множества одновременных инстансов, длинного контекста и высокой плотности запросов.
NVIDIA-Nemotron-3-Super-120B-A12B-NVFP4	NVFP4 (FP4 для NVIDIA)	Примерно 80.4GB	✅	Удобна для параллельного запуска нескольких инстансов, работы с длинным контекстом и высокой плотности запросов.
Kimi-K2.7-Code	Нет	Примерно 595GB	✅	Полноразмерная версия для мощных GPU-серверов; подходит для reasoning-задач, RAG, агентных рабочих процессов и производственного инференса с высоким запасом качества.
MiniMax-M3	UD-Q4_K_M	Примерно 264GB	✅	Квантизированная версия с заметно меньшим объёмом; удобна для серверов с ограниченным запасом памяти, RAG-сценариев, ассистентов и локальных LLM-сервисов.
MiMo-V2.5-Pro-GGUF	UD_Q4_K_M	Примерно 630GB	✅	Квантизированная Pro-версия для более гибкого размещения на серверных конфигурациях с разным объёмом памяти; подходит для RAG, reasoning-задач и производственных LLM-сервисов.

Совместимость с диффузионными моделями

Модель	Тип	Совместимость	Примечание
Stable Diffusion XL 1.0	Текст в изображение	✅	Уверенно подходит для high-res генерации, параллельных пайплайнов и больших очередей задач на нескольких GPU.
Flux.2-dev	Текст в изображение	✅	Требовательная модель, но на этой конфигурации удобно распределять нагрузку по GPU, держать крупные батчи и обслуживать несколько тяжёлых пайплайнов одновременно.
SD Turbo	Быстрые предпросмотры	✅	Хорошо подходит для быстрых итераций, массовой генерации и одновременной обработки нескольких задач.
Kandinsky-5.0-T2I-Lite-sft-Diffusers	Текст в изображение	✅	Лёгкая модель с большим запасом памяти под высокое разрешение, батчи и параллельную работу пользователей.
Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers	Текст в видео	✅	Удобна для пакетной генерации коротких роликов и хорошо масштабируется по нескольким GPU.
Kimi-K2.7-Code	Нет	Примерно 595GB	✅	Полноразмерная версия для мощных GPU-серверов; подходит для reasoning-задач, RAG, агентных рабочих процессов и производственного инференса с высоким запасом качества.
MiniMax-M3	UD-Q4_K_M	Примерно 264GB	✅	Квантизированная версия с заметно меньшим объёмом; удобна для серверов с ограниченным запасом памяти, RAG-сценариев, ассистентов и локальных LLM-сервисов.
MiMo-V2.5-Pro-GGUF	UD_Q4_K_M	Примерно 630GB	✅	Квантизированная Pro-версия для более гибкого размещения на серверных конфигурациях с разным объёмом памяти; подходит для RAG, reasoning-задач и производственных LLM-сервисов.

Совместимость с диффузионными моделями

Модель	Тип	Совместимость	Примечание
Stable Diffusion 3 Medium	Текст в изображение	✅	Легко справляется с высоким разрешением, крупными батчами и несколькими параллельными пайплайнами без какого-либо дефицита видеопамяти.
FLUX.2-dev	Текст в изображение	✅	Требовательная модель, но для 8 x H200 NVL это комфортная нагрузка с огромным запасом под высокое разрешение, batch generation и несколько одновременных задач.
Stable Video Diffusion 1.1	Видео(img2vid)	✅	Хорошо подходит для генерации роликов, пакетного рендера и одновременной обработки нескольких видео-пайплайнов на разных GPU.
Kandinsky-5.0-T2I-Lite-sft-Diffusers	Текст в изображение	✅	Лёгкая версия Kandinsky 5.0 и на этой конфигурации остаётся огромный запас по видеопамяти для высокого разрешения, батчей и параллельной работы пользователей.
Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers	Текст в видео	✅	Подходит для продакшн-пайплайнов, пакетной генерации коротких роликов и уверенно масштабируется по нескольким GPU.

Технические характеристики

Платформа	GIGABYTE XL44-SX0-AAS2
Видеокарта	8x NVIDIA RTX PRO 6000 Blackwell Server Edition 96GB GDDR7
Процессор	2x Intel Xeon 6500/6700 серии
Оперативная память	32 DIMM, до 4TB DDR5 ECC REG
SSD накопитель	4x 2.5" Gen5 NVMe, 2x M.2 (2280/22110)

Задать вопрос

Наличие на складах (0 шт.)

Санкт-Петербург, ул. Заозёрная, 8, корп. 2Л

Временно нет в наличии

Доступно бесплатное перемещение с другого склада в течении 1-2 рабочих дней

Москва, 2-я Брестская ул., 39 с4

Временно нет в наличии

Доступно бесплатное перемещение с другого склада в течении 1-2 рабочих дней

Мы отправляем заказы ведущими транспортными компаниями:

CDEK
Деловые линии
ПЭК

Все отправления тщательно упаковываются и скорейшие сроки передаются в ТК.

Ориентировочные сроки сборки заказов:

Серверные комплектующие: 1-2 раб. дня.
Серверы: 1-4 раб. дня.
Перемещение между офисами (МСК-СПБ): 1-2 раб. дня.

В случае если оборудование требуется в срочном порядке сообщите менеджеру и мы организуем приоритетную обработку вашего заказа с учетом выбора тарифа “Экспресс” со стороны ТК.

Оплата заказа доступна после подтверждения менеджером посредством следующих способов оплаты:

Безналичная оплата по счету (для организаций)
Онлайн оплата банковской картой ЮКасса (SberPay, T-Pay, СБП)

Узнать больше

ServerFlow — это интернет магазин специализирующийся на продаже Б/У и новой серверной техники. Все наше оборудование проходит строгий процесс предпродажной подготовки. Мы уделяем большое внимание тестированию всех компонентов, чтобы минимизировать вероятность возникновения гарантийных случаев и обеспечить высокое качество продукции.

Также мы можем предложить расширенный срок гарантийных отношений:

Стандартная гарантия 1 год

входит в стоимость

Расширенная гарантия на 2 года

1 493 810 ₽

Расширенная гарантия на 3 года

2 240 715 ₽

Расширенная гарантия на 4 года

2 987 620 ₽

Расширенная гарантия на 5 лет

3 734 525 ₽

Мы верим, что сможем обеспечить наилучший пользовательский опыт и ценим ваше доверие. Если у вас остались дополнительные вопросы, вы можете адресовать их в онлайн чате на сайте или задать в Telegram @serverflow.

Подробнее об условиях гарантии ServerFlow

ServerFlow активно занимается б/у оборудованием, поэтому мы готовы рассмотреть ваше оборудование в качестве основания для предоставления скидки в рамках “Trade-in”. Чтобы произвести оценку оборудования обратитесь в онлайн чат на сайте или в Telegram @serverflow.

Почему Trade-in в ServerFlow — это удобно:

Оперативная оценка оборудования. Оператор онлайн чата постарается в течении 30 минут дать оценку оборудованию.
Конструктивный диалог. Если вы не согласны с предложенной стоимостью мы постараемся найти компромисс.
Забор оборудования. После согласования Trade-in мы согласуем курьерскую доставку от двери, а если вам удобно лично посетить наш офис в Москве или Санкт-Петербурге.
Тестирование и подтверждение скидки. Технические инженеры ServerFlow проверяет стабильность вашего оборудования. В случае подтверждения стабильности мы утвердим скидку на оборудование.

Скидка 1 500 ₽ за обратную связь

Поделитесь впечатлением о работе ServerFlow после получения заказа.

* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена
бесплатная доставка до ПВЗ СДЭК.

копироватьскопировано

Новый

+200 ₽

Цена с учетом расширенной гарантии

Цена включает НДС 7%

14 938 100 руб.

Под заказ

Узнать сроки доставки

Получить спец. цену Получить КП за час Отправить КП себе на почту