Top.Mail.Ru
GIGABYTE XV24-SU0-AAJ1 (4× RTX PRO 6000 BSE 96GB, 1× Xeon 6737P, RAM 768GB) купить в Москве, Санкт-Петербурге с доставкой по России - цены Скачать
прайс-лист
Бесплатная
доставка по РФ
Скидка
за отзыв!
Distribution of
Server Components
8 (800) 222-70-01 Консультация IT-специалиста Сравнение

GIGABYTE XV24-SU0-AAJ1 (4× RTX PRO 6000 BSE 96GB, 1× Xeon 6737P, RAM 768GB)

GIGABYTE
+200

Цена с учетом расширенной гарантии

Цена включает НДС 7%

10 251 050 руб.

Узнать сроки доставки

добавить В корзину
Гарантия 1 год с заменой компонентов
Доставка СДЭК и ведущими службами доставки
Тестируем оборудование
перед отправкой
Гарантия 1 год с заменой компонентов
Подробнее
Условия доставки и самовывоза
Подробнее
Помощь в вопросе выбора и совместимости
Подробнее
Тип Новые
Основная задача Обучение моделей / Инференс / Дообучение моделей / RAG-системы / Анализ данных / Визуализация и рендеринг
Процессор (CPU) Intel Xeon 6-series
Видеокарта (GPU) NVIDIA RTX PRO 6000 Blackwell
Количество GPU, шт 4
Общий объем видеопамяти (VRAM), ГБ 384
Тип памяти GPU GDDR7
Объем оперативной памяти (RAM), ГБ 768
Тип оперативной памяти DDR5 ECC REG
Форм-фактор 2U
Подробные характеристики
Подробное описание

Это наша сборка на Северной платформе Gigabyte XV24-SU0-AAJ1: компактный высокоплотный узел под 4 GPU, рассчитанный на продакшн-нагрузки и масштабирование по сети. Конфигурация отлично закрывает Инференс / Развертывание (Inference) и RAG-системы (Retrieval-Augmented Generation) - можно держать длинный контекст, несколько реплик и параллельные пайплайны без постоянной борьбы за память.

NVIDIA RTX PRO 6000 Blackwell Server Edition 96GB GDDR7 дают 384GB суммарной VRAM - этого хватает для запуска больших LLM в multi-GPU режиме (tensor/pipeline parallel) и для тяжёлых генеративных пайплайнов. Сервер также подходит для Дообучение моделей (Fine-tuning) и Обучение моделей (Training) (особенно когда важен большой batch/градиенты и стабильная работа на FP16/FP8 в современном стеке CUDA).

Сильная сторона именно этой конфигурации - баланс GPU + память + сеть: 768GB DDR5 ECC REG позволяют держать крупные датасеты/индексы RAG в RAM, а 2× NVIDIA MCX713106AC-VEAT (итого 4 порта 200GbE QSFP112) - удобно для распределённых сценариев (несколько узлов, внешние хранилища, высокие QPS-кластеры).

Производительность GPU

Тип точностиСовокупная мощность четырех RTX PRO 6000 BSE
FP32480 TFLOPS
FP4 16 PFLOPS
RT Core performance*1420 TFLOPS

*-RT Core performance - это пиковая производительность специализированных RT-ядер (Ray Tracing Cores), которые аппаратно ускоряют операции трассировки лучей (поиск пересечений луча с геометрией и обход BVH). Показатель важен для визуализации/рендеринга и некоторых графических/3D-пайплайнов, но не является прямым аналогом FP32/AI-производительности.

Совместимость с LLM-моделями

Модель Тип квантизации Требуется VRAM Совместимость Примечание
DeepSeek-R1-Distill-Llama-70B Нет Примерно 141GB Запускается на одном сервере в multi-GPU режиме (обычно 2–4 GPU) через tensor/pipeline parallel (vLLM/TensorRT-LLM). Хорош для reasoning и длинного контекста; запас общей VRAM можно отдать под KV-cache и высокий QPS.
Qwen3-235B-A22B-Thinking-2507-FP8/td> FP8 Примерно 236GB Хороший кандидат для “большой модели на одном узле”: запускается в FP8 с распределением по 4 GPU, остаётся запас под KV-cache и несколько параллельных запросов. Подходит для агентов, продакшн-чатов и RAG с высоким QPS.
gpt-oss:120b Нет (FP16) Примерно 260GB Комфортно работает на одном узле при распределении по 4 GPU. Хороший баланс “размер модели ↔ пропускная способность”: можно держать модель без квантизации и при этом оставить ресурс под несколько потоков инференса и увеличенный KV-cache.
Mistral-Large-3-675B-Instruct-2512-GGUF IQ4_XS Примерно 360GB ⚠️ Запуск возможен в рамках 4×96GB, но “впритык”: потребуется аккуратная настройка контекста и batch size. Рекомендуется vLLM и контроль KV-cache, чтобы сохранить стабильную латентность.
GLM-4.7-FP8 FP8 Примерно 362GB ⚠️ FP8 снижает требования к памяти и помогает поднять throughput, но по VRAM модель близка к лимиту узла. Для стабильной работы рекомендуются умеренный контекст, грамотное распределение по 4 GPU и продакшн-движок (TensorRT-LLM/vLLM).
ai-sage_GigaChat3-702B-A36B-preview-GGUF IQ4_XS Примерно 376GB ⚠️ На узле 4×96GB (384GB VRAM) работает «на грани» по памяти: потребуется строгий контроль контекста (KV-cache), batch size и числа параллельных сессий. Рекомендуется запуск через vLLM/TensorRT-LLM с аккуратным распределением (tensor/pipeline parallel); при правильной настройке подходит для крупных ассистентов и длинных диалогов, но без большого запаса под высокие QPS-нагрузки

Совместимость с диффузионными моделями

Модель Тип Совместимость Примечание
Stable Diffusion XL 1.0 Текст в изображение На 4× RTX PRO 6000 BSE удобно параллелить пайплайны (несколько пользователей/очередей), держать большие batch и стабильно генерировать high-res. 96GB на GPU дают большой запас под upscalers и постобработку.
Flux.2-dev Текст в изображение Требовательна к VRAM, но 96GB на GPU позволяют комфортно работать с высоким разрешением и батчами. Можно масштабировать throughput по нескольким GPU внутри одного сервера для стабильной high-res генерации.
SD Turbo Быстрые предпросмотры Максимальная скорость итераций: легко держать много параллельных задач предпросмотра/серийных кадров на одном узле и обслуживать несколько потоков одновременно с низкой задержкой.
Kandinsky-5.0-T2I-Lite-sft-Diffusers Текст в изображение Лёгкая модель: остаётся большой запас VRAM под высокое разрешение, батчи и одновременную работу нескольких пайплайнов на 4 GPU — удобно для многопользовательских сценариев.
Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers Текст в видео Для коротких роликов удобно распараллеливать генерацию по GPU: один сервер ускоряет пакетную обработку, держит несколько очередей и стабильно обслуживает серию задач на CUDA-стеке.

Технические характеристики

ПлатформаGIGABYTE XV24-SU0-AAJ1
Видеокарта4x NVIDIA RTX PRO 6000 Blackwell Server Edition 96GB GDDR7
Процессор1x Intel Xeon 6737P (32c/64t, 2.9GHz-4.0GHz, 270W)
Оперативная память6x 128GB DDR5 ECC REG Micron 6400Mhz 2Rx4
SSD накопитель1x Solidigm D7-PS1030 6.4TB 2.5" U.2
Сетевая карта2x NVIDIA MCX713106AC-VEAT (2x QSFP112 200GBE)
Задать вопрос

Наличие на складах (0 шт.)

Санкт-Петербург, ул. Заозёрная, 8, корп. 2Л
Временно нет в наличии
Позиция временно отсутствует на складе. Ваш заказ будет отправлен с другого склада. В случае если вам требуется самовывоз, менеджер согласует бесплатное перемещение на нужный склад.
Доступно бесплатное перемещение с другого склада в течении 1-2 рабочих дней
Москва, 2-я Брестская ул., 39 с4
Временно нет в наличии
Позиция временно отсутствует на складе. Ваш заказ будет отправлен с другого склада. В случае если вам требуется самовывоз, менеджер согласует бесплатное перемещение на нужный склад.
Доступно бесплатное перемещение с другого склада в течении 1-2 рабочих дней

Мы отправляем заказы ведущими транспортными компаниями:

  • CDEK
  • Деловые линии
  • ПЭК

Все отправления тщательно упаковываются и скорейшие сроки передаются в ТК.


Ориентировочные сроки сборки заказов:

  • Серверные комплектующие: 1-2 раб. дня.
  • Серверы: 1-4 раб. дня.
  • Перемещение между офисами (МСК-СПБ): 1-2 раб. дня.

В случае если оборудование требуется в срочном порядке сообщите менеджеру и мы организуем приоритетную обработку вашего заказа с учетом выбора тарифа “Экспресс” со стороны ТК.


Оплата заказа доступна после подтверждения менеджером посредством следующих способов оплаты:

  • Безналичная оплата по счету (для организаций)
  • Онлайн оплата банковской картой ЮКасса (SberPay, T-Pay, СБП)
Узнать больше

ServerFlow — это интернет магазин специализирующийся на продаже Б/У и новой серверной техники. Все наше оборудование проходит строгий процесс предпродажной подготовки. Мы уделяем большое внимание тестированию всех компонентов, чтобы минимизировать вероятность возникновения гарантийных случаев и обеспечить высокое качество продукции.

Также мы можем предложить расширенный срок гарантийных отношений:


входит в стоимость
1 025 105
1 537 658
2 050 210
2 562 763

Мы верим, что сможем обеспечить наилучший пользовательский опыт и ценим ваше доверие. Если у вас остались дополнительные вопросы, вы можете адресовать их в онлайн чате на сайте или задать в Telegram @serverflow.


Подробнее об условиях гарантии ServerFlow

ServerFlow активно занимается б/у оборудованием, поэтому мы готовы рассмотреть ваше оборудование в качестве основания для предоставления скидки в рамках “Trade-in”. Чтобы произвести оценку оборудования обратитесь в онлайн чат на сайте или в Telegram @serverflow.

Почему Trade-in в ServerFlow — это удобно:

  • Оперативная оценка оборудования. Оператор онлайн чата постарается в течении 30 минут дать оценку оборудованию.
  • Конструктивный диалог. Если вы не согласны с предложенной стоимостью мы постараемся найти компромисс.
  • Забор оборудования. После согласования Trade-in мы согласуем курьерскую доставку от двери, а если вам удобно лично посетить наш офис в Москве или Санкт-Петербурге.
  • Тестирование и подтверждение скидки. Технические инженеры ServerFlow проверяет стабильность вашего оборудования. В случае подтверждения стабильности мы утвердим скидку на оборудование.
Скидка 3000₽*

Оставьте отзыв о ServerFlow на Яндексе и условия акции будут исполнены

* скидка предоставляется при покупке от 30 000 рублей,
в ином случае предусмотрена бесплатная доставка.

Подписаться
GIGABYTE
+200
Цена с учетом расширенной гарантии

Цена включает НДС 7%

10 251 050 руб.

Узнать сроки доставки

добавить В корзину
Гарантия 1 год с заменой компонентов
Доставка СДЭК и ведущими службами доставки
Тестируем оборудование
перед отправкой
Под заказ
10 251 041 руб. Цена включает НДС 7%
добавить В корзину

Похожие товары

Huawei Atlas 800T A2 (8× Ascend 910B 64GB, 4× Kunpeng 920, RAM 512GB)
Санкт-Петербург, ул. Заозёрная, 8, корп. 2Л
Временно нет в наличии
Москва, 2-я Брестская ул., 39 с4
Временно нет в наличии
Подробнее
NVIDIA DGX H200 (8× H200 SXM 141GB, 2× Xeon Platinum 8480C, RAM 2TB)
Санкт-Петербург, ул. Заозёрная, 8, корп. 2Л
Временно нет в наличии
Москва, 2-я Брестская ул., 39 с4
Временно нет в наличии
Подробнее
GIGABYTE G294-A22-AAP2 (4× RTX PRO 6000 BSE 96GB, 1× Xeon 6944P, RAM 1.1TB)
Санкт-Петербург, ул. Заозёрная, 8, корп. 2Л
Временно нет в наличии
Москва, 2-я Брестская ул., 39 с4
Временно нет в наличии
Подробнее
NVIDIA DGX B200 (8× B200 SXM 180GB, 2× Xeon Platinum 8570, RAM 2TB)
Санкт-Петербург, ул. Заозёрная, 8, корп. 2Л
Временно нет в наличии
Москва, 2-я Брестская ул., 39 с4
Временно нет в наличии
Подробнее
Lenovo ThinkStation PGX (GB10 Grace Superchip, ARM v9.2-A (GB10), RAM 128GB)
Санкт-Петербург, ул. Заозёрная, 8, корп. 2Л
Временно нет в наличии
Москва, 2-я Брестская ул., 39 с4
Временно нет в наличии
Подробнее
ASUS Ascent GX10 (GB10 Grace Superchip, ARM v9.2-A (GB10), RAM 128GB, SSD 4TB)
Санкт-Петербург, ул. Заозёрная, 8, корп. 2Л
Временно нет в наличии
Москва, 2-я Брестская ул., 39 с4
Временно нет в наличии
Подробнее
Supermicro AS-5126GS-TNRT2 (8× RTX PRO 6000 BSE 96GB, 2× EPYC 9554, RAM 1.5TB)
Санкт-Петербург, ул. Заозёрная, 8, корп. 2Л
Временно нет в наличии
Москва, 2-я Брестская ул., 39 с4
Временно нет в наличии
Подробнее
Huawei Atlas 800I A3 (8× Ascend 910C 128GB, 4× Kunpeng 920, RAM 2TB)
Санкт-Петербург, ул. Заозёрная, 8, корп. 2Л
Временно нет в наличии
Москва, 2-я Брестская ул., 39 с4
Временно нет в наличии
Подробнее
Написать отзыв
До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Написать комментарий

Комментарий появится на сайте после предварительной модерации

До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Мы свяжемся с вами утром

График работы: Пн-Пт 10:00-18:30 (по МСК)

Обработаем вашу заявку
в ближайший рабочий день

График работы: Пн-Пт 10:00-18:30 (по МСК)