GIGABYTE G294-A22-AAP2 (4× RTX PRO 6000 BSE 96GB, 1× Xeon 6944P, RAM 1.1TB)

Name: GIGABYTE G294-A22-AAP2 (4× RTX PRO 6000 BSE 96GB, 1× Xeon 6944P, RAM 1.1TB)
Brand: GIGABYTE
Price: 10306800 RUB
Availability: PreOrder

GIGABYTE G294-A22-AAP2 (4× RTX PRO 6000 BSE 96GB, 1× Xeon 6944P, RAM 1.1TB) 1

GIGABYTE G294-A22-AAP2 (4× RTX PRO 6000 BSE 96GB, 1× Xeon 6944P, RAM 1.1TB) 2

GIGABYTE G294-A22-AAP2 (4× RTX PRO 6000 BSE 96GB, 1× Xeon 6944P, RAM 1.1TB) 3

GIGABYTE G294-A22-AAP2 (4× RTX PRO 6000 BSE 96GB, 1× Xeon 6944P, RAM 1.1TB) 4

GIGABYTE G294-A22-AAP2 (4× RTX PRO 6000 BSE 96GB, 1× Xeon 6944P, RAM 1.1TB) 5

GIGABYTE G294-A22-AAP2 (4× RTX PRO 6000 BSE 96GB, 1× Xeon 6944P, RAM 1.1TB) 6

Новый

+200 ₽

Цена с учетом расширенной гарантии

Цена включает НДС 7%

10 306 800 руб.

Под заказ

Узнать сроки доставки

Получить спец. цену Получить КП за час Отправить КП себе на почту

добавить В корзину

Сравнить

Гарантия 1 год с заменой компонентов

Доставка СДЭК и ведущими службами доставки

Тестируем оборудование
перед отправкой

Гарантия 1 год с заменой компонентов

Подробнее

Условия доставки и самовывоза

Подробнее

Помощь в вопросе выбора и совместимости

Подробнее

Характеристики Доставка и оплата Гарантия Отзывы Trade In

Спецификация GIGABYTE G294-A22-AAP2.pdf

Тип	Новые
Основная задача	Обучение моделей / Инференс / Дообучение моделей / RAG-системы / Визуализация и рендеринг
Процессор (CPU)	Intel Xeon 6-series
Видеокарта (GPU)	NVIDIA RTX PRO 6000 Blackwell
Количество GPU, шт	4
Общий объем видеопамяти (VRAM), ГБ	384
Тип памяти GPU	GDDR7
Объем оперативной памяти (RAM), ГБ	1152
Тип оперативной памяти	DDR5 ECC REG
Форм-фактор	2U

Подробные характеристики

Подробное описание

GIGABYTE G294-A22-AAP2 с 4× NVIDIA RTX PRO 6000 Blackwell Server Edition (4×96GB) и суммарными 384 GB GDDR7 VRAM - это компактный GPU-узел для Инференс / Развертывание (Inference) и RAG-системы (Retrieval-Augmented Generation), когда нужен высокий throughput и несколько параллельных инстансов моделей в одном сервере.

Blackwell + большой объём VRAM позволяют уверенно держать крупные LLM (в т.ч. MoE) в multi-GPU режиме (tensor/pipeline parallel), а также эффективно обслуживать длинные контексты и много одновременных запросов. Для генеративных задач по изображениям/видео сервер хорошо подходит благодаря запасу памяти и возможности распараллеливания пайплайнов по 4 GPU.

Оптимальные сценарии: Инференс / Развертывание (Inference), RAG-системы (Retrieval-Augmented Generation), Дообучение моделей (Fine-tuning), Анализ данных (Data Science), Визуализация и рендеринг, Видеоаналитика / Видеонаблюдение. Обучение моделей (Training) возможно для средних/части крупных моделей, но эффективность будет зависеть от конкретного стека и схемы параллелизма (и это скорее “практичный on-prem”, а не топовый тренировочный кластер).

Производительность GPU

Тип точности	Совокупная мощность четырех RTX PRO 6000 BSE
FP32	480 TFLOPS
FP4	16 PFLOPS
RT Core performance*	1420 TFLOPS

*-RT Core performance - это пиковая производительность специализированных RT-ядер (Ray Tracing Cores), которые аппаратно ускоряют операции трассировки лучей (поиск пересечений луча с геометрией и обход BVH). Показатель важен для визуализации/рендеринга и некоторых графических/3D-пайплайнов, но не является прямым аналогом FP32/AI-производительности.

Совместимость с LLM-моделями

Модель	Тип квантизации	Требуется VRAM	Совместимость	Примечание
DeepSeek-R1-Distill-Llama-70B	Нет	Примерно 141GB	✅	На узле 4× RTX PRO 6000 BSE (384GB VRAM) уверенно запускается в multi-GPU (обычно 2 GPU, при длинном контексте - 4 GPU) через vLLM/TensorRT-LLM. Хорош для reasoning; запас VRAM можно направить на большой KV-cache и высокий QPS при множестве параллельных сессий.
Qwen3-235B-A22B-Thinking-2507-FP8	FP8	Примерно 236GB	✅	Оптимальный формат для «большой модели в одном узле»: FP8 + распределение по 4 GPU оставляют заметный запас под KV-cache, высокий batch и несколько одновременных диалогов. Подходит для агентных сценариев, продакшн-чатов и RAG с высоким QPS.
gpt-oss:120b	Нет (FP16)	Примерно 260GB	✅	Комфортный “workhorse” для узла 4×96GB: запускается с распределением по 4 GPU, при этом остаётся VRAM под увеличенный контекст и параллельные запросы. Хороший баланс качества и throughput для продакшн-инференса.
Mistral-Large-3-675B-Instruct-2512-GGUF	IQ4_XS	Примерно 360GB	⚠️	Запуск возможен на 4×96GB, но с минимальным запасом: потребуется жёстко контролировать контекст (KV-cache), batch size и число одновременных сессий. Рекомендуется vLLM/TensorRT-LLM и аккуратная схема tensor/pipeline parallel, чтобы удерживать стабильную латентность.
GLM-4.7-FP8	FP8	Примерно 362GB	⚠️	FP8 снижает требования к памяти и повышает throughput, но модель близка к лимиту узла 384GB. Для стабильной работы нужны умеренный контекст, ограничение параллельных сессий и продакшн-движок (TensorRT-LLM/vLLM) с корректным распределением по 4 GPU.
ai-sage_GigaChat3-702B-A36B-preview-GGUF	IQ4_XS	Примерно 376GB	⚠️	На 4×96GB работает «впритык» по VRAM: нужен строгий контроль KV-cache/контекста, batch size и количества параллельных диалогов. Рекомендуется запуск через vLLM/TensorRT-LLM с аккуратным tensor/pipeline parallel; подходит для крупных ассистентов, но без большого запаса под высокий QPS.

Совместимость с диффузионными моделями

Модель	Тип	Совместимость	Примечание
Stable Diffusion XL 1.0	Текст в изображение	✅	На 4× RTX PRO 6000 BSE удобно держать несколько очередей/пользователей и параллельные пайплайны; 96GB на GPU дают большой запас под high-res, крупные batch, refiner и постобработку (апскейл/инпейтинг) без упора в память.
Flux.2-dev	Текст в изображение	✅	Требовательна к VRAM, но 96GB на GPU позволяют комфортно работать с высоким разрешением и батчами; throughput удобно масштабировать, распределяя задания по нескольким GPU внутри одного сервера для стабильной high-res генерации.
SD Turbo	Быстрые предпросмотры	✅	Максимальная скорость итераций: на одном узле легко держать много параллельных предпросмотров и серийных кадров, обеспечивая низкую задержку и стабильное обслуживание нескольких потоков одновременно.
Kandinsky-5.0-T2I-Lite-sft-Diffusers	Текст в изображение	✅	Лёгкая модель: остаётся большой запас VRAM под повышенное разрешение, батчи и одновременную работу нескольких пайплайнов; удобно для многопользовательских сценариев и высокой пропускной способности.
Kandinsky-5.0-T2V-Lite-sft-5s-Diffusers	Текст в видео	✅	Для коротких роликов удобно распараллеливать генерацию по GPU: сервер ускоряет пакетную обработку, держит несколько очередей и стабильно обслуживает серию задач на CUDA-стеке (видео/серийные кадры).

Технические характеристики

Платформа	GIGABYTE G294-A22-AAP2
Видеокарта	4x NVIDIA RTX PRO 6000 Blackwell Server Edition 96GB GDDR7
Процессор	1x Intel Xeon 6944P (72c/144t, 1.8GHz-3.9GHz, 350W)
Оперативная память	12x 96GB DDR5 ECC REG Micron 6400Mhz 2Rx4
SSD накопитель	6x Samsung PM883a 7.68TB 2.5" 6Gb/s

Задать вопрос

Наличие на складах (0 шт.)

Санкт-Петербург, ул. Заозёрная, 8, корп. 2Л

Временно нет в наличии

Доступно бесплатное перемещение с другого склада в течении 1-2 рабочих дней

Москва, 2-я Брестская ул., 39 с4

Временно нет в наличии

Доступно бесплатное перемещение с другого склада в течении 1-2 рабочих дней

Мы отправляем заказы ведущими транспортными компаниями:

CDEK
Деловые линии
ПЭК

Все отправления тщательно упаковываются и скорейшие сроки передаются в ТК.

Ориентировочные сроки сборки заказов:

Серверные комплектующие: 1-2 раб. дня.
Серверы: 1-4 раб. дня.
Перемещение между офисами (МСК-СПБ): 1-2 раб. дня.

В случае если оборудование требуется в срочном порядке сообщите менеджеру и мы организуем приоритетную обработку вашего заказа с учетом выбора тарифа “Экспресс” со стороны ТК.

Оплата заказа доступна после подтверждения менеджером посредством следующих способов оплаты:

Безналичная оплата по счету (для организаций)
Онлайн оплата банковской картой ЮКасса (SberPay, T-Pay, СБП)

Узнать больше

ServerFlow — это интернет магазин специализирующийся на продаже Б/У и новой серверной техники. Все наше оборудование проходит строгий процесс предпродажной подготовки. Мы уделяем большое внимание тестированию всех компонентов, чтобы минимизировать вероятность возникновения гарантийных случаев и обеспечить высокое качество продукции.

Также мы можем предложить расширенный срок гарантийных отношений:

Стандартная гарантия 1 год

входит в стоимость

Расширенная гарантия на 2 года

1 030 680 ₽

Расширенная гарантия на 3 года

1 546 020 ₽

Расширенная гарантия на 4 года

2 061 360 ₽

Расширенная гарантия на 5 лет

2 576 700 ₽

Мы верим, что сможем обеспечить наилучший пользовательский опыт и ценим ваше доверие. Если у вас остались дополнительные вопросы, вы можете адресовать их в онлайн чате на сайте или задать в Telegram @serverflow.

Подробнее об условиях гарантии ServerFlow

ServerFlow активно занимается б/у оборудованием, поэтому мы готовы рассмотреть ваше оборудование в качестве основания для предоставления скидки в рамках “Trade-in”. Чтобы произвести оценку оборудования обратитесь в онлайн чат на сайте или в Telegram @serverflow.

Почему Trade-in в ServerFlow — это удобно:

Оперативная оценка оборудования. Оператор онлайн чата постарается в течении 30 минут дать оценку оборудованию.
Конструктивный диалог. Если вы не согласны с предложенной стоимостью мы постараемся найти компромисс.
Забор оборудования. После согласования Trade-in мы согласуем курьерскую доставку от двери, а если вам удобно лично посетить наш офис в Москве или Санкт-Петербурге.
Тестирование и подтверждение скидки. Технические инженеры ServerFlow проверяет стабильность вашего оборудования. В случае подтверждения стабильности мы утвердим скидку на оборудование.

Скидка 1 500 ₽ за обратную связь

Поделитесь впечатлением о работе ServerFlow после получения заказа.

* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена
бесплатная доставка до ПВЗ СДЭК.

копироватьскопировано

Новый

+200 ₽

Цена с учетом расширенной гарантии

Цена включает НДС 7%

10 306 800 руб.

Под заказ

Узнать сроки доставки

Получить спец. цену Получить КП за час Отправить КП себе на почту