Компания AMD сообщила о поддержке моделей Qwen 3.5 от Alibaba на ускорителях линейки AMD Instinct MI300X, AMD Instinct MI325X и AMD Instinct MI355X. Поддержка реализована в тесном сотрудничестве с командой разработчиков Alibaba и доступна с нулевого дня благодаря оптимизациям в программном стеке ROCm, а также интеграции с SGLang и vLLM. Это позволяет разработчикам сразу развертывать топовую китайскую ИИ-модель без дополнительной низкоуровневой донастройки.
Подробнее о поддержке Qwen 3.5 на AMD Instinct
Ключевой акцент сделан на эффективной работе с длинным контекстом и сложными мультимодальными сценариями. ИИ-модель Qwen 3.5 поддерживает контекстные окна от 256 тысяч до 1 миллиона токенов, поддерживает полную мультимодальность за счет технологии DeepStack Vision Transformer и использует гибридную архитектуру внимания, сочетающую полное многоголовое внимание и линейные Gated Delta-сети. Такой подход устраняет квадратичную зависимость вычислительных затрат от длины последовательности и обеспечивает линейное масштабирование при росте контекста. При обработке последовательностей свыше 32 000 токенов достигается заметный прирост пропускной способности за счет снижения вычислительной нагрузки и более эффективного управления памятью. Это особенно важно для корпоративных сценариев — анализа длинных документов, обработки кодовых баз, агентных рабочих процессов и сложных логических цепочек.
С точки зрения оптимизаций, линейное внимание реализовано через Triton-ядра fused_recurrent_gated_delta_rule, которые поддерживаются vLLM и SGLang на ROCm. В архитектуре MoE путь Shared Expert использует оптимизированные hipBLASLt GEMM-ядра, а специализированные эксперты задействуют реализации AITER FusedMoE. Мультимодальные компоненты, включая mRoPE и Conv3d, работают через стандартные библиотеки MIOpen и PyTorch на GPU AMD.
Интеграция Qwen 3.5 с ускорителями AMD Instinct открывает компаниям возможность строить масштабируемые ИИ-платформы без жесткой привязки к одному поставщику ИИ-оборудования. Большой объем HBM-памяти в MI300X/MI325X/MI355X позволяет запускать крупные модели и длинные контексты на одном GPU или в пределах одного узла, уменьшая инфраструктурные затраты.
Поддержка Qwen 3.5 на графических процессорах AMD Instinct демонстрирует стратегическое стремление AMD усилить позиции в сегменте ИИ-инфраструктуры для инференса LLM и агентных систем. Комбинация гибридного внимания, MoE с Shared Expert, мультимодального стека и оптимизаций ROCm/SGLang/vLLM формирует готовую платформу для развертывания моделей с длинным контекстом и высокой вычислительной эффективностью в корпоративных и промышленных средах. В ассортименте ServerFlow доступны различные решения линеек AMD Instinct и AMD Radeon AI Pro, при покупке мы поможем вам развернуть весь программный стек для работы с передовой ИИ-моделью Qwen 3.5.
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Скидка 1 500 ₽ или бесплатная доставка - уже сейчас 🔥
Мы ценим обратную связь от клиентов. При оформлении заказа вы можете сообщить о своём намерении поделиться впечатлением о работе ServerFlow после получения товара.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка до ПВЗ СДЭК.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.
При оформлении заказа в ServerFlow вы можете сообщить о намерении оставить отзыв о нашей работе после получения товара.
Нам важно ваше честное мнение. Оно помогает развивать сервис и даёт другим клиентам представление о нашей работе.
Вы можете оставить отзыв на удобной для вас платформе:
Google Maps
2GIS
Яндекс Карты
Как работает акция
Применяя промокод, вы подтверждаете намерение поделиться впечатлением о работе ServerFlow после получения заказа. Мы применяем бонус уже к текущему заказу в знак благодарности за обратную связь.
Условия акции:
скидка 1 500 ₽ при заказе от 30 000 ₽
или бесплатная доставка* при заказе до 30 000 ₽
* Бесплатная доставка заказа осуществляется до ПВЗ СДЭК.