В прошлой статье мы рассказали вам, как запускать большие языковые модели на китайском ИИ-ускорителе Huawei Atlas 300i Duo. Но на развертывании LLM возможности этого передового решения не заканчиваются — вы также можете использовать его для инференса диффузионных нейросетей, генерирующих детальные изображения по вашему текстовому запросу или по референсным медиа-материалам. Однако, ввиду специфики программного стека и отсутствия большого ИИ-сообщества вокруг решений Huawei, найти полезный гайд по развертыванию диффузионок на NPU-ускорителях — дело непростое. Команда ServerFlow решила исправить это и подготовила для вас подробное руководство по запуску диффузионных ИИ-моделей через ComfyUI на Huawei Atlas 300i Duo.
Скачивание и запуск контейнера
О подготовке системы, скачивании драйверов и дополнительных инструментов мы рассказывали в предыдущем материале, поэтому сразу переходим на этап скачивания и развертывания контейнера движка инференса MindIE с ComfyUI. Для этого идем на официальный страницу с версиями сборок контейнеров MindIE и выбираем версию 2.2.RC1-300I-Duo-py311-openeuler24.03-lts. Находим нужный контейнер и выполняем установку командой:
docker run -itd --net=host --ipc=host --shm-size=2g --name mindie_2.2_comfyui_test
Как вы можете заметить, мы перенесли VAE-операции на CPU, и это сделано не просто так. Дело в том, что в противном случае ComfyUI не будет работать корректно на Huawei Atlas 300i Duo, так как при выполнении операций кодирования и декодирования VAE на NPU могут возникать ошибки совместимости отдельных операторов и типов данных, из-за чего генерация будет завершается с ошибкой.
После запуска сервера в терминале появится ссылка, при переходе на которую вы попадете в интерфейс ComfyUI. Теперь перейдите во вкладку templates и найдите Stable Diffusion XL, после чего выберите именно модель в SDXL Turbo workflow и скопируйте ее URL. Скачайте веса нейросети в папку checkpoints.
Затем перейдите в контейнер и перейдите в эту папку:
comfyui/models/checkpoints
Теперь пропишите wget и вставьте скопированный URL. Дождитесь скачивания, после чего вы можете перейти в ComfyUI и запустить генерацию изображения. Рекомендуем отслеживать нагрузку на NPU при генерации с помощью команды npu-smi info. Не удивляйтесь, что нагрузка идет только на один чип — дело в том, что ComfyUI не может распределить нагрузку между двумя чипами. Первая генерация займет очень много времени, но последующие запуски будут происходить почти моментально.
Инференс SDXL Turbo в ComfyUI на Huawei Atlas 300i Duo
Скорее всего, сгенерированные изображения вас не обрадуют — SDXL Turbo вышла еще в 2023 году, поэтому уровень ее производительности оставляет желать лучшего. Результаты генерации показали в нашем новом видео на YouTube. Другие, более современные ИИ-модели, к сожалению, не поддерживают запуск на Huawei Atlas 300i Duo. Мы также делали попытки выполнить инференс более современных диффузионок, таких как Flux 1.dev и Wan2.1, но они не увенчались успехом — flux 1.dev просто не поддерживается, а генерация видео wan2.1 обрывается, так как мощностей одного NPU просто не хватает.
Выводы
Несмотря на то, что запуск ComfyUI на Huawei Atlas 300i Duo возможен, особого смысла в таком сценарии использования нет — ИИ-ускоритель поддерживает только старые модели, а из-за особенностей работы платформы ComfyUI, нагрузка будет уходить только на один NPU-чип, что режет производительность генерации в два раза. Ввиду этого, можно подвести итог, что Huawei Atlas 300i Duo — это отличное решение для инференса именно больших языковых моделей, но никак не диффузионных нейросетей. Если вы решили приобрести Huawei Atlas 300I Duo, обращайтесь в компанию ServerFlow — наши специалисты проведут вас за руку от покупки топового китайского ИИ-ускорителя до настройки всего необходимого софта и запуска вашей первой локальной ИИ-модели.
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Скидка 1 500 ₽ или бесплатная доставка - уже сейчас 🔥
Мы ценим обратную связь от клиентов. При оформлении заказа вы можете сообщить о своём намерении поделиться впечатлением о работе ServerFlow после получения товара.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка до ПВЗ СДЭК.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.
При оформлении заказа в ServerFlow вы можете сообщить о намерении оставить отзыв о нашей работе после получения товара.
Нам важно ваше честное мнение. Оно помогает развивать сервис и даёт другим клиентам представление о нашей работе.
Вы можете оставить отзыв на удобной для вас платформе:
Google Maps
2GIS
Яндекс Карты
Как работает акция
Применяя промокод, вы подтверждаете намерение поделиться впечатлением о работе ServerFlow после получения заказа. Мы применяем бонус уже к текущему заказу в знак благодарности за обратную связь.
Условия акции:
скидка 1 500 ₽ при заказе от 30 000 ₽
или бесплатная доставка* при заказе до 30 000 ₽
* Бесплатная доставка заказа осуществляется до ПВЗ СДЭК.