В связи с праздниками в Китае ожидаются трудности при работе с товарами "под заказ". Возможны задержки в уточнении цен и оформлении заказов из-за отсутствия связи с партнёрами.
Alibaba запустила предварительное тестирование WAN 2.5 — нового поколения современных генеративных LLM для преобразования текстовых и графических описаний в видео. Передовая модель WAN 2.5 предлагает возможности генерации высококачественных видеороликов в разрешении 480p, 720p, 1080p, а ключевым нововведением стала интеграция нативного аудио-сопровождения на основе текстовых или визуальных промптов. В сравнении с решением Google Veo3, модель предлагает более доступную стоимость и высокую скорость генерации.
Подробнее о WAN 2.5
В настоящее время модельный ряд WAN 2.5 включает следующие нейросети:
wan-2.5/text-to-video;
wan-2.5/image-to-video;
wan-2.5/text-to-video-fast;
wan-2.5/image-to-video-fast;
wan-2.5/text-to-image.
Пока что передовые нейросети для генерации видео доступны только через API Alibaba Cloud и WaveSpeed на время предварительного тестирования, но уже в ближайшее время Alibaba откроет доступ через ИИ-интерфейсы вроде ComfyUI.
Главное преимущество моделей Wan 2.5 заключается в экономичности — несмотря на недавнее снижение цен конкурентами, Wan 2.5 сохраняет более доступную стоимость, предлагая энтузиастам и компаниям расширенный функционал и высокое качество при снижении накладных расходов. Кроме того, в Wan 2.5 реализована передовая функция сквозной аудио-визуальной синхронизации при генерации видео, благодаря чему у пользователей отпадает необходимость отдельно записывать закадровый голос и вручную синхронизировать движения губ. Чтобы функция работала корректно, важно создать четко сформулированный промпт. Wan 2.5 также демонстрирует многоязыковую поддержку, включая китайский, русский, английский и другие языки, с правильной синхронизацией аудиоряда и видеоряда, в отличие от конкурента в лице Veo 3, который часто некорректно обрабатывает запросы не на английском языке. Wan 2.5 позволяет создавать видеоролики продолжительностью до 10 секунд против 8 секунд у аналога Veo 3, а также предлагает три варианта соотношения сторон для адаптации к различным платформам и сценариям использования.
Выводы
Полноценный релиз Wan 2.5 обещает стать самым грандиозным событием в мире генеративных моделей искусственного интеллекта. Мы будем внимательно следить за всеми обновлениями и после официального выхода Wan 2.5 протестируем ее передовые возможности в ИИ-интерфейсе ComfyUI.
Veoapi предлагает генерацию veo3 по такой же цене как wan 2.5 Так что зачем нам нужен какой то wan, когда есть шикарный вео3
Serverflow
Даже при одинаковой цене WAN 2.5 даёт больше ценности: нативное аудио с авто-синхронизацией, стабильная многоязычная генерация (в т.ч. русский/китайский) и ролики до 10 секунд против 8 у Veo 3, плюс быстрые режимы и гибкие соотношения сторон. При ценовом паритете логичнее брать инструмент с большим функционалом и меньшими ручными операциями, а это как раз WAN 2.5.
Получите скидку 3 000 рублей или бесплатную доставку за подписку на новости*!
* — скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка.
Мы получили ваш отзыв!
Он появится на сайте после модерации.
Мы получили ваш отзыв!
Он появится на сайте после модерации.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.