Baidu официально представила новейшую открытую модель для генерации изображений ERNIE-Image. Модель объемом всего 8 миллиардов параметров демонстрирует выдающуюся производительность, сопоставимую и даже превосходящую значительно более крупные аналоги, включая закрытые системы и нейросети с сотнями миллиардов параметров. Особенно хорошо модель справляется при генерации изображений по сложным инструкциям, сохраняет качество в рендеринге текста и сохраняет структуру изображения вне зависимости от промпта. Модель, ее код и веса уже доступны на GitHub и Hugging Face под свободной лицензией Apache 2.0, что открывает широкие возможности для коммерческого использования.
Подробнее о ERNIE-Image
ERNIE-Image построена на базе однопоточного диффузионного трансформера (DiT) с 8 миллиардами параметров, что делает крайне компактной в сравнении с моделями конкурентов. В отличие от многих аналогов, например, Flux, использующих параллельные "ветки" для обработки текста и изображения, ERNIE-Image применяет единый, общий трансформер для всех типов данных с самого начала, что упрощает и ускоряет процесс генерации без потери качества. Важной частью архитектуры ERNIE-Image является облегченный модуль Prompt Enhancer, представляющий собой настроенную 3B LLM, которая автоматически преобразует краткие пользовательские запросы в подробные, структурированные описания, значительно повышая стабильность и качество результата. ERNIE-Image отлично справляется с точным воплощением сложных, многосоставных инструкций. Модель выпущена в двух версиях: стандартная ERNIE-Image, требующая 50 шагов для достижения максимальной точности, и оптимизированная ERNIE-Image-Turbo, которая, благодаря методам DMD и RL, способна генерировать изображения высокого качества всего за 8 шагов, что ускоряет вывод в несколько раз. На мощных ускорителях, таких как H200, Turbo-версия генерирует изображение за 11 секунд.
Модель превосходно выполняет задачи, где критически важны детализация, взаимосвязи между множеством объектов и точное следование длинным текстовым описаниям. В сравнительных бенчмарках 8B ERNIE-Image успешно конкурирует с более крупной моделью Qwen Image и обходит Z-image, демонстрируя лучшую точность. Еще одна сильная сторона модели ERNIE-Image — генерация текста. В то время как многие конкуренты часто выдают нечитаемые символы, особенно на русском языке, ERNIE-Image удивительно хорошо справляется с рендерингом плотного, объемного и чувствительного к макету текста. Это делает ее идеальным инструментом для создания инфографики, макетов интерфейсов, рекламных материалов и другого визуального контента, насыщенного текстовой информацией. Помимо этого, модель поддерживает широкий спектр художественных стилей: от гиперреалистичной фотографии и чистого, ориентированного на дизайн, изображения до более стилизованных, кинематографичных и атмосферных визуальных решений.
Благодаря компактному размеру, ERNIE-Image может работать на потребительских графических процессорах с 24 ГБ видеопамяти, таких как NVIDIA RTX 3090 или 4090. Это существенно снижает порог входа для ИИ-энтузиастов, разработчиков и небольших команд.
Выводы
С выпуском ERNIE-Image Baidu сделала сильный ход, предоставив сообществу открытую модель, которая на равных конкурирует с лучшими проприетарными решениями. Выдающаяся точность выполнения инструкций, качественный рендеринг текста и компактность, позволяющая запускать ее на доступном оборудовании. делают ERNIE-Image одним из лучших диффузионных трансформеров на рынка. А лицензия Apache 2.0 и полная открытость кода и весов делают ERNIE-Image привлекательным инструментом для коммерческой разработки в сфере дизайна, маркетинга и создания визуального контента.
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Скидка 1 500 ₽ или бесплатная доставка - уже сейчас 🔥
Мы ценим обратную связь от клиентов. При оформлении заказа вы можете сообщить о своём намерении поделиться впечатлением о работе ServerFlow после получения товара.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка до ПВЗ СДЭК.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.
При оформлении заказа в ServerFlow вы можете сообщить о намерении оставить отзыв о нашей работе после получения товара.
Нам важно ваше честное мнение. Оно помогает развивать сервис и даёт другим клиентам представление о нашей работе.
Вы можете оставить отзыв на удобной для вас платформе:
Google Maps
2GIS
Яндекс Карты
Как работает акция
Применяя промокод, вы подтверждаете намерение поделиться впечатлением о работе ServerFlow после получения заказа. Мы применяем бонус уже к текущему заказу в знак благодарности за обратную связь.
Условия акции:
скидка 1 500 ₽ при заказе от 30 000 ₽
или бесплатная доставка* при заказе до 30 000 ₽
* Бесплатная доставка заказа осуществляется до ПВЗ СДЭК.