Китайский ИИ-стартап jdopensource представил новые открытые модели семейства JoyAI-Image-Edit, которые объединяют мультимодальную LLM на 8 миллиардов параметров и мультимодальный диффузионный трансформер на 16 миллиардов параметров в единой архитектуре для понимания, генерации и редактирования изображений. Ключевая особенность JoyAI-Image-Edit — приоритет на пространственное восприятие: модель не просто приблизительно определяет область редактирования, а выполняет точный анализ сцены, реляционную привязку объектов и детальную декомпозицию инструкций, благодаря чему изменения вносятся именно в нужное место с высоким качеством. Модели распространяются под лицензией Apache 2.0 и доступны на , и .
Подробнее о JoyAI-Image-Edit
Архитектура JoyAI-Image базируется на замкнутом пайплайне, где пространственное восприятие улучшает процесс редактирования, а генеративные преобразования, такие как изменение точки обзора, влияют на логику рассуждений, создавая двустороннюю связь между пониманием и генерацией. Модель поддерживает три режима пространственного редактирования: перемещение объекта с помощью красного квадрата-маркера, поворот объекта с выбором из восьми канонических видов, а также управление камерой через поворот по осям Y и P вместе с масштабированием. Система также демонстрирует расширенные возможности рендеринга текста, включая создание мультипанельных комиксов, плотную многоязычную типографику, работу с развернутыми макетами и рукописными стилями.
В семейство моделей входят несколько версий ИИ: JoyAI-Image-Und для мультимодального понимания с высокоточными пространственными рассуждениями, JoyAI-Image-Edit для пошагового редактирования по инструкциям, а также дистиллированная версия для более быстрого вывода, JoyAI-Image-Edit-Plus для редактирования нескольких изображений с сохранением согласованности и композиции, и отдельная модель JoyAI-Image для генерации из текста в изображение. Все они основаны на едином интерфейсе MLLM-MMDiT и используют масштабируемый конвейер данных SpatialEdit, OpenSpatial и многоэтапные стратегии оптимизации. Благодаря этому JoyAI-Image обеспечивает более точное управляемое редактирование с лучшей сохранностью структуры сцены, а также пробуждает пространственный интеллект, позволяя системе понимать сложные пространственные отношения и выполнять преобразования с учетом геометрии объектов.
Выводы
JoyAI-Image-Edit — это еще один пример открытых ИИ-моделей, которые демократизируют доступ к генерации и редактированию изображений. Сочетание мощной языковой модели и диффузионного трансформера в едином цикле понимания и генерации позволяет достичь беспрецедентной точности пространственных манипуляций. А поддержка трех режимов редактирования, расширенный рендеринг текста и возможность работы с несколькими изображениями делают эту систему универсальным решением для самых разных творческих и исследовательских задач.
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Скидка 1 500 ₽ или бесплатная доставка - уже сейчас 🔥
Мы ценим обратную связь от клиентов. При оформлении заказа вы можете сообщить о своём намерении поделиться впечатлением о работе ServerFlow после получения товара.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка до ПВЗ СДЭК.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.
При оформлении заказа в ServerFlow вы можете сообщить о намерении оставить отзыв о нашей работе после получения товара.
Нам важно ваше честное мнение. Оно помогает развивать сервис и даёт другим клиентам представление о нашей работе.
Вы можете оставить отзыв на удобной для вас платформе:
Google Maps
2GIS
Яндекс Карты
Как работает акция
Применяя промокод, вы подтверждаете намерение поделиться впечатлением о работе ServerFlow после получения заказа. Мы применяем бонус уже к текущему заказу в знак благодарности за обратную связь.
Условия акции:
скидка 1 500 ₽ при заказе от 30 000 ₽
или бесплатная доставка* при заказе до 30 000 ₽
* Бесплатная доставка заказа осуществляется до ПВЗ СДЭК.