Команда PaddlePaddle представила PaddleOCR-VL-1.6 — обновленную компактную OCR-модель с поддержкой русского языка, которая продолжает развитие предыдущей версии PaddleOCR-VL 1.5 и привносит значительно больший уровень производительности анализа текстов. Основной упор сделан на точечное усиление слабых сторон предшественницы: в новинку встроен механизм региональной оптимизации данных, позволяющий прицельно улучшать те области, где модель раньше ошибалась, а также внедрена прогрессивная схема пост-обучения на тщательно отфильтрованных примерах с подкреплением. Результат — сразу три установленных рекорда на ключевых бенчмарках и полная архитектурная совместимость с предшественницей, сводящая миграцию к простой замене файла модели.
Подробнее о PaddleOCR-VL-1.6
Ключевая инновация PaddleOCR-VL-1.6 — так называемая система регионально-осведомленной оптимизации данных, которая анализирует, в каких именно типах контента (таблицы, редкие символы, формулы) предшественница выдавала наибольшее количество ошибок, и целенаправленно дополняет обучающую выборку в этих проблемных зонах. Дополнительно применяется прогрессивное пост-обучение: после базового fine-tuning модель проходит через несколько этапов дообучения на все более сложных и тонко отобранных данных, а на финальной стадии задействуется обучение с подкреплением для повышения надежности ключевых метрик.
PaddleOCR-VL-1.6 обновляет рекорд точности распознавания текста среди ИИ-моделей. Источник: .
В результате этих оптимизаций, в бенчмарке OmniDocBench модель PaddleOCR-VL-1.6 достигла точности 96,33%, что является новым абсолютным рекордом среди всех открытых и закрытых OCR-нейросетей. Одновременно с этим обновлены рекорды на бенчмарке OmniDocBench v1.5 и на наборе тестов Real5-OmniDocBench. Впечатляющий прирост показан в распознавании таблиц, работе с историческими документами, редкими иероглифами, и рукописными текстами, а также в с извлечении печатей, штампов, выделении текста и анализе диаграмм.
Результаты тестирования PaddleOCR-VL-1.6. Источник: .
Архитектурно PaddleOCR-VL-1.6 полностью повторяет предыдущую нейронку PaddleOCR-VL-1.5 — для миграции на обновленную модель, ни одной строчки кода интеграции менять не нужно. Пользователи PaddleOCR-VL-1.5 могут перейти на новую версию простой заменой весов, без каких-либо затрат на адаптацию. Более того, модель уже доступна для быстрого развертывания через библиотеку transformers.
Выводы
PaddleOCR-VL-1.6 демонстрирует, что грамотная работа с данными и хирургически точное дообучение проблемных зон могут дать больший прирост, чем наращивание архитектурной сложности. Прибавка в 0,8% (с 95,52% до 96,33% на v1.6 OmniDocBench), на первый взгляд скромная, на деле означает сокращение количества реальных ошибок в практических задачах на десятки процентов, что критически важно для автоматизации корпоративного документооборота. Полная совместимость с предыдущей версией делает обновление безболезненным для бизнеса, а очередной SOTA укрепляет позиции PaddleOCR как одной из ведущих open-source платформ для интеллектуальной обработки документов.
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Скидка 1 500 ₽ или бесплатная доставка - уже сейчас 🔥
Мы ценим обратную связь от клиентов. При оформлении заказа вы можете сообщить о своём намерении поделиться впечатлением о работе ServerFlow после получения товара.
* - скидка предоставляется при покупке от 30 000 рублей, в ином случае предусмотрена бесплатная доставка до ПВЗ СДЭК.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.
При оформлении заказа в ServerFlow вы можете сообщить о намерении оставить отзыв о нашей работе после получения товара.
Нам важно ваше честное мнение. Оно помогает развивать сервис и даёт другим клиентам представление о нашей работе.
Вы можете оставить отзыв на удобной для вас платформе:
Google Maps
2GIS
Яндекс Карты
Как работает акция
Применяя промокод, вы подтверждаете намерение поделиться впечатлением о работе ServerFlow после получения заказа. Мы применяем бонус уже к текущему заказу в знак благодарности за обратную связь.
Условия акции:
скидка 1 500 ₽ при заказе от 30 000 ₽
или бесплатная доставка* при заказе до 30 000 ₽
* Бесплатная доставка заказа осуществляется до ПВЗ СДЭК.