Top.Mail.Ru
LightOnOCR-2-1B: новая компактная OCR-модель с рекордной скоростью и точностью | Блог Serverflow Скачать
прайс-лист
Бесплатная
доставка по РФ
Скидка
за отзыв!
Distribution of
Server Components
8 (800) 222-70-01 Консультация IT-специалиста Сравнение

LightOnOCR-2-1B: новая компактная OCR-модель с рекордной скоростью и точностью

~ 2 мин
169
Простой
Новости
LightOnOCR-2-1B: новая компактная OCR-модель с рекордной скоростью и точностью

Введение

Компания LightOn представила LightOnOCR-2-1B — флагманскую модель распознавания текста нового поколения. Это сквозная OCR-система с компактным размером в 1 млрд параметров, дообученная с использованием RLVR-подхода, ориентированного на максимальную точность. Модель предназначена для прямого преобразования PDF-документов, сканов и изображений в чистый, структурированный текст без сложных и нестабильных конвейеров.

Подробнее о LightOnOCR-2-1B

LightOnOCR-2-1B является развитием второй версии LightOnOCR-2 и обучена на существенно расширенном и более качественном корпусе данных. Особый упор сделан на французский язык, научные статьи arXiv и реальные сканы документов, что позволило улучшить устойчивость к шуму и сложным макетам. В модели переработана обработка LaTeX и математических выражений, а также нормализация текста, благодаря чему выходные данные ближе к естественному виду, удобного для прочтения человеком.

По результатам тестрирования OlmOCR-Bench модель демонстрирует лучшую совокупную производительность среди открытых OCR-решений, оставаясь при этом примерно в девять раз компактнее и заметно быстрее большинства открытых конкурентов. LightOnOCR-2-1B способна обрабатывать около 5,7 страниц в секунду при локальном инференсе на одном ускорителе NVIDIA H100, что эквивалентно почти полумиллиону страниц в сутки. При этом заявленная стоимость вычислений составляет менее одного цента за тысячу страниц, что делает модель интересной не только с точки зрения улучшения качества распознавания текста, но и в области экономики средств для бизнеса.

Архитектура модели полностью сквозная и дифференцируемая, без внешних этапов детекции и распознавания, которые часто становятся источником ошибок. LightOnOCR-2-1B корректно работает с таблицами, формами, квитанциями, многостолбцовыми макетами и математической нотацией. В релиз вошла как базовая модель LightOnOCR-2-1B для тонкой настройки, так и ряд модифицированных версий для решения конкретных типов задач, вроде LightOnOCR-2-1B-bbox с функцией распознавания изображений и LightOnOCR-2-1B-ocr-soup для лучшей согласованности в сложных типах документов, а также компромиссные варианты с объединенным функционалом.

Производительность LightOnOCR-2-1B
Производительности ИИ-модели LightOnOCR-2-1B. Источник: Hugging Face.

Выводы

LightOnOCR-2-1B от стартапа LightOn благодаря сочетанию высокой точности, скорости, предсказуемой стоимости обработки страниц и, что самое главное, широкой доступности за счет небольшого количества параметров, фактически задает новые стандарты в сегменте искусственного интеллекта для мультимодального распознавания текста. Публикация весов на Hugging Face делает LightOnOCR-2-1B сильным кандидатом на роль базового OCR-решения для разработчиков и компаний, работающих с большими объемами документов.
Автор: Serverflow Serverflow
Поделиться

Комментарии 0

Написать комментарий
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Написать отзыв
До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Написать комментарий

Комментарий появится на сайте после предварительной модерации

До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Мы свяжемся с вами утром

График работы: Пн-Пт 10:00-18:30 (по МСК)

Обработаем вашу заявку
в ближайший рабочий день

График работы: Пн-Пт 10:00-18:30 (по МСК)