Top.Mail.Ru
Granite-Docling-258M: лучшая LLM для анализа документов | Блог Serverflow Скачать
прайс-лист
Бесплатная
доставка по РФ
Скидка
за отзыв!
Distribution of
Server Components
8 (800) 222-70-01 Консультация IT-специалиста Сравнение

Granite-Docling-258M: лучшая LLM для анализа документов

~ 2 мин
245
Простой
Новости
Granite-Docling-258M: лучшая LLM для анализа документов

Введение

Компания IBM выпустила новую, мультимодальную ИИ-модель для анализа документов и их перевода в текстовый формат — Granite Docling 258M. Новая LLM сохраняет ключевые функциональные возможности своего предшественника в лице Docling и обеспечивает простую интеграцию с системой DoclingDocuments, гарантируя полную совместимость с существующей инфраструктурой.

Подробнее о Granite Docling 258M

Архитектура Granite Docling 258M базируется на фреймворке Idefics3 с тремя ключевыми модификациями: традиционный энкодер изображений заменен на усовершенствованный siglip2-base-patch16-512, внедрен изуально-языковой коннектор с проектором пиксельного перемешивания (аналогично idefics3), а базовая языковая модель заменена на Granite 165M LLM. Благодаря этому, ИИ-модель демонстрирует улучшенное распознавание математических уравнений с повышенной точностью определения и форматирования формул. Платформа предлагает гибкие режимы логического вывода с выбором между полностраничной обработкой и анализом выделенных областей (bbox). Кроме того, в модели значительно улучшена стабильность работы, в результате чего исключены бесконечные циклы генерации, а также реализована функция проверки элементов документа с возможностью анализа структуры и последовательности элементов. Помимо библиотеки Docling, нейросеть Granite Docling 258M также поддерживает инференс через движки для моделей трансформеров, вроде vLLM, ONNX или mlx-vlm. Также возможна работа через API-интеграцию docling-core.

Датасет модели состоит из общедоступных наборов данных и внутренних синтетических данных, включая SynthCodeNet (фрагменты кода на 50+ языках программирования), SynthFormulaNet (математические выражения с LaTeX-разметкой), SynthChartNet (изображения диаграмм с табличными выводами) и DoclingMatix (реальные страницы документов из различных областей). Обучение Granite Docling 258M выполнялось на мощностях суперкомпьютерного кластера IBM Blue Vela с графическими процессорами NVIDIA H100, обеспечивающем масштабируемую и эффективную среду для тренировки моделей на тысячах GPU. 

Анализ документа через Granite Docling 258M
Наглядный пример анализа документа с помощью ИИ-модели Granite Docling 258M. Источник: Hugging Face.

Выводы

На данный момент Granite Docling 258M уже успела занять третье место в топе самых трендовых ИИ-моделей на Hugging Face. Это свидетельствует о высочайшей эффективности ИИ-продукта от IBM и дает надежную опору для дальнейшего развития направления искусственного интеллекта одной из самых известных IT-компаний в мире.
Автор: Serverflow Serverflow
Поделиться

Комментарии 0

Написать комментарий
Сейчас тут ничего нет. Ваш комментарий может стать первым.
Написать отзыв
До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Написать комментарий

Комментарий появится на сайте после предварительной модерации

До 6 фото, размером до 12Мб каждое
Мы получили ваш отзыв!

Он появится на сайте после модерации.

Мы свяжемся с вами утром

График работы: Пн-Пт 10:00-19:00 (по МСК)

Обработаем вашу заявку
в ближайший рабочий день

График работы: Пн-Пт 10:00-19:00 (по МСК)