Как вы помните из нашей прошлой статьи, RAG стал мощным инструментом для оптимизации больших языковых моделей, открывая им доступ для работы с актуальными или специализированными данными. Однако, классический RAG, основанный на векторном поиске, хорошо справляется только с задачами вроде ответов на вопросы из FAQ или анализа простого семантического поиска. Когда речь заходит о сложных, многоступенчатых запросах, взаимосвязанных документах или необходимости выполнения действий, его возможностей часто оказывается недостаточно. Именно эти ограничения стимулировали развитие двух мощных надстроек над классическим RAG — Graph-RAG и Agentic RAG. Но эти технологии стали не “убийцей” традиционного RAG, а продолжателями его идей, расширяя функциональность, эффективность и интеллектуальность базовых систем Retrieval-Augmented Generation. В этой статье мы разберемся, что из себя представляют Graph-RAG и Agentic RAG, зачем нужны эти передовые системы, как они используются, а также объясним, как в будущем будут развиваться RAG-технологии.
Graph-RAG вносит структурное понимание данных, превращая разрозненные фрагменты информации в связанное полотно знаний. Agentic RAG добавляет элемент принятия решений, позволяя системе самостоятельно планировать и выполнять последовательности действий для ответа на запрос. Вместе они представляют собой следующий логический шаг в развитии RAG-систем. Сначала мы разберем Graph-RAG как метод работы с графами знаний, а затем перейдем к агентам, которые оживляют эти данные.
Graph-RAG: когда база знаний превращается в граф
Основная идея надстройки Graph-RAG заключается в переходе от хранения документов в виде изолированных векторных представлений к построению динамического графа знаний. Граф знаний — это способ структурированного представления информации, который организует и связывает данные из различных источников, чтобы представить данные в максимально структурированном виде. В отличие от традиционной базы данных, где данные хранятся в таблицах, граф знаний сосредоточен на контексте и связях между частями информации. В такой системе каждый узел данных не просто находится в удобном доступе для RAG, а превращается в паутину, где из основного контекстного объекта (сущности) в центре ветвятся нити (связи) к логически связанным с ним объектам. Это коренным образом меняет подход к поиску информации. Если вы думаете, что RAG хорош сам по себе и ему не нужна дополнительная оптимизация поиска данных в виде Graph-RAG, то вы ошибаетесь, ведь эта технология не так проста, как кажется на первый взгляд. Благодаря Graph-RAG ваша LLM не только лучше справляется с поиском, но и начинает в разы эффективнее справляться с многоуровневыми операциями, перескакивая из одного блока знаний в другой.
Рассмотрим практический пример. Вы задаете вопрос ИИ: “Почему сайт начинает тормозить при росте количества пользователей?”. Векторный RAG, скорее всего, подберет тексты о проблемах с производительностью серверов, оптимизацией запросов к базе данных или масштабированием, но не установит причинно-следственную связь между этими явлениями — он просто выдаст сухие факты. Graph-RAG же может пройти по цепочке этих фактов последовательно: от сущности “увеличение нагрузки” по связи “приводит к” к сущности “рост числа запросов”, затем к сущности “увеличение времени отклика базы данных”, а оттуда к сущности “замедление работы сайта”. Такой подход особенно полезен в IT-аналитике, где важно выявлять не просто набор признаков проблемы, а их взаимосвязи — например, при исследовании архитектурных узких мест, анализе дыр в системах защиты или построении моделей причин отказов в распределенных системах.
Реализация Graph-RAG на практике опирается на использование специализированных инструментов и баз данных. Центральное место здесь занимают графовые базы данных, такие как Neo4j, TigerGraph и ArangoDB, которые идеально подходят для хранения и анализа сложных сетей взаимосвязей и имеют открытый исходный код. У Microsoft тоже есть свой GraphRAG база данных, но несмотря на свое название, она скорее является референсной архитектурой и одновременной библиотекой, которая демонстрирует полный цикл работы с базами графов: от извлечения сущностей и связей из текста с помощью LLM до построения графа и генерации ответов на основе глобального и локального поиска.
Фреймворки для построения LLM-приложений активно интегрируют возможности работы с графами. Например, LlamaIndex предоставляет мощные абстракции для создания и использования индексов на основе графов знаний, а LangChain позволяет интегрировать графовые базы данных через концепцию ритриверов и инструментов, делая Graph-RAG частью более сложных агентских рабочих процессов.
Процесс построения графа обычно включает в себя несколько этапов:
Извлечение сущностей (NER): идентификация сущностей в тексте.
Извлечение отношений: определение связей между этими сущностями.
Кластеризация: алгоритмы, такие как Leiden, группируют тесно связанные сущности в сообщества.
Суммаризация: LLM генерирует текстовые описания для этих сообществ, что позволяет системе эффективно отвечать на вопросы, используя имеющийся набор данных.
Стоит отметить, что построение и поддержка графов знаний — задача более сложная и ресурсоемкая по сравнению с созданием векторных индексов. Поэтому Graph-RAG не является универсальным решением, так как он не подойдет для развертывания на системах с ограниченным объемом ресурсов. Однако для сложных доменов, где связи между данными не менее важны, чем сами данные, Graph-RAG становится must-have инструментом.
Agentic RAG: когда к поиску добавляются действия
Если Graph-RAG делает систему "знатоком", то Agentic RAG делает ее "сообразительной". Это подход, в котором RAG сочетается с концепцией ИИ-агентов — программных модулей на основе искусственного интеллекта, способных к принятию решений и выполнению различных операций. Агент не просто пассивно извлекает контекст по запросу, а активно решает, как на этот запрос ответить: нужно ли обратиться к векторной базе, выполнить ли SQL-запрос, сделать ли вызов API или скомбинировать несколько этих действий.
Ярким примером является связка LangChain Agents и LangGraph. LangGraph позволяет проектировать сложные, многошаговые рабочие процессы (графы состояний), где LLM выступает в роли "мозга", принимающего решения о переходе между узлами-действиями. Например, на запрос пользователя "Покажи продажи за текущий квартал и сравни с прошлым годом" агент может выполнить следующую последовательность:
Принять решение: LLM анализирует запрос и определяет, что для ответа нужны данные из базы.
Вызвать инструмент: агент формирует и выполняет соответствующий SQL-запрос.
Оценить результат: полученные данные могут быть переданы обратно агенту для анализа.
Сгенерировать ответ: на основе извлеченных данных LLM формирует итоговый ответ для пользователя.
Важной особенностью Agentic RAG является возможность итеративного уточнения. Если первоначально найденные документы релевантны, система переходит к генерации ответа. Если нет — агент может принять решение переформулировать вопрос и повторить поиск. Этот цикл мышления превращает RAG из статичного инструмента поиска в динамичного интеллектуального ассистента.
Схема работы системы агентского RAG. Источник: .
Примеры использования Graph-RAG и Agentic-RAG
Комбинации этих технологий находят применение в реальных бизнес-задачах, трансформируя области, где требуется глубокий анализ информации.
Сценарии для Graph-RAG:
Медицина и фармацевтика: построение графов знаний, связывающих гены, болезни, симптомы, лекарства и клинические исследования. Это позволяет исследователям находить скрытые связи и генерировать новые гипотезы для изучения инновационных лекарств.
Юриспруденция: анализ сложных юридических дел, где необходимо отследить взаимосвязи между статьями законодательства, судебными прецедентами, сторонами процесса и доказательствами.
Корпоративные знания: управление внутренней документацией крупных компаний, где проекты, продукты, сотрудники и отчеты тесно переплетены друг с другом. Graph-RAG позволяет новым сотрудникам быстро погружаться в контекст и находить экспертов по нужным темам.
Сценарии для Agentic RAG:
Бизнес-аналитика и отчетность: агент может самостоятельно, получая запросы на естественном языке, делать запросы к базам данных, извлекать ключевые метрики из CRM-систем, строить сводки и даже формировать визуализации.
Автоматизация рутинных задач: Например, ассистент в службе поддержки, который не только находит информацию в базе знаний, но и может проверить статус заказа через API, а затем сообщить его клиенту.
Эти подходы переводят RAG из категории "умного поиска" в категорию "интеллектуальных партнеров", способных решать комплексные задачи.
Будущее: Multimodal RAG и комбинации
Эволюция RAG не заканчивается на изобретении Graph-RAG и Agentic-RAG. Набирает обороты направление так называемых Multimodal RAG, которые позволяют работать не только с текстом, но и с изображениями, таблицами, аудио и видео. Эти функции критически важны для обработки современных корпоративных данных, которые часто представлены в виде PDF-отчетов с графиками, технической документации со схемами или мультимедийных презентаций.
Существует несколько подходов к реализации Multimodal RAG:
Единое векторное пространство: модели CLIP кодируют и текст, и изображения в едином латентентном пространстве, что упрощает поиск нужных данных.
Приведение к одному формату: например, генерация текстовых описаний для всех изображений и таблиц с последующей работой только с текстом.
Раздельные хранилища с реранкингом: создание отдельных индексов для каждого типа данных с последующим объединением и ранжированием результатов.
Наиболее перспективным выглядит сценарий, в котором Graph-RAG, Agentic RAG и Multimodal RAG связываются в единой интеллектуальной системе, где агент (Agentic RAG) для ответа на вопрос "Проанализируй динамику продаж по регионам на основе последнего отчета" сначала извлекает сырые данные из SQL-базы, затем обогащает их контекстом из графа знаний (Graph-RAG) о региональных менеджерах и маркетинговых активностях, а итоговый ответ представляет в виде текста и графика, сгенерированного мультимодальном LLM.
Graph-RAG и Agentic RAG — это не просто новые акронимы в мире ИИ, а закономерный шаг в эволюции RAG-систем, направленный на решение его ключевых ограничений. Graph-RAG вносит структурное понимание и способность к сложным логическим выводам, в то время как Agentic RAG добавляет гибкость, самостоятельность и возможность взаимодействия с внешними системами. Важно помнить, что эти подходы не отменяют и не заменяют классический RAG, а скорее дополняют его, создавая мощные гибридные архитектуры. Они превращают RAG из инструмента для поиска фактов в платформу для построения интеллектуальных ассистентов, способных решать реальные бизнес-задачи в сложных предметных областях.Такие фреймворки, как LangChain и LlamaIndex, уже сегодня предоставляют инструментарий для построения таких гибридных систем, открывая новые горизонты для разработчиков ИИ-приложений.
Продолжная использовать наш сайт, вы даете согласие на использование файлов Cookie, пользовательских данных (IP-адрес, вид операционной системы, тип браузера, сведения о местоположении, источник, откуда пришел на сайт пользователь, с какого сайта или по какой рекламе, какие страницы
открывает и на какие страницы нажимает пользователь) в целях функционирования сайта, проведения статистических исследований и обзоров. Если вы не хотите, чтобы ваши данные обрабатывались, покиньте сайт.