La Generació Augmentada per Recuperació (RAG, per les seves sigles en anglès) ha estat durant molt de temps una pedra angular de les aplicacions impulsades per IA, però una nova evolució arquitectònica – Agentic RAG – s’està convertint ràpidament en la norma de la indústria per a sistemes llestos per a producció.
Més enllà del RAG tradicional
Els canals del RAG tradicional incorporen una consulta, recuperen context i generen una resposta. Agentic RAG introdueix intel·ligència en el procés. Classificant la intenció abans de decidir si cal recuperar informació, trucar eines o respondre directament, les empreses reporten reduccions de costos de fins al 40% i millores de latència del 35%.
Patrons clau que n’impulsen l’adopció
Els experts de la indústria assenyalen tres patrons arquitectònics que defineixen Agentic RAG:.
- Intent-Based Query Routing: determina si és necessari recuperar informació o si una resposta directa és suficient.
- Orquestració d’eines amb gestió d’errors: coordina APIs, calculadores i bases de dades mentre gestiona els errors de manera eficient.
- Avaluació contínua de costos i latència: controla l’ús de tokens i els indicadors de rendiment en temps real.
Aquests patrons permeten als sistemes decidir, adaptar-se i optimitzar, un requisit crític per a la IA a escala empresaria
Arquitectura en pràctica
Els sistemes Agentic RAG normalment es construeixen sobre tres capes:
- Capa d’Orquestració: el “cervell de decisió” que dirigeix les consultes de manera intel·ligent.
- Capa d’Execució: gestiona la recuperació d’informació, les crides a eines i la inferència LLM.
- Capa d’Infraestructura: proporciona bases de dades vectorials, gestió del desplegament i observabilitat.
A diferència del RAG tradicional, que sempre realitza recuperació d’informació, l’Agentic RAG avalua si la recuperació és necessària, organitzant la combinació òptima de recuperació, eines i generació.
Flexibilitat del proveïdor a través de capes de gateway
Una altra tendència clau és l’auge de les abstraccions de gateway que permeten als desenvolupadors canviar sense problemes entre proveïdors com OpenAI, Anthropic, Google i Bedrock. Aquest enfocament permet:
- Encaminament de reserva quan els proveïdors tenen temps d’inactivitat;
- proves A/B sense canvis de codi;
- optimització de costos dirigint les consultes al model més eficient;
- llibertat respecte a la dependència d’un proveïdor.
Les empreses estan adoptant cada cop més passarel·les unificades per equilibrar velocitat, cost i fiabilitat entre els proveïdors.
Conclusió
L’Agentic RAG ja no és un experiment de nínxol, sinó el model per als sistemes d’IA de producció. En combinar la recuperació amb la presa de decisions, l’orquestració i l’observabilitat, la tècnica estableix nous estàndards d’eficiència i adaptabilitat en l’IA empresarial.
“L’IA de producció no tracta només de la recuperació. Tracta d’intel·ligència: saber quan recuperar, quan utilitzar eines i quan respondre directament. L’Agentic RAG ofereix aquesta intel·ligència”.


























