📄 Paper de la Semana: Agentic RAG
- Paper: Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG
- Autores: Singh et al.
- Publicación: 14 de enero, 2026
- GitHub: asinghcsu/AgenticRAG-Survey
🎯 ¿Por qué es relevante?
El RAG (Retrieval-Augmented Generation) tradicional tiene un límite claro: es pasivo. Recupera documentos basados en similitud y reza para que la respuesta esté ahí. Agentic RAG rompe esa barrera introduciendo agentes que razonan sobre lo que necesitan buscar, evalúan la calidad de lo recuperado y refinan su estrategia en tiempo real. Este survey es el mapa definitivo para entender cómo la búsqueda está pasando de ser un proceso estático a un flujo de trabajo agéntico dinámico.
🔬 Detalles Técnicos
El paper clasifica los sistemas de Agentic RAG en una taxonomía basada en niveles de autonomía y razonamiento:
- Razonamiento Agéntico (Agentic Reasoning): El núcleo del sistema. En lugar de un simple retrieve-then-generate, el modelo utiliza patrones como ReAct o ToT (Tree of Thoughts) para descomponer preguntas complejas en sub-tareas de búsqueda.
- Uso de Herramientas (Tool Use): El agente no solo busca en bases vectoriales; tiene acceso a APIs, calculadoras o motores de búsqueda web (como Google/Bing) para complementar su conocimiento.
- Planificación Activa:
- Self-Correction: Si la información recuperada es irrelevante, el agente lo detecta y reformula la query.
- Multi-hop Retrieval: Para preguntas que requieren conectar hechos dispersos (e.g., “¿El CEO de la empresa que compró GitHub nació en un año bisiesto?”), el agente ejecuta múltiples rondas de búsqueda secuenciales.
Diferencia clave: Mientras RAG estándar es un camino de una sola vía (Query → Contexto → Respuesta), Agentic RAG es un bucle (Pensar → Actuar → Observar → Repetir).
💡 Opinión
Estamos viendo la comoditización de la inteligencia “lenta” aplicada a la búsqueda. Agentic RAG no es solo “mejor búsqueda”, es delegar la responsabilidad de la investigación al modelo. El coste de inferencia aumenta (más tokens, más llamadas), pero para tareas complejas donde la precisión es innegociable (legal, médica, análisis financiero), este enfoque se convertirá en el estándar de facto en 2026.
