El 70% de los proyectos de RAG (Retrieval Augmented Generation) que hemos auditado en 2025 estaban abandonados o en uso marginal seis meses después del lanzamiento. La causa no fue el modelo, casi nunca lo es. Fue una combinación de mala ingesta, mala recuperación y ausencia de evaluación. Este estudio resume lo que sí funciona.
La ingesta es el 60% del éxito
Un RAG es tan bueno como los documentos que indexa. Ingestar PDFs sin estructura, sin metadatos y sin control de versiones es la receta para un buscador que devuelve respuestas plausibles pero incorrectas. La inversión en parsing decente, chunking semántico y enriquecimiento con metadatos paga más que cualquier optimización posterior del modelo.
Recuperación híbrida, no solo vectorial
La búsqueda puramente vectorial pierde sistemáticamente contra una recuperación híbrida (BM25 + denso + reranker). En nuestros benchmarks internos, añadir BM25 y un reranker basado en cross-encoder sube el recall@5 entre 18 y 27 puntos sobre vectorial sola. Es la mejora individual con mejor relación coste-beneficio.
- Chunking por estructura semántica (secciones, no tamaño fijo).
- Metadatos enriquecidos: autor, fecha, departamento, versión, nivel de confidencialidad.
- Recuperación híbrida: BM25 + denso + reranker.
- Citas explícitas en cada respuesta, con enlace al fragmento exacto.
- Evaluación continua sobre un conjunto dorado de 100-300 preguntas reales.
Sin evaluación no hay mejora
Ningún RAG que llegó a producción funcionando lo hizo sin un conjunto dorado de preguntas y respuestas mantenido por el negocio. Las métricas que importan no son ROUGE ni BLEU: son fidelidad (la respuesta se apoya en las fuentes), cobertura (las preguntas tienen respuesta cuando deberían tenerla) y rechazo (no se inventa cuando no debería). Sin estas tres medidas activas, no se sabe si el sistema mejora o empeora.
Adopción interna
El último kilómetro es organizativo. Un RAG que requiere abrir otra pestaña es un RAG abandonado. Los que sobreviven se integran donde el usuario ya trabaja: dentro del helpdesk, dentro del CRM, dentro de Teams o Slack. La integración no es un detalle de UI, es lo que decide si la inversión se amortiza.
Conclusión
RAG no es magia, es ingeniería bien hecha aplicada a un problema concreto. Los proyectos que tratan el problema como un experimento de IA fracasan. Los que lo tratan como un proyecto de búsqueda empresarial con un modelo de lenguaje encima, funcionan. La diferencia está en quién lidera el proyecto: si lidera un científico de datos, suele fallar; si lidera alguien que entiende cómo busca información el usuario final, suele triunfar.



