RAG: cuando el LLM consulta una biblioteca antes de responder
Cómo la recuperación documental reduce alucinación pero no la elimina, y por qué un RAG sobre web abierta sigue siendo riesgoso para derecho laboral chileno.
Marco normativo aplicable
- Art. 172 inc. 2 Código del Trabajo — Cálculo con remuneración variable: aritmética que RAG no garantiza.
- Art. 50 Código del Trabajo — Tope gratificación legal 4,75 IMM/12; un RAG genérico puede omitirlo.
- Art. 2 Código del Trabajo (texto post-Ley 21.643) — RAG sobre web abierta puede recuperar versiones derogadas.
Objetivos de aprendizaje
- Comprender qué agrega RAG (Retrieval-Augmented Generation) sobre un LLM puro.
- Distinguir RAG genérico (web abierta) de RAG sobre corpus jurídico verificado.
- Identificar los límites de RAG: por qué reduce alucinación pero no la elimina.
1. Qué es RAG
RAG es una arquitectura que combina dos pasos: primero recuperar fragmentos relevantes de un corpus indexado; segundo generar la respuesta condicionada a esos fragmentos. El LLM ya no responde "de memoria": responde leyendo lo que el sistema le pasa como contexto.
Productos de esta categoría: ChatGPT con browsing activo, Perplexity, Gemini con Google Search, Claude con conexión a corpus privado. La capa de recuperación puede ser:
- Buscador web genérico: el modelo lee resultados de Google/Bing en tiempo real.
- Vector store sobre documentos privados: el modelo lee fragmentos de una carpeta o base curada.
- Híbrido: búsqueda léxica (palabras clave) más búsqueda semántica (embeddings).
2. Qué problema resuelve
RAG ataca la causa principal de alucinación: la falta de fuente en el momento de generar. Cuando el modelo recibe el texto literal del Art. 172 inc. 2 CT en su contexto, ya no necesita "recordar" la norma — la lee. La respuesta puede citar fragmento exacto.
También resuelve parcialmente el problema del corte de entrenamiento: si el corpus indexado se actualiza, una norma de 2026 puede aparecer en respuestas aunque el modelo base sea anterior.
3. Por qué RAG no es suficiente para derecho laboral chileno
3.1 Calidad del corpus
RAG sobre web abierta hereda la calidad de Google. Una búsqueda sobre "indemnización por años de servicio Chile" devuelve mezcla de fuentes oficiales (BCN, Dirección del Trabajo, Poder Judicial) con sitios desactualizados, blogs con errores y consultas de foros. El modelo elige el fragmento "más relevante semánticamente", no el más autoritativo. Resultado: puede citar correctamente la norma con referencia a un blog que la malinterpreta.
3.2 Sin control de vigencia
Un buscador genérico no sabe que la versión del Art. 2 CT del 2022 está derogada. Si el blog mejor posicionado para esa keyword cita la versión vieja, el RAG la entrega como vigente. La capa de recuperación es ciega al eje temporal.
3.3 Sin reglas determinísticas
RAG no calcula. Si el problema es "indemnización con remuneración variable", RAG entrega texto sobre la fórmula, pero la aritmética sigue siendo generación. Topes (90 UF, 81,6 UF), promedios (Art. 172 inc. 2 CT — últimos 3 meses), gratificaciones proporcionales (Art. 50 CT, tope 4,75 IMM/12) — todo queda en manos del LLM, que sigue propenso a errores aritméticos.
4. RAG bien hecho vs RAG mal hecho
| Dimensión | RAG mal hecho | RAG bien hecho |
|---|---|---|
| Corpus | Web abierta sin curar | Código del Trabajo + leyes especiales con marca de vigencia + jurisprudencia DT y CS |
| Recuperación | Solo semántica | Léxica + semántica + filtro por fecha vigente |
| Cita | Genérica ("según el CT") | Inciso/numeral + URL a fuente oficial |
| Cálculo | El LLM produce el número | Módulo determinístico aplica fórmula con valores 2026 |
| Output cuando no hay fuente | Inventa | Declara "no encontrado" |
5. Cuándo conviene RAG genérico en práctica laboralista
RAG genérico (Perplexity, ChatGPT con browsing) es útil para investigación preliminar — entender un concepto general, identificar normativa aplicable, encontrar el dictamen relevante. No es seguro para producir texto que entrará a un escrito procesal sin verificación humana. La diferencia entre "consultar" y "redactar" es la frontera operativa.
Mini autoevaluación
Pregunta: Tu cliente pregunta "¿cuál es el plazo para denunciar acoso laboral hoy?". Usas un RAG sobre web abierta. ¿Qué riesgo persiste?
Ver respuesta
El sistema puede recuperar un artículo periodístico anterior a la Ley 21.643 que diga "30 días desde el último episodio de reiteración". La respuesta sonará fundamentada (cita la fuente), pero la fuente está desactualizada y el RAG no sabe distinguir vigencia. Riesgo: asesoría errónea con apariencia de respaldo. La solución es un asistente con corpus curado y date-aware retrieval — el tema de la próxima lección.
Próxima lección
1.4 — Asistente legal especializado: las cuatro capas que agrega JurisBot frente a un RAG genérico, y por qué la elección entre las tres categorías es de gestión de riesgo profesional.
Preguntas frecuentes
¿Perplexity es seguro para citar en una demanda?
No directamente. Perplexity es buen punto de partida para investigación, pero la cita debe verificarse manualmente: la fuente recuperada puede estar desactualizada, ser un blog secundario o tergiversar la norma original.
¿Si subo el Código del Trabajo a un GPT personalizado, deja de alucinar?
Reduce alucinación sobre normas específicas, pero no elimina dos riesgos clave: (1) cálculos numéricos con topes, que el GPT sigue produciendo por generación; (2) jurisprudencia, si no está en el corpus subido. Es mejor que un LLM puro pero no equivale a un asistente especializado con validador determinístico.
¿Cómo distingo si una herramienta usa RAG o solo LLM puro?
Pregunta sobre normativa muy reciente (posterior al 2024) y observa: si responde con cita a fuente actual con URL/fecha, hay RAG; si responde sin fuente o cita una versión derogada, es LLM puro. También puedes pedirle explícitamente que cite con URL — herramientas con RAG la entregan.