Módulo 0 · Lección 1.3 Fundamentos 6 min lectura

RAG: cuando el LLM consulta una biblioteca antes de responder

Cómo la recuperación documental reduce alucinación pero no la elimina, y por qué un RAG sobre web abierta sigue siendo riesgoso para derecho laboral chileno.

Marco normativo aplicable

Art. 172 inc. 2 Código del Trabajo — Cálculo con remuneración variable: aritmética que RAG no garantiza.
Art. 50 Código del Trabajo — Tope gratificación legal 4,75 IMM/12; un RAG genérico puede omitirlo.
Art. 2 Código del Trabajo (texto post-Ley 21.643) — RAG sobre web abierta puede recuperar versiones derogadas.

Publicada: 27 abr 2026 · Actualizada: 27 abr 2026 · 6 min lectura · Nivel: Fundamentos

Objetivos de aprendizaje

Comprender qué agrega RAG (Retrieval-Augmented Generation) sobre un LLM puro.
Distinguir RAG genérico (web abierta) de RAG sobre corpus jurídico verificado.
Identificar los límites de RAG: por qué reduce alucinación pero no la elimina.

1. Qué es RAG

RAG es una arquitectura que combina dos pasos: primero recuperar fragmentos relevantes de un corpus indexado; segundo generar la respuesta condicionada a esos fragmentos. El LLM ya no responde "de memoria": responde leyendo lo que el sistema le pasa como contexto.

Productos de esta categoría: ChatGPT con browsing activo, Perplexity, Gemini con Google Search, Claude con conexión a corpus privado. La capa de recuperación puede ser:

Buscador web genérico: el modelo lee resultados de Google/Bing en tiempo real.
Vector store sobre documentos privados: el modelo lee fragmentos de una carpeta o base curada.
Híbrido: búsqueda léxica (palabras clave) más búsqueda semántica (embeddings).

2. Qué problema resuelve

RAG ataca la causa principal de alucinación: la falta de fuente en el momento de generar. Cuando el modelo recibe el texto literal del Art. 172 inc. 2 CT en su contexto, ya no necesita "recordar" la norma — la lee. La respuesta puede citar fragmento exacto.

También resuelve parcialmente el problema del corte de entrenamiento: si el corpus indexado se actualiza, una norma de 2026 puede aparecer en respuestas aunque el modelo base sea anterior.

3. Por qué RAG no es suficiente para derecho laboral chileno

3.1 Calidad del corpus

RAG sobre web abierta hereda la calidad de Google. Una búsqueda sobre "indemnización por años de servicio Chile" devuelve mezcla de fuentes oficiales (BCN, Dirección del Trabajo, Poder Judicial) con sitios desactualizados, blogs con errores y consultas de foros. El modelo elige el fragmento "más relevante semánticamente", no el más autoritativo. Resultado: puede citar correctamente la norma con referencia a un blog que la malinterpreta.

3.2 Sin control de vigencia

Un buscador genérico no sabe que la versión del Art. 2 CT del 2022 está derogada. Si el blog mejor posicionado para esa keyword cita la versión vieja, el RAG la entrega como vigente. La capa de recuperación es ciega al eje temporal.

3.3 Sin reglas determinísticas

RAG no calcula. Si el problema es "indemnización con remuneración variable", RAG entrega texto sobre la fórmula, pero la aritmética sigue siendo generación. Topes (90 UF, 81,6 UF), promedios (Art. 172 inc. 2 CT — últimos 3 meses), gratificaciones proporcionales (Art. 50 CT, tope 4,75 IMM/12) — todo queda en manos del LLM, que sigue propenso a errores aritméticos.

4. RAG bien hecho vs RAG mal hecho

Dimensión	RAG mal hecho	RAG bien hecho
Corpus	Web abierta sin curar	Código del Trabajo + leyes especiales con marca de vigencia + jurisprudencia DT y CS
Recuperación	Solo semántica	Léxica + semántica + filtro por fecha vigente
Cita	Genérica ("según el CT")	Inciso/numeral + URL a fuente oficial
Cálculo	El LLM produce el número	Módulo determinístico aplica fórmula con valores 2026
Output cuando no hay fuente	Inventa	Declara "no encontrado"

5. Cuándo conviene RAG genérico en práctica del derecho laboral

RAG genérico (Perplexity, ChatGPT con browsing) es útil para investigación preliminar — entender un concepto general, identificar normativa aplicable, encontrar el dictamen relevante. No es seguro para producir texto que entrará a un escrito procesal sin verificación humana. La diferencia entre "consultar" y "redactar" es la frontera operativa.

Mini autoevaluación

Pregunta: Tu cliente pregunta "¿cuál es el plazo para denunciar acoso laboral hoy?". Usas un RAG sobre web abierta. ¿Qué riesgo persiste?

Ver respuesta

El sistema puede recuperar un artículo periodístico anterior a la Ley 21.643 que diga "30 días desde el último episodio de reiteración". La respuesta sonará fundamentada (cita la fuente), pero la fuente está desactualizada y el RAG no sabe distinguir vigencia. Riesgo: asesoría errónea con apariencia de respaldo. La solución es un asistente con corpus curado y date-aware retrieval — el tema de la próxima lección.

Próxima lección

1.4 — Asistente legal especializado: las cuatro capas que agrega JurisBot frente a un RAG genérico, y por qué la elección entre las tres categorías es de gestión de riesgo profesional.

Preguntas frecuentes

¿Perplexity es seguro para citar en una demanda?

No directamente. Perplexity es buen punto de partida para investigación, pero la cita debe verificarse manualmente: la fuente recuperada puede estar desactualizada, ser un blog secundario o tergiversar la norma original.

¿Si subo el Código del Trabajo a un GPT personalizado, deja de alucinar?

Reduce alucinación sobre normas específicas, pero no elimina dos riesgos clave: (1) cálculos numéricos con topes, que el GPT sigue produciendo por generación; (2) jurisprudencia, si no está en el corpus subido. Es mejor que un LLM puro pero no equivale a un asistente especializado con validador determinístico.

¿Cómo distingo si una herramienta usa RAG o solo LLM puro?

Pregunta sobre normativa muy reciente (posterior al 2024) y observa: si responde con cita a fuente actual con URL/fecha, hay RAG; si responde sin fuente o cita una versión derogada, es LLM puro. También puedes pedirle explícitamente que cite con URL — herramientas con RAG la entregan.

← AnteriorLLM puro Siguiente →Asistente especializado

← Volver al índice del curso Probar JurisBot →