Módulo 0 · Lección 1.3 Fundamentos 6 min lectura

RAG: cuando el LLM consulta una biblioteca antes de responder

Cómo la recuperación documental reduce alucinación pero no la elimina, y por qué un RAG sobre web abierta sigue siendo riesgoso para derecho laboral chileno.

Marco normativo aplicable

Publicada: 27 abr 2026 · Actualizada: 27 abr 2026 · 6 min lectura · Nivel: Fundamentos

Objetivos de aprendizaje

  1. Comprender qué agrega RAG (Retrieval-Augmented Generation) sobre un LLM puro.
  2. Distinguir RAG genérico (web abierta) de RAG sobre corpus jurídico verificado.
  3. Identificar los límites de RAG: por qué reduce alucinación pero no la elimina.

1. Qué es RAG

RAG es una arquitectura que combina dos pasos: primero recuperar fragmentos relevantes de un corpus indexado; segundo generar la respuesta condicionada a esos fragmentos. El LLM ya no responde "de memoria": responde leyendo lo que el sistema le pasa como contexto.

Productos de esta categoría: ChatGPT con browsing activo, Perplexity, Gemini con Google Search, Claude con conexión a corpus privado. La capa de recuperación puede ser:

2. Qué problema resuelve

RAG ataca la causa principal de alucinación: la falta de fuente en el momento de generar. Cuando el modelo recibe el texto literal del Art. 172 inc. 2 CT en su contexto, ya no necesita "recordar" la norma — la lee. La respuesta puede citar fragmento exacto.

También resuelve parcialmente el problema del corte de entrenamiento: si el corpus indexado se actualiza, una norma de 2026 puede aparecer en respuestas aunque el modelo base sea anterior.

3. Por qué RAG no es suficiente para derecho laboral chileno

3.1 Calidad del corpus

RAG sobre web abierta hereda la calidad de Google. Una búsqueda sobre "indemnización por años de servicio Chile" devuelve mezcla de fuentes oficiales (BCN, Dirección del Trabajo, Poder Judicial) con sitios desactualizados, blogs con errores y consultas de foros. El modelo elige el fragmento "más relevante semánticamente", no el más autoritativo. Resultado: puede citar correctamente la norma con referencia a un blog que la malinterpreta.

3.2 Sin control de vigencia

Un buscador genérico no sabe que la versión del Art. 2 CT del 2022 está derogada. Si el blog mejor posicionado para esa keyword cita la versión vieja, el RAG la entrega como vigente. La capa de recuperación es ciega al eje temporal.

3.3 Sin reglas determinísticas

RAG no calcula. Si el problema es "indemnización con remuneración variable", RAG entrega texto sobre la fórmula, pero la aritmética sigue siendo generación. Topes (90 UF, 81,6 UF), promedios (Art. 172 inc. 2 CT — últimos 3 meses), gratificaciones proporcionales (Art. 50 CT, tope 4,75 IMM/12) — todo queda en manos del LLM, que sigue propenso a errores aritméticos.

4. RAG bien hecho vs RAG mal hecho

DimensiónRAG mal hechoRAG bien hecho
CorpusWeb abierta sin curarCódigo del Trabajo + leyes especiales con marca de vigencia + jurisprudencia DT y CS
RecuperaciónSolo semánticaLéxica + semántica + filtro por fecha vigente
CitaGenérica ("según el CT")Inciso/numeral + URL a fuente oficial
CálculoEl LLM produce el númeroMódulo determinístico aplica fórmula con valores 2026
Output cuando no hay fuenteInventaDeclara "no encontrado"

5. Cuándo conviene RAG genérico en práctica laboralista

RAG genérico (Perplexity, ChatGPT con browsing) es útil para investigación preliminar — entender un concepto general, identificar normativa aplicable, encontrar el dictamen relevante. No es seguro para producir texto que entrará a un escrito procesal sin verificación humana. La diferencia entre "consultar" y "redactar" es la frontera operativa.

Mini autoevaluación

Pregunta: Tu cliente pregunta "¿cuál es el plazo para denunciar acoso laboral hoy?". Usas un RAG sobre web abierta. ¿Qué riesgo persiste?

Ver respuesta

El sistema puede recuperar un artículo periodístico anterior a la Ley 21.643 que diga "30 días desde el último episodio de reiteración". La respuesta sonará fundamentada (cita la fuente), pero la fuente está desactualizada y el RAG no sabe distinguir vigencia. Riesgo: asesoría errónea con apariencia de respaldo. La solución es un asistente con corpus curado y date-aware retrieval — el tema de la próxima lección.

Próxima lección

1.4 — Asistente legal especializado: las cuatro capas que agrega JurisBot frente a un RAG genérico, y por qué la elección entre las tres categorías es de gestión de riesgo profesional.

Preguntas frecuentes

¿Perplexity es seguro para citar en una demanda?

No directamente. Perplexity es buen punto de partida para investigación, pero la cita debe verificarse manualmente: la fuente recuperada puede estar desactualizada, ser un blog secundario o tergiversar la norma original.

¿Si subo el Código del Trabajo a un GPT personalizado, deja de alucinar?

Reduce alucinación sobre normas específicas, pero no elimina dos riesgos clave: (1) cálculos numéricos con topes, que el GPT sigue produciendo por generación; (2) jurisprudencia, si no está en el corpus subido. Es mejor que un LLM puro pero no equivale a un asistente especializado con validador determinístico.

¿Cómo distingo si una herramienta usa RAG o solo LLM puro?

Pregunta sobre normativa muy reciente (posterior al 2024) y observa: si responde con cita a fuente actual con URL/fecha, hay RAG; si responde sin fuente o cita una versión derogada, es LLM puro. También puedes pedirle explícitamente que cite con URL — herramientas con RAG la entregan.

← AnteriorLLM puro Siguiente →Asistente especializado

← Volver al índice del curso   Probar JurisBot →