LLM puro: cómo funcionan ChatGPT, Claude y Gemini estándar
Conocimiento congelado en una fecha de corte, sin recuperación documental, alta tasa de alucinación frente a normativa chilena reciente.
Marco normativo aplicable
- Art. 88 Código de Procedimiento Civil — Probidad procesal: incorporar contenido fabricado configura falta de probidad.
- Código de Ética CGAL, Art. 25 — Deber de diligencia y conocimiento del derecho aplicable.
- Ley 21.643 (Karin) — Vigente desde 1 ago 2024. LLM con corte anterior la ignora.
- Ley 21.561 (40 horas) — Implementación gradual desde 26 abr 2024. LLM con corte anterior no la conoce.
Objetivos de aprendizaje
- Comprender la arquitectura básica de un LLM puro: predicción de tokens sin recuperación documental.
- Identificar el corte de entrenamiento y por qué fija un horizonte temporal de respuestas.
- Reconocer dónde aparece el mayor riesgo de alucinación en consultas laborales chilenas.
1. Qué es y cómo opera
Un LLM (Large Language Model) puro es un modelo entrenado con un corpus masivo de texto público — libros, foros, noticias, código — hasta una fecha específica de corte. Su única operación es: dado un contexto de entrada, predecir qué token sigue. Sin acceso a internet, sin biblioteca consultada en tiempo real, sin verificación factual.
Productos de esta categoría: ChatGPT en modo estándar (sin browsing), Claude estándar, Gemini sin Google Search activo. Su fortaleza es la fluidez retórica; su debilidad es que no distingue entre lo que recordó y lo que infirió por similitud.
2. Conocimiento congelado
El "corte de entrenamiento" es el punto donde el modelo dejó de aprender. Para los modelos más usados en práctica laboralista chilena el corte está en torno a 2023–2024. Concretamente:
- Un modelo con corte previo a agosto 2024 entrega la versión derogada del Art. 2 CT (acoso con reiteración como requisito).
- Un modelo con corte previo a abril 2024 no conoce la implementación gradual de la jornada de 42 horas (Ley 21.561).
- Cualquier modificación previsional, jurisprudencia uniforme reciente o circular DT posterior al corte simplemente no existe para el modelo.
El modelo no avisa que su conocimiento está vencido. Tampoco distingue entre lo que sabe con certeza y lo que produce por completación estadística. Cualquier consulta sobre normativa reciente recibe respuesta sin advertencia.
3. Por qué alucina
Cuando el modelo no encontró un patrón confiable durante el entrenamiento, sigue produciendo texto — porque está optimizado para fluidez, no para silencio. El resultado son frases bien construidas con contenido fabricado: Roles inexistentes, dictámenes Ord. inventados, citas literales del Código del Trabajo que no figuran en él. Esto se conoce como alucinación.
La alucinación es más peligrosa cuando produce material plausible. Un Rol "12.345-2022" tiene formato correcto; un dictamen "Ord. 4934/0220" suena verosímil. Solo verificación contra la fuente puede descartar.
4. Riesgo concreto en práctica laboralista
Tres situaciones típicas donde un LLM puro produce daño profesional:
- Demanda con cita jurisprudencial inventada → defecto formal del escrito y exposición a sanción procesal por falta de probidad (Art. 88 CPC).
- Cálculo de indemnización con norma derogada → la base legal del cálculo es incorrecta. La pretensión queda atada a un monto erróneo y no se puede ampliar fácilmente en juicio.
- Asesoría con "el plazo es de 60 días" sin precisar hábiles vs corridos ni norma de origen → el cliente actúa fuera de plazo y pierde la acción.
5. Cuándo sí usar un LLM puro
Un LLM puro es útil cuando la verificación está integrada por defecto en la tarea:
- Reformular un párrafo redactado por el abogado (estilo, no sustancia).
- Producir un primer borrador estructural que será corregido contra fuente.
- Brainstorm de argumentos a evaluar críticamente.
Es peligroso o inútil para:
- Citar normas con inciso/numeral.
- Citar jurisprudencia con Rol verificable.
- Calcular cifras con topes (90 UF, 81,6 UF, 4,75 IMM).
- Resolver dudas sobre vigencia.
Mini autoevaluación
Pregunta: Si un LLM puro tiene corte de entrenamiento abril 2024 y le preguntas sobre acoso laboral, ¿qué versión del Art. 2 CT usará?
Ver respuesta
La versión post-Ley 21.643 ya estaba vigente desde el 1 de agosto de 2024. Como el corte es abril 2024, el modelo no tiene la versión vigente: va a entregar la versión pre-Karin que exigía reiteración. Cualquier asesoría basada en esa respuesta queda expuesta al Art. 88 CPC y al deber de diligencia del Art. 25 del Código de Ética CGAL.
Próxima lección
1.3 — RAG: cómo cambia el panorama cuando el modelo consulta una biblioteca antes de responder, y por qué la recuperación documental reduce alucinación pero no la elimina.
Preguntas frecuentes
¿Puedo confiar en ChatGPT si solo lo uso para estilo?
Sí, dentro de ese límite. Reformular un párrafo redactado por ti es bajo riesgo. El problema aparece cuando el modelo genera contenido sustantivo (norma, cálculo, jurisprudencia) que no estaba en tu redacción original.
¿Cómo sé el corte de entrenamiento de un modelo?
Pregúntale directamente: "¿Cuál es tu fecha de corte de entrenamiento?". La mayoría de modelos responde la fecha aproximada. Igual conviene verificar en la documentación oficial del proveedor.
¿Un modelo más nuevo elimina la alucinación?
No. Los modelos más nuevos alucinan menos en promedio, pero la alucinación es estructural a la arquitectura: el modelo está optimizado para fluidez, no para silencio. La única garantía real es verificación contra fuente.