Cómo verificar citas legales con IA y evitar alucinaciones: guía para abogados : Lexiel

El caso que lo cambió todo

En 2023, un abogado estadounidense presentó ante un juez federal un escrito con seis sentencias del Tribunal Supremo de Estados Unidos citadas como precedentes. El juez ordenó verificarlas. Ningúna existía. Las había generado ChatGPT.

El abogado fue sancionado y el caso tuvo repercusión mundial. En España, el riesgo es exactamente el mismo.

Qué es una alucinación de IA en contexto legal

Un modelo de lenguaje generativo (LLM) como GPT-4 o Claude sin acceso a bases de datos verificadas no "busca" información. Genera texto que parece plausible basándose en patrones estadísticos.

En contexto legal, esto significa:

Citar sentencias del Tribunal Supremo que nunca se dictaron
Inventar números de artículo ("Art. 1547 CC" cuando ese artículo no existe o dice otra cosa)
Citar normas derogadas como si estuvieran vigentes
Mezclar la doctrina de dos sentencias distintas y atribuirla a una sola

El problema: El texto generado suena absolutamente convincente. Tiene el formato correcto, la numeración correcta, el lenguaje forense adecuado. No hay ningúna señal externa de que es falso.

Cómo detectar alucinaciones sin herramientas

Si usas un LLM sin verificación, el único método es verificar manualmente:

CENDOJ (cendoj.poderjudicial.es): busca el número ECLI o ROJ de cada sentencia citada

BOE (boe.es): busca el número de artículo y verifica el texto literal
Tribunal Constitucional (tribunalconstitucional.es): para sentencias TC
EUR-Lex (eur-lex.europa.eu): para normativa europea

Este proceso lleva entre 5 y 15 minutos por cita. Si un escrito tiene 8 citas, son 40-120 minutos solo en verificación.

Por qué RAG resuelve el problema en origen

RAG (Retrieval-Augmented Generation) es una arquitectura diferente a la generación pura. El proceso es:

Primero busca: el sistema busca en la base de datos de fuentes verificadas (BOE, CENDOJ, TC) los fragmentos más relevantes para tu consulta

Luego genera: el LLM genera el texto usando exclusivamente los fragmentos recuperados como fuente
Cita la fuente: cada afirmación se vincula al fragmento del que proviene

La diferencia crítica: el modelo no puede inventar algo que no está en la base de datos. Si la sentencia no está indexada, no la cita. Si el artículo no existe, no lo menciona.

Cómo funciona la verificación de citas en Lexiel

Paso 1: Genera el escrito o consulta

Cualquier texto generado por Lexiel o copiado desde otra fuente puede someterse a verificación.

Paso 2: El verificador extrae las referencias

El sistema analiza automáticamente el texto e identifica:

Referencias normativas: "Art. 1902 CC", "Art. 56 ET", "Art. 249.1.5.º LEC"
Referencias jurisprudenciales: "STS 241/2013", "ECLI:ES:TS:2023:1234", "SAP Madrid 456/2022"
Referencias al BOE: "BOE-A-2023-12345", "RD 1007/2023"

Paso 3: Verificación contra fuentes oficiales

Para cada referencia identificada:

Normativa → Consulta el BOE: ¿existe el artículo? ¿Dice lo que se afirma? ¿Está vigente?

Jurisprudencia → Consulta el corpus CENDOJ indexado: ¿existe la sentencia? ¿Contiene el razonamiento citado?

Resultado por cita:

✅ Verificada: existe y el contenido es correcto
⚠️ Revisar: existe pero el contenido no coincide exactamente con lo citado
❓ No verificable: no está en el corpus indexado (puede existir pero no estar indexada)
❌ No encontrada: no existe en las fuentes verificadas

Paso 4: Corrección sugerida

Para las citas ⚠️ y ❌, Lexiel sugiere la referencia correcta más probable basándose en el contexto.

Casos reales donde la verificación salva situaciones

Caso 1: Artículo derogado: Un abogado cita el Art. 1798 CC sobre juego y apuesta. Ese artículo fue modificado por la Ley 13/2011. La verificación alerta que el texto vigente es diferente.

Caso 2: Sentencia mal numerada: Se cita "STS 1523/2022" pero el año correcto es 2021. La verificación lo detecta y sugiere "STS 1523/2021".

Caso 3: Doctrina de otra sentencia: Un LLM genera un párrafo atribuyendo una doctrina concreta a una sentencia real que efectivamente existe pero que trata un tema completamente diferente. La verificación marca ⚠️ porque la sentencia existe pero no contiene ese razonamiento.

Comparativa: ChatGPT vs Lexiel en verificación de citas

Aspecto	ChatGPT / Copilot	Lexiel
Arquitectura	Generación pura (LLM)	RAG (recuperación + generación)
Base de datos	Datos de entrenamiento (corte 2024)	BOE + CENDOJ + TC actualizados
Verificación de citas	❌ No incluida	✅ Automática
Citas inventadas	⚠️ Posible	✅ Prevenido en origen
Responsabilidad profesional	⚠️ Riesgo alto	✅ Riesgo reducido

El estándar mínimo de diligencia profesional

Con la normalización del uso de IA en despachos, los colegios de abogados y la doctrina académica empiezan a definir el estándar mínimo de diligencia profesional:

Verificar toda cita jurisprudencial antes de presentar un escrito
No confiar en afirmaciones de IA sin fuente identificable
Documentar el proceso de verificación cuando se usa IA como herramienta

Usar Lexiel con verificación automática de citas no elimina la responsabilidad del abogado, pero sí proporciona una capa objetiva de control que puede acreditarse ante el colegio si fuera necesario.

Prueba el verificador de citas de Lexiel gratis →