Cómo verificar citas legales con IA y evitar alucinaciones: guía para abogados
Las alucinaciones de IA son el mayor riesgo para abogados que usan ChatGPT o Copilot. Aprende a detectarlas, evitarlas y cómo funciona la verificación automática de citas en Lexiel contra el BOE y CENDOJ.
El caso que lo cambió todo
En 2023, un abogado estadounidense presentó ante un juez federal un escrito con seis sentencias del Tribunal Supremo de Estados Unidos citadas como precedentes. El juez ordenó verificarlas. Ninguna existía. Las había generado ChatGPT.
El abogado fue sancionado y el caso tuvo repercusión mundial. En España, el riesgo es exactamente el mismo.
Qué es una alucinación de IA en contexto legal
Un modelo de lenguaje generativo (LLM) como GPT-4 o Claude sin acceso a bases de datos verificadas no "busca" información. Genera texto que parece plausible basándose en patrones estadísticos.
En contexto legal, esto significa:
- Citar sentencias del Tribunal Supremo que nunca se dictaron
- Inventar números de artículo ("Art. 1547 CC" cuando ese artículo no existe o dice otra cosa)
- Citar normas derogadas como si estuvieran vigentes
- Mezclar la doctrina de dos sentencias distintas y atribuirla a una sola
El problema: El texto generado suena absolutamente convincente. Tiene el formato correcto, la numeración correcta, el lenguaje forense adecuado. No hay ninguna señal externa de que es falso.
Cómo detectar alucinaciones sin herramientas
Si usas un LLM sin verificación, el único método es verificar manualmente:
- CENDOJ (cendoj.poderjudicial.es): busca el número ECLI o ROJ de cada sentencia citada
- BOE (boe.es): busca el número de artículo y verifica el texto literal
- Tribunal Constitucional (tribunalconstitucional.es): para sentencias TC
- EUR-Lex (eur-lex.europa.eu): para normativa europea
Este proceso lleva entre 5 y 15 minutos por cita. Si un escrito tiene 8 citas, son 40-120 minutos solo en verificación.
Por qué RAG resuelve el problema en origen
RAG (Retrieval-Augmented Generation) es una arquitectura diferente a la generación pura. El proceso es:
- Primero busca: el sistema busca en la base de datos de fuentes verificadas (BOE, CENDOJ, TC) los fragmentos más relevantes para tu consulta
- Luego genera: el LLM genera el texto usando exclusivamente los fragmentos recuperados como fuente
- Cita la fuente: cada afirmación se vincula al fragmento del que proviene
La diferencia crítica: el modelo no puede inventar algo que no está en la base de datos. Si la sentencia no está indexada, no la cita. Si el artículo no existe, no lo menciona.
Cómo funciona la verificación de citas en Lexiel
Paso 1: Genera el escrito o consulta
Cualquier texto generado por Lexiel o copiado desde otra fuente puede someterse a verificación.
Paso 2: El verificador extrae las referencias
El sistema analiza automáticamente el texto e identifica:
- Referencias normativas: "Art. 1902 CC", "Art. 56 ET", "Art. 249.1.5.º LEC"
- Referencias jurisprudenciales: "STS 241/2013", "ECLI:ES:TS:2023:1234", "SAP Madrid 456/2022"
- Referencias al BOE: "BOE-A-2023-12345", "RD 1007/2023"
Paso 3: Verificación contra fuentes oficiales
Para cada referencia identificada:
Normativa → Consulta el BOE: ¿existe el artículo? ¿Dice lo que se afirma? ¿Está vigente?
Jurisprudencia → Consulta el corpus CENDOJ indexado: ¿existe la sentencia? ¿Contiene el razonamiento citado?
Resultado por cita:
- ✅ Verificada: existe y el contenido es correcto
- ⚠️ Revisar: existe pero el contenido no coincide exactamente con lo citado
- ❓ No verificable: no está en el corpus indexado (puede existir pero no estar indexada)
- ❌ No encontrada: no existe en las fuentes verificadas
Paso 4: Corrección sugerida
Para las citas ⚠️ y ❌, Lexiel sugiere la referencia correcta más probable basándose en el contexto.
Casos reales donde la verificación salva situaciones
Caso 1: Artículo derogado: Un abogado cita el Art. 1798 CC sobre juego y apuesta. Ese artículo fue modificado por la Ley 13/2011. La verificación alerta que el texto vigente es diferente.
Caso 2: Sentencia mal numerada: Se cita "STS 1523/2022" pero el año correcto es 2021. La verificación lo detecta y sugiere "STS 1523/2021".
Caso 3: Doctrina de otra sentencia: Un LLM genera un párrafo atribuyendo una doctrina concreta a una sentencia real que efectivamente existe pero que trata un tema completamente diferente. La verificación marca ⚠️ porque la sentencia existe pero no contiene ese razonamiento.
Comparativa: ChatGPT vs Lexiel en verificación de citas
| Aspecto | ChatGPT / Copilot | Lexiel |
|---|---|---|
| Arquitectura | Generación pura (LLM) | RAG (recuperación + generación) |
| Base de datos | Datos de entrenamiento (corte 2024) | BOE + CENDOJ + TC actualizados |
| Verificación de citas | ❌ No incluida | ✅ Automática |
| Citas inventadas | ⚠️ Posible | ✅ Prevenido en origen |
| Responsabilidad profesional | ⚠️ Riesgo alto | ✅ Riesgo reducido |
El estándar mínimo de diligencia profesional
Con la normalización del uso de IA en despachos, los colegios de abogados y la doctrina académica empiezan a definir el estándar mínimo de diligencia profesional:
- Verificar toda cita jurisprudencial antes de presentar un escrito
- No confiar en afirmaciones de IA sin fuente identificable
- Documentar el proceso de verificación cuando se usa IA como herramienta
Usar Lexiel con verificación automática de citas no elimina la responsabilidad del abogado, pero sí proporciona una capa objetiva de control que puede acreditarse ante el colegio si fuera necesario.
Prueba Lexiel gratis · 28 días
Usa el código LEX-BLOG para obtener el doble del período de prueba estándar. Cancela cuando quieras, sin compromiso.