Cómo funciona el RAG jurídico de Lexiel: investigación legal sin alucinaciones
Explicación técnica y práctica de cómo el RAG jurídico de Lexiel garantiza citas verificadas y elimina las alucinaciones en IA para abogados. Con datos del benchmark oficial 2026.
# Cómo funciona el RAG jurídico de Lexiel: investigación legal sin alucinaciones
El mayor miedo de los abogados al usar inteligencia artificial es legítimo: ¿y si me inventa una sentencia? En Lexiel hemos resuelto este problema con una arquitectura llamada RAG jurídico. En este artículo explicamos cómo funciona.
El problema: los LLMs no "saben" jurisprudencia
Los grandes modelos de lenguaje como GPT-4 o Claude fueron entrenados con texto de internet hasta una fecha de corte. Cuando le preguntas a ChatGPT por sentencias del TS posteriores a 2020, puede responderte con números de sentencia que parecen reales pero que no existen. Esto se llama alucinación y es el mayor riesgo de usar IA generalista en contextos jurídicos.
La solución: RAG (Retrieval-Augmented Generation)
RAG separa dos funciones:
- Recuperación (Retrieval): buscar en una base de datos de documentos reales los fragmentos más relevantes para la consulta
- Generación (Generation): usar esos fragmentos como contexto para que el LLM genere una respuesta basada en datos reales
El LLM no tiene que inventar la información, se la proporcionamos directamente desde fuentes verificadas.
El flujo de una consulta en Lexiel
```
Consulta del abogado
↓
[Embedding de la consulta]
↓
[Búsqueda vectorial en corpus jurídico]
↓
[Top 8 fragmentos más relevantes]
↓
[Contexto → LLM]
↓
Respuesta con citas verificadas
```
El corpus jurídico de Lexiel: más de 7.000 fuentes verificadas
- España: 1.937 fuentes (BOE + CENDOJ: TS, TC, AN), 95.244 preceptos
- LATAM: México (329 leyes), Colombia (4.959 fuentes), Argentina (47 leyes), Chile (42 leyes), Perú (101 fuentes)
- Total global: más de 130.000 fuentes, más de 2.300.000+ preceptos indexados
Chunking a nivel de artículo
En Lexiel dividimos los documentos en fragmentos que corresponden exactamente a un artículo del Código Civil o los fundamentos jurídicos clave de una sentencia. Esto garantiza:
- Coherencia semántica: cada fragmento tiene sentido por sí solo
- Citabilidad exacta: podemos citar "Art. 1964 CC" o "STS 149/2020, FJ 3º"
- Sin ruido: no mezclamos artículos de diferentes materias
Sistema de puntuación y deduplicación
- Umbral mínimo: solo fragmentos con puntuación > 0,72 (escala 0–1)
- Deduplicación: si hay varios fragmentos de la misma fuente, solo se incluye el mejor
- Top 8 fragmentos: más fragmentos = más ruido = peor respuesta
El resultado: 99,3% en el examen oficial
| Sistema | Puntuación |
|---|---|
| Lexiel con RAG | 99,3% |
| Claude Sonnet 4.6 sin RAG | 88% |
| Gemini 2.5 Flash sin RAG | 87% |
| ChatGPT-4o sin RAG | ~71% |
La diferencia entre Lexiel (99,3%) y Claude sin RAG (88%) es pura arquitectura: 7 puntos porcentuales de mejora por tener el corpus jurídico correcto y la búsqueda híbrida.
Ejemplo práctico: cláusula suelo
Sin RAG (ChatGPT):
"La STS 705/2015 establece que las cláusulas suelo son nulas si no superan el control de transparencia."
Problema: la numeración puede ser incorrecta. Verificación manual obligatoria.
Con RAG (Lexiel):
"La STS 705/2015, de 23 de diciembre (ponente: Francisco Marín Castán), FJ 5º, establece que la cláusula suelo no supera el control de transparencia cuando el consumidor no recibió información suficiente sobre su impacto económico."
El abogado puede citar directamente en el escrito con confianza.
Preguntas frecuentes
¿Lexiel actualiza su corpus regularmente?
Sí. El corpus de BOE se actualiza con nuevas disposiciones. El de CENDOJ se actualiza periódicamente con nuevas sentencias del TS.
¿Puedo añadir mis propios documentos al RAG?
Sí. La "Biblioteca del despacho" permite subir documentos propios que se indexan y se incluyen en las búsquedas RAG para tu organización.
¿Qué LLM usa Lexiel?
Lexiel utiliza modelos de IA de última generación seleccionados por su capacidad de razonamiento jurídico y honestidad calibrada. Evaluamos continuamente los mejores modelos del mercado y actualizamos nuestro motor cuando encontramos un modelo con mejor rendimiento en derecho español.
Prueba Lexiel gratis · 28 días
Usa el código LEX-BLOG para obtener el doble del período de prueba estándar. Cancela cuando quieras, sin compromiso.