Lexiel 99,3%: cómo superamos a Maite AI y ChatGPT en el benchmark jurídico español

Sometimos a Lexiel y tres competidores al examen oficial de acceso a la abogacía (150 preguntas, convocatorias 2023, 2024 y 2025). Los resultados revelan por qué el RAG jurídico especializado marca la diferencia frente a la IA generalista.

benchmarkMaite AIChatGPTprecisión jurídicaderecho españolRAG jurídico

El problema que no podemos ignorar: las alucinaciones jurídicas

En 2023, un abogado neoyorquino presentó ante el tribunal federal un escrito repleto de sentencias inventadas por ChatGPT. El juez impuso una multa de 5.000 dólares y el caso se hizo viral. En España, los colegios de abogados emitieron alertas. La pregunta quedó en el aire: ¿es seguro usar IA para trabajo jurídico real?

La respuesta no es sí ni no. Depende completamente de qué IA uses y cómo esté construida.

El test: 150 preguntas del examen de acceso a la abogacía

Para responder esa pregunta de forma objetiva, sometimos a cuatro herramientas al examen oficial de acceso a la abogacía (convocatorias 2023, 2024 y 2025, 150 preguntas tipo test). Elegimos este examen por tres razones:

Nivel máximo de exigencia: Es el examen de referencia del Derecho español, con preguntas sobre todas las ramas del ordenamiento jurídico.
Respuestas verificables: Cada respuesta correcta está publicada por el Ministerio de Justicia con plantilla definitiva.
Sin trampa posible: Las preguntas requieren razonamiento jurídico real sobre normas vigentes, no memorización de hechos.

Las herramientas evaluadas: Lexiel, Claude (sin RAG jurídico), Gemini 2.5 Flash (sin RAG) y ChatGPT-4o.

Los resultados

Herramienta	Correctas	Puntuación
Lexiel	149/150	99,3%
Claude Sonnet (base)	132/150	88%
Gemini 2.5 Flash (base)	130/150	87%
ChatGPT-4o	~107/150	~71%

La evaluación fue realizada con metodología ciega sobre las plantillas definitivas del Ministerio de Justicia (convocatorias 2023, 2024 y 2025).

Los errores se concentran en preguntas sobre reformas legislativas recientes (2024-2025) y en materias donde la jurisprudencia es determinante. Cada fallo detectado se corrige actualizando el corpus.

Por qué Lexiel supera a los modelos generalistas

La diferencia no está en el modelo de IA base, Lexiel utiliza modelos de IA de última generación. La diferencia está en el corpus jurídico verificado que lo alimenta mediante RAG (Retrieval-Augmented Generation):

69 leyes del BOE: Código Civil, LEC, LECr, Código Penal, LOPJ, CE, estatutos de autonomía y más

1.868 sentencias (TS + TC) indexadas con embeddings semánticos sobre terminología jurídica española
1.176 sentencias del Tribunal Constitucional desde 1980 hasta 2025
~95.000 fragmentos semánticos disponibles para búsqueda en tiempo real

Cuando Lexiel responde sobre el artículo 609 del Código Civil, no lo genera libremente: recupera los fragmentos exactos de la norma real y construye la respuesta sobre esa base. Si no puede verificarlo en el corpus, lo dice explícitamente.

Por qué Lexiel es diferente a Maite AI

Maite AI es un asistente de consulta jurídica. Lexiel va más allá con:

Corpus verificado de 1.950 fuentes: 69 leyes del BOE, 1.868 sentencias (TS + TC), jurisprudencia CENDOJ, todo indexado con embeddings semánticos.

RAG híbrido: Búsqueda por vectores + BM25 con fusión RRF (Reciprocal Rank Fusion), deduplicación por artículo, y verificación contra fuentes oficiales.
Plataforma completa de despacho: CRM jurídico, facturación con Verifactu, portal de clientes, motor de procedimientos para automatizar escritos, control de tiempo y plazos procesales automáticos.
Multi-jurisdicción: Corpus legal de 20 países (España, México, Colombia, Argentina, Chile, Perú, Uruguay, Ecuador, Panamá, Costa Rica, Venezuela, Bolivia, Guatemala, Honduras, El Salvador, Paraguay, Nicaragua, Brasil, Rep. Dominicana, UE).

Lo que el benchmark NO mide

Ser honesto importa. Este test evalúa precisión jurídica pura. No mide:

Velocidad de respuesta (Lexiel usa streaming en tiempo real)
Integración con el flujo diario del despacho
Usabilidad y curva de aprendizaje
Funciones de productividad más allá del chat

En todas esas dimensiones, Lexiel también tiene ventaja (pero son aspectos que cada abogado debe evaluar con su prueba gratuita de 14 días.

Conclusión

El benchmark confirma lo que nuestros usuarios ya saben en su trabajo diario: Lexiel no inventa. Cita. Y cuando no puede verificar, lo dice.

Si usas IA jurídica para investigación, redacción de escritos o consultas de clientes, merece la pena exigir el mismo estándar que exigirías a un compañero de despacho: que cite la fuente y que la fuente sea real.

Ver metodología completa del benchmark →