Antecedentes del proyecto
Una plataforma de tecnología legal ofrece servicios de consulta jurídica en línea a empresas y particulares, con un volumen diario superior a las 3000 consultas. Anteriormente, la plataforma respondía a las preguntas legales con modelos grandes genéricos. Sin embargo, el ámbito jurídico es altamente especializado y denso en terminología, por lo que la precisión de esos modelos en escenarios de consulta legal era solo del 71 %, con una tasa de alucinaciones del 28 %. Con frecuencia se generaban respuestas plausibles pero erróneas, lo que perjudicaba gravemente la profesionalidad de la plataforma y la confianza de los usuarios. Se necesitaba con urgencia un modelo exclusivo que comprendiera realmente el derecho.
Principales desafíos
Solución
Ajuste fino LoRA en el ámbito jurídico
Se aplicó un ajuste fino mediante LoRA (Low‑Rank Adaptation) sobre ChatGLM‑6B, utilizando un conjunto cuidadosamente elaborado de 2000 pares de preguntas y respuestas jurídicas anotadas, que abarcan áreas como disputas contractuales, derecho laboral, propiedad intelectual y derecho societario. Tras el ajuste, la precisión pasó del 71 % al 95 % y la tasa de alucinaciones se redujo del 28 % al 4 %.
Mejora con conocimiento jurídico
Se construyó una base de conocimiento jurídico como complemento RAG, que incorpora normativa, interpretaciones judiciales, jurisprudencia relevante y otras fuentes autorizadas. Al responder, el modelo recupera automáticamente los artículos y casos pertinentes para fundamentar sus respuestas, garantizando así que cada respuesta esté respaldada por fuentes legales verificables, lo que incrementa la credibilidad y el rigor profesional.
Evaluación de calidad y mejora continua
Se estableció un sistema de evaluación de la calidad de las respuestas jurídicas, que mide automáticamente precisión, integridad y conformidad normativa. Los problemas detectados se utilizan para ampliar y refinar continuamente los datos de entrenamiento, creando un ciclo virtuoso de datos que permite una mejora constante del modelo.
Datos de resultado
| Indicador | Antes | Después | Mejora |
|---|---|---|---|
| Precisión de la consulta legal | 71 % | 95 % | 34 % |
| Tasa de alucinaciones | 28 % | 4 % | 86 % |
| Tasa de citas correctas de normativa | 55 % | 92 % | 67 % |
| Satisfacción del usuario | 62 % | 91 % | 47 % |
Stack tecnológico
ChatGLM‑6B, ajuste fino LoRA, PEFT, base de conocimientos jurídicos, RAG, Python, PyTorch, Hugging Face Transformers