中芸汇科技
GeneralAIAjuste fino de modeloBase de conocimientosChina

Proyecto de ajuste fino de modelo sectorial para una plataforma de tecnología legal

Proyecto de ajuste fino de modelo sectorial para una plataforma de tecnología legal

Antecedentes del proyecto

Una plataforma de tecnología legal ofrece servicios de consulta jurídica en línea a empresas y particulares, con un volumen diario superior a las 3000 consultas. Anteriormente, la plataforma respondía a las preguntas legales con modelos grandes genéricos. Sin embargo, el ámbito jurídico es altamente especializado y denso en terminología, por lo que la precisión de esos modelos en escenarios de consulta legal era solo del 71 %, con una tasa de alucinaciones del 28 %. Con frecuencia se generaban respuestas plausibles pero erróneas, lo que perjudicaba gravemente la profesionalidad de la plataforma y la confianza de los usuarios. Se necesitaba con urgencia un modelo exclusivo que comprendiera realmente el derecho.

Principales desafíos

  • Baja precisión en la consulta jurídica: la precisión del modelo genérico era solo del 71 %, muy por debajo de las exigencias propias de los servicios legales.
  • Tasa de alucinaciones muy elevada: el 28 % de las respuestas contenía artículos inventados o referencias incorrectas, lo que suponía un riesgo profesional.
  • Comprensión deficiente de la terminología jurídica: el modelo genérico no interpretaba correctamente los términos especializados ni las citas normativas.
  • Elevado coste de anotación de datos: los datos anotados de alta calidad en el ámbito jurídico son escasos y costosos de producir.
  • Solución

    Ajuste fino LoRA en el ámbito jurídico

    Se aplicó un ajuste fino mediante LoRA (Low‑Rank Adaptation) sobre ChatGLM‑6B, utilizando un conjunto cuidadosamente elaborado de 2000 pares de preguntas y respuestas jurídicas anotadas, que abarcan áreas como disputas contractuales, derecho laboral, propiedad intelectual y derecho societario. Tras el ajuste, la precisión pasó del 71 % al 95 % y la tasa de alucinaciones se redujo del 28 % al 4 %.

    Mejora con conocimiento jurídico

    Se construyó una base de conocimiento jurídico como complemento RAG, que incorpora normativa, interpretaciones judiciales, jurisprudencia relevante y otras fuentes autorizadas. Al responder, el modelo recupera automáticamente los artículos y casos pertinentes para fundamentar sus respuestas, garantizando así que cada respuesta esté respaldada por fuentes legales verificables, lo que incrementa la credibilidad y el rigor profesional.

    Evaluación de calidad y mejora continua

    Se estableció un sistema de evaluación de la calidad de las respuestas jurídicas, que mide automáticamente precisión, integridad y conformidad normativa. Los problemas detectados se utilizan para ampliar y refinar continuamente los datos de entrenamiento, creando un ciclo virtuoso de datos que permite una mejora constante del modelo.

    Datos de resultado

    IndicadorAntesDespuésMejora
    Precisión de la consulta legal71 %95 %34 %
    Tasa de alucinaciones28 %4 %86 %
    Tasa de citas correctas de normativa55 %92 %67 %
    Satisfacción del usuario62 %91 %47 %

    Stack tecnológico

    ChatGLM‑6B, ajuste fino LoRA, PEFT, base de conocimientos jurídicos, RAG, Python, PyTorch, Hugging Face Transformers

    El modelo ajustado ahora realmente entiende de derecho. Los abogados están empezando a confiar en las recomendaciones de la IA. Es el paso clave que nos ha llevado de un modelo genérico a uno especializado.