中芸汇科技
GeralIAAjuste Fino de ModeloBase de ConhecimentoChina

Projeto de Ajuste Fino de Modelo Específico para uma Plataforma de Tecnologia Jurídica

Projeto de Ajuste Fino de Modelo Específico para uma Plataforma de Tecnologia Jurídica

Contexto do Projeto

Uma plataforma de tecnologia jurídica oferece serviços de consultoria jurídica online para empresas e indivíduos, com um volume médio diário de mais de 3.000 consultas. Anteriormente, a plataforma utilizava modelos de linguagem genéricos para responder a questões jurídicas, porém o domínio jurídico é altamente especializado e denso em terminologia. Os modelos genéricos alcançavam apenas 71% de precisão em cenários de consultoria jurídica, com uma taxa de alucinação de 28%, frequentemente fornecendo sugestões imprecisas ou até incorretas, afetando seriamente a profissionalidade da plataforma e a confiança dos usuários. A plataforma precisava urgentemente de um modelo exclusivo que realmente entendesse a lei.

Principais Dores

  • Baixa precisão na consultoria jurídica: O modelo genérico atingia apenas 71% de precisão, não atendendo aos requisitos de profissionalismo dos serviços jurídicos.
  • Taxa de alucinação extremamente alta: 28% das respostas continham invenção de artigos legais ou citações incorretas, representando riscos à prática profissional.
  • Compreensão insuficiente da terminologia jurídica: O modelo genérico não compreendia adequadamente termos jurídicos específicos e referências a cláusulas.
  • Alto custo de anotação de dados: Dados anotados de alta qualidade no domínio jurídico são escassos, com custos de anotação elevados.
  • Solução

    Ajuste Fino LoRA no Domínio Jurídico

    Realizamos o ajuste fino LoRA (Low-Rank Adaptation) no ChatGLM-6B para o domínio jurídico, construindo cuidadosamente 2.000 dados anotados de perguntas e respostas jurídicas de alta qualidade, abrangendo áreas jurídicas principais como disputas contratuais, conflitos trabalhistas, propriedade intelectual e direito societário. Após o ajuste fino, a precisão do modelo aumentou de 71% para 95%, e a taxa de alucinação caiu de 28% para 4%.

    Aprimoramento do Conhecimento Jurídico

    Construímos uma base de conhecimento jurídico como complemento de RAG (Geração Aumentada por Recuperação), incluindo leis e regulamentos, interpretações judiciais, casos típicos e outras fontes autorizadas. Durante a resposta, o modelo recupera automaticamente artigos legais e casos relevantes como fundamentação, garantindo que cada resposta seja respaldada por fontes jurídicas verificáveis, elevando ainda mais a credibilidade e a profissionalidade das respostas.

    Avaliação de Qualidade e Iteração Contínua

    Estabelecemos um sistema de avaliação da qualidade das respostas jurídicas, avaliando automaticamente as saídas do modelo em três dimensões: precisão, completude e conformidade. Para os problemas identificados na avaliação, complementamos continuamente os dados de treinamento, criando um ciclo de dados virtuoso que assegura a melhoria contínua das capacidades do modelo.

    Dados de Resultados

    IndicadorAntesDepoisMelhoria
    Precisão da consultoria jurídica71%95%34%
    Taxa de alucinação28%4%86%
    Taxa de citação correta de artigos legais55%92%67%
    Satisfação do usuário62%91%47%

    Stack Tecnológica

    ChatGLM-6B, Ajuste Fino LoRA, PEFT, Base de Conhecimento Jurídico, RAG, Python, PyTorch, Hugging Face Transformers

    O modelo ajustado realmente entende a lei, e os advogados começaram a confiar nas sugestões da IA. Este é um passo fundamental de um modelo genérico para um modelo especializado.