Contexto do Projeto
Uma plataforma de tecnologia jurídica oferece serviços de consultoria jurídica online para empresas e indivíduos, com um volume médio diário de mais de 3.000 consultas. Anteriormente, a plataforma utilizava modelos de linguagem genéricos para responder a questões jurídicas, porém o domínio jurídico é altamente especializado e denso em terminologia. Os modelos genéricos alcançavam apenas 71% de precisão em cenários de consultoria jurídica, com uma taxa de alucinação de 28%, frequentemente fornecendo sugestões imprecisas ou até incorretas, afetando seriamente a profissionalidade da plataforma e a confiança dos usuários. A plataforma precisava urgentemente de um modelo exclusivo que realmente entendesse a lei.
Principais Dores
Solução
Ajuste Fino LoRA no Domínio Jurídico
Realizamos o ajuste fino LoRA (Low-Rank Adaptation) no ChatGLM-6B para o domínio jurídico, construindo cuidadosamente 2.000 dados anotados de perguntas e respostas jurídicas de alta qualidade, abrangendo áreas jurídicas principais como disputas contratuais, conflitos trabalhistas, propriedade intelectual e direito societário. Após o ajuste fino, a precisão do modelo aumentou de 71% para 95%, e a taxa de alucinação caiu de 28% para 4%.
Aprimoramento do Conhecimento Jurídico
Construímos uma base de conhecimento jurídico como complemento de RAG (Geração Aumentada por Recuperação), incluindo leis e regulamentos, interpretações judiciais, casos típicos e outras fontes autorizadas. Durante a resposta, o modelo recupera automaticamente artigos legais e casos relevantes como fundamentação, garantindo que cada resposta seja respaldada por fontes jurídicas verificáveis, elevando ainda mais a credibilidade e a profissionalidade das respostas.
Avaliação de Qualidade e Iteração Contínua
Estabelecemos um sistema de avaliação da qualidade das respostas jurídicas, avaliando automaticamente as saídas do modelo em três dimensões: precisão, completude e conformidade. Para os problemas identificados na avaliação, complementamos continuamente os dados de treinamento, criando um ciclo de dados virtuoso que assegura a melhoria contínua das capacidades do modelo.
Dados de Resultados
| Indicador | Antes | Depois | Melhoria |
|---|---|---|---|
| Precisão da consultoria jurídica | 71% | 95% | 34% |
| Taxa de alucinação | 28% | 4% | 86% |
| Taxa de citação correta de artigos legais | 55% | 92% | 67% |
| Satisfação do usuário | 62% | 91% | 47% |
Stack Tecnológica
ChatGLM-6B, Ajuste Fino LoRA, PEFT, Base de Conhecimento Jurídico, RAG, Python, PyTorch, Hugging Face Transformers