项目背景
某法律科技平台为企业和个人提供在线法律咨询服务,日均咨询量超过3000次。平台此前使用通用大模型回答法律问题,但法律领域专业性强、术语密集,通用模型在法律咨询场景下的准确率仅为71%,幻觉率高达28%,经常给出似是而非甚至错误的建议,严重影响平台专业性和用户信任度。平台迫切需要一个真正懂法律的专属模型。
核心痛点
解决方案
法律领域LoRA微调
基于ChatGLM-6B进行法律领域LoRA(Low-Rank Adaptation)微调,精心构建2000条高质量法律问答标注数据,涵盖合同纠纷、劳动争议、知识产权、公司法等核心法律领域。微调后模型准确率从71%提升至95%,幻觉率从28%降至4%。
法律知识增强
构建法律知识库作为RAG补充,收录法律法规、司法解释、典型案例等权威资料。模型回答时自动检索相关法条和案例作为依据,确保每个回答都有法律依据可查,进一步提升回答的可信度和专业性。
质量评估与持续迭代
建立法律回答质量评估体系,从准确性、完整性、合规性三个维度自动评估模型输出。针对评估中发现的问题持续补充训练数据,形成数据飞轮,确保模型能力持续提升。
效果数据
| 指标 | 改造前 | 改造后 | 提升 |
|---|---|---|---|
| 法律咨询准确率 | 71% | 95% | 34% |
| 幻觉率 | 28% | 4% | 86% |
| 法条引用正确率 | 55% | 92% | 67% |
| 用户满意度 | 62% | 91% | 47% |
技术栈
ChatGLM-6B、LoRA微调、PEFT、法律知识库、RAG、Python、PyTorch、Hugging Face Transformers