خلفية المشروع
تقدم منصة تكنولوجيا قانونية خدمات استشارات قانونية عبر الإنترنت للشركات والأفراد، بمتوسط حجم استشارات يومي يزيد عن 3000 استشارة. استخدمت المنصة سابقًا نماذج كبيرة عامة للإجابة على الأسئلة القانونية، ولكن نظرًا للطبيعة المتخصصة والمصطلحات الكثيفة في المجال القانوني، كانت دقة النموذج العام في سيناريوهات الاستشارات القانونية 71% فقط، وبلغ معدل الهلوسة 28%، حيث كان يقدم غالبًا إجابات غامضة أو حتى خاطئة، مما أثر بشكل خطير على مهنية المنصة وثقة المستخدمين. أصبحت المنصة في حاجة ماسة إلى نموذج مخصص يفهم القانون حقًا.
نقاط الألم الرئيسية
الحلول
ضبط نموذج LoRA في المجال القانوني
تم إجراء ضبط نموذج LoRA (التكيف منخفض الرتبة) في المجال القانوني بناءً على ChatGLM-6B، من خلال بناء دقيق لـ 2000 عينة بيانات معنونة عالية الجودة لأسئلة وأجوبة قانونية، تغطي نزاعات العقود، النزاعات العمالية، الملكية الفكرية، قانون الشركات وغيرها من المجالات القانونية الأساسية. بعد الضبط، ارتفعت دقة النموذج من 71% إلى 95%، وانخفض معدل الهلوسة من 28% إلى 4%.
تعزيز المعرفة القانونية
بناء قاعدة معرفة قانونية كمكمل لـ RAG، تضم القوانين واللوائح، والتفسيرات القضائية، والقضايا النموذجية وغيرها من المواد الرسمية. عند الإجابة، يقوم النموذج تلقائيًا باسترجاع النصوص القانونية والقضايا ذات الصلة كمرجع، مما يضمن أن كل إجابة لها أساس قانوني يمكن التحقق منه، لزيادة مصداقية الإجابات ومهنيتها.
تقييم الجودة والتحسين المستمر
إنشاء نظام لتقييم جودة الإجابات القانونية، يقيم مخرجات النموذج تلقائيًا من ثلاثة أبعاد: الدقة، والاكتمال، والامتثال القانوني. واستنادًا إلى المشكلات التي يتم اكتشافها في التقييم، يتم تحديث بيانات التدريب باستمرار، مما يشكل دورة بيانات متسارعة (دولاب بيانات) لضمان تحسين قدرات النموذج بشكل مستمر.
بيانات النتائج
| المؤشر | قبل التحسين | بعد التحسين | التحسن |
|---|---|---|---|
| دقة الاستشارات القانونية | 71% | 95% | 34% |
| معدل الهلوسة | 28% | 4% | 86% |
| دقة استشهاد النصوص القانونية | 55% | 92% | 67% |
| رضا المستخدمين | 62% | 91% | 47% |
الحزمة التقنية
ChatGLM-6B، ضبط LoRA، PEFT، قاعدة المعرفة القانونية، RAG، Python، PyTorch، Hugging Face Transformers