中芸汇科技
عامAIضبط النموذجقاعدة المعرفةالصين

مشروع ضبط نموذج خاص بمنصة تكنولوجيا قانونية

مشروع ضبط نموذج خاص بمنصة تكنولوجيا قانونية

خلفية المشروع

تقدم منصة تكنولوجيا قانونية خدمات استشارات قانونية عبر الإنترنت للشركات والأفراد، بمتوسط حجم استشارات يومي يزيد عن 3000 استشارة. استخدمت المنصة سابقًا نماذج كبيرة عامة للإجابة على الأسئلة القانونية، ولكن نظرًا للطبيعة المتخصصة والمصطلحات الكثيفة في المجال القانوني، كانت دقة النموذج العام في سيناريوهات الاستشارات القانونية 71% فقط، وبلغ معدل الهلوسة 28%، حيث كان يقدم غالبًا إجابات غامضة أو حتى خاطئة، مما أثر بشكل خطير على مهنية المنصة وثقة المستخدمين. أصبحت المنصة في حاجة ماسة إلى نموذج مخصص يفهم القانون حقًا.

نقاط الألم الرئيسية

  • انخفاض دقة الاستشارات القانونية: دقة النموذج العام لا تتجاوز 71%، مما لا يلبي متطلبات المهنية في الخدمات القانونية.
  • معدل هلاوس مرتفع جدًا: 28% من الإجابات تحتوي على صياغة مزيفة لنصوص قانونية أو استشهادات خاطئة، مما يشكل مخاطر مهنية.
  • فهم ضعيف للمصطلحات القانونية: النموذج العام لا يفهم جيدًا المصطلحات القانونية الخاصة والاستشهادات بالنصوص.
  • تكلفة عالية لوسم البيانات: البيانات المعنونة عالية الجودة في المجال القانوني نادرة، وتكاليف الوسم مرتفعة.
  • الحلول

    ضبط نموذج LoRA في المجال القانوني

    تم إجراء ضبط نموذج LoRA (التكيف منخفض الرتبة) في المجال القانوني بناءً على ChatGLM-6B، من خلال بناء دقيق لـ 2000 عينة بيانات معنونة عالية الجودة لأسئلة وأجوبة قانونية، تغطي نزاعات العقود، النزاعات العمالية، الملكية الفكرية، قانون الشركات وغيرها من المجالات القانونية الأساسية. بعد الضبط، ارتفعت دقة النموذج من 71% إلى 95%، وانخفض معدل الهلوسة من 28% إلى 4%.

    تعزيز المعرفة القانونية

    بناء قاعدة معرفة قانونية كمكمل لـ RAG، تضم القوانين واللوائح، والتفسيرات القضائية، والقضايا النموذجية وغيرها من المواد الرسمية. عند الإجابة، يقوم النموذج تلقائيًا باسترجاع النصوص القانونية والقضايا ذات الصلة كمرجع، مما يضمن أن كل إجابة لها أساس قانوني يمكن التحقق منه، لزيادة مصداقية الإجابات ومهنيتها.

    تقييم الجودة والتحسين المستمر

    إنشاء نظام لتقييم جودة الإجابات القانونية، يقيم مخرجات النموذج تلقائيًا من ثلاثة أبعاد: الدقة، والاكتمال، والامتثال القانوني. واستنادًا إلى المشكلات التي يتم اكتشافها في التقييم، يتم تحديث بيانات التدريب باستمرار، مما يشكل دورة بيانات متسارعة (دولاب بيانات) لضمان تحسين قدرات النموذج بشكل مستمر.

    بيانات النتائج

    المؤشرقبل التحسينبعد التحسينالتحسن
    دقة الاستشارات القانونية71%95%34%
    معدل الهلوسة28%4%86%
    دقة استشهاد النصوص القانونية55%92%67%
    رضا المستخدمين62%91%47%

    الحزمة التقنية

    ChatGLM-6B، ضبط LoRA، PEFT، قاعدة المعرفة القانونية، RAG، Python، PyTorch، Hugging Face Transformers

    أصبح النموذج بعد الضبط يفهم القانون حقًا، وبدأ المحامون يثقون في توصيات الذكاء الاصطناعي. هذه هي الخطوة الرئيسية من نموذج عام إلى نموذج متخصص.