中芸汇科技
सामान्यAIमॉडल फ़ाइन-ट्यूनिंगज्ञान आधारचीन

एक कानूनी प्रौद्योगिकी प्लेटफ़ॉर्म के लिए उद्योग मॉडल फ़ाइन-ट्यूनिंग

एक कानूनी प्रौद्योगिकी प्लेटफ़ॉर्म के लिए उद्योग मॉडल फ़ाइन-ट्यूनिंग

परियोजना पृष्ठभूमि

एक कानूनी प्रौद्योगिकी प्लेटफ़ॉर्म व्यवसायों और व्यक्तियों को ऑनलाइन कानूनी परामर्श प्रदान करता है, दैनिक परामर्श संख्या 3000 से अधिक है। प्लेटफ़ॉर्म पहले सामान्य बड़े मॉडल का उपयोग करके कानूनी प्रश्नों का उत्तर देता था, लेकिन कानूनी क्षेत्र की उच्च विशेषज्ञता और घनी शब्दावली के कारण, सामान्य मॉडल की कानूनी परामर्श परिदृश्य में सटीकता केवल 71% थी, तथा भ्रामक सूचना दर 28% तक थी, जो अक्सर संदिग्ध या गलत सलाह देता था, जिससे प्लेटफ़ॉर्म की विशेषज्ञता और उपयोगकर्ता विश्वास पर गंभीर प्रभाव पड़ता था। प्लेटफ़ॉर्म को एक ऐसे विशेष मॉडल की तत्काल आवश्यकता थी जो वास्तव में कानून समझ सके।

मुख्य चुनौतियाँ

  • कानूनी परामर्श सटीकता कम: सामान्य मॉडल की सटीकता केवल 71% है, कानूनी सेवा की विशेषज्ञता आवश्यकताओं को पूरा नहीं कर सकती
  • अत्यधिक भ्रामक सूचना दर: 28% उत्तरों में कानूनी धाराओं का मनगढ़ंत उल्लेख या गलत उद्धरण होता है, व्यावसायिक जोखिम पैदा करता है
  • कानूनी शब्दावली की खराब समझ: सामान्य मॉडल कानूनी विशिष्ट शब्दों और धाराओं के उद्धरणों को सही ढंग से नहीं समझ पाता
  • डेटा एनोटेशन लागत अधिक: उच्च-गुणवत्ता वाले कानूनी एनोटेटेड डेटा की कमी, एनोटेशन लागत अत्यधिक
  • समाधान

    कानूनी क्षेत्र के लिए LoRA फ़ाइन-ट्यूनिंग

    ChatGLM-6B पर आधारित कानूनी क्षेत्र के लिए LoRA (Low-Rank Adaptation) फ़ाइन-ट्यूनिंग, 2000 उच्च-गुणवत्ता वाले कानूनी प्रश्न-उत्तर एनोटेटेड डेटा सावधानीपूर्वक तैयार किए गए, जिसमें अनुबंध विवाद, श्रम विवाद, बौद्धिक संपदा, कंपनी कानून जैसे प्रमुख कानूनी क्षेत्र शामिल हैं। फ़ाइन-ट्यूनिंग के बाद मॉडल सटीकता 71% से बढ़कर 95% हो गई, तथा भ्रामक सूचना दर 28% से घटकर 4% रह गई।

    कानूनी ज्ञान वृद्धि

    RAG के पूरक के रूप में एक कानूनी ज्ञान आधार बनाया गया, जिसमें कानून-कानूनी विनियम, न्यायिक व्याख्याएँ, मानक मामले आदि प्रामाणिक सामग्री शामिल है। मॉडल उत्तर देते समय स्वचालित रूप से प्रासंगिक कानूनी धाराओं और मामलों को आधार के रूप में खोजता है, यह सुनिश्चित करता है कि हर उत्तर का कानूनी आधार सत्यापित किया जा सके, जिससे उत्तरों की विश्वसनीयता और विशेषज्ञता में और वृद्धि होती है।

    गुणवत्ता मूल्यांकन और निरंतर पुनरावृत्ति

    कानूनी उत्तर गुणवत्ता मूल्यांकन प्रणाली स्थापित की गई, जो सटीकता, पूर्णता और अनुपालन के तीन आयामों पर मॉडल आउटपुट का स्वचालित मूल्यांकन करती है। मूल्यांकन में पहचाने गए मुद्दों के लिए निरंतर प्रशिक्षण डेटा जोड़ा जाता है, जिससे डेटा फ्लाईव्हील बनता है और मॉडल क्षमताओं में निरंतर सुधार सुनिश्चित होता है।

    प्रभाव डेटा

    मीट्रिकसुधार से पहलेसुधार के बादसुधार
    कानूनी परामर्श सटीकता71%95%34%
    भ्रामक सूचना दर28%4%86%
    कानूनी धारा उद्धरण सटीकता55%92%67%
    उपयोगकर्ता संतुष्टि62%91%47%

    तकनीकी स्टैक

    ChatGLM-6B, LoRA फ़ाइन-ट्यूनिंग, PEFT, कानूनी ज्ञान आधार, RAG, Python, PyTorch, Hugging Face Transformers

    फ़ाइन-ट्यून किया गया मॉडल अब वास्तव में कानून समझता है, वकीलों ने AI की सलाह पर भरोसा करना शुरू कर दिया है। यह हमारा सामान्य मॉडल से विशेषज्ञ मॉडल तक का महत्वपूर्ण कदम है।