परियोजना पृष्ठभूमि
एक कानूनी प्रौद्योगिकी प्लेटफ़ॉर्म व्यवसायों और व्यक्तियों को ऑनलाइन कानूनी परामर्श प्रदान करता है, दैनिक परामर्श संख्या 3000 से अधिक है। प्लेटफ़ॉर्म पहले सामान्य बड़े मॉडल का उपयोग करके कानूनी प्रश्नों का उत्तर देता था, लेकिन कानूनी क्षेत्र की उच्च विशेषज्ञता और घनी शब्दावली के कारण, सामान्य मॉडल की कानूनी परामर्श परिदृश्य में सटीकता केवल 71% थी, तथा भ्रामक सूचना दर 28% तक थी, जो अक्सर संदिग्ध या गलत सलाह देता था, जिससे प्लेटफ़ॉर्म की विशेषज्ञता और उपयोगकर्ता विश्वास पर गंभीर प्रभाव पड़ता था। प्लेटफ़ॉर्म को एक ऐसे विशेष मॉडल की तत्काल आवश्यकता थी जो वास्तव में कानून समझ सके।
मुख्य चुनौतियाँ
समाधान
कानूनी क्षेत्र के लिए LoRA फ़ाइन-ट्यूनिंग
ChatGLM-6B पर आधारित कानूनी क्षेत्र के लिए LoRA (Low-Rank Adaptation) फ़ाइन-ट्यूनिंग, 2000 उच्च-गुणवत्ता वाले कानूनी प्रश्न-उत्तर एनोटेटेड डेटा सावधानीपूर्वक तैयार किए गए, जिसमें अनुबंध विवाद, श्रम विवाद, बौद्धिक संपदा, कंपनी कानून जैसे प्रमुख कानूनी क्षेत्र शामिल हैं। फ़ाइन-ट्यूनिंग के बाद मॉडल सटीकता 71% से बढ़कर 95% हो गई, तथा भ्रामक सूचना दर 28% से घटकर 4% रह गई।
कानूनी ज्ञान वृद्धि
RAG के पूरक के रूप में एक कानूनी ज्ञान आधार बनाया गया, जिसमें कानून-कानूनी विनियम, न्यायिक व्याख्याएँ, मानक मामले आदि प्रामाणिक सामग्री शामिल है। मॉडल उत्तर देते समय स्वचालित रूप से प्रासंगिक कानूनी धाराओं और मामलों को आधार के रूप में खोजता है, यह सुनिश्चित करता है कि हर उत्तर का कानूनी आधार सत्यापित किया जा सके, जिससे उत्तरों की विश्वसनीयता और विशेषज्ञता में और वृद्धि होती है।
गुणवत्ता मूल्यांकन और निरंतर पुनरावृत्ति
कानूनी उत्तर गुणवत्ता मूल्यांकन प्रणाली स्थापित की गई, जो सटीकता, पूर्णता और अनुपालन के तीन आयामों पर मॉडल आउटपुट का स्वचालित मूल्यांकन करती है। मूल्यांकन में पहचाने गए मुद्दों के लिए निरंतर प्रशिक्षण डेटा जोड़ा जाता है, जिससे डेटा फ्लाईव्हील बनता है और मॉडल क्षमताओं में निरंतर सुधार सुनिश्चित होता है।
प्रभाव डेटा
| मीट्रिक | सुधार से पहले | सुधार के बाद | सुधार |
|---|---|---|---|
| कानूनी परामर्श सटीकता | 71% | 95% | 34% |
| भ्रामक सूचना दर | 28% | 4% | 86% |
| कानूनी धारा उद्धरण सटीकता | 55% | 92% | 67% |
| उपयोगकर्ता संतुष्टि | 62% | 91% | 47% |
तकनीकी स्टैक
ChatGLM-6B, LoRA फ़ाइन-ट्यूनिंग, PEFT, कानूनी ज्ञान आधार, RAG, Python, PyTorch, Hugging Face Transformers