প্রকল্প প্রেক্ষাপট
একটি আইনী প্রযুক্তি প্ল্যাটফর্ম ব্যবসা এবং ব্যক্তিদের অনলাইন আইনি পরামর্শ পরিষেবা প্রদান করে, দৈনিক গড়ে 3000টিরও বেশি পরামর্শ গ্রহণ করে। প্ল্যাটফর্মটি আগে সাধারণ বড় ভাষার মডেল ব্যবহার করে আইনি প্রশ্নের উত্তর দিত, কিন্তু আইনি ক্ষেত্র অত্যন্ত বিশেষায়িত এবং পরিভাষা-ঘন, সাধারণ মডেল আইনি পরামর্শের প্রসঙ্গে নির্ভুলতা মাত্র 71%, হ্যালুসিনেশন হার 28% পর্যন্ত ছিল, প্রায়শই অস্পষ্ট বা ভুল পরামর্শ দিত, যা প্ল্যাটফর্মের পেশাদারিত্ব এবং ব্যবহারকারীর আস্থাকে গুরুতরভাবে প্রভাবিত করেছিল। প্ল্যাটফর্মটির সত্যিই আইন বুঝতে পারে এমন একটি একচেটিয়া মডেলের জরুরি প্রয়োজন ছিল।
মূল সমস্যা
সমাধান
আইন ক্ষেত্রের LoRA ফাইন-টিউনিং
ChatGLM-6B-এর উপর ভিত্তি করে আইন ক্ষেত্রে LoRA (Low-Rank Adaptation) ফাইন-টিউনিং সম্পন্ন করা হয়েছে, চুক্তি বিরোধ, শ্রম বিরোধ, মেধাস্বত্ব, কোম্পানি আইনের মতো মূল আইনি ক্ষেত্রগুলি অন্তর্ভুক্ত করে 2000টি উচ্চ-মানের আইনি প্রশ্ন-উত্তরের লেবেলযুক্ত ডেটা সতর্কতার সাথে তৈরি করা হয়েছে। ফাইন-টিউনিংয়ের পরে মডেলের নির্ভুলতা 71% থেকে 95%-এ উন্নীত হয়েছে, এবং হ্যালুসিনেশন হার 28% থেকে 4%-এ নেমে এসেছে।
আইন জ্ঞান সম্প্রসারণ
RAG-এর সম্পূরক হিসেবে একটি আইনি জ্ঞানভাণ্ডার তৈরি করা হয়েছে, যা আইন-কানুন, বিচারিক ব্যাখ্যা, এবং সাধারণ মামলার মতো প্রামাণিক সামগ্রী অন্তর্ভুক্ত করে। মডেল উত্তর দেওয়ার সময় স্বয়ংক্রিয়ভাবে প্রাসঙ্গিক আইনের ধারা এবং মামলার ভিত্তি হিসাবে তথ্য অনুসন্ধান করে, যাতে প্রতিটি উত্তরের আইনি ভিত্তি যাচাইযোগ্য হয়, যা উত্তরের বিশ্বাসযোগ্যতা এবং পেশাদারিত্ব আরও বৃদ্ধি করে।
গুণমান মূল্যায়ন ও অবিচ্ছিন্ন পুনরাবৃত্তি
আইনি উত্তরের গুণমান মূল্যায়নের একটি ব্যবস্থা প্রতিষ্ঠা করা হয়েছে, যা নির্ভুলতা, সম্পূর্ণতা এবং সম্মতি এই তিনটি মাত্রা থেকে মডেলের আউটপুট স্বয়ংক্রিয়ভাবে মূল্যায়ন করে। মূল্যায়নে চিহ্নিত সমস্যার সমাধানে ক্রমাগত প্রশিক্ষণের ডেটা যোগ করে একটি ডেটা ফ্লাইহুইল তৈরি করা হয়, যা মডেলের ক্ষমতার অবিচ্ছিন্ন উন্নতি নিশ্চিত করে।
ফলাফলের তথ্য
| সূচক | পরিবর্তনের পূর্বে | পরিবর্তনের পরে | উন্নতি |
|---|---|---|---|
| আইনি পরামর্শের নির্ভুলতা | 71% | 95% | 34% |
| হ্যালুসিনেশন হার | 28% | 4% | 86% |
| আইনের ধারা উদ্ধৃতির সঠিকতা | 55% | 92% | 67% |
| ব্যবহারকারী সন্তুষ্টি | 62% | 91% | 47% |
টেকনোলজি স্ট্যাক
ChatGLM-6B, LoRA ফাইন-টিউনিং, PEFT, আইন জ্ঞানভাণ্ডার, RAG, Python, PyTorch, Hugging Face Transformers