সাধারণAIমডেল ফাইন-টিউনিংজ্ঞানভাণ্ডারচীন

একটি আইনী প্রযুক্তি প্ল্যাটফর্মের জন্য শিল্প মডেল ফাইন-টিউনিং প্রকল্প

প্রকল্প প্রেক্ষাপট

একটি আইনী প্রযুক্তি প্ল্যাটফর্ম ব্যবসা এবং ব্যক্তিদের অনলাইন আইনি পরামর্শ পরিষেবা প্রদান করে, দৈনিক গড়ে 3000টিরও বেশি পরামর্শ গ্রহণ করে। প্ল্যাটফর্মটি আগে সাধারণ বড় ভাষার মডেল ব্যবহার করে আইনি প্রশ্নের উত্তর দিত, কিন্তু আইনি ক্ষেত্র অত্যন্ত বিশেষায়িত এবং পরিভাষা-ঘন, সাধারণ মডেল আইনি পরামর্শের প্রসঙ্গে নির্ভুলতা মাত্র 71%, হ্যালুসিনেশন হার 28% পর্যন্ত ছিল, প্রায়শই অস্পষ্ট বা ভুল পরামর্শ দিত, যা প্ল্যাটফর্মের পেশাদারিত্ব এবং ব্যবহারকারীর আস্থাকে গুরুতরভাবে প্রভাবিত করেছিল। প্ল্যাটফর্মটির সত্যিই আইন বুঝতে পারে এমন একটি একচেটিয়া মডেলের জরুরি প্রয়োজন ছিল।

মূল সমস্যা

আইনি পরামর্শের নিম্ন নির্ভুলতা: সাধারণ মডেলের নির্ভুলতা মাত্র 71%, আইনি পরিষেবার পেশাদারিত্বের প্রয়োজনীয়তা পূরণ করতে অক্ষম।

অত্যন্ত উচ্চ হ্যালুসিনেশন হার: 28% উত্তরে আইনের ধারা তৈরি বা ভুল উদ্ধৃতি রয়েছে, যা পেশাগত ঝুঁকি তৈরি করে।

আইনি পরিভাষা বোঝার অভাব: সাধারণ মডেল আইনি বিশেষ্য এবং ধারার উদ্ধৃতি সঠিকভাবে বুঝতে পারে না।

ডেটা লেবেলিংয়ের উচ্চ খরচ: উচ্চ-মানের আইনি ক্ষেত্রের লেবেলযুক্ত ডেটা দুর্লভ, এবং লেবেলিংয়ের খরচ অত্যন্ত বেশি।

সমাধান

আইন ক্ষেত্রের LoRA ফাইন-টিউনিং

ChatGLM-6B-এর উপর ভিত্তি করে আইন ক্ষেত্রে LoRA (Low-Rank Adaptation) ফাইন-টিউনিং সম্পন্ন করা হয়েছে, চুক্তি বিরোধ, শ্রম বিরোধ, মেধাস্বত্ব, কোম্পানি আইনের মতো মূল আইনি ক্ষেত্রগুলি অন্তর্ভুক্ত করে 2000টি উচ্চ-মানের আইনি প্রশ্ন-উত্তরের লেবেলযুক্ত ডেটা সতর্কতার সাথে তৈরি করা হয়েছে। ফাইন-টিউনিংয়ের পরে মডেলের নির্ভুলতা 71% থেকে 95%-এ উন্নীত হয়েছে, এবং হ্যালুসিনেশন হার 28% থেকে 4%-এ নেমে এসেছে।

আইন জ্ঞান সম্প্রসারণ

RAG-এর সম্পূরক হিসেবে একটি আইনি জ্ঞানভাণ্ডার তৈরি করা হয়েছে, যা আইন-কানুন, বিচারিক ব্যাখ্যা, এবং সাধারণ মামলার মতো প্রামাণিক সামগ্রী অন্তর্ভুক্ত করে। মডেল উত্তর দেওয়ার সময় স্বয়ংক্রিয়ভাবে প্রাসঙ্গিক আইনের ধারা এবং মামলার ভিত্তি হিসাবে তথ্য অনুসন্ধান করে, যাতে প্রতিটি উত্তরের আইনি ভিত্তি যাচাইযোগ্য হয়, যা উত্তরের বিশ্বাসযোগ্যতা এবং পেশাদারিত্ব আরও বৃদ্ধি করে।

গুণমান মূল্যায়ন ও অবিচ্ছিন্ন পুনরাবৃত্তি

আইনি উত্তরের গুণমান মূল্যায়নের একটি ব্যবস্থা প্রতিষ্ঠা করা হয়েছে, যা নির্ভুলতা, সম্পূর্ণতা এবং সম্মতি এই তিনটি মাত্রা থেকে মডেলের আউটপুট স্বয়ংক্রিয়ভাবে মূল্যায়ন করে। মূল্যায়নে চিহ্নিত সমস্যার সমাধানে ক্রমাগত প্রশিক্ষণের ডেটা যোগ করে একটি ডেটা ফ্লাইহুইল তৈরি করা হয়, যা মডেলের ক্ষমতার অবিচ্ছিন্ন উন্নতি নিশ্চিত করে।

ফলাফলের তথ্য

সূচক	পরিবর্তনের পূর্বে	পরিবর্তনের পরে	উন্নতি
আইনি পরামর্শের নির্ভুলতা	71%	95%	34%
হ্যালুসিনেশন হার	28%	4%	86%
আইনের ধারা উদ্ধৃতির সঠিকতা	55%	92%	67%
ব্যবহারকারী সন্তুষ্টি	62%	91%	47%

টেকনোলজি স্ট্যাক

ChatGLM-6B, LoRA ফাইন-টিউনিং, PEFT, আইন জ্ঞানভাণ্ডার, RAG, Python, PyTorch, Hugging Face Transformers

“ফাইন-টিউনিংয়ের পর মডেলটি সত্যিই আইন বুঝতে পারছে, আইনজীবীরা AI-এর পরামর্শের উপর আস্থা রাখতে শুরু করেছেন। এটি সাধারণ মডেল থেকে পেশাদার মডেলে আমাদের যাত্রার একটি গুরুত্বপূর্ণ পদক্ষেপ।”

একটি আইনী প্রযুক্তি প্ল্যাটফর্মের জন্য শিল্প মডেল ফাইন-টিউনিং প্রকল্প

প্রকল্প প্রেক্ষাপট

মূল সমস্যা

সমাধান

আইন ক্ষেত্রের LoRA ফাইন-টিউনিং

আইন জ্ঞান সম্প্রসারণ

গুণমান মূল্যায়ন ও অবিচ্ছিন্ন পুনরাবৃত্তি

ফলাফলের তথ্য

টেকনোলজি স্ট্যাক

সম্পর্কিত কেস

একটি যৌথমূলধনী ব্যাংকের বৃহৎ মডেল প্রাইভেট ডিপ্লয়মেন্ট ও ঝুঁকি নিয়ন্ত্রণ অ্যাপ্লিকেশন

একটি ই-কমার্স প্ল্যাটফর্মের AI সুপারিশ সিস্টেম MLOps পরিচালনা অপ্টিমাইজেশন প্রকল্প

হুয়াডং ফার্মাসিউটিক্যাল গ্রুপ ERP+AI স্মার্ট এন্ট্রি ইন্টিগ্রেশন প্রকল্প