این راهنمای بنیادین توضیح میدهد RAG برای اسناد فارسی فقط کنار هم چیدن چند ابزار نیست و چگونه باید با دامنه مسئله، داده نمونه، معیار پذیرش و بازبینی انسانی شروع کرد تا خروجی واقعاً قابل استفاده شود.
خروجی مورد انتظار این راهنما یک خروجی اجرایی واقعی است، نه یک برداشت کلی. در پایان باید بتوانید مرز کار، معیار پذیرش و مسیر بازبینی انسانی را روی کاغذ یا در ابزار تیم ثبت کنید.
این آموزش برای چیست؟
این آموزش برای تیمهای دانش، حقوقی، عملیات و پشتیبانی طراحی شده است تا قبل از رفتن به سراغ ابزار یا فروشنده، مرز بهکارگیری RAG برای اسناد فارسی را روشن کند و بداند چه چیزی باید خودکار شود و چه چیزی باید همچنان زیر نظر انسان بماند.
پیشنیازها
- یک مسئله واقعی از جنس تیمهای دانش، حقوقی، عملیات و پشتیبانی
- نمونه داده یا ورودی قابل اتکا مثل اسناد فارسی، فراداده سند، تاریخ نسخه و نمونه سؤالهای پرتکرار
- مسئول مشخص برای بازبینی و تصمیمگیری روی خروجی
- یک سنجه روشن از جنس پوشش ارجاع، نرخ پاسخ مستند و نیاز به پیگیری انسانی
مرحله 1: مسئله و مرز تصمیم را روشن کنید
بهجای شروع از ابزار، ابتدا معلوم کنید چه تصمیمی قرار است بهتر شود و مرز اتکا کجاست. اگر سند معتبر پیدا نشود، سیستم باید صادقانه بگوید اطلاعات کافی ندارد و آن را به بازبین برگرداند.
مرحله 2: ورودیهای واقعی را جمع کنید
تا وقتی نمونه واقعی در دسترس نباشد، طراحی شما روی مسیرهای ساده میماند. برای این مرحله اسناد فارسی، فراداده سند، تاریخ نسخه و نمونه سؤالهای پرتکرار را جمعآوری و برچسبگذاری کنید.
مرحله 3: خروجی اجرایی اولیه را تعریف کنید
از روز اول مشخص کنید خروجی نهایی چه شکلی است. در این موضوع، خروجی اجرایی اصلی شما فرایند ورود اسناد، قاعده قطعهبندی، قواعد ارجاعدهی و مسیر بهروزرسانی است و باید قابل بازبینی باشد.
مرحله 4: موارد مرزی را جداگانه ببینید
بخش زیادی از خطا بعداً از همین نقطه میآید. سند قدیمی، نسخه متناقض، PDF اسکنشده و پرسش چندبخشی را از مسیرهای ساده جدا کنید و برای هرکدام قاعده یا مسیر جایگزین مشخص بگذارید.
مرحله 5: پایلوت کوچک و قابلسنجش ببندید
اولین پایلوت باید دامنه محدود اما قابلاندازهگیری داشته باشد تا تیم بتواند روی پوشش ارجاع، نرخ پاسخ مستند و نیاز به پیگیری انسانی مبنای واقعی بسازد.
سناریوی نمونه
سازمانی که میخواهد از سند و آییننامه پاسخ قابلاستناد بگیرد، نه اینکه مدل فقط حدس بزند.
نمونه ورودی
سؤال کاربر درباره روند مرخصی، نسخههای مختلف آییننامه و این الزام که پاسخ باید بند و تاریخ سند را نشان دهد.
نمونه خروجی
پاسخ همراه با ارجاع، درجه اطمینان، بند مرجع و هشدار اگر سند منبع قدیمی یا مبهم باشد.
محدودیتها و خطاهای رایج
- شروع از نسخه نمایشی بدون اینکه پوشش ارجاع، نرخ پاسخ مستند و نیاز به پیگیری انسانی تعریف شده باشد
- قفلشدن روی ابزار قبل از روشن شدن مسئول و مرز اتکا
- اگر سند معتبر پیدا نشود، سیستم باید صادقانه بگوید اطلاعات کافی ندارد و آن را به بازبین برگرداند.
نتیجه نهایی
در پایان این آموزش باید RAG قابلاستناد برای اسناد فارسی را در اختیار داشته باشید؛ یعنی یک تعریف روشن از دامنه، ورودی، خروجی، ریسک و بازبینی که بتواند مبنای پایلوت بعدی شود.
قدم بعدی
بعد از راهاندازی اولیه، پرسشهای بدون ارجاع و اسناد کمکیفیت را هفتهای یکبار اولویتبندی کنید.
