TL;DR
- چکیده:.
- LLMها بهطور فزایندهای برای تصمیمگیریهای پرمخاطره استفاده میشوند،.
- اما حساسیت آنها به اطلاعات زمینهای جعلی میتواند سوگیریهای مضری را ایجاد کند.
چه اتفاقی افتاد
چکیده:. LLMها بهطور فزایندهای برای تصمیمگیریهای پرمخاطره استفاده میشوند،.
اما حساسیت آنها به اطلاعات زمینهای جعلی میتواند سوگیریهای مضری را ایجاد کند. زمانی که مدلهایی برای کارهایی مانند ارزیابی کیفیت آموزشی معلمان،.
که ارزیابی مغرضانه میتواند بر پیشرفت حرفهای معلمان و مسیرهای شغلی تأثیر بگذارد،. به کار گرفته میشوند،.
این یک نگرانی مهم است. ما استحکام مدل را در زمینههای اجتماعی جعلی با استفاده از بزرگترین مجموعه داده عمومیموجود از رونوشتهای.
کلاس درس ایالات متحده (NCTE) همراه با نمرات روبریک متخصص بررسی میکنیم. با ارزیابی هفت مدل مرزی و وزن باز در هفت دسته زمینههای جعلی - از جمله تجربه.
معلم،. سطح تحصیلات،.
هویت جمعیت شناختی،. و چارچوبهای القای همنوایی - متوجه میشویم که اطلاعات متنی نامربوط میتواند پیش بینیهای.
مدل را تا 1. 48 امتیاز در مقیاس 7 درجهای تغییر دهد، با مدلهای بزرگتر گاهی اوقات.
با وجود دقت پیشبینی بالاتر، حساسیت بیشتری از خود نشان میدهند. کاهش با استفاده از دستورات و بهینهسازی اولویت مستقیم استاندارد (DPO) تا حد زیادی کافی نیست.
ما **Debiasing-DPO** را پیشنهاد میکنیم،. یک روش آموزشی خود نظارت که استدلال خنثی ایجاد شده از پرس و جو را به تنهایی،.
با استدلال مغرضانه مدل ایجاد شده با پرس و جو و زمینه جعلی اضافی جفت میکند. ما بیشتر این هدف را با تنظیم دقیق نظارت شده بر روی ی حقیقت زمینی ترکیب میکنیم.
تا از تلفات در دقت پیش بینی جلوگیری کنیم. Debiasing-DPO که در مدلهای Llama 3B \& 8B و Qwen 3B \& 7B Instruct اعمال میشود،.
سوگیری را تا 84 درصد کاهش میدهد و دقت پیشبینی را بهطور متوسط تا 52 درصد بهبود میبخشد. یافتههای ما از مطالعه موردی آموزشی نشان میدهد که استحکام نسبت به زمینه جعلی محصول جانبی طبیعی مقیاسبندی.
مدل نیست و روش پیشنهادی ما میتواند دستاوردهای قابلتوجهی در دقت و صحت داشته باشد. استحکام برای کارهای پیش بینی مبتنی بر فوری صفحه هوش مصنوعی (cs.
AI)؛ محاسبات و زبان (cs. CL) استناد بهعنوان: (یا v1 [cs.
AI] برای این نسخه) https:. // شده توسط arXiv از طریق DataCite (در انتظار ثبت نام) تاریخچه ارسال از:.
Hyunji Alex Nam [مشاهده ایمیل] [v1] پنجشنبه،. 2 آوریل 2026،.
ساعت 23:. 42:.
20 UTC (2,. 721 KB).
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
