TL;DR
- چکیده:.
- از آنجایی که مدلهای زبان بزرگ (LLM) بهطور فزایندهای به سیستمهای تصمیمگیری در حوزههای حیاتی قدرت میدهند،.
- درک و کاهش تعصبات آنها برای استقرار مسئول هوش مصنوعی ضروری میشود.
چه اتفاقی افتاد
چکیده:. از آنجایی که مدلهای زبان بزرگ (LLM) بهطور فزایندهای به سیستمهای تصمیمگیری در حوزههای حیاتی قدرت میدهند،.
درک و کاهش تعصبات آنها برای استقرار مسئول هوش مصنوعی ضروری میشود. اگرچه چارچوبهای ارزیابی سوگیری برای ویژگیهایی مانند نژاد و جنسیت زیاد شده است،.
سوگیری وضعیت اجتماعی-اقتصادی علیرغم پیامدهای گسترده آن در دنیای واقعی بهطور قابل توجهی مورد بررسی قرار نگرفته است. ما SocioEval را معرفی میکنیم،.
یک چارچوب مبتنی بر الگو برای ارزیابی سیستماتیک سوگیری اجتماعی-اقتصادی در مدلهای بنیاد از طریق وظایف تصمیمگیری. چارچوب سلسله مراتبی ما شامل 8 موضوع و 18 موضوع است که 240 درخواست را در 6 ترکیب.
کلاس-جفت ایجاد میکند. ما 13 LLM مرزی را بر روی 3120 پاسخ با استفاده از یک پروتکل حاشیه نویسی سه مرحله.
ای دقیق ارزیابی کردیم که تنوع قابل توجهی در نرخ سوگیری (0. 42\%33.
75%) را نشان داد. یافتههای ما نشان میدهد که تعصب در مختلف بهطور متفاوتی آشکار میشود،.
قضاوتهای سبک زندگی 10 دلار\ برابر دلار بیشتر از تصمیمهای مربوط به آموزش و پرورش نشان میدهند و. این که پادمانهای استقرار بهطور مؤثر از تبعیض صریح جلوگیری میکند،.
اما نسبت به کلیشههای خاص حوزه شکنندگی نشان میدهد. SocioEval یک پایه مقیاس پذیر و قابل توسعه برای ممیزی تعصب مبتنی بر کلاس در مدلهای زبان.
فراهم میکند. محاسبات و زبان (cs.
CL) استناد بهعنوان: (یا v1 [cs. CL] برای این نسخه) https:.
// شده توسط arXiv از طریق DataCite (در انتظار ثبت نام) تاریخچه ارسال از:. Divyanshu Kumar [مشاهده ایمیل] [v1] جمعه،.
3 آوریل 2026،. 02:.
47:. 37 UTC (2,.
298 KB).
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
