TL;DR
- چکیده:.
- مدلهای زبانی بزرگ،.
- همخوانی را نشان میدهند:.
چه اتفاقی افتاد
چکیده:. مدلهای زبانی بزرگ،.
همخوانی را نشان میدهند:. تمایل به تغییر خروجیها به سمت مواضع بیان شده توسط کاربر،.
بدون در نظر گرفتن صحت یا سازگاری. در حالی که کار قبلی این موضوع و تأثیرات آن را مورد مطالعه قرار داده است،.
معیارهای زبانی محاسباتی دقیقی برای شناسایی زمانی که مدلها دودلانه هستند مورد نیاز است. در اینجا، ما SWAY را معرفی میکنیم، یک معیار زبانی محاسباتی بدون نظارت برای سنجش همسانی.
ما یک مکانیسم تحریک کننده خلاف واقع برای شناسایی میزان تغییر توافق مدل تحت فشار زبانی مثبت در. مقابل منفی ایجاد میکنیم،.
و اثرات چارچوب بندی را از محتوا جدا میکنیم. با اعمال این معیار برای معیار 6 مدل، متوجه میشویم که همسویی با تعهد معرفتی افزایش مییابد.
با استفاده از معیارهای خود،. مدلهای آموزشی استراتژی کاهش خلاف واقع را معرفی میکنیم تا در نظر بگیریم که اگر مفروضات مخالف پیشنهاد.
شود،. چه پاسخی خواهد داشت.
در حالی که کاهش پایه که دستور میدهد صریحاً ضد غم انگیز باشد،. کاهشهای متوسطی را به همراه دارد،.
و میتواند نتیجه معکوس داشته باشد،. کاهش CoT خلاف واقع ما،.
همزمانی را در بین مدلها،. سطوح تعهد و انواع بند به نزدیکی صفر میرساند،.
در حالی که پاسخگویی به شواهد واقعی را سرکوب نمیکند. در مجموع،.
ما معیاری را برای سنجش همسویی و کاهشی که از آن اطلاع داده شده است،. ارائه میکنیم.
محاسبات و زبان (cs. CL); کامپیوتر و جامعه (cs.
CY) استناد بهعنوان: (یا v1 [cs. CL] برای این نسخه) https:.
// شده توسط arXiv از طریق DataCite (در انتظار ثبت نام) تاریخچه ارسال از:. کریستینا گلیگوریک [مشاهده ایمیل] [v1] پنجشنبه،.
2 آوریل 2026،. ساعت 18:.
00:. 14 UTC (2,.
612 KB).
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
