TL;DR
- چکیده:.
- آیا انسانها میتوانند تشخیص دهند که یک مقاله خبری توسط یک شخص نوشته شده است یا.
- یک مدل زبان بزرگ (LLM)؟
چه اتفاقی افتاد
چکیده:. آیا انسانها میتوانند تشخیص دهند که یک مقاله خبری توسط یک شخص نوشته شده است یا.
یک مدل زبان بزرگ (LLM)؟ ما این سوال را با استفاده از JudgeGPT بررسی میکنیم،.
یک پلتفرم مطالعه که بهطور مستقل اسناد منبع (انسان در مقابل ماشین) و قضاوت اصالت (مشروع در مقابل. جعلی) را در مقیاسهای پیوسته اندازهگیری میکند.
از 2,. 318 قضاوت جمعآوریشده از 1,.
054 شرکتکننده در سراسر محتوای تولید شده توسط شش LLM،. ما پنج یافته را گزارش میکنیم:.
(1) شرکتکنندگان نمیتوانند بهطور قابل اعتمادی متن تولید شده توسط ماشین را از متن نوشته شده توسط انسان. تشخیص دهند (p > 0.
05، آزمون t ولش). (2) این ناتوانی در تمام مدلهای آزمایش شده، از جمله مدلهای وزن باز با پارامترهای 7B وجود دارد.
(3) تخصص دامنه خود گزارش شده دقت قضاوت را پیش بینی میکند (r = 0. 35، p <.
001) در حالی که جهت گیری سیاسی اینطور نیست (r = -. 10، n.
s.). (4) خوشه بندی استراتژیهای پاسخ متمایز را نشان میدهد ("شک گرایان" در مقابل.
"مؤمنان")؛ و (5) دقت پس از حدود 30 ارزیابی متوالی به دلیل خستگی شناختی کاهش مییابد. پاسخ، بهطور خلاصه، منفی است: انسانها نمیتوانند بهطور قابل اعتماد بگویند.
این نتایج نشان میدهد که تشخیص سمت کاربر یک دفاع قابل قبول نیست و اقدامات متقابل در. سطح سیستم مانند منشأ محتوای رمزنگاری را تحریک میکند.
صفحه، 6 شکل، 1 جدول. پذیرفته شده در هجدهمین کنفرانس علوم وب ACM (WebSci Companion '26) کامپیوتر و جامعه (cs.
CY)؛ هوش مصنوعی (cs. AI)؛ محاسبات و زبان (cs.
CL); تعامل انسان و رایانه (cs. HC) کلاسهای ACM: H.
5. 2; K.
4. 2; I.
2. 7 استناد بهعنوان: (یا v1 [cs.
CY] برای این نسخه) https:. // شده توسط arXiv از طریق DataCite (در انتظار ثبت نام) پیوند (های) منابع مرتبط تاریخچه ارسال از:.
Alexander Loth [مشاهده ایمیل] [v1] شنبه،. 4 آوریل 2026،.
15:. 03:.
42 UTC (1,. 197 KB).
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
