TL;DR
- چکیده:.
- حل خلاقانه مسئله مستلزم ترکیب تواناییهای شناختی متعدد،.
- از جمله استدلال منطقی،.
چه اتفاقی افتاد
چکیده:. حل خلاقانه مسئله مستلزم ترکیب تواناییهای شناختی متعدد،.
از جمله استدلال منطقی،. تفکر جانبی،.
قیاس سازی،. و دانش عام است،.
تا بینشهایی را کشف کند که اطلاعات به ظاهر نامرتبط را به هم متصل میکند. با این حال،.
اکثر معیارهای موجود برای مدلهای زبان بزرگ (LLM) تنها اجزای خاص این فرآیند را ارزیابی میکنند. علاوه بر این،.
بسیاری از معیارهای مبتنی بر خلاقیت به بازیهای فکری ساختهشده مصنوعی یا سناریوهای ساختگی تکیه میکنند که نشاندهنده. چگونگی حل خلاقانه مسئله در محیطهای دنیای واقعی نیستند.
برای رفع این شکاف،. CresOWLve را معرفی میکنیم،.
معیاری برای ارزیابی حل خلاقانه مسئله با استفاده از پازلهای مبتنی بر دانش دنیای واقعی. مشکلات موجود در CresOWLve نیازمند به کارگیری استراتژیهای تفکر خلاق متعدد،.
بازیابی حقایق از حوزههای مختلف و ترکیب خلاقانه آنها برای رسیدن به یک راهحل است. در حال ارزیابی چندین LLM غیرمتفکر و متفکر مرزی، نشان میدهیم که CresOWLve همچنان بسیار چالشبرانگیز است.
تجزیه و تحلیل ما یک شکاف عملکردی ثابت را نشان میدهد:. مدلها در سؤالات واقعی بهطور قابلتوجهی بهتر از سؤالات خلاقانه عمل میکنند (تا 17 ٪ کاهش).
در حالی که مدلها اغلب میتوانند دانش مربوطه را بازیابی کنند،. آنها برای ایجاد ارتباطات خلاقانه غیر آشکار مورد نیاز برای ادغام این اطلاعات و رسیدن به پاسخ صحیح.
تلاش میکنند. در دست بررسی محاسبات و زبان (cs.
CL); هوش مصنوعی (cs. AI) استناد بهعنوان: (یا v1 [cs.
CL] برای این نسخه) https:. // شده توسط arXiv از طریق DataCite (در انتظار ثبت نام) تاریخچه ارسال از:.
Mete Ismayilzada [مشاهده ایمیل] [v1] جمعه،. 3 آوریل 2026،.
18:. 08:.
14 UTC (1,. 942 KB).
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
