TL;DR
- چکیده: توضیحات متنی که با مدلهای زبان بزرگ (LLM) تولید میشوند، بهطور فزایندهای برای توجیه توصیهها استفاده میشوند.
- با این حال، ارزیابی این توضیحات همچنان یک چالش حیاتی است.
- ما از تغییر در هدف حمایت میکنیم: رتبه، تولید نکنید.
چه اتفاقی افتاد
چکیده: توضیحات متنی که با مدلهای زبان بزرگ (LLM) تولید میشوند، بهطور فزایندهای برای توجیه توصیهها استفاده میشوند. با این حال، ارزیابی این توضیحات همچنان یک چالش حیاتی است.
ما از تغییر در هدف حمایت میکنیم: رتبه، تولید نکنید. ما توصیههای قابل توضیح را بهعنوان یک مشکل رتبهبندی در سطح بیانیه رسمیمیکنیم،.
که در آن سیستمها اظهارات توضیحی نامزد به دست آمده از بررسیها را رتبهبندی میکنند و top-k را. بهعنوان توضیح برمیگردانند.
این فرمول توهم را با ساخت و ساز کاهش میدهد و تجزیه و تحلیل واقعی واقعی را. امکان پذیر میکند.
همچنین اهمیت فاکتورها را از طریق امتیازهای مرتبط مدلسازی میکند و از ارزیابی استاندارد و تکرارپذیر با. معیارهای رتبهبندی تعیین شده پشتیبانی میکند.
با این حال،. ارزیابی معنادار مستلزم آن است که هر عبارت توضیحی باشد (حقایق موردی که بر تجربه کاربر تأثیر میگذارند)،.
اتمی (یک نظر در مورد یک جنبه)،. و منحصر به فرد (تجمیع عبارتها)،.
که به دست آوردن آن از بررسیهای پر سر و صدا چالش برانگیز است. ما این موضوع را با (i) یک خط لوله استخراج مبتنی بر LLM که عبارات توضیحی و اتمی.
تولید میکند،. و (ب) یک روش خوشهبندی معنایی مقیاسپذیر و ادغام عبارتها برای اعمال منحصربهفرد بودن،.
بررسی میکنیم. با تکیه بر این خط لوله،.
ما StarR را معرفی میکنیم،. معیاری برای رتبهبندی بیانیه در توصیههای قابل توضیح،.
که از چهار دستهبندی محصول Amazon Reviews 2014 ساخته شده است. ما خطوط پایه مبتنی بر محبوبیت و مدلهای پیشرفته را تحت رتبهبندی سطح جهانی (همه عبارات) و سطح.
آیتم (گزارههای مورد هدف) ارزیابی میکنیم. خطوط پایه محبوبیت در رتبهبندی در سطح جهانی رقابتی هستند،.
اما در رتبهبندی سطح آیتمها بهطور متوسط از مدلهای پیشرفته بهتر عمل میکنند و محدودیتهای حیاتی را در. رتبهبندی توضیحات شخصی نشان میدهند.
صفحه، 6 جدول، 5 شکل بازیابی اطلاعات (cs. IR) استناد بهعنوان: (یا v1 [cs.
IR] برای این نسخه) https:. // شده توسط arXiv از طریق DataCite (در انتظار ثبت نام) تاریخچه ارسال از:.
Ben Kabongo [مشاهده ایمیل] [v1] شنبه،. 4 آوریل 2026،.
13:. 01:.
45 UTC (554 KB).
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
