TL;DR
- چکیده:.
- مدلهای استدلال بزرگ (LRMs) زنجیرههای فکری ساختاریافته (CoTs) را قبل از تولید پاسخهای نهایی ایجاد میکنند،.
- و آنها را بهویژه در برابر نشت دانش از طریق مراحل استدلال میانی آسیبپذیر میکنند.
چه اتفاقی افتاد
چکیده:. مدلهای استدلال بزرگ (LRMs) زنجیرههای فکری ساختاریافته (CoTs) را قبل از تولید پاسخهای نهایی ایجاد میکنند،.
و آنها را بهویژه در برابر نشت دانش از طریق مراحل استدلال میانی آسیبپذیر میکنند. با این حال،.
حفظ اطلاعات حساس در دادههای آموزشی مانند محتوای دارای حق چاپ و خصوصی منجر به نگرانیهای. اخلاقی و قانونی شده است.
برای پرداختن به این مسائل،. فراموشی انتخابی (همچنین بهعنوان یادگیری ماشینی شناخته میشود) بهعنوان یک درمان بالقوه برای LRMها ظاهر شده.
است. با این حال،.
روشهای غیریادگیری موجود،. در درجه اول پاسخهای نهایی را هدف قرار میدهند و ممکن است پس از فراموشی،.
توانایی استدلال کلی LRMها را کاهش دهند. علاوه بر این،.
استفاده مستقیم از یادگیری در کل CoTها میتواند قابلیتهای استدلال عمومیرا کاهش دهد. چالش کلیدی برای unLearning LRM در دستیابی به یادگیری دقیق از دانش هدفمند و در عین حال حفظ.
یکپارچگی عمومینهفته است. قابلیتهای استدلال برای پر کردن این شکاف،.
ما در این مقاله یک چارچوب جدید یادگیری LRM را پیشنهاد میکنیم که بهطور انتخابی اجزای استدلال حساس. را حذف میکند و در عین حال قابلیتهای استدلال کلی را حفظ میکند.
رویکرد ما از چندین LLM با تولید افزوده بازیابی (RAG) برای تجزیه و تحلیل ردیابیهای CoT،. شناسایی بخشهای مرتبط با فراموشی و جایگزینی آنها با متغیرهایی خوشخیم که ساختار منطقی را حفظ میکنند،.
استفاده میکند. ما همچنین یک جایگزینی ویژگی جدید از دست دادن یادگیری را برای LRMها معرفی میکنیم،.
که میتواند همزمان احتمال تولید محتوای فراموش شده را سرکوب کند و در عین حال جایگزینهای. معتبر ساختاری را تقویت کند.
آزمایشهای گسترده بر روی مجموعه دادههای مصنوعی و پزشکی، ویژگیهای مورد نظر روش پیشنهادی ما را تأیید میکند. هوش مصنوعی (cs.
AI) استناد بهعنوان: (یا v1 [cs. AI] برای این نسخه) https:.
// شده توسط arXiv از طریق DataCite (در انتظار ثبت نام) تاریخچه ارسال از:. Tuan Le [مشاهده ایمیل] [v1] شنبه،.
4 آوریل 2026،. 03:.
47:. 12 UTC (417 KB).
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
