TL;DR
- چکیده: یادگیری تقویتی (RL) نتایج چشمگیری در بازیها، روباتیک و کنترل مستمر ایجاد کرده است.
- با این حال،.
- علیرغم این موفقیتها،.
چه اتفاقی افتاد
چکیده: یادگیری تقویتی (RL) نتایج چشمگیری در بازیها، روباتیک و کنترل مستمر ایجاد کرده است. با این حال،.
علیرغم این موفقیتها،. سیاستهای آموخته شده اغلب نمیتوانند فراتر از توزیع آموزشی خود تعمیم پیدا کنند و تأثیر دنیای واقعی را.
محدود کنند. کار اخیر بر روی RL متنی (cRL) نشان میدهد که قرار دادن عوامل در معرض ویژگیهای.
محیطی - زمینهها - میتواند انتقال صفر شات را بهبود بخشد. تا کنون،.
جامعه زمینه را بهعنوان یک قابل مشاهده یکپارچه،. ایستا،.
رویکردی که قابلیتهای تعمیم عوامل RL را محدود میکند،. در نظر گرفته است.
برای دستیابی به هوش زمینهای،. ابتدا یک طبقهبندی جدید از زمینهها را پیشنهاد میکنیم که عوامل آلوژنیک (تحمیل شده توسط محیط) را از.
عوامل خودزا (عامل محور) جدا میکند. ما سه جهت تحقیقاتی اساسی را شناسایی میکنیم که باید برای ارتقای هوش زمینهای واقعی مورد.
توجه قرار گیرند:. (1) یادگیری با زمینههای ناهمگون برای صراحتاً از سطوح طبقه بندی بهره برداری میکنند تا عوامل.
بتوانند در مورد تأثیر آنها بر جهان استدلال کنند و بالعکس. (2) مدلسازی در مقیاس چند زمانه برای تشخیص اینکه متغیرهای آلوژنیک به کندی تکامل مییابند یا ثابت میمانند،.
در حالی که متغیرهای خودزایی ممکن است در یک قسمت تغییر کنند و بهطور بالقوه به مکانیسمهای یادگیری. متفاوتی نیاز دارند.
(3) ادغام زمینههای انتزاعی و سطح بالا برای ترکیب نقشها،. منابع و رژیمهای نظارتی،.
عدم قطعیتها و سایر توصیفکنندههای غیر فیزیکی که بهشدت بر رفتار تأثیر میگذارند. ما زمینه را بهعنوان یک مدلسازی ابتدایی درجه یک تصور میکنیم که به عوامل قدرت میدهد تا درباره.
اینکه چه کسی هستند،. چه چیزی جهان اجازه میدهد و چگونه هر دو در طول زمان تکامل مییابند استدلال کنند.
با انجام این کار،. هدف ما تسریع نسل جدیدی از عوامل آگاه از زمینه است که میتوانند بهطور ایمن و کارآمد.
در دنیای واقعی مستقر شوند. پذیرفته شده در AAMAS 2025 (Blue Sky Ideas Track) یادگیری ماشینی (cs.
LG) استناد بهعنوان: (یا v1 [cs. LG] برای این نسخه) https:.
// شده توسط arXiv از طریق DataCite تاریخچه ارسال از:. André Biedenkapp [مشاهده ایمیل] [v1] سه شنبه،.
17 فوریه 2026،. 11:.
12:. 05 UTC (45 KB).
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
