TL;DR
- مشاهده PDF چکیده:.
- استقرار کنترلکنندههای مبتنی بر یادگیری تقویتی (RL) در سیستمهای فیزیکی اغلب به دلیل تعمیم ضعیف به سناریوهای دنیای.
- واقعی محدود میشود،.
چه اتفاقی افتاد
مشاهده PDF چکیده:. استقرار کنترلکنندههای مبتنی بر یادگیری تقویتی (RL) در سیستمهای فیزیکی اغلب به دلیل تعمیم ضعیف به سناریوهای دنیای.
واقعی محدود میشود،. که به عنوان شکاف شبیهسازی به واقعیت (sim-to-real) شناخته میشود.
این شکاف به ویژه در پروازهای فضایی چالش برانگیز است،. جایی که داده های آموزشی در دنیای واقعی به دلیل هزینه بالا و داده های اکتشاف سیاره محدود.
کمیاب است. رویکردهای سنتی،.
مانند شناسایی سیستم و تولید دادههای مصنوعی،. به دادههای کافی بستگی دارند و اغلب به دلیل مفروضات مدلسازی یا عدم محدودیتهای مبتنی بر فیزیک شکست.
میخورند. ما با معرفی سوگیری یادگیری مبتنی بر فیزیک در یک مدل تولیدی،.
پرداختن به این کمبود داده را پیشنهاد میکنیم. به طور خاص،.
ما رمزگذار خودکار متغیر مبتنی بر اطلاعات متقابل (MI-VAE) را توسعه میدهیم،. یک VAE با اطلاعات فیزیک که تفاوتهای بین مسیرهای سیستم مشاهدهشده و موارد پیشبینیشده توسط مدلهای مبتنی بر.
فیزیک را یاد میگیرد. را فضای پنهان MI-VAE امکان تولید مجموعه داده های مصنوعی را فراهم می کند که به محدودیت های.
فیزیکی احترام می گذارند. ما MI-VAE را در یک مشکل فرودگر سیاره ای ارزیابی می کنیم،.
با تمرکز بر داده های محدود دنیای واقعی و آموزش آفلاین RL. نتایج نشان میدهد که افزایش مجموعه دادهها با نمونههای MI-VAE به طور قابلتوجهی عملکرد پاییندستی RL را بهبود.
میبخشد،. و از VAEهای استاندارد در وفاداری آماری،.
تنوع نمونه و میزان موفقیت خطمشی بهتر عمل میکند. این کار یک استراتژی مقیاسپذیر برای افزایش استحکام کنترلکننده مستقل در محیطهای پیچیده و با محدودیت داده را.
نشان میدهد. موضوعات:.
یادگیری ماشینی (cs.LG) استناد به عنوان:. arXiv:.
2604.02438 [cs.LG] (یا arXiv:. 2604.02438v1 [cs.LG] برای این نسخه) https:.
//doi.org/10.48550/arXiv.2604.02438 DOI صادر شده توسط arXiv از طریق DataCite (در انتظار ثبت نام) تاریخچه ارسال از:. Nachiket Bapat [مشاهده ایمیل] [v1] پنجشنبه،.
2 آوریل 2026،. 18:.
09:. 11 UTC (6,.
168 KB).
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
