TL;DR
- چکیده:.
- استقرار سیاستهای یادگیری تقویتی آموزشدیده در شبیهسازی برای وسایل نقلیه خودمختار واقعی،.
- بهویژه برای چارچوبهای RL هدایتشده با VLM که خطمشیهای آنها معمولاً با مشاهدات بومیشبیهساز و معانی عمل.
چه اتفاقی افتاد
چکیده:. استقرار سیاستهای یادگیری تقویتی آموزشدیده در شبیهسازی برای وسایل نقلیه خودمختار واقعی،.
بهویژه برای چارچوبهای RL هدایتشده با VLM که خطمشیهای آنها معمولاً با مشاهدات بومیشبیهساز و معانی عمل. همراه با شبیهساز که در پلتفرمهای فیزیکی در دسترس نیستند،.
یک چالش اساسی باقی میماند. این مقاله Sim2Real-AD را ارائه میکند،.
یک چارچوب مدولار برای انتقال صفر-شات سیم به واقعی سیاستهای RL هدایتشده توسط VLM آموزشدیده شده توسط CARLA. به وسایل نقلیه در مقیاس کامل بدون هیچ گونه دادههای آموزشی RL در دنیای واقعی.
این چارچوب مسئله انتقال را به چهار جزء تجزیه میکند:. پل مشاهده هندسی (GOB) که تصاویر نمای جلوی تکچشمیرا به مشاهدات دید پرنده (BEV) سازگار با شبیهساز.
تبدیل میکند،. نقشهبرداری اقدام آگاه فیزیک (PAM) که خروجیهای سیاست را به دستورات فیزیکی پلتفرم آگنوستیک Progressive Two-P ترجمه میکند.
استراتژی آموزشی (TPT) که سازگاری را با جداسازی فضای عمل و انتقال فضای مشاهده تثبیت میکند،. و یک خط لوله استقرار در زمان واقعی (RDP) که ادراک،.
استنتاج خط مشی،. تبدیل کنترل و نظارت ایمنی را برای اجرای حلقه بسته یکپارچه میکند.
آزمایشهای شبیهسازی نشان میدهند که چارچوب،. ترتیب عملکرد نسبی الگوریتمهای RL نماینده را در پارادایمهای مختلف پاداش حفظ میکند و سهم هر ماژول را.
تأیید میکند. استقرار شات صفر در مقیاس کامل فورد E-Transit به ترتیب به میزان موفقیت 90 ٪،.
80 ٪ و 75 ٪ در سناریوهای تعقیب خودرو،. اجتناب از مانع و تعامل با علامت توقف دست مییابد.
تا جایی که ما میدانیم،. این مطالعه یکی از اولین مطالعههایی است که استقرار حلقه بسته بدون شات یک خط مشی RL.
هدایت شده توسط VLM آموزش دیده توسط CARLA را بر روی یک وسیله نقلیه واقعی در مقیاس کامل. بدون هیچ گونه داده آموزشی RL در دنیای واقعی نشان میدهد.
ویدئوی نمایشی و کد هستند موجود در: این آدرس https. صفحه، 21 شکل رباتیک (cs.
RO)؛ هوش مصنوعی (cs. AI)؛ بینایی کامپیوتری و تشخیص الگو (cs.
CV) استناد بهعنوان: (یا v1 [cs. RO] برای این نسخه) https:.
// شده توسط arXiv از طریق DataCite (در انتظار ثبت نام) تاریخچه ارسال از:. Zilin Huang [مشاهده ایمیل] [v1] جمعه،.
3 آوریل 2026،. ساعت 22:.
41:. 45 UTC (9,.
247 KB).
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
