TL;DR
- چکیده:.
- مدلهای روباتیک Vision-Language-Action (VLA) به خوبی برای دستکاری با پایان باز تعمیم مییابند،.
- اما درک آنها تحت تخریبهای مرحله سنجش مانند نور بسیار کم،.
چه اتفاقی افتاد
چکیده:. مدلهای روباتیک Vision-Language-Action (VLA) به خوبی برای دستکاری با پایان باز تعمیم مییابند،.
اما درک آنها تحت تخریبهای مرحله سنجش مانند نور بسیار کم،. تاری حرکت،.
و برش سیاه شکننده است. ما E-VLA را ارائه میکنیم،.
یک چارچوب VLA با رویداد افزوده شده که وقتی دید مبتنی بر فریم معمولی غیرقابل اعتماد میشود،. استحکام دستکاری را بهبود میبخشد.
به جای بازسازی تصاویر از رویدادها،. E-VLA مستقیماً از حرکت و نشانههای ساختاری در جریان رویدادها برای حفظ ادراک معنایی و سازگاری ادراک-عمل.
تحت شرایط نامطلوب استفاده میکند. ما یک پلتفرم عملیات از راه دور منبعباز با دوربین رویداد DAVIS346 میسازیم و مجموعه داده.
دستکاری کنش-رویداد RGB همگام سازی شده در دنیای واقعی را در وظایف مختلف و تنظیمات روشنایی جمع آوری. میکنیم.
ما همچنین استراتژیهای ادغام رویدادهای سبک وزن و سازگار با رویداد و رویداد مطالعه را پیشنهاد میکنیم پنجره. و فیوژن برای استقرار پایدار.
آزمایشها نشان میدهند که حتی یک ترکیب ساده بدون پارامتر،. یعنی پوشاندن نقشههای رویداد انباشته شده بر روی تصاویر RGB،.
میتواند بهطور قابلتوجهی استحکام را در صحنههای تاریک و تاری شدید بهبود بخشد:. در Pick-Place در 20 لوکس،.
موفقیت از 0% (فقط تصویر) به 60% با ادغام رویداد به 90% افزایش مییابد. تحت تاری شدید حرکتی (1000 میلیثانیه قرار گرفتن در معرض)،.
Pick-Place از 0% به 20-25% و مرتبسازی از 5% به 32. 5% بهبود مییابد.
بهطور کلی،. E-VLA شواهد سیستماتیکی ارائه میدهد که ادراک رویداد محور را میتوان بهطور موثر در مدلهای.
VLA ادغام کرد و به هوش تجسم قوی فراتر از تصویربرداری مبتنی بر فریم معمولی اشاره میکند. کد و مجموعه داده در این URL https در دسترس خواهد بود.
بینایی کامپیوتری و تشخیص الگو (cs. CV)؛ چند رسانهای (cs.
MM)؛ رباتیک (cs. RO)؛ پردازش تصویر و ویدئو (eess.
IV) استناد بهعنوان: (یا v1 [cs. CV] برای این نسخه) https:.
// شده توسط arXiv از طریق DataCite (در انتظار ثبت نام) تاریخچه ارسال از:. Kailun Yang [مشاهده ایمیل] [v1] دوشنبه،.
6 آوریل 2026،. 16:.
35:. 57 UTC (3,.
312 KB).
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
