TL;DR
- چکیده:.
- جمعآوری تظاهرات انسانی از طریق عملیات از راه دور یک رویکرد رایج برای آموزش مهارتهای کار خاص به.
- روباتها است.
چه اتفاقی افتاد
چکیده:. جمعآوری تظاهرات انسانی از طریق عملیات از راه دور یک رویکرد رایج برای آموزش مهارتهای کار خاص به.
روباتها است. با این حال،.
زمانی که تنها تعداد محدودی از نمایشها در دسترس هستند،. سیاستها مستعد ورود به حالتهای خارج از توزیع (OOD) به دلیل خطاهای ترکیبی یا تصادفی محیطی.
هستند. روشهای یادگیری تقلیدی تعاملی موجود یا روشهای انسان در حلقه سعی میکنند با پیروی از پارادایم خنجر دردار.
انسانی (HG-DAgger) به این موضوع بپردازند،. رویکردی که تظاهرات را از طریق مداخله انتخابی انسانی در طول اجرای سیاست افزایش میدهد.
با این وجود،. این رویکردها برای متعادل کردن مهارت و کلیت تلاش میکنند:.
آنها یا اصلاحات دقیقی را ارائه میکنند اما به ساختارهای سینماتیکی خاص محدود میشوند،. یا به بهای کنترل دقیق به عمومیت میرسند.
برای غلبه بر این محدودیت،. چارچوب انسان-ربات Copilot را پیشنهاد میکنیم که میتواند از یک عامل مقیاس برای عملیات از راه.
دور ماهرانه استفاده کند و در عین حال سازگاری با طیف گستردهای از دستکاریهای صنعتی و. تحقیقاتی را حفظ کند.
نتایج تجربی نشان میدهد که چارچوب ما با همان تعداد مسیرهای نمایشی به عملکرد بالاتری دست مییابد. علاوه بر این،.
از آنجایی که مداخلات اصلاحی فقط به صورت متناوب مورد نیاز است،. فرآیند جمعآوری دادهها کارآمدتر و زمانبرتر است.
رباتیک (cs. RO) استناد بهعنوان: (یا v1 [cs.
RO] برای این نسخه) https:. // شده توسط arXiv از طریق DataCite (در انتظار ثبت نام) تاریخچه ارسال از:.
Rui Yan [مشاهده ایمیل] [v1] شنبه،. 4 آوریل 2026،.
07:. 00:.
32 UTC (3,. 036 KB).
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
