TL;DR
- v1 نوع اعلام:.
- متقاطع چکیده:.
- ادغام مدلهای زبان بزرگ (LLM) با عوامل تجسمیافته،.
چه اتفاقی افتاد
v1 نوع اعلام:. متقاطع چکیده:.
ادغام مدلهای زبان بزرگ (LLM) با عوامل تجسمیافته،. قابلیتهای استدلال سطح بالا را بهبود بخشیده است.
با این حال، یک شکاف مهم بین درک معنایی و اجرای فیزیکی باقی میماند. در حالی که سیستمهای vision-language-action (VLA) و vision-language-navigation (VLN) رباتها را قادر میسازند تا وظایف دستکاری و ناوبری.
را از دستورالعملهای زبان طبیعی انجام دهند،. آنها هنوز با وظایف متوالی و ساختار زمانی طولانی مدت مبارزه میکنند.
چارچوبهای موجود معمولاً خطوط لوله مدولار را برای جمعآوری دادهها،. آموزش مهارت و استقرار خطمشی اتخاذ میکنند که منجر به هزینههای بالایی در اعتبارسنجی تجربی و بهینهسازی خطمشی.
میشود. برای پرداختن به این محدودیتها،.
ما ROSClaw را پیشنهاد میکنیم،. یک چارچوب عامل برای روباتهای ناهمگن که یادگیری خطمشی و اجرای کار را در یک مدل زبان-دید واحد.
(VLM) یکپارچه میکند. کنترل کننده این چارچوب از نمایشهای e-URDF رباتهای ناهمگن بهعنوان محدودیتهای فیزیکی برای ساختن یک نقشهبرداری توپولوژیکی شبیه.
به واقعی استفاده میکند و امکان دسترسی بلادرنگ به حالتهای فیزیکی عاملهای شبیهسازیشده و واقعی را فراهم میکند. ما بیشتر یک مکانیسم جمعآوری داده و انباشت حالت را ترکیب میکنیم که حالتهای ربات،.
مشاهدات چندوجهی و مسیرهای اجرا را در طول اجرای واقعی ذخیره میکند و بهینهسازی خط مشی تکراری بعدی. را ممکن میسازد.
در طول استقرار،. یک عامل یکپارچه تداوم معنایی بین استدلال و اجرا را حفظ میکند و بهطور پویا کنترل خاص وظیفه.
را به عوامل مختلف اختصاص میدهد،. در نتیجه استحکام در اجرای چند سیاستی را بهبود میبخشد.
با ایجاد یک چارچوب حلقه بسته مستقل،. ROSClaw اتکا به گردش کار توسعه خاص ربات را به حداقل میرساند.
این چارچوب از اعتبار سنجی در سطح سخت افزار،. تولید خودکار پشتیبانی میکند برنامههای کنترل سطح SDK و اجرای مبتنی بر ابزار،.
انتقال سریع بین پلتفرمیو بهبود مستمر مهارتهای روباتیک را امکانپذیر میسازد. صفحه پروژه ما: https: //www.
rosclaw. io/.
چرا مهم است
اهمیت این خبر در این است که روی استفاده واقعی از AI و تصمیمگیری سازمانی اثر میگذارد.
منبع
لینک منبع اصلی در کارت و صفحه مقاله نمایش داده میشود.
