مهندسان چارچوب نوآورانهای ایجاد کردهاند که به رباتها این امکان را میدهد تا مهارتها را بین مدلهای مختلف به طور خودکار به اشتراک بگذارند.
نامگذاری شده RoVi-Aug، این چارچوب نیاز به دخالت انسانی در فرآیند یادگیری را از بین میبرد و تمرین رباتیک را ساده میکند.
آزمایشهای فیزیکی نشان میدهند که RoVi-Aug بر روی دادههای بهبود یافته آموزش میبیند تا فوراً با رباتهای جدید، بدون توجه به زوایای دوربین، کار کند. برخلاف سایرین، مراحل اضافی در زمان آزمون را نادیده میگیرد، سیاستها را تطبیق میدهد و وظایف چند ربات را یاد میگیرد. این امر کارایی انتقال مهارت را افزایش میدهد و نرخ موفقیت را تا ۳۰ درصد افزایش میدهد.
به گفته تیم UC برکلی، این روش گامی مهم به سوی توسعه رباتهای مستقل و سازگارتر است.
مقیاسگذاری دادههای تطبیقی
تحقیقات نشان میدهند که افزایش دادهها توانایی رباتها در یادگیری مهارتهای کلی و قابل اعتماد را بهبود میبخشد. با این حال، دادههای رباتها به مراتب کمتر از دادههای مورد استفاده در مدلهای پیشرفته AI برای دید و زبان است. جمعآوری دادههای واقعی و متنوع ربات آهسته، پرزحمت و دشوار است تا برای تمرینات تطبیقی مناسب باشد.
مدلهای موجود مانند پروژه Open-X Embodiment (OXE) دادهها را از ۶۰ مجموعه داده ربات ترکیب میکنند تا یادگیری مشترک رباتها را افزایش دهند. این رویکرد به رباتها کمک میکند تا تجربیات خود را به اشتراک بگذارند و تواناییهایشان را بهبود بخشند.
به گفته محققان، مجموعه دادهها نیاز به تعادل بیشتری دارند و با رباتهای خاص مانند فرانکا و xArm غالب هستند و نیاز به زوایای دوربین متنوع دارند. این امر باعث میشود که مدلها بیش از حد تطبیق یافته و نیاز به تعدیل هنگام استفاده با رباتها یا نماهای مختلف داشته باشند.
الگوریتم Mirage رباتهای ناشناخته را از طریق 'رنگآمیزی متقابل' تطبیق میدهد و آنها را شبیه رباتهای آموزشی نشان میدهد. در حالی که برای یادگیری خالی از شات موثر است، Mirage دارای ایراداتی است: به مدلهای دقیق ربات نیاز دارد، از اصلاح دقیق پشتیبانی نمیکند و با تغییرات بزرگ در دوربینها مشکل دارد.
کار UC برکلی، RoVi-Aug، رویکرد پیشرفتهای را برای غلبه بر ناتوانیهای تکنیکهای یادگیری رباتهای موجود ارائه میدهد.
پیشرفت در آموزش رباتها
چارچوب جدید نمایشهای بصری مصنوعی ایجاد میکند که بر اساس نوع ربات و زوایای دوربین متفاوت است و آموزش را همهکارهتر میسازد. این چارچوب شامل دو بخش اصلی است: ماژول افزایش ربات (Ro-Aug) که نمایشها با سیستمهای رباتیک مختلف تولید میکند و ماژول افزایش دیدگاه (Vi-Aug) که نمایشها از زوایای دوربین مختلف را شبیهسازی میکند.
ترکیب این ماژولها، مجموعه داده آموزشی غنیتر و متنوعتری را ارائه میدهد. این رویکرد به رباتها امکان میدهد از دامنه وسیعتری از سناریوها یاد بگیرند، تواناییشان در انتقال مهارتها به مدلها و وظایف مختلف را بهبود بخشید و نیاز به جمعآوری گسترده دادههای دنیای واقعی را کاهش میدهد.
روش پیشنهادی نیاز به جمعآوری گسترده دادههای واقعی جهان را کاهش میدهد در حالی که به رباتها امکان میدهد در شرایط گوناگون یاد بگیرند و توانایی آنها در انتقال مهارتها بین مدلها و مشاغل مختلف را افزایش میدهد.
به گفته محققان، رویکرد جدید استحکام سیاستها و قابلیت تعمیم آنها برای مدیریت نمایشهای مختلف ربات و زوایای دوربین در طول تمرینها را افزایش میدهد و نیاز به تنظیمات دقیق زمان آزمون مانند خطوط لوله رنگآمیزی متقابل را حذف میکند.
برخلاف روشهایی مانند Mirage، RoVi-Aug به ماتریسهای شناخته شده دوربین نیاز ندارد و از تنظیم سیاست پشتیبانی میکند، که عملکرد را به طور قابلتوجهی در وظایف پیچیده بهبود میبخشد.RoVi-Aug کارایی نمونههای تنظیم دقیق را افزایش میدهد در حالی که یادگیری سیاستهای چند ربات و چند وظیفهای را با همآموزی بر روی مجموعه دادههای اصلی و تقویت شده تسهیل میکند.
اگرچه RoVi-Aug مجموعههای داده رباتها را هماهنگ میکند و انتقال مهارتها را بهبود میبخشد، محققان اشاره میکنند که دارای نقاط ضعفی است. تحقیقات آینده میتواند تغییرات پسزمینه را برطرف کند، سنتز دیدگاه با دادههای رباتیک را بهبود بخشد، مدلهای جفت ربات را یکپارچه کند و مدیریت آثار هنری را بهبود بخشد.
تعمیم ممکن است با گسترش به دستگیرهای مختلف، مانند دستهای چند انگشتی، و یکپارچهسازی با افزایش شیء و وظیفه بیشتر تقویت شود.
جزئیات تحقیقات تیم UC برکلی در ArXiv پیشانتشار شد.