تکنولوژی

آمریکا 'برنامه درسی' برای ربات‌ها ایجاد می‌کند تا بدون نیاز به انسان مهارت‌ها را مبادله کنند

محققان چارچوبی نوآورانه به نام RoVi-Aug ایجاد کرده‌اند که به ربات‌ها اجازه می‌دهد به صورت خودکار مهارت‌ها را بین مدل‌های مختلف به اشتراک بگذارند. این روش نیاز به دخالت انسان در فرایند یادگیری را کاهش می‌دهد و تمرین رباتیک را ساده می‌کند. از طرف دیگر، الگوریتم Mirage می‌تواند ربات‌های ناشناخته را تطبیق دهد. با این حال، برای یادگیری دقیق، به مدل‌های دقیق ربات و تغییرات بزرگ دوربین نیاز دارد.

مهندسان چارچوب نوآورانه‌ای ایجاد کرده‌اند که به ربات‌ها این امکان را می‌دهد تا مهارت‌ها را بین مدل‌های مختلف به طور خودکار به اشتراک بگذارند.

نام‌گذاری شده RoVi-Aug، این چارچوب نیاز به دخالت انسانی در فرآیند یادگیری را از بین می‌برد و تمرین رباتیک را ساده می‌کند.

آزمایش‌های فیزیکی نشان می‌دهند که RoVi-Aug بر روی داده‌های بهبود یافته آموزش می‌بیند تا فوراً با ربات‌های جدید، بدون توجه به زوایای دوربین، کار کند. برخلاف سایرین، مراحل اضافی در زمان آزمون را نادیده می‌گیرد، سیاست‌ها را تطبیق می‌دهد و وظایف چند ربات را یاد می‌گیرد. این امر کارایی انتقال مهارت را افزایش می‌دهد و نرخ موفقیت را تا ۳۰ درصد افزایش می‌دهد.

به گفته تیم UC برکلی، این روش گامی مهم به سوی توسعه ربات‌های مستقل و سازگارتر است.

مقیاس‌گذاری داده‌های تطبیقی

تحقیقات نشان می‌دهند که افزایش داده‌ها توانایی ربات‌ها در یادگیری مهارت‌های کلی و قابل اعتماد را بهبود می‌بخشد. با این حال، داده‌های ربات‌ها به مراتب کمتر از داده‌های مورد استفاده در مدل‌های پیشرفته AI برای دید و زبان است. جمع‌آوری داده‌های واقعی و متنوع ربات آهسته، پرزحمت و دشوار است تا برای تمرینات تطبیقی مناسب باشد.

مدل‌های موجود مانند پروژه Open-X Embodiment (OXE) داده‌ها را از ۶۰ مجموعه داده ربات ترکیب می‌کنند تا یادگیری مشترک ربات‌ها را افزایش دهند. این رویکرد به ربات‌ها کمک می‌کند تا تجربیات خود را به اشتراک بگذارند و توانایی‌هایشان را بهبود بخشند.

به گفته محققان، مجموعه داده‌ها نیاز به تعادل بیشتری دارند و با ربات‌های خاص مانند فرانکا و xArm غالب هستند و نیاز به زوایای دوربین متنوع دارند. این امر باعث می‌شود که مدل‌ها بیش از حد تطبیق یافته و نیاز به تعدیل هنگام استفاده با ربات‌ها یا نماهای مختلف داشته باشند.

الگوریتم Mirage ربات‌های ناشناخته را از طریق 'رنگ‌آمیزی متقابل' تطبیق می‌دهد و آن‌ها را شبیه ربات‌های آموزشی نشان می‌دهد. در حالی که برای یادگیری خالی از شات موثر است، Mirage دارای ایراداتی است: به مدل‌های دقیق ربات نیاز دارد، از اصلاح دقیق پشتیبانی نمی‌کند و با تغییرات بزرگ در دوربین‌ها مشکل دارد.

کار UC برکلی، RoVi-Aug، رویکرد پیشرفته‌ای را برای غلبه بر ناتوانی‌های تکنیک‌های یادگیری ربات‌های موجود ارائه می‌دهد.

پیشرفت در آموزش ربات‌ها

چارچوب جدید نمایش‌های بصری مصنوعی ایجاد می‌کند که بر اساس نوع ربات و زوایای دوربین متفاوت است و آموزش را همه‌کاره‌تر می‌سازد. این چارچوب شامل دو بخش اصلی است: ماژول افزایش ربات (Ro-Aug) که نمایش‌ها با سیستم‌های رباتیک مختلف تولید می‌کند و ماژول افزایش دیدگاه (Vi-Aug) که نمایش‌ها از زوایای دوربین مختلف را شبیه‌سازی می‌کند.

ترکیب این ماژول‌ها، مجموعه داده آموزشی غنی‌تر و متنوع‌تری را ارائه می‌دهد. این رویکرد به ربات‌ها امکان می‌دهد از دامنه وسیع‌تری از سناریوها یاد بگیرند، توانایی‌شان در انتقال مهارت‌ها به مدل‌ها و وظایف مختلف را بهبود بخشید و نیاز به جمع‌آوری گسترده داده‌های دنیای واقعی را کاهش می‌دهد.

روش پیشنهادی نیاز به جمع‌آوری گسترده داده‌های واقعی جهان را کاهش می‌دهد در حالی که به ربات‌ها امکان می‌دهد در شرایط گوناگون یاد بگیرند و توانایی آن‌ها در انتقال مهارت‌ها بین مدل‌ها و مشاغل مختلف را افزایش می‌دهد.

به گفته محققان، رویکرد جدید استحکام سیاست‌ها و قابلیت تعمیم آن‌ها برای مدیریت نمایش‌های مختلف ربات و زوایای دوربین در طول تمرین‌ها را افزایش می‌دهد و نیاز به تنظیمات دقیق زمان آزمون مانند خطوط لوله رنگ‌آمیزی متقابل را حذف می‌کند.

برخلاف روش‌هایی مانند Mirage، RoVi-Aug به ماتریس‌های شناخته شده دوربین نیاز ندارد و از تنظیم سیاست پشتیبانی می‌کند، که عملکرد را به طور قابل‌توجهی در وظایف پیچیده بهبود می‌بخشد.RoVi-Aug کارایی نمونه‌های تنظیم دقیق را افزایش می‌دهد در حالی که یادگیری سیاست‌های چند ربات و چند وظیفه‌ای را با هم‌آموزی بر روی مجموعه داده‌های اصلی و تقویت شده تسهیل می‌کند.

اگرچه RoVi-Aug مجموعه‌های داده ربات‌ها را هماهنگ می‌کند و انتقال مهارت‌ها را بهبود می‌بخشد، محققان اشاره می‌کنند که دارای نقاط ضعفی است. تحقیقات آینده می‌تواند تغییرات پس‌زمینه را برطرف کند، سنتز دیدگاه با داده‌های رباتیک را بهبود بخشد، مدل‌های جفت ربات را یکپارچه کند و مدیریت آثار هنری را بهبود بخشد.

تعمیم ممکن است با گسترش به دست‌گیرهای مختلف، مانند دست‌های چند انگشتی، و یکپارچه‌سازی با افزایش شیء و وظیفه بیشتر تقویت شود.

جزئیات تحقیقات تیم UC برکلی در ArXiv پیش‌انتشار شد.

توسط
Interesting Engineering
منبع
Interesting Engineering
نمایش بیشتر

اخبار مرتبط

بازگشت به بالا