تبدیل سگ رباتیک MIT به استاد پارکور با LucidSim بدون تمرین در دنیای واقعی
پژوهشگران در MIT یک شبیهساز مبتنی بر هوش مصنوعی ساختهاند که قادر به تولید دادههای آموزشی بیحد و حصر و واقعگرایانه برای رباتها میباشد.
این سیستم که LucidSim نام دارد، از تصاویر تولید شده توسط هوش مصنوعی برای آموزش یک سگ رباتیک در پارکور به صورت کاملاً مجازی استفاده میکند.
طبق گفتههای تیم آزمایشگاه علوم کامپیوتر و هوش مصنوعی (CSAIL) در MIT، رباتهایی که در این محیط مجازی آموزش دیدهاند، میتوانند وظایف واقعی را بدون نیاز به تنظیمات بیشتر انجام دهند.
Ge Yang، پسا دکترای MIT CSAIL و یک از پژوهشگران اصلی LucidSim، در بیانیهای گفت: «یک چالش بنیادی در یادگیری رباتها همیشه تفاوت بین محیطهای آموزشی شبیهسازی شده و دنیای واقعی پیچیده و غیرقابل پیشبینی بوده است.»
پیشرفت در آموزش شبیهسازی شده
قابلیت تعمیم - توانایی ماشینآلات برای سازگاری با هر محیط - همچنان یک چالش اساسی برای رباتیکدانها باقی مانده است. از دهه 1970، این زمینه از برنامهنویسی به یادگیری عمیق پیشرفت کرده، و به رباتها امکان یادگیری از رفتار انسان را داده است. با این حال، کیفیت دادهها همچنان یک گلوگاه است.
رباتها باید با سناریوهایی که محدودیتهای آنها را تحت فشار قرار میدهد، روبرو شوند که به طور سنتی نیاز به اپراتورهای انسانی برای هدایت یادگیری آنها دارد. این رویکرد با افزایش تقاضا برای دادههای آموزشی با کیفیت بالا دچار مشکل میشود و مشکل مقیاسپذیری را ایجاد میکند.
پژوهشگران CSAIL در MIT از LucidSim برای غلبه بر این چالش بهره میبرند و با استفاده از هوش مصنوعی مولد و شبیهسازهای فیزیکی، محیطهای مجازی متنوع و واقعگرایانهای ایجاد میکنند که به رباتها امکان میدهد وظایف پیچیده را بدون اتکا به دادههای دنیای واقعی مسلط شوند.
به گفته پژوهشگران، این نوآوری آموزش و بهرهبرداری رباتهای هوشمند و سازگار را تسریع کرده و راهحلی مقیاسپذیر برای دستیابی به عملکرد رباتیک حرفهای ارائه میدهد.
LucidSim با ادغام مدلهای مولد با شبیهسازی فیزیکی، یکی از دائمیترین مشکلات رباتیک را حل میکند: اعمال تواناییهای یادگرفته شده از شبیهسازی به دنیای واقعی. این سیستم چندجنبهای ترکیبی از فناوریهای مختلف است.
LucidSim اساساً با استفاده از مدلهای زبان بزرگ، انواع مختلفی از توصیفات سازمانیافته از محیطها ایجاد میکند. سپس مدلهای مولد برای تبدیل این توصیفات به تصاویر استفاده میشوند. یک مدل فیزیکی پایه روش ایجاد را هدایت میکند تا اطمینان حاصل شود که این تصاویر فیزیک دنیای واقعی را به درستی نشان میدهند.
یادگیری رباتیک با الهام از هوش مصنوعی
الهام LucidSim در یک گفتگوی غیررسمی در کمبریج، ماساچوست به دست آمد که به پیشرفتی در آموزش رباتهایی با قابلیت دید منجر شد.
تیم یک روش برای تولید تصاویر واقعگرایانه با استخراج نقشههای عمقی و ماسکهای معنایی از صحنههای شبیهسازی شده طرحریزی کردند و اطلاعات ضروری هندسی و برچسبگذاری ارائه میدهند. برای اطمینان از تنوع، آنها متون پیشنهادی متنوعی را از سیستمهای هوش مصنوعی استفاده کردند.
با شناخت نیاز به محتوای دینامیک، آنها «رویاهای در حرکت» را توسعه دادند، روشی که تصاویر منفرد را به ویدیوهای کوتاه و منسجم تبدیل میکند. این روش جابجایی پیکسلها بین قابها را محاسبه میکند، به گونهای که با استفاده از هندسه صحنه 3D و تغییرات در دیدگاه ربات، تجارب آموزشی واقعگرایانه ایجاد میکند.
این سیستم از روش تصادفی سازی دامنه، یک روش سال 2017 که رنگها و الگوهای تصادفی را به اشیاء در محیط اعمال میکند، پیشی میگیرد و همچنان به طور گستردهای استفاده میشود.
آلن یو، دانشجوی کارشناسی در رشته مهندسی برق و علوم کامپیوتر در MIT و نویسنده همگام LucidSim، در بیانیهای گفت: «در حالی که این تکنیک دادههای متنوع تولید میکند، از واقعگرایی بیبهره است. LucidSim به مشکلات تنوع و واقعگرایی میپردازد. جالب است که حتی بدون دیدن دنیای واقعی در حین آموزش، ربات میتواند موانع را در محیطهای واقعی شناسایی و طی کند.»
بازتعریف رباتیک
تیم برای LucidSim در وظایف فراتر از حرکت، از جمله دستکاری موبایل که در آن رباتها اشیاء را در فضاهای باز با استفاده از درک پیشرفته رنگها داره پردازد، پتانسیلی میبیند.
یانگ گفت: «امروز، این رباتها همچنان از نمایشهای دنیای واقعی یاد میگیرند. اگرچه جمعآوری نمایشها آسان است، مقیاسگذاری یک تنظیم تلهعملیات ربات دنیای واقعی به هزاران مهارت چالشی است زیرا انسان باید هر صحنه را به صورت فیزیکی آماده کند. ما امیدواریم این کار را آسانتر کنیم و به این ترتیب مقیاسپذیری بیشتر کیفیتی ایجاد کنیم، با انتقال جمعآوری داده به یک محیط مجازی.»
تیم ادعا میکند که LucidSim به طور قابل توجهی از روشهای آموخته از کارشناسان در آموزش ربات ها عملکرد بهتری داشته است. رباتهایی که با دادههای کارشناس آموزش دیده بودند، تنها 15 درصد موفقیت داشتند، حتی با دادههای بیشتر. با استفاده از LucidSim برای جمعآوری دادههای تمرینی خود، نرخ موفقیت به 88 درصد رسید. سیستم به چالشهای ایجاد واقعگرایی بصری برای انتقال آموزشی شبیهسازی به واقعیت دنیای واقعی پرداخته است.
Shuran Song, استاد دستیار مهندسی برق در دانشگاه استنفورد، در بیانیهای گفت: «چارچوب LucidSim راهحلی زیبا ارائه میدهد با استفاده از مدلهای مولد برای ایجاد دادههای بصری متنوع و بسیار واقعگرا برای هر شبیهسازی. این کار میتواند به طور قابلتوجهی تسریع کند استقرار رباتها را که در محیطهای مجازی آموزش دیده شدهاند به وظایف دنیای واقعی.»
تیم بر این باور است که پیشرفتهایی مانند LucidSim در حال هدایت توسعه رباتهایی هوشمند و سازگار است که قادر به مسلط شدن در وظایف پیچیده دنیای واقعی هستند، کاملاً از طریق آموزش مجازی.