هوش مصنوعی جدید دیپمایند به رباتها یاد میدهد بند کفش ببندند و وظایف پیچیده انجام دهند
گوگل دیپمایند دو سیستم هوش مصنوعی جدید معرفی کرده که برای کمک به یادگیری و انجام وظایف پیچیده با حرکات دقیق طراحی شدهاند.
اولین سیستم، ALOHA Unleashed، نسخه ارتقاء یافته ALOHA 2 است. مجهز به دو بازو، این سیستم میتواند از راه دور کنترل شود تا دادههای آموزشی با کیفیت بالا جمعآوری کند، به رباتها اجازه میدهد تا با نمایشهای کمتری وظایف جدید را یاد بگیرند.
DemoStart با استفاده از الگوریتم یادگیری تقویتی، پیشرفت در یادگیری رفتارهای مختلف را با تنها چند نمایش شبیهسازی شده شروع میکند.
با استفاده از این سیستمها، تیم دیپمایند رباتها را در شبیهسازیها و وظایف دنیای واقعی آزمایش کرده است. این رباتها موفق به بستن بند کفش، جایگذاری دندهها، جایگزینی قطعات رباتی، آویزان کردن پیراهنها و تمیز کردن آشپزخانه شدهاند.
با این حال، توانایی بستن بند کفش این رباتها هنوز در حال توسعه است و نیاز به بهبود دارد.
گوگل در یک بیانیه اظهار کرد: «این سیستمها با کمک به یادگیری رباتها از نمایشهای انسانی و تبدیل تصاویر به عمل، راه را برای رباتهایی که میتوانند وظایف مختلف و مفید را انجام دهند هموار میکنند».
تا کنون، بیشتر رباتهای هوش مصنوعی پیشرفته قادر به استفاده از یک بازو برای برداشتن و موقعیتیابی اجسام بودهاند. دیپمایند ادعا میکند که ALOHA Unleashed در کنترل دوبازویی به یک درجه بالا از مهارت دست یافته است.
روش ALOHA Unleashed بر اساس پلتفرم ALOHA 2 توسعه یافته که خود از ALOHA اصلی، یک سیستم سختافزاری متنباز کم هزینه برای تلهاپراسیون دوبازویی از دانشگاه استنفورد، منشأ گرفته است.
طبق گفته تیم، ALOHA 2 از سیستمهای قبلی ماهرتر است. این سیستم دارای دو دست تلهاپراسیون برای تسهیل آموزش و جمعآوری دادهها است که به رباتها اجازه میدهد تا با نمایشهای کمتری وظایف جدید را یاد بگیرند.
آخرین سیستم همچنین شامل طرح ارگونومیک بهبود یافته و یک فرآیند یادگیری پیشرفته است. دادههای نمایش با کنترل از راه دور ربات برای انجام وظایف پیچیده مانند بستن بند کفش و آویزان کردن تیشرتها جمعآوری شد.
روش دیفیوژن، مشابه با مدل Imagen که برای تولید تصاویر استفاده میشود، برای پیشبینی اعمال ربات از نویز تصادفی اعمال شد. این روش به ربات امکان میدهد تا از دادهها بیاموزد و وظایف مشابه را به تنهایی انجام دهد.
کنترل یک دست رباتی ماهرانه یک چالش پیچیده است، بهخصوص وقتی که انگشتها، مفاصل و سنسورهای بیشتری اضافه میشود. DemoStart، رویکرد جدیدی که در تحقیقات اخیر شرح داده شده، با استفاده از یادگیری تقویتی به رباتها کمک میکند تا در شبیهسازیها مهارتهای ماهرانهای را پرورش دهند. این روش بهویژه برای رباتهایی با ویژگیهای پیچیده مانند دستهای چندانگشتی مفید است.
DemoStart با یادگیری از وظایف ساده شروع میکند و بتدریج به وظایف پیچیدهتر میرسد، هر وظیفه را قدم به قدم تسلط پیدا میکند. در مقایسه با روشهای سنتی یادگیری از مثالهای دنیای واقعی، DemoStart به 100 برابر نمایشی شبیهسازی شده کمتر برای دستیابی به همان سطح مهارت نیاز دارد.
توسعه یافته با استفاده از MuJoCo، یک شبیهساز فیزیک متنباز، رفتارهای آموخته شده توسط DemoStart میتوانند با تنظیمات کم به رباتهای فیزیکی منتقل شوند. تکنیکهایی مانند تصادفیسازی حوزه میتوانند فاصله شبیهسازی تا واقعیت را پوشش دهند.
این روش با کاهش نیاز به آزمایشهای فیزیکی هر دو زمان و هزینهها را صرفهجویی میکند. با این حال، طراحی شبیهسازیهایی که به طور موفقیتآمیز به عملکرد دنیای واقعی ترجمه شوند یکی از چالشهای همیشگی بوده است.
یادگیری تقویتی DemoStart، همراه با چند نمایش، یک برنامه آموزشی ایجاد میکند که به طور موثری این فاصله را پر میکند. در آزمایش بر روی یک دست رباتی سه انگشتی، DEX-EE، این روش در شبیهسازی موفقیت بالای بیش از 98 درصد برای وظایفی مانند بازچینی مکعب و سفت کردن مهرهها و تا 97 درصد در آزمایشهای واقعی برای وظایف مشابه به دست آورد.
به گفته دیپمایند، رباتیک یکی از رشتههای منحصربهفرد مطالعه هوش مصنوعی است که نشان میدهد رویکردهای ما چگونه در دنیای واقعی موثر هستند. برای مثال، حتی اگر یک مدل زبان وسیع در یک ربات پیادهسازی شود، نمیتواند وظایفی مانند بستن بند کفش یا سفت کردن مهره را به تنهایی انجام دهد.
تیم دیپمایند گفت: «روزی، رباتهای هوش مصنوعی به افراد در انجام انواع وظایف در خانه، محل کار و بیشتر کمک خواهند کرد. تحقیقات مربوط به مهارتدست، از جمله رویکردهای یادگیری عمومی و کارآمد که امروز توصیف کردهایم، به ایجاد آن آینده کمک خواهند کرد».