محققان چارچوبی در حرکت چهارپاها با الهام از طبیعت با قابلیت انطباقپذیری فوقالعاده ایجاد کردهاند.
چارچوب جدید یادگیری تقویت عمیق (DRL) که از حرکت حیوانات الهام گرفته شده است، انطباقپذیری چهارپاها را از طریق انتقال بین راهرفتنیهای گوناگون، حافظه رویهای و تنظیمات حرکتی بلادرنگ افزایش میدهد و محدودیتهای روشهای کنترلی موجود را بازنگری میکند.
مدل تیم دانشگاه لیدز و دانشگاه کالج لندن بدون نیاز به حسگرهای بیرونی، در زمینهای پیچیده مستقر میشود و پایداری خود را بر روی زمینهای ناپایدار حفظ میکند.
به گفته محققان، توسعه این مدل همچنین به پیچیدگیهای استراتژیهای حرکت حیوانات اشاره میکند و نشان میدهد که تحقیقات بیومکانیک و رباتیک چگونه میتوانند یکدیگر را پیش ببرند.
مدل الهامگرفته از زیست
الهامگرفته از انطباقپذیری فوقالعاده حرکت پستانداران، که توسط عوامل ذاتی و محیطی شکل گرفته است، رباتیک چهارپا در حال پیشرفت در توسعه چارچوبهای حرکت پیشرفته است.
سیستمهای فعلی اغلب به DRL با چندلایه پرسپترونها (MLPs) متکی هستند که برای پیمایش در زمینهای مختلف آموزش دیدهاند. این چارچوبها در مقاومت، مدیریت تغییرات، پرش، عبور از سطوح تغییرپذیر و بازیابی از سقوط عالی عمل میکنند. با این حال، انطباقپذیری آنها محدود است و اغلب به یک استراتژی راهرفتنی متکی است.
در عوض، تحقیقات بیومکانیک نشان میدهد که حیوانات از راهرفتنیهای متنوعی استفاده میکنند، مانند تروت یا دویدن برای کارایی، و راهرفتنیهای ویژه، مانند حبو برای وظایف خاص.
به گفته محققان، انطباقپذیری از سه ویژگی کلیدی ناشی میشود: استراتژیهای پیشرفته انتخاب راهرفتنی، حافظه رویهای راهرفتنی برای استقرار سریع و تنظیمات دقیق حرکتی برای شرایط نامعرفت. در حالی که برخی از روشهای DRL برای چند راهرفتنی آموزش دیدهاند، هنوز قادر به ترکیب همزمان همه این ویژگیها بهطور کامل نیستند.
روشهای الهامگرفته از زیست، مانند ژنراتورهای مرکزی الگویی (CPGs)، انتقالات خودبهخودی راهرفتنی را ممکن میسازند اما در کاربردهای واقعی محدود باقی میمانند.
تیم تأکید میکند که افزوده شدن ویژگیهای بیومکانیکی سطح بالا—کارایی انرژی، کمینهسازی کار مکانیکی و هماهنگی عضلانی-اسکلتی—به چارچوبهای DRL میتواند این شکاف را پر کند و انطباقپذیری و عملکرد حرکت رباتیک را در محیطهای پیچیده بهبود بخشد.
چارچوب راهرفتنی انطباقپذیر
الهامگرفته از حرکت حیوانات، محققان چارچوبی توسعه دادهاند که به رباتها اجازه میدهد زمینهای پیچیده و پرخطر را بدون حسگرهای بیرونی و با آموزشهای خاص حرکت کنند.
این توسط ترکیب خروجی BGS βL، که حافظه راهرفتنی رویهای وابسته به وضعیت و تنظیمات حرکتی انطباقپذیر را کدگذاری میکند، به فضای مشاهداتی ربات محقق شد.
تیم تأکید میکند که بدون βL، ربات با ناپایداری و شکست بیشتر مشابه حالت حذف مخچه در حیوانات مواجه میشود که هماهنگی اندامها و پایداری را مختل میکند. این تأیید میکند که βL بهطور مؤثر حافظه راهرفتنی رویهای را نمایندگی میکند.
مولفه πuniG چارچوب انطباقپذیری را با امکانپذیر ساختن استراتژیهای انتخاب راهرفتنی بهینه، شبیه به حیوانات، افزایش میدهد. حتی در سطوح با تغییرات ساختاری یا اصطکاکی ناگهانی—شرایطی که رباتهای مبتنی بر دید اغلب با آن مواجه هستند—پایداری را حفظ میکند.
محققان ادعا میکنند که πuniG این عملیات را بدون نیاز به حسگرهای پرهزینه با استفاده از راهرفتنیهای کمکی برای پیشگیری از شکست انجام میدهد. پیچیدگیهای انتقال راهرفتنی حیوانات در این رفتار انعکاس مییابد که در حین آموزش هدفمند نیست.
قابل ذکر است که نیروهای ساختاری محرک به عنوان نشانگر ناپایداری مشاهده شدند، که تفسیرهای قبلی را به چالش میکشید. هرچند که معیارهای بیومکانیک تنها بر روی حیوانات در حال حرکت خطی بر روی زمین صاف آزمایش شد، πuniG این معیارها را با موفقیت در زمینهای متنوع و سرعتهای مختلف اعمال کرد.
«این رویکرد به چارچوب ما اجازه میدهد انطباقپذیری بینظیری را بدست آورد که از طریق استقرار بیهیچ چشمگیری بر روی زمینهای پیچیده و بازیابی از وضعیتهای بحرانی ناپایدار نشان داده میشود. یافتههای ما اطلاعات ارزشمندی درباره بیومکانیک حرکت حیوانات ارائه میدهد و راه را برای سیستمهای رباتیک مقاوم و انعطافپذیر هموار میکند،» تیم در چکیده مطالعه گفت.
محققان میگویند که این همچنین به پتانسیل رباتها برای تأیید فرضیات بیومکانیک بدون چالشهای آزمایشهای حیوانی اشاره دارد. کارهای آینده حسگرهای بیرونی برای برنامهریزی راهرفتنی پیشگیرانه را یکپارچه خواهد کرد و خطرات ناپایداری را کاهش خواهد داد.
جزئیات تحقیق تیم در مجله arXiv منتشر شد.