تکنولوژی

روبات‌های انسان‌نمای چین: از نمایش تا استفاده عملی

این مقاله به بررسی پیشرفت روبات‌های انسان‌نما از نمایش‌های جذاب به کاربردهای عملی در صنعت و به خصوص در خطوط تولید خودرو می‌پردازد. با وجود اینکه روبات‌ها توانایی‌های فیزیکی و نرم‌افزاری خود را بهبود بخشیده‌اند، موانع مهمی نظیر هزینه‌های بالا و چالش‌های تجاری‌سازی همچنان باقی است. معرفی «مغز کوچک» به عنوان لایه‌ای واسطه میان مدل‌های بزرگ چندرسانه‌ای و بدن فیزیکی روبات‌ها از راهکارهای پیشنهادی برای بهبود عملکرد روبات‌ها است.

نی تائو ستون‌نویس نشریه IE است که دیدگاهی اختصاصی درباره اکوسیستم فناوری و مهندسی چین ارائه می‌دهد. ستون او در داخل چین مسائلی را که باعث شکل‌گیری بحث‌ها و درک درباره نوآوری‌های چینی می‌شود، بررسی کرده و دیدگاه‌های تازه‌ای ارائه می‌دهد که در جای دیگر یافت نمی‌شوند.

در ۳۰ اکتبر، بوستون دینامیکس ویدیویی از روبات اطلس خود منتشر کرد که اکنون به‌طور کامل الکتریکی شده و جهشی بزرگی برداشته است.

این بار، روبات با حرکات پارکور ویژه خود مخاطبان را شگفت‌زده نکرد بلکه با انجام کارهای عملی در یک محیط کارخانه‌ای این کار را کرد.

در این ویدئو، اطلس به‌طور خودکار پوشش‌های موتور را بین کانتینرهای تأمین‌کننده در یک کارخانه منتقل می‌کرد. این کار به ظاهر ساده برداشتن و قرار دادن اشیاء، موجی از شگفتی و نگرانی را در جامعه جهانی روباتیک انسان‌نما به‌ویژه در چین به راه انداخت.

اطلس که قبلاً با هیدرولیک قدرت می‌گرفت، نماد جاه‌طلبی‌های مهندسی و معیار بسیاری از کسانی بود که در روباتیک انسان‌نما فعالیت می‌کردند.

اطلس الکتریکی کارهای بسیار خودکار در محیط کارخانه انجام می‌دهد و پوشش‌های موتور را از یک کانتینر به کانتینر دیگر در سراسر کف حرکت می‌دهد. اعتبار: بوستون دینامیکس

با این حال، همانطور که صنعت به سمت الکتریکی کردن پیش می‌رود، افسانه اطلس دیگر همان سطح تحسین را جذب نمی‌کند. بلکه به هدف تمسخر تبدیل شده‌است - یک نمایش پر زرق‌وبرق و گران‌قیمت با ارزش تجاری کم.

اما زمانی که بوستون دینامیکس اطلس بازطراحی شده خود را برای نمایش توانایی انجام کارهای عملی به کار گرفت، مشخص بود که این شرکت در حال تغییر رویکرد است - دیگر تمرکز بر اجرای حرکات پارکور نداشت بلکه به سمت برنامه‌های صنعتی حرکت کرده است.

در کوتاه‌مدت، بازار فوری‌ترین برای ربات‌های انسان‌نما پژوهش‌های STEM است. این ابزارها معمولاً به دانشگاه‌ها، شرکت‌های هوش مصنوعی و توسعه‌دهندگان در چین فروخته می‌شوند اما بازار نسبتاً کوچک است زیرا تقاضا محدود است. طبق نظر ناظران صنعت، باید موارد استفاده سریع‌تری برای باقی‌ماندن از نظر اقتصادی پیدا شود تا اینکه بتوانند سرانجام به خانه‌ها در صدها یا هزارها عنوان نسل جدیدی از ترمینال‌های هوشمند وارد شوند.

پیوند روبات-خودرو

در سطح جهانی، رابطه میان ساخت خودرو و روبات‌های انسان‌نما قوت می‌گیرد. چه مدل شکل ۰۲ وارد کارخانه بی‌ام‌و شود یا روبات‌های زراعی برای تولید، لجستیک و وظایف انبارداری در کارخانه‌های جهانی شفلر AG ، روند آشکار است: روبات‌ها می‌توانند در فرآیند ساخت خودرو کمک کنند.

چین نیز به همین روند پیوسته است. اوایل امسال، پیشگام صنعت مستقر در شنزن، اوبتچ ویدیویی منتشر کرد که روبات پرچمدار خود، واکر S1، را که وظایفی ساده در خط تولید خودرو انجام می‌دهد، نمایش داد؛ مانند بازرسی قطعات، بررسی کمربندها و نصب نشان‌ها.

در حالی که چشمگیر بود، کسانی که درون صنعت بودند سریع به محدودیت‌های آن اشاره کردند. نمایش به دلیل کندی و دراماتیک بودن مورد تمسخر قرار گرفت.

علاوه بر این، شایعاتی بعداً منتشر شد که عکس‌برداری بیش از ده روز طول کشید و بیشتر وقت آن صرف کالیبراسیون دوباره تجهیزات و بازنویسی الگوریتم‌ها توسط مهندسان مستقر شد تا اجرایی صاف از وظایف را تضمین کند.

در میان همه صنایع، ساخت خودرو بی‌وقفه بر راندمان متمرکز است که یک خودرو در هر ۶۰ ثانیه یا کمتر از خط تولید خارج می‌شود.

این منجر به یک سوال می‌شود: اگر روبات‌های انسان‌نما هنوز نمی‌توانند کارگران انسانی را جایگزین کنند، چرا چنین صنعتی که بر راندمان متمرکز است به سرمایه‌گذاری در این فناوری‌های نارس می‌پردازد؟ پاسخ در نیازهای دقیق خطوط تولید مدرن نهفته است.

چن جیانیو، هم‌بنیانگذار استارتاپ روباتیک انسان‌نمای چینی روبات ارا، توضیح می‌دهد که تولید خودرو یک اکوسیستم وسیع و جامع است. این شامل وظایف بزرگ مقیاس مانند پرس، جوشکاری، نقاشی و مونتاژ و وظایف کوچکتر و پیچیده‌تر که نیاز به دقت و تکرارپذیری بالا دارند، می‌شود.

این وظایف نیاز به کار بیشتری برای انجام موثر توسط روبات‌های صنعتی بزرگ مقیاس یا حتی کوچکتر دارند. به عنوان مثال، جابجایی بخش‌های مجزا مانند پیچ‌های کوچک و چرخاندن کابل‌های برق به دور آنها نیاز به دست‌های روباتی با مهارت‌های حرکتی دقیق و حساس و لمسی دارد.

آنها چالش‌هایی برای هر دو بخش سخت‌افزار و نرم‌افزار ایجاد می‌کنند. سخت‌افزار روبات باید طوری طراحی شود که اشیاء نامنظم و غیرقابل پیش‌بینی را دستکاری کند، در حالی که الگوریتم‌های پیشرفته‌ای برای تضمین کنترل دقیق مورد نیاز است.

روبات واکر S1 اوبتچ در کارخانه BYD در چانگشا، پایتخت استان هونان باکس‌ها را حمل می‌کند. اعتبار: اوبتچ

نیازی نیست همه وظایف این سطح بالا از دقت را نیاز داشته باشند. چن اشاره می‌کند که وظایف ساده‌تری مانند مرتب‌سازی قطعات، جابجایی باکس‌ها و حمل و نقل مواد در کوتاه مدت بیشتر امکان‌پذیر هستند. این عملیات‌های پایه‌گذاری و چیدن کمتر چالش‌های فنی را دارند و اغلب مرکز تمرکز آزمایش‌های کنونی کارخانه هستند.

چن می‌گوید روبات‌های انسان‌نما می‌توانند مرحله به مرحله اجرا شوند و به تدریج وظایف پیچیده‌تری را با بهبود قابلیت‌های خود برعهده بگیرند.

با این وجود، تجاری‌سازی با موانع بزرگی روبرو است، به ویژه هزینه. در حال حاضر، روبات‌های انسان‌نمای ساخته شده در چین عموماً بین ۵۰۰,۰۰۰ یوان تا ۱ میلیون یوان ($68,765 تا $137,530) هزینه دارند، قیمتی که بسیاری از خودروسازان نمی‌توانند توجیه کنند درحالیکه در تلاش برای کاهش هزینه‌ها و بهبود راندمان هستند.

در نتیجه، گسترش استفاده از روبات‌های انسان‌نما در خودروسازی یا سایر صنایع تولیدی چین در ۱-۲ سال آینده بعید است. نقطه بازگشت هنوز دور است.

هوش مجسم: شکافی در حال رشد

اما آیا چیزی می‌تواند این فرآیند را تسریع کند؟ پاسخ ممکن است در مناظره‌ای طولانی در داخل صنعت نهفته باشد. با افزایش هوش مجسم، شرکت‌های روباتیک انسان‌نما در چین افزایش یافته‌اند. اکنون بیش از ۱۰۰ شرکت بر روی روباتیک انسان‌نما و زنجیره‌های تأمین مرتبط با آن کار می‌کنند.

با رشد تعداد بازیگران، یک «هیرارکی تحقیر» شکل گرفته است. به طور ساده، تیم‌های متمرکز بر نرم‌افزار به مهندسین سخت‌افزار نگاه تحقیرآمیزی دارند، در حالی که آن‌ها که بر مدل‌های بزرگ متمرکز هستند متخصصان یادگیری تقویتی را دست کم می‌گیرند.

در یک سو از این شکاف تیم‌هایی با سابقه روباتیک هستند که بهره‌برداری از توانایی‌های فیزیکی روبات‌ها را اولویت می‌دهند، با تمرکز بر فرم، بازوها یا مفاصل روبات. در سوی دیگر تیم‌های متمرکز بر نرم‌افزار هستند که بر هوش و چندکاربردی‌بودن روبات‌ها تأکید دارند. در بالای هیرارکی توسعه‌دهندگان مدل‌های بزرگ قرار دارند.

بحث بین این دسته‌ها به طرز جالبی شدید است: آیا روبات‌های انسان‌نما باید به یک بدن فیزیکی محکم برای پشتیبانی از کاربردهای هوش مصنوعی وابسته باشند یا هوش مصنوعی کلید تبدیل بدن‌های بی‌جان به ماشین‌های انسان‌مانند است؟

پاسخ واضح است: هر دو مهم هستند. اما واقعیت تلخ این است که این دو اردوگاه از هم دور شده‌اند، به طوری که شرکت‌های سخت‌افزاری به روش‌های سنتی ادامه می‌دهند و تعامل محدودی با هوش مصنوعی دارند. در حالی که اکثر شرکت‌های متمرکز بر نرم‌افزار ترجیح می‌دهند سخت‌افزار خود را از نو توسعه دهند.

امسال، بسیاری از تولیدکنندگان روبات چینی ویدیوهایی از حرکت روبات‌ها در کارخانه‌ها، مرتب‌سازی کالاها یا انجام وظایف منتشر کردند. این فیلم‌ها نشان می‌دهند که آن‌ها یک تنفس از دستیابی به هوش عام مصنوعی (AGI) دور هستند.

با این حال، پشت نمایش‌های براق، بسیاری از شکست‌ها پنهان است. به عنوان مثال، گرفتن لیوان از یک کشو ممکن است ساده به نظر برسد، اما تغییرات جزیی مانند تغییر زمان روز یا تنظیمات کشو ممکن است باعث شکست آن شود. ممکن است یک نمایش فراوان هزاران بار فیلم‌برداری شود قبل از اینکه موفقیت‌آمیز باشد.

علاوه بر این، مدل‌های زبان بزرگ (LLMs)، که انتظار می‌رفت توانایی‌های روباتیک را به‌طور قابل‌توجهی تقویت کنند، کمتر از حد انتظار مفید بوده‌اند. داده‌های عظیمی که در LLMها ذخیره شده است می‌تواند یک عامل هوش مصنوعی فیزیکی را غرق کند و در اجرای وظایف تداخل ایجاد کند. در حال حاضر، بیشتر شرکت‌های سخت‌افزاری در چین نیاز به درک عمیق‌تر از چگونگی استفاده از مدل‌های بزرگ به‌طور مؤثر به جای تکیه بر مدل‌های زبان آماده دارند. فاصله بین این مدل‌ها و هوش فضایی مورد نیاز توسط روبات‌های انسان‌نما همچنان بزرگ است.

لایه‌واسط «مغز کوچک»

یکی از راهکارهای پیشنهادی معرفی مغز کوچک یا یک لایه واسطه میان مدل‌های بزرگ چندرسانه‌ای روبات و بدن فیزیکی آن است. این مغز کوچک وظایف پیچیده را به زیروظایف قابل مدیریت تقسیم می‌کند.

برای مثال، آبیاری گیاه ممکن است به مراحل مانند برداشتن پارچ، پر کردن آن با آب و ریختن آب تقسیم شود. هر زیروظیفه با الگوریتم‌های کنترل تخصصی اجرا می‌شود، که به روبات امکان می‌دهد به تغییرات محیطی تطبیق پیدا کند.

اما این فرآیند نیاز به تقسیم بیشتر وظایف به هزاران گام دارد. مکانیسم‌های کنترل سنتی مانند درک، برنامه‌ریزی و کنترل باعث می‌شود فرآیند بیش از حد پیچیده شود.

علاوه بر این، آن‌ها به شرایط ایده‌آل نیاز دارند که در محیط‌های دنیای واقعی دشوار است پیاده‌سازی شوند، که ایجاد کننده شکاف از شبیه‌سازی به واقعیت می‌شود.

پیش از ۲۰۲۴، بسیاری از سرمایه‌گذاران به روباتیک انسان‌نما به عنوان یک سرمایه‌گذاری در زمینه سخت‌افزار نگاه می‌کردند. تا نیمه دوم سال، صنعت شروع به تغییر کرد. تمرکز اکنون به سمت توسعه مدل‌های بزرگ و جهانی یکپارچه برای روبات‌ها منتقل شده و بر سیستم‌های مبتنی بر دیده‌یاستان‌های انتها به انتها تاکید بیشتری قرار گرفته است.

امروزه، یک مدل انتها به انتها که هوش فضایی را برای درک دنیای فیزیکی در بر دارد، به توافق عمومی در صنعت تبدیل شده است. این به‌عنوان پایه‌ای برای روبات‌های انسان‌نما عمل می‌کند که عملی‌تر و همه‌کاره‌تر هستند.

علی‌رغم این پیش‌زمینه، بحث جاری بین مدافعان سخت‌افزار و نرم‌افزار بی‌معنی به نظر می‌رسد. با تغییرات جاری در صنعت، هماهنگی این تفاوت‌ها گام اولی حیاتی به سوی تجاری‌شدن روبات‌های انسان‌نما است. تا آن زمان، صنعت باید با انتقادات از کناری زندگی کند.

توسط
Interesting Engineering
منبع
Interesting Engineering
نمایش بیشتر

اخبار مرتبط

بازگشت به بالا