استارتاپ نوظهور « فیزیکال اینتلیجنس » (Physical Intelligence) علاقهای به ساخت ربات ندارد. درعوض، این شرکت مدل هوش مصنوعی معرفی کرده که مانند مغز به رباتهای موجود امکان میدهد وظایف مختلفی را انجام دهند که نیازمند حرکات دقیق و مهارت بالاست؛ ازجمله کارهای خانه.
این مدل مانند «مغز» سختافزارهای رباتیک عمل میکند و همواره درحال یادگیری است؛ درنتیجه، ماشینهای مجهز به آن میتوانند وظایف مختلفی را انجام دهند ؛ ازجمله بیرونآوردن لباسها از خشککن لباسشویی و تاکردن آنها، چیدن مرتب تخممرغها در ظرف مخصوص، آسیابکردن قهوه و مرتبسازی میز. با این فناوری، تصور رباتهایی که مانند فیلمهای علمی-تخیلی به کارهای خانه رسیدگی میکنند، چندان دشوار نیست.
کمپانی آمریکایی فیزیکال اینتلیجنس یا بهاختصار «پی» (π) این «مدل بنیادی ربات همهمنظوره» را π 0 (پی-صفر) نامیده است.
هدف پی آن است که رباتهای فیزیکی نیز در آینده بتوانند مانند مدلهای زبانی بزرگ و دستیارهای هوش مصنوعی از پس هر وظیفهای بربیایند؛ نه اینکه فقط منحصر به یک یا چند وظیفه خاص باشند. مدل π 0 مانند مدلهای زبانی بزرگ با دادههای بزرگ و متنوع آموزش میبیند و میتواند دستورالعملهای متنی مختلفی را دنبال کند.
π 0 تصاویر، متنها و کنشها را بررسی میکند و با تمرین از طریق تجربه واقعی رباتها هوش فیزیکی خود را بهبود میدهد؛ بهاینترتیب π 0 با استفاده از معماری نوآورانه فرمانهای سطح پایین را مستقیم به ماشینها انتقال میدهد. کاربران میتوانند برای انجام وظیفه موردنظر یا حل سناریویی چالشبرانگیز به π 0 دستور یا «پرامپت» (Prompt) بدهند.
کمپانی π در ویدیوی زیر بخشی از تواناییهای رباتهای مجهز به π 0 را در انجام کارهای خانه نمایش داده است.
آینده رباتها برای کار در خانه
هدف کمپانی π حل مسئلههای خاص نیست. آنها میخواهند یک مدل ایجاد کنند که تعاملات فیزیکی را میفهمد و با استفاده از این هوش فیزیکی، کارهای مختلف انجام میدهد. در معرفی این مدل، ربات مجهز به π 0 توانست ۲۰ وظیفه مختلف را اجرا کند.
مدل π 0 قرار است مانند حیوانات همهفنحریف در طبیعت، مانند راکونها و خرسهای گریزلی، باشد. این حیوانات مهارتهای تخصصی بالایی ندارند اما میتوانند با بسیاری از زیستگاهها و منابع غذایی سازگار شوند؛ درنتیجه، آنها مقابل تغییرات پویای محیطی بسیار مقاوماند؛ برخلاف حیوانات متخصص، مانند زنبورها که توانایی زیادی برای مقابله با تغییرات ندارند.
مدل π 0 از مدل بینایی-زبانی (VLM) برای تمرین اولیه و از روش « مطابقت جریان » (flow matching) برای هماهنگی حرکات خود با یادگیریهای هوش مصنوعی استفاده میکند؛ بهاینترتیب، π 0 تبدیل به مدلی همهکاره میشود.
هیچکدام از وظایف ویدیوی بالا بهتنهایی هیجانانگیز یا جدید نیستند اما π 0 توانسته با ۱۰ هزار ساعت تمرین و ۷ سختافزار رباتیک مختلف به ۶۸ وظیفه متفاوت مسلط شود که ویژگی نویدبخشی است.
کمپانی π هنوز در مراحل اولیه پژوهش و توسعه است اما مهندسان آن عقیده دارند مدلشان موانع موجود بر سر راه ایجاد هوش فیزیکی همهکاره را از میان برمیدارد؛ ازجمله زمان و هزینهای که برای تمرین سختافزارها بهمنظور یادگیری وظایف جدید لازم است.