تکنولوژی

اوپن‌ای‌آی و دیگر شرکت‌ها به دنبال مسیر تازه‌ای برای بهبود عملکرد هوش مصنوعی هستند

شرکت‌های هوش مصنوعی برای غلبه بر مشکلات و تاخیرهای غیرمنتظر در توسعه مدل‌های زبانی بزرگتر به دنبال ترفند‌های جدید آموزشی هستند که از روش‌های انسان‌گونه‌ای برای «تفکر» الگوریتم‌ها استفاده می‌کند.

به گزارش پیوست به نقل از رویترز، ده‌ها پژوهشگر، محقق و سرمایه‌گذار می‌گویند این ترفند‌ها که یکی از بنیان‌های توسعه مدل o1 هستند ممکن است شکل تازه‌ای به رقابت هوش مصنوعی بدهند و تبعاتی برای انرژی و چیپ‌های خواهند داشت.

پس از عرضه چت‌بات محبوب ChatGPT در سال ۲۰۲۲، شرکت‌های فناوری که در حال حاضر با رقم‌های خیره‌کننده ارزش‌گذاری می‌شوند به دنبال توسعه ابعاد این مدل‌ها بودند و از داده بیشتر و افزایش قدرت رایانشی در این مسیر بهره گرفته‌اند.

اما حالا پژوهشگران ارشد این حوزه رویکرد «بزرگتر بهتر است» را مورد تحت بازبینی دارند و ممکن است رویکرد تازه‌ای را در مسیر توسعه این صنعت مشاهده کنیم.

ایلیا سوتسکور، هم‌بنیان‌گذار شرکت هوش مصنوعی Safe Superintelligence (SSI) و یکی از بنیان‌گذاران اوپن‌ای‌آی، می‌گوید در حال حاضر نتیجه حاصل از توسعه پیش آموزش (مرحله‌ای که یک مدل هوش مصنوعی با استفاده از مقدار زیادی داده آموزش دیده و الگو‌ها و ساختارهای آن را درک می‌کند) به بن‌بست رسیده است.

سوتسکور به عنوان یکی از افراد تاثیرگذار در جهش‌های هوش مصنوعی مولد و آموزش این مدل‌های شناخته می‌شود که در نهایت به توسعه ChatGPT منتهی شد.

شرکت‌های هوش مصنوعی برای غلبه بر مشکلات و تاخیرهای غیرمنتظر در توسعه مدل‌های زبانی بزرگتر به دنبال ترفند‌های جدید آموزشی هستند که از روش‌های انسان‌گونه‌ای برای «تفکر» الگوریتم‌ها استفاده می‌کند.

به گزارش پیوست به نقل از رویترز، ده‌ها پژوهشگر، محقق و سرمایه‌گذار می‌گویند این ترفند‌ها که یکی از بنیان‌های توسعه مدل o1 هستند ممکن است شکل تازه‌ای به رقابت هوش مصنوعی بدهند و تبعاتی برای انرژی و چیپ‌های خواهند داشت.

پس از عرضه چت‌بات محبوب ChatGPT در سال ۲۰۲۲، شرکت‌های فناوری که در حال حاضر با رقم‌های خیره‌کننده ارزش‌گذاری می‌شوند به دنبال توسعه ابعاد این مدل‌ها بودند و از داده بیشتر و افزایش قدرت رایانشی در این مسیر بهره گرفته‌اند.

اما حالا پژوهشگران ارشد این حوزه رویکرد «بزرگتر بهتر است» را مورد تحت بازبینی دارند و ممکن است رویکرد تازه‌ای را در مسیر توسعه این صنعت مشاهده کنیم.

ایلیا سوتسکور، هم‌بنیان‌گذار شرکت هوش مصنوعی Safe Superintelligence (SSI) و یکی از بنیان‌گذاران اوپن‌ای‌آی، می‌گوید در حال حاضر نتیجه حاصل از توسعه پیش آموزش (مرحله‌ای که یک مدل هوش مصنوعی با استفاده از مقدار زیادی داده آموزش دیده و الگو‌ها و ساختارهای آن را درک می‌کند) به بن‌بست رسیده است.

سوتسکور به عنوان یکی از افراد تاثیرگذار در جهش‌های هوش مصنوعی مولد و آموزش این مدل‌های شناخته می‌شود که در نهایت به توسعه ChatGPT منتهی شد. او ابتدای سال جاری میلادی پس از جدایی از اوپن‌ای‌آی شرکت SSI را بنیان‌گذاری کرد.

سوتسکور می‌گوید: «دهه ۲۰۱۰ عصر توسعه بود، حالا بار دیگر به عصر پرسش و کشف بازگشته‌ایم. همه به دنبال پدیده بزرگ بعدی هستند. در حال حاضر مهمترین چیز این است که یک عنصر درست را توسعه دهید.»

سوتسکور جزئیات بیشتری درمورد پیشرفت تیمش در این حوزه اشاره نکرد و تنها گفت SSI در حال کار روی رویکردی متفاوت نسبت به توسعه پیش از آموزش است.

افراد مطلع می‌گویند که پژوهشگران در پشت پرده بزرگترین آزمایشگا‌ه‌های هوش مصنوعی با تاخیر و ناامیدی برای ساخت مدلی بهتر از GPT-4 مواجه شده‌اند که حدود دو سالی از عمرش می‌گذرد.

روند آموزش مدل‌های بزرگتر ممکن است ده‌ها میلیون دلار هزینه داشته باشد و در عین حال به صدها چیپ تخصصی نیاز است. با توجه به پیچیدگی این سیستم‌ها، احتمال ناتوانی سخت‌افزار هم بیشتر می‌شود و پژوهشگران ممکن است از عملکرد نهایی یک مدل که شاید روند توسعه آن ماه‌ها زمان ببرد اطلاعی نداشته باشند.

مساله دیگر این است که مدل‌های بزرگ زبانی مقدار زیادی داده را می‌طلبند و مدل‌های هوش مصنوعی در حال حاضر بیشتر داده‌های عمومی را استفاده کرده‌اند. کمبود انرژی نیز یکی دیگر از موانع توسعه این سیستم‌ها است.

پژوهشگران برای غلبه بر این موانع در حال بررسی ترفندی به نام «تخمین زمان آزمایش» هستند که مدل‌های موجود را در مرحله «استنباط» یا همان زمان استفاده از آنها، تقویت می‌کند. برای مثال به جای انتخاب یک پاسخ واحد و فوری، مدل می‌تواند چندین احتمال را در لحظه تولید و ارزیابی کند و در نهایت بهترین مسیر را انتخاب کند.

این روش به مدل‌ها اجازه می‌دهد تا توان رایانشی بیشتری را به وظایف پیچیده مثل ریاضی و کدنویسی یا عملیات‌های پیچیده که نیازمند استدلال انسان‌گونه و تصمیم‌گیری هستند، اختصاص دهند.

نوام براون، پژوهشگری از اوپن‌ای‌آی که روی مدل o1 فعالیت داشته است ماه گذشته در کنفرانس هوش مصنوعی TED در سن‌ فرانسیسکو، گفت: «متوجه شدیم که وادار کردن یک روبات به تنها ۲۰ ثانیه فکر کردن در یک دست پوکر باعث شد تا عملکرد مدل معادل با توسعه ۱۰۰ هزار برابری و آموزش ۱۰۰ هزار بار طولانی‌تر افزایش یابد.»

اوپن‌ای‌آی در مدل جدید o1 از همین ترفند استفاده کرده است. این مدل می‌تواند به شکلی گام به گام روی مسائل فکر کند و فرایندی شبیه به استدلال انسانی را رقم بزند. همچنین در این مدل از داده‌ها و بازخورد ساخته متخصصان استفاده شده است. وجه تمایز اصلی این مدل‌‌ها، آموزش‌های اضافی روی مدل‌های پایه از جمله GPT-4 است و شرکت می‌گوید سعی دارد از این ترفند برای مدل‌های پایه بیشتری استفاده کند.

پژوهشگران دیگر آزمایشگاه‌های هوش مصنوعی از آنتروپیک گرفته تا xAI و گوگل دیپ‌مایند نیز روی نسخه‌های خاص خود از این ترفند کار می‌کنند.

کوین ویل، مدیرمحصول اوپن‌ای‌آی در یک کنفرانس فناوری در ماه اکتبر گفت: «ما میوه‌های رسیده زیادی را می‌بینیم که با چیدنشان خیلی سریع قرار است این مدل‌ها تقویت شوند. ما سعی داریم تا وقتی که دیگران به ما برسند، سه قدم یا بیشتر از آنها جلو باشیم.»

این پیشرفت‌ها می‌توانند گسترده صحنه رقابت برای سخت‌افزار هوش مصنوعی را به طور کامل دگرگون کند و در نتیجه تقاضای فزاینده برای پردازنده‌های انویدیا نیز کاهش یابد. فعالان بزرگ سرمایه‌گذاری جسولان از سکویا گرفته تا اندرسن هورویتز، که میلیارد‌ها دلار روی توسعه مدل‌های پیشرفته هوش مصنوعی در چندین آزمایشگاه سرمایه‌گذاری کرده‌آند می‌گویند در حال بررسی این روند و تاثیر آن بر سرمایه‌گذاری‌های خود هستند.

به گفته سونیا هوانگ، یکی از شرکای شرکت سرمایه‌گذاری جسورانه سکویا کپیتال، می‌گوید: «این تحول ما را از جهان خوشه‌های بزرگ پیش آموزشی به سمت استنباط ابری حرکت می‌دهد که رویکردی توزیعی است و از سرور‌های ابری برای استنباط استفاده می‌کند.»

تقاضا برای چیپ‌های پیشرفته انویدیا باعث شده تا این شرکت در ماه اکتبر با عبور از اپل به ارزشمندترین شرکت جهان تبدیل شود. در صورت تحول بازار و عبور از چیپ‌های آموزشی، ممکن است رقابت بیشتری را برای انویدیا شاهد باشیم.

توسط
پیوست
منبع
پیوست
نمایش بیشتر

اخبار مرتبط

بازگشت به بالا