تکنولوژی

ادعای محققان دانشگاه برکلی: ساخت هوش مصنوعی مشابه DeepSeek فقط با ۳۰ دلار!

دانشجویان دکتری دانشگاه برکلی موفق شده‌اند مدل هوش مصنوعی جدیدی توسعه بدهند که گفته می‌شود از نظر عملکرد با مدل R1-Zero از شرکت دیپ‌سیک قابل‌مقایسه است اما محققان برکلی ادعا می‌کنند فقط با۳۰ دلار، هسته اصلی این مدل با نام TinyZero را ساخته‌اند.

شرکت DeepSeek با معرفی مدل R1 موج جدیدی در صنعت ایجاد کرد.

دانشجویان دکتری دانشگاه برکلی موفق شده‌اند مدل هوش مصنوعی جدیدی توسعه بدهند که گفته می‌شود از نظر عملکرد با مدل R1-Zero از شرکت دیپ‌سیک قابل‌مقایسه است اما محققان برکلی ادعا می‌کنند فقط با۳۰ دلار، هسته اصلی این مدل با نام TinyZero را ساخته‌اند.

شرکت DeepSeek با معرفی مدل R1 موج جدیدی در صنعت ایجاد کرد. این مدل ادعا دارد می‌تواند با هزینه‌ای به‌مراتب کمتر از رقبا، کارایی مشابهی ارائه دهد اما تیم دانشگاه برکلی تصمیم گرفته مدلی ارزان‌تر بسازد.

اینکه مدل هوش مصنوعی در عرض چند روز فقط با ۳۰ دلار ساخته شود، برای بسیاری از متخصصان این حوزه شگفت‌انگیز است. این یافته‌ها با تصور رایج درباره اینکه توسعه هوش مصنوعی پیشرفته نیازمند دیتاسنترهای عظیم، پردازنده‌های گران‌قیمت و میلیاردها دلار هزینه است، تعارض دارد. استارتاپ دیپ‌سیک با کاهش چشمگیر هزینه‌های آموزش هوش مصنوعی صنعت فناوری را متحیر کرد اما اکنون تیم دانشگاه برکلی نشان داده این هزینه‌ها می‌توانند کمتر هم باشند. البته به‌ نظر می‌رسد این محققان حتی هزینه ساعت کاری خود را هم در نظر نگرفته‌اند، وگرنه این مبلغ احتمالاً باید بیشتر از این می‌شد.

طرز کار TinyZero، کلون دیپ‌سیک

«TinyZero» براساس یادگیری تقویتی کار می‌کند. در این روش، مدل ابتدا پاسخ‌های تصادفی می‌دهد سپس با اصلاح مداوم، به راه‌حل صحیح نزدیک می‌شود. اگرچه TinyZero همه قابلیت‌های مدل عظیم ۶۷۱ میلیارد پارامتری دیپ‌سیک را ندارد، به گفته سازندگان، رفتارهای کلیدی مدل R1-Zero را تقلید می‌کند.

مدل TinyZero متن‌باز در GitHub منتشر شده است و کاربران می‌توانند کد منبع و نمونه‌هایی از کاربرد آن را مشاهده کنند. داده‌های استفاده‌شده در این پروژه نیز عمومی در دسترس قرار گرفته است.

کلون ۳۰ دلاری DeepSeek

باوجود این دستاورد، برخی منتقدان درباره این ادعاها تردید دارند. آنها معتقدند دیپ‌سیک ممکن است از تکنیک‌های فشرده‌سازی مدل‌های دیگر یا منابع جایگزین استفاده کرده باشد که در هزینه‌ نهایی تأثیر داشته است.

هرچند TinyZero نشان داده یادگیری تقویتی را می‌توان با هزینه کم انجام داد، این مدل هنوز توانایی رقابت با مدل‌های بزرگ‌تر را ندارد. به نظر می‌رسد TinyZero بیشتر پروژه‌ای برای اثبات مفهوم (Proof-of-Concept) باشد تا جایگزینی جدی برای مدل‌های پیشرفته بازار.

در آخر می‌توان گفت TinyZero و DeepSeek R1 نشان‌دهنده افزایش تمایل به مدل‌های کم‌حجم و کم‌مصرف هستند. شاید بسیاری فکر می‌کردند پیشرفت‌های چشمگیر در این حوزه نیازمند هزینه‌های هنگفت است اما اکنون به نظر می‌رسد دانشجوی دکتری یا استارتاپ کوچک هم می‌تواند مسیر هوش مصنوعی را متحول کند.

توسط
دیجیاتو
منبع
دیجیاتو
نمایش بیشتر

اخبار مرتبط

بازگشت به بالا