ادعای محققان دانشگاه برکلی: ساخت هوش مصنوعی مشابه DeepSeek فقط با ۳۰ دلار!
دانشجویان دکتری دانشگاه برکلی موفق شدهاند مدل هوش مصنوعی جدیدی توسعه بدهند که گفته میشود از نظر عملکرد با مدل R1-Zero از شرکت دیپسیک قابلمقایسه است اما محققان برکلی ادعا میکنند فقط با۳۰ دلار، هسته اصلی این مدل با نام TinyZero را ساختهاند.
شرکت DeepSeek با معرفی مدل R1 موج جدیدی در صنعت ایجاد کرد.
دانشجویان دکتری دانشگاه برکلی موفق شدهاند مدل هوش مصنوعی جدیدی توسعه بدهند که گفته میشود از نظر عملکرد با مدل R1-Zero از شرکت دیپسیک قابلمقایسه است اما محققان برکلی ادعا میکنند فقط با۳۰ دلار، هسته اصلی این مدل با نام TinyZero را ساختهاند.
شرکت DeepSeek با معرفی مدل R1 موج جدیدی در صنعت ایجاد کرد. این مدل ادعا دارد میتواند با هزینهای بهمراتب کمتر از رقبا، کارایی مشابهی ارائه دهد اما تیم دانشگاه برکلی تصمیم گرفته مدلی ارزانتر بسازد.
اینکه مدل هوش مصنوعی در عرض چند روز فقط با ۳۰ دلار ساخته شود، برای بسیاری از متخصصان این حوزه شگفتانگیز است. این یافتهها با تصور رایج درباره اینکه توسعه هوش مصنوعی پیشرفته نیازمند دیتاسنترهای عظیم، پردازندههای گرانقیمت و میلیاردها دلار هزینه است، تعارض دارد. استارتاپ دیپسیک با کاهش چشمگیر هزینههای آموزش هوش مصنوعی صنعت فناوری را متحیر کرد اما اکنون تیم دانشگاه برکلی نشان داده این هزینهها میتوانند کمتر هم باشند. البته به نظر میرسد این محققان حتی هزینه ساعت کاری خود را هم در نظر نگرفتهاند، وگرنه این مبلغ احتمالاً باید بیشتر از این میشد.
طرز کار TinyZero، کلون دیپسیک
«TinyZero» براساس یادگیری تقویتی کار میکند. در این روش، مدل ابتدا پاسخهای تصادفی میدهد سپس با اصلاح مداوم، به راهحل صحیح نزدیک میشود. اگرچه TinyZero همه قابلیتهای مدل عظیم ۶۷۱ میلیارد پارامتری دیپسیک را ندارد، به گفته سازندگان، رفتارهای کلیدی مدل R1-Zero را تقلید میکند.
مدل TinyZero متنباز در GitHub منتشر شده است و کاربران میتوانند کد منبع و نمونههایی از کاربرد آن را مشاهده کنند. دادههای استفادهشده در این پروژه نیز عمومی در دسترس قرار گرفته است.
باوجود این دستاورد، برخی منتقدان درباره این ادعاها تردید دارند. آنها معتقدند دیپسیک ممکن است از تکنیکهای فشردهسازی مدلهای دیگر یا منابع جایگزین استفاده کرده باشد که در هزینه نهایی تأثیر داشته است.
هرچند TinyZero نشان داده یادگیری تقویتی را میتوان با هزینه کم انجام داد، این مدل هنوز توانایی رقابت با مدلهای بزرگتر را ندارد. به نظر میرسد TinyZero بیشتر پروژهای برای اثبات مفهوم (Proof-of-Concept) باشد تا جایگزینی جدی برای مدلهای پیشرفته بازار.
در آخر میتوان گفت TinyZero و DeepSeek R1 نشاندهنده افزایش تمایل به مدلهای کمحجم و کممصرف هستند. شاید بسیاری فکر میکردند پیشرفتهای چشمگیر در این حوزه نیازمند هزینههای هنگفت است اما اکنون به نظر میرسد دانشجوی دکتری یا استارتاپ کوچک هم میتواند مسیر هوش مصنوعی را متحول کند.