ادعای دانشمندان آمریکایی مبنی بر بازتولید مدل هوش مصنوعی DeepSeek با هزینه ناچیز
گروهی از محققان در دانشگاه کالیفرنیا، برکلی، ادعا کردهاند که تکنولوژی اصلی پشت پرده هوش مصنوعی DeepSeek، که در اخبار بودن را به خود اختصاص داده، را با هزینه کلی حدودی ۳۰ دلار بازتولید کردهاند.
این خبر تویستی جدید در روایت در حال توسعه سریعی است مبنی بر اینکه آیا ساخت هوش مصنوعی پیشرفته نیازمند بودجههای کلان است یا اینکه گزینههای بسیار مقرونبهصرفهتر توسط بزرگترین نقشآفرینان تکنولوژی نادیده گرفته شدهاند.
DeepSeek اخیراً با معرفی R1، به موجآفرینی پرداخت، مدلی از هوش مصنوعی که ادعا میکند با صرف کسری از هزینههای آموزشی معمول در سیلیکون ولی، به تکثیر عملکردهای ChatGPT و دیگر سیستمهای گرانقیمت پرداخته است.
پاسخ تیم برکلی؟ آنها آن را حتی ارزانتر انجام دادهاند. به سرپرستی جیایی پان دانشجوی دکترا، محققان نسخهای کوچکتر، به نام “TinyZero” ایجاد کرده و آن را برای آزمایش عمومی در GitHub منتشر کردهاند. برخلاف اینکه فاقد وزن عظیم ۶۷۱ میلیارد پارامتری پیشنهاد اصلی DeepSeek است، پان میگوید TinyZero رفتارهای اصلی مشاهدهشده در مدل موسوم به “R1-Zero” DeepSeek را به دست میآورد.
رویکرد پان بر یادگیری تقویتی تمرکز دارد، تکنیکی که در آن هوش مصنوعی با شروع از حدسهای تقریباً تصادفی، به تدریج پاسخهای خود را با تجدید نظر و جستجو در میان راهحلهای ممکن بهبود میبخشد. در پستی که پروژه را توصیف میکند، به بازی Countdown اشاره کرد، یک پازل تلویزیونی بریتانیایی که در آن بازیکنان با استفاده از اعداد دادهشده به مقدار هدف برسند. “نتایج: فقط کار میکند!” پان نوشت که اگرچه هوش مصنوعی ابتدا “منتجات تقلبی” را بیرون داد، در نهایت فهمید که چگونه اشتباهات خود را تصحیح کند.
<h2 id=