ادعای دانشمندان آمریکایی مبنی بر بازتولید مدل هوش مصنوعی DeepSeek با هزینه ناچیز

Interesting Engineering

11/12 19:12

گروهی از محققان در دانشگاه کالیفرنیا، برکلی، ادعا کرده‌اند که تکنولوژی اصلی پشت پرده هوش مصنوعی DeepSeek، که در اخبار بودن را به خود اختصاص داده، را با هزینه کلی حدودی ۳۰ دلار بازتولید کرده‌اند.

این خبر تویستی جدید در روایت در حال توسعه سریعی است مبنی بر اینکه آیا ساخت هوش مصنوعی پیشرفته نیازمند بودجه‌های کلان است یا اینکه گزینه‌های بسیار مقرون‌به‌صرفه‌تر توسط بزرگ‌ترین نقش‌آفرینان تکنولوژی نادیده گرفته شده‌اند.

DeepSeek اخیراً با معرفی R1، به موج‌آفرینی پرداخت، مدلی از هوش مصنوعی که ادعا می‌کند با صرف کسری از هزینه‌های آموزشی معمول در سیلیکون ولی، به تکثیر عملکردهای ChatGPT و دیگر سیستم‌های گران‌قیمت پرداخته است.

پاسخ تیم برکلی؟ آنها آن را حتی ارزان‌تر انجام داده‌اند. به سرپرستی جیایی پان دانشجوی دکترا، محققان نسخه‌ای کوچک‌تر، به نام “TinyZero” ایجاد کرده و آن را برای آزمایش عمومی در GitHub منتشر کرده‌اند. برخلاف اینکه فاقد وزن عظیم ۶۷۱ میلیارد پارامتری پیشنهاد اصلی DeepSeek است، پان می‌گوید TinyZero رفتارهای اصلی مشاهده‌شده در مدل موسوم به “R1-Zero” DeepSeek را به دست می‌آورد.

رویکرد پان بر یادگیری تقویتی تمرکز دارد، تکنیکی که در آن هوش مصنوعی با شروع از حدس‌های تقریباً تصادفی، به تدریج پاسخ‌های خود را با تجدید نظر و جستجو در میان راه‌حل‌های ممکن بهبود می‌بخشد. در پستی که پروژه را توصیف می‌کند، به بازی Countdown اشاره کرد، یک پازل تلویزیونی بریتانیایی که در آن بازیکنان با استفاده از اعداد داده‌شده به مقدار هدف برسند. “نتایج: فقط کار می‌کند!” پان نوشت که اگرچه هوش مصنوعی ابتدا “منتجات تقلبی” را بیرون داد، در نهایت فهمید که چگونه اشتباهات خود را تصحیح کند.

<h2 id=

توسط

منبع