یک تغییر عمده؟ دیدگاه چین درباره دیپ‌سیک و مسابقه جهانی هوش مصنوعی

Interesting Engineering

11/18 22:12

نی تائو، ستون‌نویس IE، نظرات اختصاصی خود را درباره اکوسیستم فناوری و مهندسی چین منتشر می‌کند. ستون Inside China او به بررسی مسائلی می‌پردازد که مباحث و درک درباره نوآوری چینی را شکل می‌دهند و نگاهی تازه به موضوعات ارائه می‌دهند.

بمب خبری دیپ‌سیک در ژانویه همچنان به جامعه جهانی هوش مصنوعی می‌پیچد.

یکی از ویژگی‌های قابل توجه این دستیار هوش مصنوعی این است که با بهبودهای الگوریتمی، عملکرد سطح ChatGPT-4o را با استفاده از 2048 واحد پردازش گرافیکی (GPU) انویدیا H800 به دست آورد.

به طور جالب، این شرکت ادعا می‌کند که هزینه آموزش تنها 5.576 میلیون دلار بوده، که بخش کوچکی از هزینه‌هایی است که OpenAI، متا، گوگل و Anthropic برای مدل‌های زبان بزرگ (LLM) خود پرداختند. برخی منابع این ادعا را مورد تردید قرار داده و پیشنهاد می‌کنند که مقادیر واقعی بالاتر است.

به طور خلاصه، دیپ‌سیک اثبات کرده که چین می‌تواند بخشی از تحریم‌ها یا محدودیت‌های آمریکا بر تراشه‌های پیشرفته را با نوآوری‌های الگوریتمی دور بزند. این موضوع برای صنعت هوش مصنوعی کشور که سال‌ها فاقد قدرت محاسباتی بوده، تقویت قابل توجهی ایجاد کرده است.

یک مسابقه بدون اسلحه‌ها

برای مدت طولانی، توسعه LLM شبیه به مسابقه تسلیحاتی شناخته شده که شرکت‌کنندگان میلیاردها دلار برای کسب تراشه‌های هوش مصنوعی پیشرفته هزینه کرده‌اند. اما چین تحت تحریم‌های شدید آمریکا قرار دارد که دسترسی به این تراشه‌ها و ابزار ساخت تراشه پیشرفته را محدود کرده است.

بنابراین، بزرگ‌ترین افشاگری پیشرفت‌های دیپ‌سیک این است که یک تغییر الگو ایجاد کرده است.

پذیرش تکنیک‌های موثر هزینه مانند مدل ترکیب کارشناسان (MoE) و آموزشی مختلط FP8 (اعداد شناور 8 بیتی) به طور قابل‌توجهی نیازهای محاسباتی برای آموزش مدل‌های بزرگ را کاهش داده و کارایی را بهبود بخشیده است.

MoE به مدل های کارشناس مختلف اجازه می‌دهد که در وظایف مختلف تخصص‌یابند و دینامیکاً مهم‌ترین کارشناسان را برای محاسبات انتخاب کنند. این موضوع عملکرد بالا را همراه با کاهش هزینه‌ها تضمین می‌کند.

در عین حال، آموزش مختلط FP8 با استفاده استراتژیک از اعداد شناور 8 بیتی جایی که دقت بالا نیاز نیست، حافظه و کارایی محاسبات را بهینه می‌کند.

برخلاف شرکت‌های آمریکایی هوش مصنوعی که به دلیل وجود منابع محاسباتی فراوان عمدتاً به دقت 16 بیتی پایبند می‌مانند، دیپ‌سیک مجبور به استفاده از FP8 برای کارایی شده است، همان‌طور که آراویند سرینیواس، مدیرعامل پرپلکسیتی AI در یک مصاحبه CNBC اخیر اشاره کرده است.

لوگوی دیپ‌سیک بر روی صفحه یک گوشی هوشمند در 27 ژانویه 2025 در سوچیان، استان جیانگسو چین نمایش داده می‌شود. VCG via Getty Images

در یک حرکت دیگر در نوآوری، دیپ‌سیک روش‌های آموزشی LLM را با اولویت‌دهی به یادگیری تقویتی (RL) بر روی روش‌های سنتی تنظیم دقیق نظارت‌شده (SFT) انقلابی ساخته است. از نمونه‌گیری چندپاسخ و داده‌های خودتولید برای RL برای توسعه قابلیت‌های استدلال پیچیده استفاده کرده است.

در نتیجه، دیپ‌سیک-R1-Zero اولین مدل کاملاً آموزش‌دیده از طریق RL بدون SFT شد، اثباتی بر اینکه LLMها می‌توانند تنها با انگیزه‌های تقویتی استدلال کنند. این باعث باز کردن راه برای برنامه‌های RL پس از آموزشی بیشتر و بهینه‌سازی‌های الگوریتمی شده است.

کاهش جذبه زورآزمایی؟

علاوه بر این، رشد فوق العاده دیپ‌سیک فرصت‌های جدیدی را برای توسعه‌دهندگان هوش مصنوعی باز کرد.

این مسیر سنتی محاسبات بزرگ و برتری‌های سخت‌افزاری که توسط غول‌های آمریکایی مانند OpenAI، گوگل و متا ترجیح داده می‌شود را منحرف کرد.

ترکیب مدلی کوچکتر (با پارامترهای کمتر)، نیازهای محاسباتی پایین و الگوریتم‌های قوی می‌تواند باعث تقلید گسترده توسط توسعه‌دهندگانی شود که منابع مشابه در اختیار ندارند.

استراتژی منبع باز نیز در مرکز موفقیت آن قرار گرفت. دیپ‌سیک-R1 که تحت مجوز MIT عرضه شده است، کاملاً منبع باز می‌باشد و به توسعه‌دهندگان اجازه می‌دهد که از آن استفاده، تغییر و توزیع کنند. این به اشتراک‌گذاری دانش هوش مصنوعی و نوآوری را تقویت کرده و برای شرکت حمایت قابل توجه کاربران و حسن نیت به‌دست آورده است.

موضع منبع باز دیپ‌سیک حتی رقبا مانند OpenAI را تحت فشار قرار داده است که o3-mini، اولین مدل استدلال رایگان خود را برای مقابله با تأثیر دیپ‌سیک منتشر کنند. حتی سم آلتمن در Reddit اذعان داشت که "ما [OpenAI] در تاریخ در طرف نادرست قرار داشتیم و نیاز داریم یک استراتژی منبع باز متفاوت را پیدا کنیم."

ورود دیپ‌سیک بدین ترتیب باعث بر هم زدن بحث‌های جاری بر سر مزایای منبع باز در مقابل منبع بسته برای LLMها شده است.

با این حال، هنوز نامشخص است که آیا این به طور بنیادین رویکرد توسعه زورآزمایی بر اساس قوانین مقیاس‌پذیری را تغییر خواهد داد، یعنی جایی که مدل‌های قدرتمند می‌توانند با استفاده از منابع محاسباتی و داده‌های گسترده آموزش ببینند.

مدل زورآزمایی تحت نظارت فزاینده‌ای قرار گرفته است زیرا سرمایه‌گذاران نگران هستند که آیا سرمایه‌گذاری‌های عظیم شرکت‌های آمریکایی در توسعه هوش مصنوعی توجیه‌پذیر است یا نه. این نگرانی‌ها باعث افت ارزش سهام انویدیا شده و باعث فروش سهام فناوری آمریکا گشته است.

تغییر‌بازی یا همگرایی در افق؟

اما خواه دیپ‌سیک با تمرکز بر بهینه‌سازی منابع محاسباتی باشد یا مدل زورآزمایی با نشانه‌های ورودی عظیم تراشه و داده، هیچ تضاد ذاتی بین این دو وجود ندارد. در واقع، ممکن است در نقطه‌ای به هم بیانجامند.

سرانجام همه چیز از این قرار است که OpenAI، متا و گوگل نیز مدام در حال ارتقاء مدل‌های خود هستند، احتمالاً به سمت الهام‌گرفته از دیپ‌سیک. و اگر دیپ‌سیک می‌تواند، قطعاً دست خود را بر روی منابع محاسباتی بیشتر خواهد گذاشت.

عکس: لوگویی دیپ‌سیک بر روی صفحه یک گوشی هوشمند در تاریخ ۲۷ ژانویه ۲۰۲۵ در سوچیان، چین نمایش داده شده است. VCG via Getty Images

این موضوع در یک اعلامیه توسط شرکت مادر دیپ‌سیک، صندوق هج پرواز بالا، در اوایل 2023 مشخص شد. این شرکت اعلام کرد که تعداد 10,000 واحد پردازش گرافیکی (GPU) انویدیا A100 با کارایی بالا به‌دست آورده است.

H800، یک نسخه کاهش یافته که دیپ‌سیک مدل LLM خود را روی آن آموزش داده بود، احتمالاً یک رزرو استراتژیک بود قبل از این که آمریکا تحریم‌های چپ‌ها را در نوامبر همان سال تشدید کند. شایعاتی وجود دارد که این شرکت تا 50,000 GPU H100 را انبار کرده است. برخلاف پیش‌بینی‌های جسورانه، تراشه‌های هوش مصنوعی در تکانه دیپ‌سیک کاهش نیافته‌اند.

تفاوت‌ها میان کارآفرینی‌های هوش مصنوعی در چین و آمریکا بیشتر در استراتژی‌هایی هستند که شرایط خاص خود به آن‌ها نیاز کرده، اما با ظهور دیپ‌سیک، این تفاوت‌ها به نحوی کاهش خواهند یافت.

در اینجا یکی از بزرگ‌ترین معماهای رقابت فناوری نهفته است. مهم نیست که عم‌جان سام چگونه سعی در حفظ پیشتازی رهبران هوش مصنوعی آمریکا بر رقبای چینی خود از طریق ممنوعیت تراشه‌ها یا کنترل‌های صادراتی شدیدتر دارد، در برخی جنبه‌ها آن‌ها شبیه‌تر خواهند شد. اگر کمک به بهبود مدل‌ها و کاهش هزینه‌ها نماید، یادگیری متقابل اجتناب‌ناپذیر است.

با توجه به این که محدودیت‌های تراشه‌ها در چین برای آینده نزدیک باقی خواهند ماند، دیپ‌سیک و لشکری از تقلیدکنندگان دیپ‌سیک احتمالاً بر بهینه‌سازی عملکرد نرم‌افزار، سخت‌افزار و الگوریتم تمرکز خواهند کرد.

زیانی برای آمریکا، سودی برای هوآوی؟

موفقیت چشمگیر دیپ‌سیک بدون نگرانی نیست. حملات سایبری اخیر به خدمات آن، که به طور ادعایی از آمریکا سرچشمه گرفته‌اند، نشان می‌دهد که قدرت جدید هوش مصنوعی چین هنوز ایمن نیست.

گفته می‌شود که آمریکا در حال بررسی تحریم‌های گسترده‌تر تراشه است در مقابل تهدید از دیپ‌سیک. این ممکن است شامل قطع دسترسی به حتی H20، یک GPU خاص چین که تنها 20 درصد از توان محاسباتی H100 را دارد، بشود.

با این حال، این حرکت ممکن است فقط دیپ‌سیک را بیشتر به آغوش دشمن آمریکا هوآوی بکشاند. طبق گزارش رسانه‌های چینی، دیپ‌سیک در 1 فوریه خدمات استنتاج R1/V3 خود را که با تراشه‌های Ascend 910B هوآوی قدرت گرفته، رونمایی کرد.

هوآوی می‌گوید Ascend 910B عملکرد 256 TFLOPS از FP16 را ارائه می‌دهد و به 80 درصد از Nvidia A100 می‌رسد. وقتی در یک خوشه ابرمحاسباتی مستقر می‌شود، نیاز به استنتاج مدل‌های بزرگ را برآورده می‌کند. Ascend 910C جدیدتر هوآوی می‌تواند حتی بیشتر انجام دهد، با قابلیت‌های استنتاج گفته شده که به 60 درصد از GPU H100 Nvidia می‌رسد، Tom’s Hardware در 4 فوریه گزارش داده، به گزارش تحقیقات دیپ‌سیک.

تصویر نمایشی از تراشه انویدیا. Antonio Bordunovi/iStock

نقطه ضعف آشیل در AI چین هرگز فقط کمبود GPU با عملکرد بالا نبوده است. تسلط Nvidia بیشتر از اکوسیستم CUDA ساخته شده در اطراف تراشه‌های آن است که بسیاری از توسعه‌دهندگان یاحیرزا می‌کنند آن را دور بزنند.

شراکت جدید با Ascend وعده‌ای برای جایگزینی CUDA با استفاده از Ascend CANN (معماری محاسباتی برای شبکه‌های عصبی) هوآوی ارائه می‌دهد. از نظر تئوریک، این می‌تواند به دیپ‌سیک اجازه دهد که آموزش بی وقفه‌ای را بر روی یک خوشه GPUهزارگانه با نوشتن مستقیم کدهای اجرای رشته موازی (PTX) برای مدل‌های استنتاجی خود به دست آورد. به عبارت ساده، این راهی برای شکستن انحصار CUDA ارائه می‌دهد.

مزایای دیگر شامل مجموعه‌ای از ابزارهای موجود برای توسعه‌دهندگان است. این ویژگی به جذب بیش از 20,000 برنامه‌نویس به نسخه آنلاین دیپ‌سیک تنها در سه روز پس از ایجاد آن کمک کرد. اینکه آیا Ascend می‌تواند یک اکوسیستم پر رونق برای به چالش کشیدن CUDA ایجاد کند، حداقل در چین، برای تماشا جالب خواهد بود.

پیشگام‌سازی یک چرخه اکوسیستم

دیپ‌سیک به سختی جاه‌طلبی‌های خود را برای پیشگامی در چرخه اکوسیستم پنهان می‌کند. در پاسخ به سوالاتی در مورد تصمیم شرکت برای کاهش قیمتها در خدمات LLM خود، بنیان‌گذار و مدیرعامل لیانگ ون‌فنگ دیپ‌سیک قبلاً توضیح داده است که «API‌ها و AI باید در دسترس همه باشد، مقرون به صرفه برای همه باشد.»

«برای سال‌های زیادی، شرکت‌های چینی به دیگران برای نوآوری‌های تکنولوژیک تکیه کرده و بر روی کاربرد آن‌ها برای سود تمرکز کرده‌اند. اما این دیگر رویکرد نیست»، لیانگ در ژانویه 2025 گفت. «هدف ما اکنون این نیست که سود سریع کسب کنیم; بلکه پیشبرد مرزهای فناوری و تحریک توسعه اکوسیستم است.»

چین هرگز به‌طور واقعی در جلوترین خط AI نبوده است از زمانی که LLMها در اوایل 2023 شیوع پیدا کردند. بلکه، غالباً به عنوان یک تف جایگزین دیده می‌شود که تنها به دنبال جاگذاری برای رهبران آمریکایی بود. اما اکنون یک استارتاپ چینی وجود دارد که نه تنها نوآوری را رهبری کرده بلکه همچنین با منبع باز کردن فناوری‌های خود، چین را به یک پایگاه اخلاقی نادر رسانده است.

البته، دیپ‌سیک [یک نقطه تحول در تاریخ هوش مصنوعی خواهد بود، نه تنها به‌عنوان «لحظه اسپوتنیک» چین، بلکه همچنین یک حسابدار در صنعت LLM.

اگر یکی فراتر از عناوین را بخواند، آشکار است که رقابت هوش مصنوعی آمریکا-چین دیگر تنها بر سر مدل‌های فردی یا تراشه‌ها نخواهد بود. بلکه، این یک برخورد اکوسیستم‌ها، فلسفه‌ها و ارزش‌ها خواهد شد.

این یک ماراتن است که هنوز برنده‌ای واضح ندارد. کدام طرف در نهایت پیروز خواهد شد بستگی به این دارد که چه کسی راه‌حل‌هایی ارائه کند که به بزرگترین عنوان مشترک مشتری بیاید.

توسط

منبع