نی تائو، ستوننویس IE، نظرات اختصاصی خود را درباره اکوسیستم فناوری و مهندسی چین منتشر میکند. ستون Inside China او به بررسی مسائلی میپردازد که مباحث و درک درباره نوآوری چینی را شکل میدهند و نگاهی تازه به موضوعات ارائه میدهند.
بمب خبری دیپسیک در ژانویه همچنان به جامعه جهانی هوش مصنوعی میپیچد.
یکی از ویژگیهای قابل توجه این دستیار هوش مصنوعی این است که با بهبودهای الگوریتمی، عملکرد سطح ChatGPT-4o را با استفاده از 2048 واحد پردازش گرافیکی (GPU) انویدیا H800 به دست آورد.
به طور جالب، این شرکت ادعا میکند که هزینه آموزش تنها 5.576 میلیون دلار بوده، که بخش کوچکی از هزینههایی است که OpenAI، متا، گوگل و Anthropic برای مدلهای زبان بزرگ (LLM) خود پرداختند. برخی منابع این ادعا را مورد تردید قرار داده و پیشنهاد میکنند که مقادیر واقعی بالاتر است.
به طور خلاصه، دیپسیک اثبات کرده که چین میتواند بخشی از تحریمها یا محدودیتهای آمریکا بر تراشههای پیشرفته را با نوآوریهای الگوریتمی دور بزند. این موضوع برای صنعت هوش مصنوعی کشور که سالها فاقد قدرت محاسباتی بوده، تقویت قابل توجهی ایجاد کرده است.
یک مسابقه بدون اسلحهها
برای مدت طولانی، توسعه LLM شبیه به مسابقه تسلیحاتی شناخته شده که شرکتکنندگان میلیاردها دلار برای کسب تراشههای هوش مصنوعی پیشرفته هزینه کردهاند. اما چین تحت تحریمهای شدید آمریکا قرار دارد که دسترسی به این تراشهها و ابزار ساخت تراشه پیشرفته را محدود کرده است.
بنابراین، بزرگترین افشاگری پیشرفتهای دیپسیک این است که یک تغییر الگو ایجاد کرده است.
پذیرش تکنیکهای موثر هزینه مانند مدل ترکیب کارشناسان (MoE) و آموزشی مختلط FP8 (اعداد شناور 8 بیتی) به طور قابلتوجهی نیازهای محاسباتی برای آموزش مدلهای بزرگ را کاهش داده و کارایی را بهبود بخشیده است.
MoE به مدل های کارشناس مختلف اجازه میدهد که در وظایف مختلف تخصصیابند و دینامیکاً مهمترین کارشناسان را برای محاسبات انتخاب کنند. این موضوع عملکرد بالا را همراه با کاهش هزینهها تضمین میکند.
در عین حال، آموزش مختلط FP8 با استفاده استراتژیک از اعداد شناور 8 بیتی جایی که دقت بالا نیاز نیست، حافظه و کارایی محاسبات را بهینه میکند.
برخلاف شرکتهای آمریکایی هوش مصنوعی که به دلیل وجود منابع محاسباتی فراوان عمدتاً به دقت 16 بیتی پایبند میمانند، دیپسیک مجبور به استفاده از FP8 برای کارایی شده است، همانطور که آراویند سرینیواس، مدیرعامل پرپلکسیتی AI در یک مصاحبه CNBC اخیر اشاره کرده است.

در یک حرکت دیگر در نوآوری، دیپسیک روشهای آموزشی LLM را با اولویتدهی به یادگیری تقویتی (RL) بر روی روشهای سنتی تنظیم دقیق نظارتشده (SFT) انقلابی ساخته است. از نمونهگیری چندپاسخ و دادههای خودتولید برای RL برای توسعه قابلیتهای استدلال پیچیده استفاده کرده است.
در نتیجه، دیپسیک-R1-Zero اولین مدل کاملاً آموزشدیده از طریق RL بدون SFT شد، اثباتی بر اینکه LLMها میتوانند تنها با انگیزههای تقویتی استدلال کنند. این باعث باز کردن راه برای برنامههای RL پس از آموزشی بیشتر و بهینهسازیهای الگوریتمی شده است.
کاهش جذبه زورآزمایی؟
علاوه بر این، رشد فوق العاده دیپسیک فرصتهای جدیدی را برای توسعهدهندگان هوش مصنوعی باز کرد.
این مسیر سنتی محاسبات بزرگ و برتریهای سختافزاری که توسط غولهای آمریکایی مانند OpenAI، گوگل و متا ترجیح داده میشود را منحرف کرد.
ترکیب مدلی کوچکتر (با پارامترهای کمتر)، نیازهای محاسباتی پایین و الگوریتمهای قوی میتواند باعث تقلید گسترده توسط توسعهدهندگانی شود که منابع مشابه در اختیار ندارند.
استراتژی منبع باز نیز در مرکز موفقیت آن قرار گرفت. دیپسیک-R1 که تحت مجوز MIT عرضه شده است، کاملاً منبع باز میباشد و به توسعهدهندگان اجازه میدهد که از آن استفاده، تغییر و توزیع کنند. این به اشتراکگذاری دانش هوش مصنوعی و نوآوری را تقویت کرده و برای شرکت حمایت قابل توجه کاربران و حسن نیت بهدست آورده است.
موضع منبع باز دیپسیک حتی رقبا مانند OpenAI را تحت فشار قرار داده است که o3-mini، اولین مدل استدلال رایگان خود را برای مقابله با تأثیر دیپسیک منتشر کنند. حتی سم آلتمن در Reddit اذعان داشت که "ما [OpenAI] در تاریخ در طرف نادرست قرار داشتیم و نیاز داریم یک استراتژی منبع باز متفاوت را پیدا کنیم."
ورود دیپسیک بدین ترتیب باعث بر هم زدن بحثهای جاری بر سر مزایای منبع باز در مقابل منبع بسته برای LLMها شده است.
با این حال، هنوز نامشخص است که آیا این به طور بنیادین رویکرد توسعه زورآزمایی بر اساس قوانین مقیاسپذیری را تغییر خواهد داد، یعنی جایی که مدلهای قدرتمند میتوانند با استفاده از منابع محاسباتی و دادههای گسترده آموزش ببینند.
مدل زورآزمایی تحت نظارت فزایندهای قرار گرفته است زیرا سرمایهگذاران نگران هستند که آیا سرمایهگذاریهای عظیم شرکتهای آمریکایی در توسعه هوش مصنوعی توجیهپذیر است یا نه. این نگرانیها باعث افت ارزش سهام انویدیا شده و باعث فروش سهام فناوری آمریکا گشته است.
تغییربازی یا همگرایی در افق؟
اما خواه دیپسیک با تمرکز بر بهینهسازی منابع محاسباتی باشد یا مدل زورآزمایی با نشانههای ورودی عظیم تراشه و داده، هیچ تضاد ذاتی بین این دو وجود ندارد. در واقع، ممکن است در نقطهای به هم بیانجامند.
سرانجام همه چیز از این قرار است که OpenAI، متا و گوگل نیز مدام در حال ارتقاء مدلهای خود هستند، احتمالاً به سمت الهامگرفته از دیپسیک. و اگر دیپسیک میتواند، قطعاً دست خود را بر روی منابع محاسباتی بیشتر خواهد گذاشت.

این موضوع در یک اعلامیه توسط شرکت مادر دیپسیک، صندوق هج پرواز بالا، در اوایل 2023 مشخص شد. این شرکت اعلام کرد که تعداد 10,000 واحد پردازش گرافیکی (GPU) انویدیا A100 با کارایی بالا بهدست آورده است.
H800، یک نسخه کاهش یافته که دیپسیک مدل LLM خود را روی آن آموزش داده بود، احتمالاً یک رزرو استراتژیک بود قبل از این که آمریکا تحریمهای چپها را در نوامبر همان سال تشدید کند. شایعاتی وجود دارد که این شرکت تا 50,000 GPU H100 را انبار کرده است. برخلاف پیشبینیهای جسورانه، تراشههای هوش مصنوعی در تکانه دیپسیک کاهش نیافتهاند.
تفاوتها میان کارآفرینیهای هوش مصنوعی در چین و آمریکا بیشتر در استراتژیهایی هستند که شرایط خاص خود به آنها نیاز کرده، اما با ظهور دیپسیک، این تفاوتها به نحوی کاهش خواهند یافت.
در اینجا یکی از بزرگترین معماهای رقابت فناوری نهفته است. مهم نیست که عمجان سام چگونه سعی در حفظ پیشتازی رهبران هوش مصنوعی آمریکا بر رقبای چینی خود از طریق ممنوعیت تراشهها یا کنترلهای صادراتی شدیدتر دارد، در برخی جنبهها آنها شبیهتر خواهند شد. اگر کمک به بهبود مدلها و کاهش هزینهها نماید، یادگیری متقابل اجتنابناپذیر است.
با توجه به این که محدودیتهای تراشهها در چین برای آینده نزدیک باقی خواهند ماند، دیپسیک و لشکری از تقلیدکنندگان دیپسیک احتمالاً بر بهینهسازی عملکرد نرمافزار، سختافزار و الگوریتم تمرکز خواهند کرد.
زیانی برای آمریکا، سودی برای هوآوی؟
موفقیت چشمگیر دیپسیک بدون نگرانی نیست. حملات سایبری اخیر به خدمات آن، که به طور ادعایی از آمریکا سرچشمه گرفتهاند، نشان میدهد که قدرت جدید هوش مصنوعی چین هنوز ایمن نیست.
گفته میشود که آمریکا در حال بررسی تحریمهای گستردهتر تراشه است در مقابل تهدید از دیپسیک. این ممکن است شامل قطع دسترسی به حتی H20، یک GPU خاص چین که تنها 20 درصد از توان محاسباتی H100 را دارد، بشود.
با این حال، این حرکت ممکن است فقط دیپسیک را بیشتر به آغوش دشمن آمریکا هوآوی بکشاند. طبق گزارش رسانههای چینی، دیپسیک در 1 فوریه خدمات استنتاج R1/V3 خود را که با تراشههای Ascend 910B هوآوی قدرت گرفته، رونمایی کرد.
هوآوی میگوید Ascend 910B عملکرد 256 TFLOPS از FP16 را ارائه میدهد و به 80 درصد از Nvidia A100 میرسد. وقتی در یک خوشه ابرمحاسباتی مستقر میشود، نیاز به استنتاج مدلهای بزرگ را برآورده میکند. Ascend 910C جدیدتر هوآوی میتواند حتی بیشتر انجام دهد، با قابلیتهای استنتاج گفته شده که به 60 درصد از GPU H100 Nvidia میرسد، Tom’s Hardware در 4 فوریه گزارش داده، به گزارش تحقیقات دیپسیک.

نقطه ضعف آشیل در AI چین هرگز فقط کمبود GPU با عملکرد بالا نبوده است. تسلط Nvidia بیشتر از اکوسیستم CUDA ساخته شده در اطراف تراشههای آن است که بسیاری از توسعهدهندگان یاحیرزا میکنند آن را دور بزنند.
شراکت جدید با Ascend وعدهای برای جایگزینی CUDA با استفاده از Ascend CANN (معماری محاسباتی برای شبکههای عصبی) هوآوی ارائه میدهد. از نظر تئوریک، این میتواند به دیپسیک اجازه دهد که آموزش بی وقفهای را بر روی یک خوشه GPUهزارگانه با نوشتن مستقیم کدهای اجرای رشته موازی (PTX) برای مدلهای استنتاجی خود به دست آورد. به عبارت ساده، این راهی برای شکستن انحصار CUDA ارائه میدهد.
مزایای دیگر شامل مجموعهای از ابزارهای موجود برای توسعهدهندگان است. این ویژگی به جذب بیش از 20,000 برنامهنویس به نسخه آنلاین دیپسیک تنها در سه روز پس از ایجاد آن کمک کرد. اینکه آیا Ascend میتواند یک اکوسیستم پر رونق برای به چالش کشیدن CUDA ایجاد کند، حداقل در چین، برای تماشا جالب خواهد بود.
پیشگامسازی یک چرخه اکوسیستم
دیپسیک به سختی جاهطلبیهای خود را برای پیشگامی در چرخه اکوسیستم پنهان میکند. در پاسخ به سوالاتی در مورد تصمیم شرکت برای کاهش قیمتها در خدمات LLM خود، بنیانگذار و مدیرعامل لیانگ ونفنگ دیپسیک قبلاً توضیح داده است که «APIها و AI باید در دسترس همه باشد، مقرون به صرفه برای همه باشد.»
«برای سالهای زیادی، شرکتهای چینی به دیگران برای نوآوریهای تکنولوژیک تکیه کرده و بر روی کاربرد آنها برای سود تمرکز کردهاند. اما این دیگر رویکرد نیست»، لیانگ در ژانویه 2025 گفت. «هدف ما اکنون این نیست که سود سریع کسب کنیم; بلکه پیشبرد مرزهای فناوری و تحریک توسعه اکوسیستم است.»
چین هرگز بهطور واقعی در جلوترین خط AI نبوده است از زمانی که LLMها در اوایل 2023 شیوع پیدا کردند. بلکه، غالباً به عنوان یک تف جایگزین دیده میشود که تنها به دنبال جاگذاری برای رهبران آمریکایی بود. اما اکنون یک استارتاپ چینی وجود دارد که نه تنها نوآوری را رهبری کرده بلکه همچنین با منبع باز کردن فناوریهای خود، چین را به یک پایگاه اخلاقی نادر رسانده است.
البته، دیپسیک [یک نقطه تحول در تاریخ هوش مصنوعی خواهد بود، نه تنها بهعنوان «لحظه اسپوتنیک» چین، بلکه همچنین یک حسابدار در صنعت LLM.
اگر یکی فراتر از عناوین را بخواند، آشکار است که رقابت هوش مصنوعی آمریکا-چین دیگر تنها بر سر مدلهای فردی یا تراشهها نخواهد بود. بلکه، این یک برخورد اکوسیستمها، فلسفهها و ارزشها خواهد شد.
این یک ماراتن است که هنوز برندهای واضح ندارد. کدام طرف در نهایت پیروز خواهد شد بستگی به این دارد که چه کسی راهحلهایی ارائه کند که به بزرگترین عنوان مشترک مشتری بیاید.