تکنولوژی

DeepSeek و نوید رقبایی جدی‌تر برای Open AI

دیپسیک ادعا می‌کند که جدیدترین هوش مصنوعی آنها یعنی  DeepSeek-R1 رقیبی جدی برای ورژن O1 اوپن ای‌آی محسوب می‌شود.

به گزارش پیوست؛ دیپسیک که به شکل رایگان و منبع‌باز(Open Source) در اختیار کاربران است نتایج امیدوارکننده‌ای را به عنوان رقیبی جدی برای O1 به ثبت رسانده است و در چندین حوزه نیز O1 را به چالش کشیده است.

R1  یک مدل استدلال محور منبع باز است که توسط شرکت چینی دیپسیک طراحی شده است. نکته ویژه در باب مدل‌های استدلال محور این است که این مدل‌ها در آن واحد پاسخ‌های خود را چندین باره چک کرده و از خطای بسیار پایینی برخوردار است.

R1 پیش‌تر از O1

به گفته دیپسیک هوش مصنوعی استدلال محور این شرکت در معیارهای AIME, MATH-500, and SWE-bench Verified توانسته است عملکرد بهتری را نسبت به O1 به ثبت برساند. این درحالی است که تمرکز SWE-bench Verified بر حوزه برنامه‌نویسی و سنجش توانایی مدل در  این زمینه است.

نمودار مقایسه دو مدل R1 با O1

۶۷۱ میلیارد پارامتر

مدل اصلی‌های DeepSeek-R1-Zero و DeepSeek-R1 که بزرگترین مدل‌های آن هستند از ۶۷۱ میلیارد پارامتر بهره می‌برند. بازه پارامتری این مدل‌ها از ۱.۵ تا ۷۰ میلیارد پارمتر است.

رعایت نفس اصول سوسیالیستی در هوش مصنوعی

مسائلی همچون میدان تیان‌آن‌من یا استقلال تایوان که اساسا در بستر اینترنت چین جزو خط قرمزها محسوب شده و مورد فیلتر قرار می‌گیرند هم توسط این مدل بدون پاسخ می‌مانند.

استقبال‌ها تا به این‌جا از این مدل بسیار خوب عنوان شده و نفس منبع باز بودن و دسترسی رایگان برای همگان از اصلی‌ترین دلایل جذابیت این مدل است.

شرکت چینی دیپسیک( DeepSeek) از جدیدترین هوش مصنوعی استدلال محور خود برای حل مسائل و معادلات پیچیده رونمایی کرد. دیپسیک ادعا می‌کند که جدیدترین هوش مصنوعی آنها یعنی  DeepSeek-R1 رقیبی جدی برای ورژن O1 اوپن ای‌آی محسوب می‌شود.

به گزارش پیوست؛ دیپسیک که به شکل رایگان و منبع‌باز(Open Source) در اختیار کاربران است نتایج امیدوارکننده‌ای را به عنوان رقیبی جدی برای O1 به ثبت رسانده است و در چندین حوزه نیز O1 را به چالش کشیده است.

R1  یک مدل استدلال محور منبع باز است که توسط شرکت چینی دیپسیک طراحی شده است. از این مدل برای اموری چون حل مسائل پیچیده ریاضی، استدلال‌های منطقی، و تصمیم‌های آنی استفاده می‌شود. نکته ویژه در باب مدل‌های استدلال محور این است که این مدل‌ها در آن واحد پاسخ‌های خود را چندین باره چک کرده و از خطای بسیار پایینی برخوردار است.

R1 پیش‌تر از O1

به گفته دیپسیک هوش مصنوعی استدلال محور این شرکت در معیارهای AIME, MATH-500, and SWE-bench Verified توانسته است عملکرد بهتری را نسبت به O1 به ثبت برساند. روش کار هر یک از این آزمون‌ها هم با یک‌دیگر متفاوت است. AIME مدل‌های دیگر را برای سنجش کیفیت ارائه یک مدل خاص به خدمت می‌گیرد. از سوی دیگر MATH-500 مجموعه‌ای از مسائل ریاضی و کلمات اشتباه را برای به چالش کشیدن مدل به کار می‌گیرد. این درحالی است که تمرکز SWE-bench Verified بر حوزه برنامه‌نویسی و سنجش توانایی مدل در  این زمینه است.

نمودار مقایسه دو مدل R1 با O1

۶۷۱ میلیارد پارامتر

مدل اصلی‌های DeepSeek-R1-Zero و DeepSeek-R1 که بزرگترین مدل‌های آن هستند از ۶۷۱ میلیارد پارامتر بهره می‌برند. این در حالی است که شرکت دیپسیک هم‌زمان با انتشار این مدل‌ها شش مدل کوچک‌تر با عنوان DeepSeek-R1-Distill برای سیستم‌های ضعیف‌تر ارائه کرده است. بازه پارامتری این مدل‌ها از ۱.۵ تا ۷۰ میلیارد پارمتر است.

رعایت نفس اصول سوسیالیستی در هوش مصنوعی

مسائلی همچون میدان تیان‌آن‌من یا استقلال تایوان که اساسا در بستر اینترنت چین جزو خط قرمزها محسوب شده و مورد فیلتر قرار می‌گیرند هم توسط این مدل بدون پاسخ می‌مانند.

استقبال‌ها تا به این‌جا از این مدل بسیار خوب عنوان شده و نفس منبع باز بودن و دسترسی رایگان برای همگان از اصلی‌ترین دلایل جذابیت این مدل است. علارغم محدودیت‌هایی که وجود دارد محققان حوزه هوش مصنوعی با ظهور چنین مدل‌های استدلال محوری با این سرعت، بسیار به آینده این حوزه و رقابتی‌تر شدن آن امیدوارند.

توسط
پیوست
منبع
پیوست
نمایش بیشتر

اخبار مرتبط

بازگشت به بالا