مدل‌های پیشرفته هوش مصنوعی چینی منتشر می‌شوند

شرکت تحقیقاتی مینی‌مکس از نسل جدید مدل‌های خود به نام MiniMax-01 رونمایی کرد. این مدل چینی که برخلاف معماری مشهور ترنسفورمر از مکانیزم Lightning Attention استفاده می‌کند، امکانات جدیدی را در پردازش هوش مصنوعی ارائه می‌دهد. استارتاپ مینی‌مکس با حمایت غول‌های فناوری علی‌بابا و تنسنت موفق به جذب ۸۵۰ میلیون دلار سرمایه شده و ارزش‌گذاری آن اکنون به بیش از ۲.۵ میلیارد دلار رسیده است.

شرکت‌های چینی با سرعت در حال معرفی مدل‌های پیشرفته‌ای هستند که توانایی رقابت با شرکت‌های مطرح آمریکایی مانند OpenAI را دارند. یکی از جدیدترین دستاوردها، امکان آپلود فایل‌هایی تا حجم ۱۰۰ مگابایت در سایت Hailuo AI است. مدل جدید این شرکت به طور ویژه برای مدیریت پرامپت‌های طولانی و تحلیل فایل‌های حجیم طراحی شده و قادر است پاسخ‌های دقیق و جامعی ارائه دهد. این ویژگی، MiniMax-01 را به ابزاری ایده‌آل برای کاربران حرفه‌ای تبدیل کرده است. دسترسی به این مدل کاملاً رایگان بوده و کاربران می‌توانند از طریق سایت hailuo.ai به آن دسترسی پیدا کنند.

هفته گذشته، شرکت MiniMax از سه مدل جدید خود رونمایی کرد که هرکدام قابلیت‌های پیشرفته‌ای در حوزه‌های مختلف ارائه می‌دهند. این مدل‌ها با نام‌های MiniMax-Text-01، MiniMax-VL-01 و T2A-01-HD معرفی شدند و در زمینه‌هایی مانند تحلیل متنی، پردازش چندرسانه‌ای و تولید صوت، عملکرد چشمگیری دارند. هر مدل با پارامترهای منحصر به فرد خود طراحی شده است و هدف آن‌ها ارائه راه‌حل‌های تخصصی برای کاربران حرفه‌ای در صنایع گوناگون است.

قابلیت مدل‌های هوش مصنوعی MiniMax-01

این مدل‌های هوش مصنوعی چینی با کاربردهای خاص متن،‌تصویر و صوت معرفی شدند. مدل MiniMax-Text-01 به طور ویژه برای پردازش متن توسعه یافته است، مدل MiniMax-VL-01 توانایی تحلیل همزمان متن و تصاویر را دارد و مدل T2A-01-HD به تولید و شبیه‌سازی صدا اختصاص یافته است. این مدل‌ها در حالی معرفی شده‌اند که محدودیت‌های جدید آمریکا برای دسترسی چین به فناوری‌های پیشرفته، رقابت در این حوزه را به یک چالش استراتژیک تبدیل کرده است.

ویژگی‌های کلیدی و عملکرد مدل‌ها

مدل MiniMax-Text-01 با ۴۶۵ میلیارد پارامتر، قابلیت بالایی در حل مسائل پیچیده دارد و در آزمون‌هایی مانند MMLU و SimpleQA، که توانایی مدل در حل مسائل ریاضی و سؤالات مبتنی بر دانش را ارزیابی می‌کنند، عملکرد بهتری نسبت به مدل Gemini 2.0 Flash گوگل نشان داده است. یکی از ویژگی‌های برجسته این مدل، پنجره متنی ۴ میلیون توکنی آن است که امکان تحلیل همزمان حدود ۳ میلیون کلمه، معادل پنج نسخه از کتاب «جنگ و صلح»، را فراهم می‌کند. این مقدار به طور چشمگیری بزرگ‌تر از مدل‌هایی مانند GPT-4o است و به این مدل قدرت ویژه‌ای در پردازش متون طولانی می‌بخشد.

مدل MiniMax-VL-01 نیز با قابلیت درک چندوجهی، در ارزیابی‌هایی مانند ChartQA که به تحلیل نمودارها و دیاگرام‌ها می‌پردازد، رقابت نزدیکی با مدل‌هایی مانند Claude 3.5 Sonnet شرکت Anthropic دارد. هرچند این مدل در برخی موارد از Gemini 2.0 Flash و GPT-4o عقب‌تر است، اما همچنان توانایی‌های چشمگیری در تحلیل متون و تصاویر به صورت همزمان ارائه می‌دهد و در بسیاری از کاربردها گزینه‌ای رقابتی به شمار می‌رود.

مدل T2A-01-HD برای تولید و شبیه‌سازی صدا طراحی شده و می‌تواند صدایی مصنوعی را با تنظیماتی مانند سرعت، لحن و تن در ۱۷ زبان مختلف، از جمله انگلیسی و چینی، تولید کند. این مدل همچنین قادر است تنها با ۱۰ ثانیه ضبط صدا، صدای کاربر را شبیه‌سازی کند. اگرچه هنوز نتایج مقایسه‌ای رسمی برای این مدل منتشر نشده است، گزارش‌ها حاکی از آن است که خروجی آن از نظر کیفیت با مدل‌های صوتی شرکت Meta و استارتاپ‌هایی مانند PlayAI برابری می‌کند.

دسترسی و محدودیت‌های استفاده

مدل‌های MiniMax-Text-01 و MiniMax-VL-01 از طریق گیت‌هاب و پلتفرم Hugging Face در دسترس قرار دارند، اما مدل T2A-01-HD فقط از طریق API و پلتفرم Hailuo AI MiniMax قابل استفاده است. با این حال، این مدل‌ها کاملاً منبع‌باز نیستند. شرکت MiniMax اجزای لازم برای بازسازی آن‌ها، مانند داده‌های آموزشی، را منتشر نکرده و استفاده از این مدل‌ها تحت مجوزهای محدودکننده‌ای قرار دارد. طبق این مجوزها، توسعه‌دهندگان نمی‌توانند از مدل‌ها برای بهبود محصولات رقیب استفاده کنند و پلتفرم‌هایی با بیش از ۱۰۰ میلیون کاربر فعال ماهانه باید برای استفاده از آن‌ها مجوز ویژه‌ای دریافت کنند.

چشم‌انداز MiniMax در رقابت فناوری

مدل‌های MiniMax نه تنها با سیستم‌های پیشرفته‌ای مانند GPT-4o و Gemini 2.0 Flash رقابت می‌کنند، بلکه با معماری جدیدی که امکان پردازش تا ۴ میلیون توکن را فراهم می‌کند، استانداردهای جدیدی را در دنیای مدل‌های زبانی و چندرسانه‌ای تعریف کرده‌اند. این ویژگی‌ها، به ویژه توانایی تحلیل متون طولانی و شبیه‌سازی صدا، MiniMax را به یکی از بازیگران اصلی در عرصه فناوری‌های پیشرفته تبدیل کرده است.

مزیت اقتصادی و چالش‌های MiniMax در صنعت هوش مصنوعی

یکی از مزیت‌های کلیدی مدل‌های MiniMax-01 هزینه پایین استفاده از آن‌هاست. این مدل‌ها از طریق API با قیمت بسیار رقابتی عرضه می‌شوند؛ تنها ۰.۲۰ دلار برای هر یک میلیون توکن ورودی و ۱.۱۰ دلار برای هر یک میلیون توکن خروجی. این صرفه‌جویی در هزینه به دلیل استفاده از تکنیک‌های بهینه‌سازی مانند Varlen Ring Attention، LASP+ (Parallelism خطی توالی)، و Expert Tensor Parallel (ETP) است که بهره‌وری محاسبات را افزایش داده و مقیاس‌پذیری را بهبود می‌بخشد.

در عین حال، دیگر استارتاپ‌های چینی نیز پیشرفت‌های مشابهی داشته‌اند. به عنوان مثال، سه هفته پیش، شرکت DeepSeek در هانگژو نسل سوم مدل خود را معرفی کرد که در مدت کوتاه دو ماه و با منابع کمتری نسبت به رقبا آموزش داده شد. مدل DeepSeek V3 توانست از نظر عملکرد با مدل‌هایی مانند GPT-4o و Claude-3.5-Sonnet رقابت کند.

انتشار مدل MiniMax-01 بیانگر توانایی صنعت هوش مصنوعی چین در مقاومت در برابر محدودیت‌های سختگیرانه صادراتی آمریکا است. این مدل‌ها اکنون از طریق پلتفرم‌های GitHub ،Hugging Face و Hailuo AI در دسترس قرار دارند. همچنین، مقاله‌ای جامع توسط این شرکت منتشر شده که جزئیات فنی بیشتری از مدل‌ها ارائه می‌دهد.

پیشینه MiniMax و محصولات جنجالی آن

شرکت MiniMax در سال ۲۰۲۱ توسط تعدادی از کارمندان سابق شرکت SenseTime، یکی از بزرگ‌ترین شرکت‌های هوش مصنوعی چین، تأسیس شد. پروژه‌های این شرکت شامل محصولاتی مانند Talkie، یک پلتفرم نقش‌آفرینی مبتنی بر هوش مصنوعی، و مدل‌های تبدیل متن به ویدئو است که در پلتفرم Hailuo منتشر شده‌اند.

با این حال، برخی محصولات این شرکت جنجال‌برانگیز بوده‌اند. برای مثال، اپلیکیشن Talkie در دسامبر از فروشگاه اپل حذف شد. دلیل حذف، استفاده این برنامه از آواتارهایی شامل شخصیت‌های عمومی مانند دونالد ترامپ، تیلور سویفت، ایلان ماسک و لبرون جیمز بود که به نظر نمی‌رسد برای استفاده از تصویرشان رضایت داده باشند. علاوه بر این، مدل‌های ویدئویی MiniMax متهم به بازتولید لوگوی کانال‌های تلویزیونی بریتانیا شده‌اند، که نشان می‌دهد داده‌های آموزشی این مدل‌ها شامل محتوای این کانال‌ها بوده است.

همچنین، شرکت iQiyi، یکی از بزرگ‌ترین سرویس‌های پخش ویدئوی چین، شکایتی علیه MiniMax تنظیم کرده است و مدعی شده که این شرکت به طور غیرقانونی از محتوای ضبط‌شده آن‌ها برای آموزش مدل‌های خود استفاده کرده است.

چالش‌های قانونی و محدودیت‌های جدید آمریکا

مدل‌های MiniMax-01 در زمانی عرضه شده‌اند که دولت بایدن در حال بررسی قوانین سخت‌گیرانه‌تر برای صادرات فناوری‌های هوش مصنوعی به چین است. شرکت‌های چینی پیش از این از خرید تراشه‌های پیشرفته هوش مصنوعی منع شده بودند، اما در صورت تصویب قوانین جدید، محدودیت‌های بیشتری بر فناوری‌های نیمه‌رسانا و مدل‌های لازم برای توسعه سیستم‌های پیشرفته هوش مصنوعی اعمال خواهد شد.

این فشارهای قانونی و رقابت شدید در کنار مزیت‌های اقتصادی مدل‌های MiniMax، تصویری دوگانه از چالش‌ها و فرصت‌های پیش روی این شرکت در صنعت هوش مصنوعی ارائه می‌دهد.

توسط
پیوست
منبع
پیوست
Exit mobile version