شرکت چینی هوش مصنوعی MiniMax مدلهای جدیدی معرفی کرد که ادعا میکند با بهترینهای صنعت رقابت میکنند
شرکتهای چینی به معرفی مدلهای هوش مصنوعی ادامه میدهند که قابلیتهای سیستمهایی را که توسط OpenAI و دیگر شرکتهای هوش مصنوعی مستقر در ایالات متحده توسعه یافتهاند، رقابت میکنند.
این هفته، MiniMax ، یک استارتاپ پشتیبانی شده توسط علیبابا و تنسنت که حدود 850 میلیون دلار سرمایهگذاری خطرپذیر کسب کرده و ارزشی بیش از 2.5 میلیارد دلار دارد، از سه مدل جدید رونمایی کرد: MiniMax-Text-01، MiniMax-VL-01 و T2A-01-HD. MiniMax-Text-01 یک مدل متنی است، در حالی که MiniMax-VL-01 میتواند هم تصاویر و هم متون را درک کند. T2A-01-HD در حین حال، تولید کننده صدا - بویژه گفتار - است.
MiniMax ادعا دارد که MiniMax-Text-01، که اندازهاش 456 میلیارد پارامتر است، بهتر از مدلهایی مانند جدیدترین مدل گوگل Gemini 2.0 Flash در شاخصهایی مانند MATH و SimpleQA عمل میکند، که توانایی مدل در حل مسائل ریاضی و پاسخ به سوالات مبتنی بر واقعیت را اندازهگیری میکند. پارامترها تقریبی به مهارت حل مسئله مدلها مربوط میشوند، و مدلهایی با پارامترهای بیشتر عموماً بهتر از آنهایی با پارامترهای کمتر عمل میکنند.
در مورد MiniMax-VL-01، MiniMax میگوید که این مدل با Claude 3.5 Sonnet شرکت Anthropic روی ارزیابیهایی که به درک چند شیوه ای نیاز دارند، رقابت میکند، مانند ChartQA که مدلها را با سوالات مربوط به نمودار و دیاگرام به چالش میکشد (مثلاً، "ارزش اوج خط نارنجی در این نمودار چیست؟"). با این حال، MiniMax-VL-01 به سختی Gemini 2.0 Flash را در بسیاری از این آزمونها شکست میدهد. مدل OpenAI GPT-4o و مدل Meta Llama 3.1 در برخی از آنها نیز بر او برتری دارند.
شایان ذکر است، MiniMax-Text-01 دارای یک پنجره بافت بسیار بزرگ است. یک مدل پنجره بافت، یا مثلاً پنجره بافت، به ورودی (مثلاً، متن) اشاره دارد که یک مدل قبل از تولید خروجی (متن بیشتر) در نظر میگیرد. با پنجره بافت 4 میلیون توکن، MiniMax-Text-01 میتواند حدود 3 میلیون کلمه را یکباره تحلیل کند - یا بیش از پنج نسخه از "جنگ و صلح".
برای بافت (نه به طور جدی)، پنجره بافت MiniMax-Text-01 حدود 31 برابر اندازه پنجره بافت GPT-4o و Llama 3.1 است.
آخری از مدلهای MiniMax که این هفته عرضه شد، T2A-01-HD است، یک تولید کننده صوتی که برای گفتار بهینه شده است. T2A-01-HD میتواند یک صدای مصنوعی با ریتم، لحن و تن قابل تنظیم در حدود 17 زبان مختلف، از جمله انگلیسی و چینی، تولید کند و یک صدا را از تنها 10 ثانیه یک ضبط صوتی شبیهسازی کند.
MiniMax نتایج معیارهای مقایسه T2A-01-HD با دیگر مدلهای تولید صوتی را منتشر نکرده است. اما به این گزارشگر، خروجیهای T2A-01-HD قابل مقایسه با مدلهای صوتی از Meta و استارتاپهایی مانند PlayAI به نظر میرسد.
جز T2A-01-HD، که به طور انحصاری از طریق API و پلتفرم Hailuo AI در دسترس است، مدلهای جدید MiniMax میتوانند از GitHub و پلتفرم توسعه AI Hugging Face دانلود شوند.
البته این که مدلها به طور "باز" در دسترس هستند به این معنا نیست که در جنبههای خاصی محدود نشدهاند. MiniMax-Text-01 و MiniMax-VL-01 به طور واقعی منبع باز نیستند از آن جهت که MiniMax اجزایی مانند دادههای آموزشی مورد نیاز برای بازسازی آنها از ابتدا را منتشر نکرده است. علاوه بر این، آنها تحت مجوز محدود کننده MiniMax قرار دارند که توسعهدهندگان را از استفاده از مدلها برای بهبود مدلهای AI رقیب منع میکند و میطلبد که پلتفرمهایی با بیش از 100 میلیون کاربر فعال ماهانه درخواست مجوز خاصی از MiniMax کنند.
MiniMax در سال 2021 توسط کارکنان پیشین SenseTime، یکی از بزرگترین شرکتهای AI چین، تأسیس شد. پروژههای این شرکت شامل برنامههایی مانند Talkie، یک پلتفرم نقش بازی کردن مبتنی بر AI مانند Character AI ، و مدلهای متن به ویدیو که MiniMax در Hailuo منتشر کرده است، میشود.
برخی از محصولات MiniMax به موضوع بحث برانگیزی جزئی تبدیل شدهاند.
Talkie، که در دسامبر برای دلایل نامشخص "فنی" از فروشگاه اپل برداشته شد، شامل آواتارهای AI از شخصیتهای عمومی، از جمله دونالد ترامپ، تیلور سویفت، ایلان ماسک و لبرون جیمز است که هیچکدام به نظر نمیرسد برای حضور در این برنامه رضایت باشند.
در دسامبر، مجله Broadcast گزارش داد که تولید کنندگان ویدئویی MiniMax میتوانند لوگوهای کانالهای تلویزیونی بریتانیا را بازتولید کنند، که نشان میدهد مدلهای MiniMax بر اساس محتوای این کانالها آموزش دیدهاند. و گزارش شده است که MiniMax به خاطر نقض حقوق کپیرایت توسط iQiyi، یک سرویس استریم ویدیو چینی که ادعا میکند MiniMax بهطور غیرقانونی بر روی ضبطهای کپیرایتشده iQiyi آموزش دیده است، تحت تعقیب قرار دارد.
مدلهای جدید MiniMax چند روز پس از آن رخ داد که دولت بایدن هر دو محدودیتهای سختگیرانهتر در صادرات و محدودیتهای بر روی فناوریهای AI برای پروژههای چینی را پیشنهاد کرد. شرکتهای چینی قبلاً از خرید تراشههای پیشرفته AI ممنوع شده بودند، اما اگر قوانین جدید به شکل نوشتهشده به اجرا درآیند، شرکتها با محدودیتهای شدیدتری در فناوری نیمههادی و مدلهایی که برای راهاندازی سیستمهای هوش مصنوعی پیچیده مورد نیاز است، مواجه خواهند شد.
روز چهارشنبه، دولت بایدن اقدامات اضافی برای جلوگیری از رسیدن تراشههای پیشرفته به چین را اعلام کرد. شرکتهای تولید تراشه و بستهبندی که میخواهند برخی از تراشهها را صادر کنند باید تحت محدودیتهای گستردهتری قرار بگیرند مگر آنکه بیشتر نظارت و دقت لازم به خرج دهند تا محصولاتشان به مشتریان چینی نرسند.