شرکت تحقیقاتی مینیمکس از نسل جدید مدلهای خود به نام MiniMax-01 رونمایی کرد. این مدل چینی که برخلاف معماری مشهور ترنسفورمر از مکانیزم Lightning Attention استفاده میکند، امکانات جدیدی را در پردازش هوش مصنوعی ارائه میدهد. استارتاپ مینیمکس با حمایت غولهای فناوری علیبابا و تنسنت موفق به جذب ۸۵۰ میلیون دلار سرمایه شده و ارزشگذاری آن اکنون به بیش از ۲.۵ میلیارد دلار رسیده است.
شرکتهای چینی با سرعت در حال معرفی مدلهای پیشرفتهای هستند که توانایی رقابت با شرکتهای مطرح آمریکایی مانند OpenAI را دارند. یکی از جدیدترین دستاوردها، امکان آپلود فایلهایی تا حجم ۱۰۰ مگابایت در سایت Hailuo AI است. مدل جدید این شرکت به طور ویژه برای مدیریت پرامپتهای طولانی و تحلیل فایلهای حجیم طراحی شده و قادر است پاسخهای دقیق و جامعی ارائه دهد. این ویژگی، MiniMax-01 را به ابزاری ایدهآل برای کاربران حرفهای تبدیل کرده است. دسترسی به این مدل کاملاً رایگان بوده و کاربران میتوانند از طریق سایت hailuo.ai به آن دسترسی پیدا کنند.
هفته گذشته، شرکت MiniMax از سه مدل جدید خود رونمایی کرد که هرکدام قابلیتهای پیشرفتهای در حوزههای مختلف ارائه میدهند. این مدلها با نامهای MiniMax-Text-01، MiniMax-VL-01 و T2A-01-HD معرفی شدند و در زمینههایی مانند تحلیل متنی، پردازش چندرسانهای و تولید صوت، عملکرد چشمگیری دارند. هر مدل با پارامترهای منحصر به فرد خود طراحی شده است و هدف آنها ارائه راهحلهای تخصصی برای کاربران حرفهای در صنایع گوناگون است.
قابلیت مدلهای هوش مصنوعی MiniMax-01
این مدلهای هوش مصنوعی چینی با کاربردهای خاص متن،تصویر و صوت معرفی شدند. مدل MiniMax-Text-01 به طور ویژه برای پردازش متن توسعه یافته است، مدل MiniMax-VL-01 توانایی تحلیل همزمان متن و تصاویر را دارد و مدل T2A-01-HD به تولید و شبیهسازی صدا اختصاص یافته است. این مدلها در حالی معرفی شدهاند که محدودیتهای جدید آمریکا برای دسترسی چین به فناوریهای پیشرفته، رقابت در این حوزه را به یک چالش استراتژیک تبدیل کرده است.
ویژگیهای کلیدی و عملکرد مدلها
مدل MiniMax-Text-01 با ۴۶۵ میلیارد پارامتر، قابلیت بالایی در حل مسائل پیچیده دارد و در آزمونهایی مانند MMLU و SimpleQA، که توانایی مدل در حل مسائل ریاضی و سؤالات مبتنی بر دانش را ارزیابی میکنند، عملکرد بهتری نسبت به مدل Gemini 2.0 Flash گوگل نشان داده است. یکی از ویژگیهای برجسته این مدل، پنجره متنی ۴ میلیون توکنی آن است که امکان تحلیل همزمان حدود ۳ میلیون کلمه، معادل پنج نسخه از کتاب «جنگ و صلح»، را فراهم میکند. این مقدار به طور چشمگیری بزرگتر از مدلهایی مانند GPT-4o است و به این مدل قدرت ویژهای در پردازش متون طولانی میبخشد.
مدل MiniMax-VL-01 نیز با قابلیت درک چندوجهی، در ارزیابیهایی مانند ChartQA که به تحلیل نمودارها و دیاگرامها میپردازد، رقابت نزدیکی با مدلهایی مانند Claude 3.5 Sonnet شرکت Anthropic دارد. هرچند این مدل در برخی موارد از Gemini 2.0 Flash و GPT-4o عقبتر است، اما همچنان تواناییهای چشمگیری در تحلیل متون و تصاویر به صورت همزمان ارائه میدهد و در بسیاری از کاربردها گزینهای رقابتی به شمار میرود.
مدل T2A-01-HD برای تولید و شبیهسازی صدا طراحی شده و میتواند صدایی مصنوعی را با تنظیماتی مانند سرعت، لحن و تن در ۱۷ زبان مختلف، از جمله انگلیسی و چینی، تولید کند. این مدل همچنین قادر است تنها با ۱۰ ثانیه ضبط صدا، صدای کاربر را شبیهسازی کند. اگرچه هنوز نتایج مقایسهای رسمی برای این مدل منتشر نشده است، گزارشها حاکی از آن است که خروجی آن از نظر کیفیت با مدلهای صوتی شرکت Meta و استارتاپهایی مانند PlayAI برابری میکند.
دسترسی و محدودیتهای استفاده
مدلهای MiniMax-Text-01 و MiniMax-VL-01 از طریق گیتهاب و پلتفرم Hugging Face در دسترس قرار دارند، اما مدل T2A-01-HD فقط از طریق API و پلتفرم Hailuo AI MiniMax قابل استفاده است. با این حال، این مدلها کاملاً منبعباز نیستند. شرکت MiniMax اجزای لازم برای بازسازی آنها، مانند دادههای آموزشی، را منتشر نکرده و استفاده از این مدلها تحت مجوزهای محدودکنندهای قرار دارد. طبق این مجوزها، توسعهدهندگان نمیتوانند از مدلها برای بهبود محصولات رقیب استفاده کنند و پلتفرمهایی با بیش از ۱۰۰ میلیون کاربر فعال ماهانه باید برای استفاده از آنها مجوز ویژهای دریافت کنند.
چشمانداز MiniMax در رقابت فناوری
مدلهای MiniMax نه تنها با سیستمهای پیشرفتهای مانند GPT-4o و Gemini 2.0 Flash رقابت میکنند، بلکه با معماری جدیدی که امکان پردازش تا ۴ میلیون توکن را فراهم میکند، استانداردهای جدیدی را در دنیای مدلهای زبانی و چندرسانهای تعریف کردهاند. این ویژگیها، به ویژه توانایی تحلیل متون طولانی و شبیهسازی صدا، MiniMax را به یکی از بازیگران اصلی در عرصه فناوریهای پیشرفته تبدیل کرده است.
مزیت اقتصادی و چالشهای MiniMax در صنعت هوش مصنوعی
یکی از مزیتهای کلیدی مدلهای MiniMax-01 هزینه پایین استفاده از آنهاست. این مدلها از طریق API با قیمت بسیار رقابتی عرضه میشوند؛ تنها ۰.۲۰ دلار برای هر یک میلیون توکن ورودی و ۱.۱۰ دلار برای هر یک میلیون توکن خروجی. این صرفهجویی در هزینه به دلیل استفاده از تکنیکهای بهینهسازی مانند Varlen Ring Attention، LASP+ (Parallelism خطی توالی)، و Expert Tensor Parallel (ETP) است که بهرهوری محاسبات را افزایش داده و مقیاسپذیری را بهبود میبخشد.
در عین حال، دیگر استارتاپهای چینی نیز پیشرفتهای مشابهی داشتهاند. به عنوان مثال، سه هفته پیش، شرکت DeepSeek در هانگژو نسل سوم مدل خود را معرفی کرد که در مدت کوتاه دو ماه و با منابع کمتری نسبت به رقبا آموزش داده شد. مدل DeepSeek V3 توانست از نظر عملکرد با مدلهایی مانند GPT-4o و Claude-3.5-Sonnet رقابت کند.
انتشار مدل MiniMax-01 بیانگر توانایی صنعت هوش مصنوعی چین در مقاومت در برابر محدودیتهای سختگیرانه صادراتی آمریکا است. این مدلها اکنون از طریق پلتفرمهای GitHub ،Hugging Face و Hailuo AI در دسترس قرار دارند. همچنین، مقالهای جامع توسط این شرکت منتشر شده که جزئیات فنی بیشتری از مدلها ارائه میدهد.
پیشینه MiniMax و محصولات جنجالی آن
شرکت MiniMax در سال ۲۰۲۱ توسط تعدادی از کارمندان سابق شرکت SenseTime، یکی از بزرگترین شرکتهای هوش مصنوعی چین، تأسیس شد. پروژههای این شرکت شامل محصولاتی مانند Talkie، یک پلتفرم نقشآفرینی مبتنی بر هوش مصنوعی، و مدلهای تبدیل متن به ویدئو است که در پلتفرم Hailuo منتشر شدهاند.
با این حال، برخی محصولات این شرکت جنجالبرانگیز بودهاند. برای مثال، اپلیکیشن Talkie در دسامبر از فروشگاه اپل حذف شد. دلیل حذف، استفاده این برنامه از آواتارهایی شامل شخصیتهای عمومی مانند دونالد ترامپ، تیلور سویفت، ایلان ماسک و لبرون جیمز بود که به نظر نمیرسد برای استفاده از تصویرشان رضایت داده باشند. علاوه بر این، مدلهای ویدئویی MiniMax متهم به بازتولید لوگوی کانالهای تلویزیونی بریتانیا شدهاند، که نشان میدهد دادههای آموزشی این مدلها شامل محتوای این کانالها بوده است.
همچنین، شرکت iQiyi، یکی از بزرگترین سرویسهای پخش ویدئوی چین، شکایتی علیه MiniMax تنظیم کرده است و مدعی شده که این شرکت به طور غیرقانونی از محتوای ضبطشده آنها برای آموزش مدلهای خود استفاده کرده است.
چالشهای قانونی و محدودیتهای جدید آمریکا
مدلهای MiniMax-01 در زمانی عرضه شدهاند که دولت بایدن در حال بررسی قوانین سختگیرانهتر برای صادرات فناوریهای هوش مصنوعی به چین است. شرکتهای چینی پیش از این از خرید تراشههای پیشرفته هوش مصنوعی منع شده بودند، اما در صورت تصویب قوانین جدید، محدودیتهای بیشتری بر فناوریهای نیمهرسانا و مدلهای لازم برای توسعه سیستمهای پیشرفته هوش مصنوعی اعمال خواهد شد.
این فشارهای قانونی و رقابت شدید در کنار مزیتهای اقتصادی مدلهای MiniMax، تصویری دوگانه از چالشها و فرصتهای پیش روی این شرکت در صنعت هوش مصنوعی ارائه میدهد.