
كشفت شركة MiniMax الصينية الناشئة، المعروفة بنموذجها الواقعي لإنشاء الفيديو Hailuo، عن أحدث نماذجها اللغوية الكبيرة MiniMax-M1.
ويمثل هذا الإطلاق نبأً سارًا للمؤسسات والمطورين، حيث يأتي النموذج مفتوح المصدر بالكامل بموجب ترخيص أباتشي 2.0، الأمر الذي يسمح للشركات باستخدامه في تطبيقات تجارية وتعديله بحرية دون قيود أو رسوم.
MiniMax-M1: المزايا والإتاحة
يطرح "M1" نفسه كنموذج مفتوح الأوزان يرسي معايير جديدة في قدرات الاستدلال ضمن سياقات طويلة، واستخدام الأدوات بفاعلية، وكفاءة الأداء الحاسوبي.
وأصبح النموذج متاحًا عبر منصة مشاركة أكواد الذكاء الاصطناعي "Hugging Face" ومنصة "GitHub" ، إيذانًا ببدء ما أطلقت عليه الشركة اسم "أسبوع ميني ماكس" (MiniMaxWeek) عبر حسابها على منصة "إكس"، مع توقعات بإعلانات أخرى عن منتجات جديدة.
الوصول إلى النموذج في هاجنج فيس
يتميز "MiniMax-M1" بقدرته على معالجة مليون وحدة إدخال (token) وما يصل إلى 80 ألف وحدة إخراج، واضعًا نفسه ضمن النماذج الأكثر رحابة لمعالجة مهام الاستدلال التي تتطلب سياقًا طويلاً.
وللمقارنة، يستطيع نموذج GPT-4o من OpenAI التعامل مع 128 ألف وحدة فقط، بينما يقدم Gemini 2.5 Pro من جوجل حدًا أقصى يبلغ مليون وحدة، مع تقارير عن تطوير نسخة تستوعب مليوني وحدة.
ولكن لا تقتصر مزايا "M1" على ذلك، فقد جرى تدريبه باستخدام تقنية تعلم معزز مبتكرة وعالية الكفاءة.
ويعتمد النموذج على بنية هجينة من "خليط الخبراء" (MoE) مع آلية انتباه سريعة مصممة لتقليل تكاليف الاستدلال.
وبحسب التقرير التقني، يستهلك النموذج 25% فقط من عمليات الفاصلة العائمة (FLOPs) التي يتطلبها نموذج DeepSeek R1 عند إنشاء مخرجات بطول 100 ألف وحدة.
البنية والإصدارات والتكلفة المفاجئة
يأتي النموذج في إصدارين: "MiniMax-M1-80k" و "MiniMax-M1-40k" في إشارة إلى "ميزانيات التفكير" أو أطوال المخرجات الخاصة بهما.
وتستند البنية إلى نموذج الشركة السابق MiniMax Text-01 وتضم 456 مليار معلمة (parameter)، مع تنشيط 45.9 مليار معلمة لكل وحدة.
ومن أحد الجوانب اللافتة في هذا الإطلاق هو تكلفة تدريب النموذج.
وأفادت "MiniMax" أن تدريب "M1" جرى باستخدام تعلم معزز واسع النطاق بكفاءة نادرة في هذا المجال، بتكلفة إجمالية بلغت 534,700 دولار أمريكي فقط.
ترجع هذه الكفاءة إلى خوارزمية تعلم معزز مخصصة تُدعى (CISPO)، وإلى تصميم الانتباه الهجين الذي يسهم في تبسيط عملية التوسع.
ويعد هذا المبلغ زهيدًا بشكل مدهش لنموذج لغوي كبير متطور. فعلى سبيل المثال، أفادت التقارير أن تكلفة تدريب نموذج "DeepSeek-R1" بلغت ما بين 5 إلى 6 ملايين دولار، بينما تجاوزت تكلفة تدريب "GPT-4" من "OpenAI"، وهو نموذج عمره أكثر من عامين الآن، 100 مليون دولار.
أداء MiniMax-M1 وتفوق على المنافسين
خضع النموذج لتقييم عبر مجموعة من المعايير الراسخة التي تختبر قدرات الاستدلال المتقدمة وهندسة البرمجيات واستخدام الأدوات.
وفي اختبار مسابقة الرياضيات "AIME 2024"، حقق نموذج "M1-80k" دقة بلغت 86.0%.
كما قدم أداءً قويًا في مهام الترميز والسياق الطويل، متفوقًا على منافسين مفتوحي الأوزان مثل "DeepSeek-R1" و "Qwen3-235B-A22B" في العديد من المهام المعقدة.
ورغم أن النماذج مغلقة المصدر مثل "o3" من "OpenAI" و "Gemini 2.5 Pro" لا تزال تتصدر بعض المعايير، يقلص "MiniMax-M1" فجوة الأداء بشكل كبير مع بقائه متاحًا مجانًا بموجب ترخيص أباتشي 2.0.
خيارات النشر وتأثيره على صناع القرار
توصي "MiniMax" باستخدام "vLLM" كواجهة خلفية للخدمة، نظرًا لتحسينه لأحمال العمل الكبيرة للنماذج وكفاءة الذاكرة ومعالجة الطلبات المجمعة.
كما تقدم الشركة خيارات نشر باستخدام مكتبة "Transformers".
ويدعم "MiniMax-M1" قدرات استدعاء الدوال المهيكلة ويأتي مع واجهة برمجة تطبيقات لروبوت محادثة تشمل البحث عبر الإنترنت، وإنشاء الفيديو والصور، وتوليد الكلام، واستنساخ الصوت.
وبالنسبة لقادة الهندسة المسؤولين عن دورة حياة النماذج اللغوية الكبيرة، يقدم النموذج تكلفة تشغيلية أقل مع دعم مهام الاستدلال المتقدمة.
وقد تقلل نافذة السياق الطويلة بشكل كبير من جهود المعالجة المسبقة لمستندات المؤسسات أو بيانات السجلات التي تمتد لعشرات أو مئات الآلاف من الوحدات.
أما بالنسبة لمديري تنسيق الذكاء الاصطناعي، فإن القدرة على ضبط ونشر "MiniMax-M1" باستخدام أدوات راسخة تسهل التكامل مع البنية التحتية الحالية.
ومن منظور منصات البيانات، تستطيع الفرق المسؤولة عن الحفاظ على بنية تحتية فعالة وقابلة للتطوير الاستفادة من دعم "M1" لاستدعاء الدوال المهيكلة وتوافقه مع خطوط الأنابيب الآلية.
كما قد يجد قادة الأمن قيمة في تقييم إمكانات النموذج لنشر آمن ومحلي لنموذج عالي القدرة لا يعتمد على نقل البيانات الحساسة إلى نقاط نهاية تابعة لجهات خارجية.
وفي المحصلة، يمثل "MiniMax-M1" خيارًا مرنًا للمنظمات التي تتطلع إلى تجربة أو توسيع نطاق قدرات الذكاء الاصطناعي المتقدمة مع إدارة التكاليف والبقاء ضمن الحدود التشغيلية وتجنب القيود الخاصة بالبائعين.