أعلنت شركة MiniMax عن إطلاق سلسلة جديدة من النماذج المفتوحة المصدر تحت اسم MiniMax-01، تشمل النموذجين الأساسيين MiniMax-Text-01 وMiniMax-VL-01.
وتهدف هذه السلسة إلى تحقيق تقدم نوعي في معالجة السياقات الطويلة للنصوص والرؤية المتعددة الوسائط.
واعتمدت MiniMax على آلية جديدة تُدعى Lightning Attention كبديل جديد للبنية التقليدية المعتمدة على المحولات (Transformers).
هذه الآلية تقلل التعقيد الحسابي بشكل كبير، كما تضم السلسلة 456 مليار معامل، مع تفعيل 45.9 مليار معامل خلال كل استدلال.
ويزيد كل هذا من كفاءة النموذج في معالجة السياقات الطويلة جدًا، والتي تصل إلى 4 ملايين رمز، أي ما يعادل مكتبة صغيرة من الكتب. وهي سعة تفوق النماذج المنافسة بـ 20 إلى 32 مرة.
وفي هذا السياق، أثبتت MiniMax-01 تفوقها في اختبارات طويلة السياق، حيث حققت دقة 100% في مهمة "Needle-In-A-Haystack" باستخدام سياق مكون من 4 ملايين رمز. كما أظهرت أقل تدهور في الأداء مع زيادة طول المدخلات مقارنة بالنماذج الأخرى.
التكلفة التنافسية والوصول المجاني
لم تكتف الشركة الصينية الرائدة بكفاءة أدواتها الجديدة، بل قدمت أيضًا أسعار معقولة للاستفادة منها.
فقد طرحت واجهات برمجة تطبيقات للنصوص والمعالجة متعددة الوسائط بأسعار تنافسية جدًا، تبدأ من 0.2 دولار لكل مليون رمز مدخل و1.1 دولار لكل مليون رمز مخرجات.
وبالمقارنة، تعتبر هذه الأسعار أقل بـ 12.5 مرة من تكلفة نماذج GPT-4o التي تقدمها OpenAI.
وأوضحت الشركة أيضًا أن النموذج متاح كمصدر مفتوح عبر GitHub وHugging Face، مما يتيح للمطورين الوصول إلى الأوزان الكاملة للنموذج واستكشاف إمكانياته.
وأشارت أن الهدف من المصدر المفتوح هو تعزيز الأبحاث والتطبيقات في مجال الذكاء الاصطناعي، مع ضمان تحديث النماذج باستمرار لتشمل ميزات جديدة.
بالإضافة إلى ذلك، أتاحت الشركة الوصول لتجربة MiniMax-01 مجانًا من خلال منصة Hailuo.
بالختام، ربما تكون Minimax معروفة للكثيرين بأنها الشركة الرائدة في مجال مولدات الفيديو، من خلال نماذجها الشهيرة مثل Video-01، وتحديثاتها المستمرة في منصتها Hailuo video. وكان آخر هذه التحديثات منذ أيام قليلة، من خلال إمكانية تصميم فيديو للمستخدم من خلال رفع صورة واحدة له.
ولكن يبدو أن الشركة تبحث عن التوسع بقوة لتخطى حدود ذلك، خاصة مع التوقعات بأن يشهد عام 2025 نموًا كبيرًا في تطبيقات وكلاء الذكاء الاصطناعي.