دليل مواقع وأدوات و تطبيقات الذكاء الاصطناعي

Llama-4 Maverick يتراجع أداؤه بقوة خلف أشهر نماذج الذكاء الاصطناعي

كشفت نتائج حديثة عن تراجع أداء النموذج الأساسي "Maverick" التابع لشركة ميتا في اختبارات الذكاء الاصطناعي الشهيرة LM Arena، مقارنةً بمنافسين مثل "GPT-4o" و"Claude 3.5".

وسببت هذه النتائج جدلًا حول استخدام ميتا إصدارًا تجريبيًّا مُحسّنًا سابقًا سجّل أداءً مرتفعًا، ما دفع المنظّمين لتعديل سياسات الاختبار.

ثم قاموا بإعادة تقييم الإصدار الأساسي Maverick غير المعدل (Llama-4-Maverick-17B-128E-Instruct).

ويعتبر Maverick واحدًا من أربعة نماذج ضمن الجيل الأحدث من الذكاء الاصطناعي "Llama-4" من شركة Meta.

وأظهر الإصدار الأساسي فجوةً واضحةً بنسبة 15-25% في المهام المعقدة كالاستدلال والتفكير النقدي، وفقًا لبيانات نشرتها منصة LM Arena يوم 12 أبريل 2025.

ليس هذا وحسب، بل جاء في مركز متأخر جداً خلف نماذج تم إطلاقها منذ أشهر مثل DeepSeek v2.5 وGemini 1.5 Pro.

رغم ذلك، دافعت ميتا عن استراتيجيتها المتمثلة في توفير نموذج مفتوح المصدر قابل للتخصيص، بدلًا من التركيز على التفوق في الاختبارات المعيارية. 

وأشار محللون إلى أن الاختبارات لا تعكس بالضرورة الأداء الواقعي للنماذج، خاصةً مع إمكانية تحسينها لتحقيق نتائج عالية في ظروف محددة.

ومن جهتها، أوضحت ميتا أن الإصدار التجريبي السابق خضع لتحسينات مكثفة تهدف لتعزيز الحوار، لكنها قد لا تناسب جميع الاستخدامات العملية.

يعكس هذا الجدل تحديًا أوسع في صناعة الذكاء الاصطناعي: التوازن بين الشفافية والتنافسية.

فبينما تركّز شركات مثل "OpenAI" على نماذج مغلقة عالية الكفاءة، تتبنى ميتا نهجًا مختلفًا عبر تمكين المطورين من تعديل النماذج وفق احتياجاتهم، حتى لو جاء الأداء الأولي متواضعًا.

ومن المتوقع أن تستمر ميتا في تطوير "مافريك"، مع تركيزٍ على دمج ملاحظات المطورين لتحسين القدرات الأساسية خلال الأشهر المقبلة. 

تجدر الإشارة إلى أن LM Arena هي منصة رائدة لتقييم نماذج المحادثة، لكن النقاش حول دقة نتائجها يتصاعد مع تزايد اعتماد الشركات على الاختبارات المعيارية في التسويق.

ويبقى الأفضل للمطورين اختيار النماذج بناءً على تطبيقاتهم العملية، وليس النتائج النظرية فقط.

اقرأ أيضًا

xAI تكشف عن Grok 4: نموذج بقدرات جديدة لمعالجة التحيز ومنافسة OpenAI
  • يوليو 9, 2025

أعلن رجل الأعمال إيلون ماسك رسميًا عن موعد إطلاق الجيل الرابع…

تابع القراءة
جوجل توسّع إتاحة Veo 3 عالميًا: نموذج تحويل النصوص لفيديو يصل للمستخدمين
  • يوليو 5, 2025

أعلنت شركة جوجل يوم الخميس الماضي عن إطلاق نموذجها الأحدث لتوليد…

تابع القراءة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *