أعلنت مؤسسة Allen Institute for AI (Ai2) عن إطلاق نموذجها الجديد Tulu 3-405B، والذي ينافس نماذج قوية مثل DeepSeek V3 وGPT-4o.
يأتي هذا النموذج لترسيخ فكرة أن الابتكار في الذكاء الاصطناعي لا يقتصر على الشركات الكبرى، بل يمكن أن يأتي أيضًا من مؤسسات بحثية مستقلة.
وفي إطار التحسينات، فإن Tulu 3-405B يمثل قفزة هائلة مقارنة بالإصدارات السابقة من النموذج، حيث يعتمد على 405 مليار معامل، وهو عدد يفوق بكثير إصداراته السابقة التي لم تتجاوز 70 مليارًا.
وتعني هذه الزيادة في عدد المعاملات قدرة أعلى على فهم الأنماط اللغوية وإنتاج نصوص أكثر دقة وتماسكًا، وهو ما جعله قادرًا على المنافسة في اختبارات الذكاء الاصطناعي المختلفة.
وفي هذا السياق، أظهر Tulu 3-405B نتائج ممتازة في اختبارات الأداء التي أجرتها الشركة، متفوقًا على DeepSeek V3 في مجموعة من المعايير.
بل وتخطى GPT-4o في بعض الاختبارات مثل PopQA، وهو اختبار لتقييم دقة الإجابات على أسئلة معرفية متخصصة.
كما حصل النموذج على المرتبة الأعلى بين جميع النماذج في اختبار GSM8K، الذي يقيس القدرة على حل المسائل الرياضية المدرسية.
تحسين الاستجابات باستخدام منهجية RLVR
تكمن أحد أبرز عوامل نجاح النموذج الجديد هو استخدام تقنية التعلم المعزز بالمكافآت القابلة للتحقق (RLVR).
وهذه المنهجية تسمح للنموذج بتحسين أدائه بناءً على التغذية الراجعة من نتائج موضوعية يمكن قياسها، مثل حل المسائل الرياضية وتنفيذ التعليمات بدقة.
وتعتمد على إعطاء مكافآت أو فرض عقوبات على النموذج بناءً على صحة استجاباته، وهذا يؤدي إلى تحسين مستمر في دقته وموثوقيته.
وقد أكدت مؤسسة Ai2 أن هذه المنهجية أثبتت فاعليتها في النماذج السابقة، لكن تطبيقها على نطاق واسع في Tulu 3-405B كان بمثابة اختبار حقيقي لقدراتها على تحسين الذكاء الاصطناعي المفتوح المصدر.
ما يميز Tulu 3-405B عن منافسيه؟
رغم وجود العديد من النماذج التي تُوصف بأنها مفتوحة المصدر، مثل DeepSeek V3 وLlama 3.1 405B، فإن Tulu 3-405B يتفوق بفضل شفافيته الكاملة.
فعلى عكس بعض النماذج الأخرى التي توفر فقط الأكواد أو الأوزان المدربة دون الكشف عن بيانات التدريب، فإن Ai2 تتيح كل مكونات النموذج، بما في ذلك البيانات، والكود البرمجي، ومعمارية التدريب، مما يسمح للمطورين بإعادة تدريب النموذج بالكامل أو تعديله وفقًا لاحتياجاتهم.
وتمنح هذه الشفافية للمستخدمين القدرة على فحص وتقييم النموذج بحرية، وهذا من شأنه زيادة الموثوقية ودفع عجلة الابتكار في مجال الذكاء الاصطناعي المفتوح المصدر.
ومع تحقيق هذا النموذج لمستويات أداء متقدمة، قد نتساءل حول مدى تأثيره على النماذج التجارية المغلقة التي تطورها شركات مثل OpenAI وGoogle.
ففي ظل التحسن المستمر للنماذج المفتوحة المصدر، يصبح من الصعب تجاهلها، خاصة أن المؤسسات البحثية مثل Ai2 تُثبت قدرتها على تطوير نماذج قادرة على المنافسة بدون الحاجة إلى موارد ضخمة مثل تلك التي تمتلكها الشركات الكبرى.
إمكانية الوصول
يتوفر Tulu 3-405B الآن للدردشة عبر تطبيق الويب، حيث يمكن اختباره مباشرة، كما أن الكود البرمجي الخاص به متاح عبر منصات GitHub وHugging Face.
تعرف على بعض إصدارات الشركة السابقة