تحاول شركة علي بابا بقوة مواكبة الصراع الحالي في سباق الذكاء الاصطناعي، وفي هذا الإطار، أطلقت أحدث نماذجها Qwen 2.5-Max.
وتزعم الشركة أنه يتفوق على العديد من النماذج المتقدمة، بما في ذلك DeepSeek-V3 وGPT-4o وLlama-3.1-405B.
جاء الإعلان عن النموذج الجديد في توقيت غير مألوف، وهو اليوم الأول من السنة القمرية الصينية، وهو ما يعكس الضغط المتزايد على الشركات بسبب ما أحدثته شركة DeepSeek الصينية.
فقد شهدت الأسابيع الأخيرة صعودًا مذهلًا لشركة DeepSeek، حيث تمكنت من إطلاق نموذج DeepSeek-V3، ثم أتبعت ذلك بإطلاق نموذج R1 المفتوح المصدر في 20 يناير.
أثارت هذه التحركات المفاجئة ضجة في وادي السيليكون، وأدت إلى تراجع أسهم بعض شركات التكنولوجيا، خاصة أن DeepSeek تعتمد على تكلفة تطوير منخفضة، مما جعل المستثمرين يعيدون النظر في خطط الإنفاق الضخمة التي تعتمدها الشركات الكبرى مثل OpenAI وMeta.
ماذا يميز Qwen 2.5-Max؟
يعتبر Qwen 2.5-Max بمثابة نسخة جديدة من نموذج Qwen 2.5 الخاص بالشركة.
وتم تطويره ليكون نموذجًا ضخمًا يعتمد على Mixture-of-Experts (MoE)، وهو نهج يسمح بتحسين كفاءة النموذج وتقليل استهلاك الموارد عند تشغيله.
وتقول على بابا أنها اعتمدت في تدريب هذا النموذج على أكثر من 20 تريليون رمز، مع تطبيق تقنيات تحسين مثل التدريب بالإشراف الفائق (SFT) والتعلم المعزز من خلال ملاحظات البشر (RLHF).
أداء Qwen 2.5-Max في الاختبارات
وضحت الشركة أن إجراء المقارنات المباشرة مع النماذج الأساسية المغلقة لم تكن ممكنة بسبب قيود الوصول.
ولهذا استخدمت نماذج التعليمات (Instruct) عوضًا عن ذلك، وهي النماذج المخصصة للمهام التفاعلية مثل الدردشة والبرمجة.
وأظهر Qwen2.5-Max أداءً متقدمًا على مجموعة من المعايير مقارنةً ببعض أبرز نماذج الذكاء الاصطناعي مثل GPT-4o وClaude-3.5-Sonnet.
وتفوق إصدار على بابا على DeepSeek V3 في اختبارات مثل Arena-Hard، الذي يقيس تفضيلات المستخدمين، وLiveBench، الذي يختبر القدرات العامة للنموذج، إلى جانب LiveCodeBench لتقييم مهارات البرمجة وGPQA-Diamond المتخصص في قياس دقة الإجابات على الأسئلة المعقدة.
بالإضافة إلى ذلك، جاء أداء Qwen2.5-Max في فئة النماذج المفتوحة منافسًا لنماذج بارزة مثل Llama-3.1-405B.
المصدر: QwenLM
إمكانية الوصول إلى النموذج
تتيح علي بابا كلاود للمستخدمين فرصة تجربة Qwen 2.5-Max عبر منصتها Qwen Chat، حيث يمكن التفاعل مع الروبوت لاختبار قدراته في المحادثة والبحث والتفاعل مع المحتوى.
جرب النموذج مجانًا على Qwen Chat
بالإضافة إلى ذلك، أصبح بإمكان المطورين الوصول إلى واجهة برمجية (API) لتكامل النموذج مع تطبيقاتهم الخاصة، بعد التسجيل في Alibaba Cloud Model Studio وإنشاء مفتاح API.