كشفت شركة Alibaba Cloud عن سلسلة نماذج Qwen2-Math المصممة خصيصًا لمعالجة التحديات الرياضية المعقدة، حيث تتميز بكفاءة عالية على حل تلك المسائل بطريقة مذهلة.
وتُعد Alibaba Cloud واحدة من الشركات الرائدة في تطوير نماذج لغوية كبيرة قادرة على حل المشكلات المعقدة، والتي تُسمى Qwen لتكون منافسًا قويًا للنماذج الأشهر مثل GPT و Gemini و Claude.
ويُعتبر الإصدار الأخير هو Qwen2، والذي اعتمدت عليه بشكل أساسي في تطوير نموذج الرياضيات Qwen2-Math.
ما هو Qwen2؟
هو نموذج لغة كبير مفتوح المصدر تم تطويره كما أشرنا سابقًا من شركة Alibaba Cloud ليكون منافسًا للنماذج الأشهر مثل GPT و Gemini و Claude.
وهو ليس النموذج الأول للشركة، حيث أنه يأتي خلفًا لنماذج Qwen1.
ما هي نماذج Qwen2-Math؟
هي سلسلة جديدة من نماذج اللغة الكبيرة المُخصصة للرياضيات.
وكما أشرنا سابقًا، تعتمد هذه النماذج على البنية الأساسية لنموذج الذكاء الاصطناعي Qwen2، والتي سبق أن أظهرت بالفعل قدرات مميزة في معالجة المسائل الرياضية.
هذه النماذج تم تطويرها باستخدام مجموعة ضخمة ومتنوعة من المصادر الرياضية، تشمل نصوصًا من الويب، كتبًا، أكوادًا، أسئلة امتحانات، وبيانات مصطنعة تم توليدها بواسطة Qwen2 ذاته.
تتميز هذه النماذج -وفقًا لما نشرته الشركة على صفحة النموذج في GitHub- بقدرتها الفائقة على حل المسائل الحسابية والمعادلات الرياضية، حيث تفوقت على النماذج الرائدة الأخرى في هذا المجال.
دعونا الآن ننتقل إلى هذا الأداء والتقييم الذي نشرته Alibaba Cloud.
الأداء والتقييم
تم تقييم أداء Qwen2-Math على معايير رياضية معروفة باللغة الإنجليزية والصينية، مثل GSM8K وMath وMMLU-STEM وCMATH وGaoKao Math.
وقد أظهرت هذه النماذج أداءً استثنائيًا، حيث تفوقت على نماذج مثل GPT-4o، Claude 3.5 sonnet، و Gemini Specialized 1.5 Pro في مهام رياضية متعددة.
أيضًا ما لفت انتباهي هو أحد النماذج البارزة في هذه السلسلة Qwen2-Math-72B-Instruct، والذي حقق أداءً مذهلاً بين النماذج من نفس الحجم، متفوقًا على غيره في تحقيق دقة أعلى في نتائج الحلول الرياضية.
علاوة على ذلك، أثبتت هذه النماذج جدارتها في مسابقات رياضية معقدة مثل امتحان American Invitational Mathematics Examination (AIME) 2024 ومسابقات أخرى مثل American Mathematics Contest (AMC) 2023.
شاهد أيضًا هذه المقارنة بين نماذج الذكاء الاصطناعي في حل المسائل و الألغاز الرياضية
ضمان دقة بيانات التدريب و الإختبارات
حرص فريق Qwen على تطبيق منهجيات دقيقة للتخلص من أي تكرارات وضمان عدم تشوه البيانات المستخدمة في التدريب.
و قد تم تنفيذ هذه الإجراءات بعناية خلال مراحل ما قبل التدريب وما بعده لضمان دقة وموثوقية النماذج.
الأهداف التالية في تطوير Qwen2-Math
لم تتوقف طموحات فريق Qwen عند هذا الحد. فبالإضافة إلى القدرات الحالية للنماذج في اللغة الإنجليزية، يُخطط الفريق لتوسيع نطاق نماذج Qwen2-Math لتشمل اللغات الثنائية والمتعددة، واستمرارية العمل في تعزيز قدرة النماذج على حل المشكلات الرياضية المعقدة،
مما يهدف إلى جعل الحلول الرياضية المعقدة في متناول المُستخدمين في جميع أنحاء العالم.
حيث يطمح الباحثون القائمون على هذا المشروع في أن يتمكن Qwen2-Math من المساهمة في المجتمع لحل المشكلات الرياضية المعقدة.
بالختام، تأتي نماذج Qwen2-Math كخطوة مُبتكرة من قبل Alibaba Cloud في مجال الذكاء الاصطناعي و تعلم الآلة.
من خلال تفوقها في حل التحديات الرياضية المعقدة، تُمثل هذه النماذج نقلة رائعة في كيفية معالجة النماذج اللغوية الكبيرة للمعادلات والمسائل الرياضية.
ومع التزام الفريق بتوسيع قدرات النماذج لتشمل لغات متعددة، يُمكن القول إن هذه النماذج ستُسهم بشكل كبير في جعل الذكاء الاصطناعي أكثر شمولية وقوة في المستقبل.
يمكنك تجربة نماذج Qwen2 مجانًا على هاجنج فيس من هنا.