نموذج Qwen2-Math من علي بابا يتفوق في حل المسائل الرياضية المعقدة

Qwen2-Math من Alibaba Cloud لحل المسائل الرياضية المعقدة

كشفت شركة Alibaba Cloud عن سلسلة نماذج Qwen2-Math المصممة خصيصًا لمعالجة التحديات الرياضية المعقدة، حيث تتميز بكفاءة عالية على حل تلك المسائل بطريقة مذهلة.

وتُعد Alibaba Cloud واحدة من الشركات الرائدة في تطوير نماذج لغوية كبيرة قادرة على حل المشكلات المعقدة، والتي تُسمى Qwen لتكون منافسًا قويًا للنماذج الأشهر مثل GPT و Gemini و Claude.

ويُعتبر الإصدار الأخير هو Qwen2، والذي اعتمدت عليه بشكل أساسي في تطوير نموذج الرياضيات Qwen2-Math.

ما هو Qwen2؟

هو نموذج لغة كبير مفتوح المصدر تم تطويره كما أشرنا سابقًا من شركة Alibaba Cloud ليكون منافسًا للنماذج الأشهر مثل GPT و Gemini و Claude.

وهو ليس النموذج الأول للشركة، حيث أنه يأتي خلفًا لنماذج Qwen1.

ما هي نماذج Qwen2-Math؟

هي سلسلة جديدة من نماذج اللغة الكبيرة المُخصصة للرياضيات.
وكما أشرنا سابقًا، تعتمد هذه النماذج على البنية الأساسية لنموذج الذكاء الاصطناعي Qwen2، والتي سبق أن أظهرت بالفعل قدرات مميزة في معالجة المسائل الرياضية.
هذه النماذج تم تطويرها باستخدام مجموعة ضخمة ومتنوعة من المصادر الرياضية، تشمل نصوصًا من الويب، كتبًا، أكوادًا، أسئلة امتحانات، وبيانات مصطنعة تم توليدها بواسطة Qwen2 ذاته.

تتميز هذه النماذج -وفقًا لما نشرته الشركة على صفحة النموذج في GitHub- بقدرتها الفائقة على حل المسائل الحسابية والمعادلات الرياضية، حيث تفوقت على النماذج الرائدة الأخرى في هذا المجال.

دعونا الآن ننتقل إلى هذا الأداء والتقييم الذي نشرته Alibaba Cloud.

الأداء والتقييم

تم تقييم أداء Qwen2-Math على معايير رياضية معروفة باللغة الإنجليزية والصينية، مثل GSM8K وMath وMMLU-STEM وCMATH وGaoKao Math.

رسم بياني يُقارن أداء نماذج Qwen2-Math من Alibaba Cloud مع نماذج لغوية كبيرة أخرى في حل المسائل الرياضية.

يُظهر هذا الرسم البياني تفوق نماذج Qwen2-Math من Alibaba Cloud على نماذج أخرى في مجال حل المسائل الرياضية.

وقد أظهرت هذه النماذج أداءً استثنائيًا، حيث تفوقت على نماذج مثل GPT-4o، Claude 3.5 sonnet، و Gemini Specialized 1.5 Pro في مهام رياضية متعددة.

أيضًا ما لفت انتباهي هو أحد النماذج البارزة في هذه السلسلة Qwen2-Math-72B-Instruct، والذي حقق أداءً مذهلاً بين النماذج من نفس الحجم، متفوقًا على غيره في تحقيق دقة أعلى في نتائج الحلول الرياضية.

دول يُقارن أداء نموذج Qwen2-Math-72B-Instruct من Alibaba Cloud مع نماذج لغوية

هذا الجدول تفوق نموذج Qwen2-Math-72B-Instruct في معايير GSM8K و MATH و MMLU-STEM و CMATH و GaoKao Math.

علاوة على ذلك، أثبتت هذه النماذج جدارتها في مسابقات رياضية معقدة مثل امتحان American Invitational Mathematics Examination (AIME) 2024 ومسابقات أخرى مثل American Mathematics Contest (AMC) 2023.

شاهد أيضًا هذه المقارنة بين نماذج الذكاء الاصطناعي في حل المسائل و الألغاز الرياضية

ضمان دقة بيانات التدريب و الإختبارات

حرص فريق Qwen على تطبيق منهجيات دقيقة للتخلص من أي تكرارات وضمان عدم تشوه البيانات المستخدمة في التدريب.

و قد تم تنفيذ هذه الإجراءات بعناية خلال مراحل ما قبل التدريب وما بعده لضمان دقة وموثوقية النماذج.

الأهداف التالية في تطوير Qwen2-Math

لم تتوقف طموحات فريق Qwen عند هذا الحد. فبالإضافة إلى القدرات الحالية للنماذج في اللغة الإنجليزية، يُخطط الفريق لتوسيع نطاق نماذج Qwen2-Math لتشمل اللغات الثنائية والمتعددة، واستمرارية العمل في تعزيز قدرة النماذج على حل المشكلات الرياضية المعقدة،

مما يهدف إلى جعل الحلول الرياضية المعقدة في متناول المُستخدمين في جميع أنحاء العالم.

حيث يطمح الباحثون القائمون على هذا المشروع في أن يتمكن Qwen2-Math من المساهمة في المجتمع لحل المشكلات الرياضية المعقدة.

بالختام، تأتي نماذج Qwen2-Math كخطوة مُبتكرة من قبل Alibaba Cloud في مجال الذكاء الاصطناعي و تعلم الآلة.

من خلال تفوقها في حل التحديات الرياضية المعقدة، تُمثل هذه النماذج نقلة رائعة في كيفية معالجة النماذج اللغوية الكبيرة للمعادلات والمسائل الرياضية.

ومع التزام الفريق بتوسيع قدرات النماذج لتشمل لغات متعددة، يُمكن القول إن هذه النماذج ستُسهم بشكل كبير في جعل الذكاء الاصطناعي أكثر شمولية وقوة في المستقبل.

يمكنك تجربة نماذج Qwen2 مجانًا على هاجنج فيس من هنا.

أو تحقق من الفئات الشعبية لدينا...

من نحن

تواصل معنا

أو تحقق من الفئات الشعبية لدينا...

نموذج علي بابا الجديد Qwen2-Math يُحقق نتائج مُذهلة في حل المسائل الرياضية المُعقدة

ما هو Qwen2؟

ما هي نماذج Qwen2-Math؟

الأداء والتقييم

ضمان دقة بيانات التدريب و الإختبارات

الأهداف التالية في تطوير Qwen2-Math

Related Posts

Perplexity Labs: أداة الذكاء الاصطناعي لإنشاء التطبيقات وجداول البيانات والتقارير

عدسة جوجل في يوتيوب شورتس: بحث بصري فوري لما تراه بالفيديوهات

اترك تعليقاً إلغاء الرد

آخر المقالات

يمكنك الآن مشاركة الكاميرا ومحتوى شاشة هاتفك مع Gemini Live مجانًا

Token Monster: منصة جديدة يرأسها “Claude” تجمع نماذج الذكاء الاصطناعي لك

Perplexity Labs: أداة الذكاء الاصطناعي لإنشاء التطبيقات وجداول البيانات والتقارير

عدسة جوجل في يوتيوب شورتس: بحث بصري فوري لما تراه بالفيديوهات