دليل مواقع وأدوات و تطبيقات الذكاء الاصطناعي

نموذج علي بابا الجديد Qwen2-Math يُحقق نتائج مُذهلة في حل المسائل الرياضية المُعقدة

كشفت شركة Alibaba Cloud عن سلسلة نماذج Qwen2-Math المصممة خصيصًا لمعالجة التحديات الرياضية المعقدة، حيث تتميز بكفاءة عالية على حل تلك المسائل بطريقة مذهلة.

وتُعد Alibaba Cloud واحدة من الشركات الرائدة في تطوير نماذج لغوية كبيرة قادرة على حل المشكلات المعقدة، والتي تُسمى Qwen لتكون منافسًا قويًا للنماذج الأشهر مثل GPT و Gemini و Claude.

ويُعتبر الإصدار الأخير هو Qwen2، والذي اعتمدت عليه بشكل أساسي في تطوير نموذج الرياضيات Qwen2-Math.

 

ما هو Qwen2؟

هو نموذج لغة كبير مفتوح المصدر تم تطويره كما أشرنا سابقًا من شركة Alibaba Cloud ليكون منافسًا للنماذج الأشهر مثل GPT و Gemini و Claude.

وهو ليس النموذج الأول للشركة، حيث أنه يأتي خلفًا لنماذج Qwen1.

ما هي نماذج Qwen2-Math؟


هي سلسلة جديدة من نماذج اللغة الكبيرة المُخصصة للرياضيات.
وكما أشرنا سابقًا، تعتمد هذه النماذج على البنية الأساسية لنموذج الذكاء الاصطناعي Qwen2، والتي سبق أن أظهرت بالفعل قدرات مميزة في معالجة المسائل الرياضية.
هذه النماذج تم تطويرها باستخدام مجموعة ضخمة ومتنوعة من المصادر الرياضية، تشمل نصوصًا من الويب، كتبًا، أكوادًا، أسئلة امتحانات، وبيانات مصطنعة تم توليدها بواسطة Qwen2 ذاته.

تتميز هذه النماذج -وفقًا لما نشرته الشركة على صفحة النموذج في GitHub- بقدرتها الفائقة على حل المسائل الحسابية والمعادلات الرياضية، حيث تفوقت على النماذج الرائدة الأخرى في هذا المجال.

دعونا الآن ننتقل إلى هذا الأداء والتقييم الذي نشرته Alibaba Cloud.

الأداء والتقييم

تم تقييم أداء Qwen2-Math على معايير رياضية معروفة باللغة الإنجليزية والصينية، مثل GSM8K وMath وMMLU-STEM وCMATH وGaoKao Math.

رسم بياني يُقارن أداء نماذج Qwen2-Math من Alibaba Cloud مع نماذج لغوية كبيرة أخرى في حل المسائل الرياضية.
يُظهر هذا الرسم البياني تفوق نماذج Qwen2-Math من Alibaba Cloud على نماذج أخرى في مجال حل المسائل الرياضية.

وقد أظهرت هذه النماذج أداءً استثنائيًا، حيث تفوقت على نماذج مثل GPT-4o، Claude 3.5 sonnet، و Gemini Specialized 1.5 Pro في مهام رياضية متعددة.

أيضًا ما لفت انتباهي هو أحد النماذج البارزة في هذه السلسلة Qwen2-Math-72B-Instruct، والذي حقق أداءً مذهلاً بين النماذج من نفس الحجم، متفوقًا على غيره في تحقيق دقة أعلى في نتائج الحلول الرياضية.

دول يُقارن أداء نموذج Qwen2-Math-72B-Instruct من Alibaba Cloud مع نماذج لغوية
هذا الجدول تفوق نموذج Qwen2-Math-72B-Instruct في معايير GSM8K و MATH و MMLU-STEM و CMATH و GaoKao Math.

علاوة على ذلك، أثبتت هذه النماذج جدارتها في مسابقات رياضية معقدة مثل امتحان American Invitational Mathematics Examination (AIME) 2024 ومسابقات أخرى مثل American Mathematics Contest (AMC) 2023.

شاهد أيضًا هذه المقارنة بين نماذج الذكاء الاصطناعي في حل المسائل و الألغاز الرياضية

ضمان دقة بيانات التدريب و الإختبارات 

حرص فريق Qwen على تطبيق منهجيات دقيقة للتخلص من أي تكرارات وضمان عدم تشوه البيانات المستخدمة في التدريب.

و قد تم تنفيذ هذه الإجراءات بعناية خلال مراحل ما قبل التدريب وما بعده لضمان دقة وموثوقية النماذج.

 

الأهداف التالية في تطوير Qwen2-Math

لم تتوقف طموحات فريق Qwen عند هذا الحد. فبالإضافة إلى القدرات الحالية للنماذج في اللغة الإنجليزية، يُخطط الفريق لتوسيع نطاق نماذج Qwen2-Math لتشمل اللغات الثنائية والمتعددة، واستمرارية العمل في تعزيز قدرة النماذج على حل المشكلات الرياضية المعقدة،

مما يهدف إلى جعل الحلول الرياضية المعقدة في متناول المُستخدمين في جميع أنحاء العالم.

حيث يطمح الباحثون القائمون على هذا المشروع في أن يتمكن Qwen2-Math من المساهمة في المجتمع لحل المشكلات الرياضية المعقدة.

بالختام، تأتي نماذج Qwen2-Math كخطوة مُبتكرة من قبل Alibaba Cloud في مجال الذكاء الاصطناعي و تعلم الآلة.

من خلال تفوقها في حل التحديات الرياضية المعقدة، تُمثل هذه النماذج نقلة رائعة في كيفية معالجة النماذج اللغوية الكبيرة للمعادلات والمسائل الرياضية.

ومع التزام الفريق بتوسيع قدرات النماذج لتشمل لغات متعددة، يُمكن القول إن هذه النماذج ستُسهم بشكل كبير في جعل الذكاء الاصطناعي أكثر شمولية وقوة في المستقبل.

يمكنك تجربة نماذج Qwen2 مجانًا على هاجنج فيس من هنا.

 

Khaled B.

خبير في الذكاء الاصطناعي يتمتع بخبرة واسعة في تطوير وتنفيذ حلول متقدمة باستخدام أحدث تقنياته. مُتخصص في توظيف هذه الإمكانيات لتحسين الأعمال وتحقيق الأرباح من خلال الابتكار التكنولوجي. لديه شغف لإيجاد استراتيجيات وحلول مبتكرة تساعد الشركات والأفراد على تحقيق أهدافهم من خلال تسخير هذه التكنولوجيا.

Related Posts

DeepSeek-R1: هل يتفوق على OpenAI o1? جربه مجانًا

شهدت صناعة الذكاء الاصطناعي أمس إطلاق نموذج جديد من شركة DeepSeek الصينية، يُعرف بـ DeepSeek-R1…

اقرأ المزيد

ميتا تعلن تحديثات ماسنجر: مكالمات فيديو HD ورسائل دون استخدام اليدين!

ماسنجر يحصل على مزايا جديدة في “Messenger Calling” تشمل مكالمات الفيديو بجودة HD، خلفيات مُولدة…

اقرأ المزيد

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

مقالات قد تهمك

DeepSeek-R1: هل يتفوق على OpenAI o1? جربه مجانًا

    DeepSeek-R1: هل يتفوق على OpenAI o1? جربه مجانًا

    ميتا تعلن تحديثات ماسنجر: مكالمات فيديو HD ورسائل دون استخدام اليدين!

      ميتا تعلن تحديثات ماسنجر: مكالمات فيديو HD ورسائل دون استخدام اليدين!

      محركات البحث بالذكاء الاصطناعي: هل نثق بها؟

        محركات البحث بالذكاء الاصطناعي: هل نثق بها؟

        AI Ease: تحرير وتعديل وتحسين جودة الصور مجانًا

          AI Ease: تحرير وتعديل وتحسين جودة الصور مجانًا

          Le Chat يُنافس ChatGPT بميزات جديدة مجانية

            Le Chat يُنافس ChatGPT بميزات جديدة مجانية