دليل مواقع وأدوات و تطبيقات الذكاء الاصطناعي

نموذج علي بابا الجديد Qwen2-Math يُحقق نتائج مُذهلة في حل المسائل الرياضية المُعقدة

كشفت شركة Alibaba Cloud عن سلسلة نماذج Qwen2-Math المصممة خصيصًا لمعالجة التحديات الرياضية المعقدة، حيث تتميز بكفاءة عالية على حل تلك المسائل بطريقة مذهلة.

وتُعد Alibaba Cloud واحدة من الشركات الرائدة في تطوير نماذج لغوية كبيرة قادرة على حل المشكلات المعقدة، والتي تُسمى Qwen لتكون منافسًا قويًا للنماذج الأشهر مثل GPT و Gemini و Claude.

ويُعتبر الإصدار الأخير هو Qwen2، والذي اعتمدت عليه بشكل أساسي في تطوير نموذج الرياضيات Qwen2-Math.

 

ما هو Qwen2؟

هو نموذج لغة كبير مفتوح المصدر تم تطويره كما أشرنا سابقًا من شركة Alibaba Cloud ليكون منافسًا للنماذج الأشهر مثل GPT و Gemini و Claude.

وهو ليس النموذج الأول للشركة، حيث أنه يأتي خلفًا لنماذج Qwen1.

ما هي نماذج Qwen2-Math؟


هي سلسلة جديدة من نماذج اللغة الكبيرة المُخصصة للرياضيات.
وكما أشرنا سابقًا، تعتمد هذه النماذج على البنية الأساسية لنموذج الذكاء الاصطناعي Qwen2، والتي سبق أن أظهرت بالفعل قدرات مميزة في معالجة المسائل الرياضية.
هذه النماذج تم تطويرها باستخدام مجموعة ضخمة ومتنوعة من المصادر الرياضية، تشمل نصوصًا من الويب، كتبًا، أكوادًا، أسئلة امتحانات، وبيانات مصطنعة تم توليدها بواسطة Qwen2 ذاته.

تتميز هذه النماذج -وفقًا لما نشرته الشركة على صفحة النموذج في GitHub- بقدرتها الفائقة على حل المسائل الحسابية والمعادلات الرياضية، حيث تفوقت على النماذج الرائدة الأخرى في هذا المجال.

دعونا الآن ننتقل إلى هذا الأداء والتقييم الذي نشرته Alibaba Cloud.

الأداء والتقييم

تم تقييم أداء Qwen2-Math على معايير رياضية معروفة باللغة الإنجليزية والصينية، مثل GSM8K وMath وMMLU-STEM وCMATH وGaoKao Math.

رسم بياني يُقارن أداء نماذج Qwen2-Math من Alibaba Cloud مع نماذج لغوية كبيرة أخرى في حل المسائل الرياضية.
يُظهر هذا الرسم البياني تفوق نماذج Qwen2-Math من Alibaba Cloud على نماذج أخرى في مجال حل المسائل الرياضية.

وقد أظهرت هذه النماذج أداءً استثنائيًا، حيث تفوقت على نماذج مثل GPT-4o، Claude 3.5 sonnet، و Gemini Specialized 1.5 Pro في مهام رياضية متعددة.

أيضًا ما لفت انتباهي هو أحد النماذج البارزة في هذه السلسلة Qwen2-Math-72B-Instruct، والذي حقق أداءً مذهلاً بين النماذج من نفس الحجم، متفوقًا على غيره في تحقيق دقة أعلى في نتائج الحلول الرياضية.

دول يُقارن أداء نموذج Qwen2-Math-72B-Instruct من Alibaba Cloud مع نماذج لغوية
هذا الجدول تفوق نموذج Qwen2-Math-72B-Instruct في معايير GSM8K و MATH و MMLU-STEM و CMATH و GaoKao Math.

علاوة على ذلك، أثبتت هذه النماذج جدارتها في مسابقات رياضية معقدة مثل امتحان American Invitational Mathematics Examination (AIME) 2024 ومسابقات أخرى مثل American Mathematics Contest (AMC) 2023.

شاهد أيضًا هذه المقارنة بين نماذج الذكاء الاصطناعي في حل المسائل و الألغاز الرياضية

ضمان دقة بيانات التدريب و الإختبارات 

حرص فريق Qwen على تطبيق منهجيات دقيقة للتخلص من أي تكرارات وضمان عدم تشوه البيانات المستخدمة في التدريب.

و قد تم تنفيذ هذه الإجراءات بعناية خلال مراحل ما قبل التدريب وما بعده لضمان دقة وموثوقية النماذج.

 

الأهداف التالية في تطوير Qwen2-Math

لم تتوقف طموحات فريق Qwen عند هذا الحد. فبالإضافة إلى القدرات الحالية للنماذج في اللغة الإنجليزية، يُخطط الفريق لتوسيع نطاق نماذج Qwen2-Math لتشمل اللغات الثنائية والمتعددة، واستمرارية العمل في تعزيز قدرة النماذج على حل المشكلات الرياضية المعقدة،

مما يهدف إلى جعل الحلول الرياضية المعقدة في متناول المُستخدمين في جميع أنحاء العالم.

حيث يطمح الباحثون القائمون على هذا المشروع في أن يتمكن Qwen2-Math من المساهمة في المجتمع لحل المشكلات الرياضية المعقدة.

بالختام، تأتي نماذج Qwen2-Math كخطوة مُبتكرة من قبل Alibaba Cloud في مجال الذكاء الاصطناعي و تعلم الآلة.

من خلال تفوقها في حل التحديات الرياضية المعقدة، تُمثل هذه النماذج نقلة رائعة في كيفية معالجة النماذج اللغوية الكبيرة للمعادلات والمسائل الرياضية.

ومع التزام الفريق بتوسيع قدرات النماذج لتشمل لغات متعددة، يُمكن القول إن هذه النماذج ستُسهم بشكل كبير في جعل الذكاء الاصطناعي أكثر شمولية وقوة في المستقبل.

يمكنك تجربة نماذج Qwen2 مجانًا على هاجنج فيس من هنا.

 

Khaled B.

خبير في الذكاء الاصطناعي يتمتع بخبرة واسعة في تطوير وتنفيذ حلول متقدمة باستخدام أحدث تقنياته. مُتخصص في توظيف هذه الإمكانيات لتحسين الأعمال وتحقيق الأرباح من خلال الابتكار التكنولوجي. لديه شغف لإيجاد استراتيجيات وحلول مبتكرة تساعد الشركات والأفراد على تحقيق أهدافهم من خلال تسخير هذه التكنولوجيا.

Related Posts

كل ما تحتاج معرفته عن نماذج OpenAI الثورية o1-preview و mini

في عالم الذكاء الاصطناعي، كل تحديث أو نموذج جديد يجلب معه تحولًا كبيرًا في القدرات والاحتمالات. في الأشهر الـ 18 الماضية، أثار إصدار نموذج GPT-4 من OpenAI ضجة كبيرة، حيث…

إطلاق Reflection 70B | نموذج ذكاء اصطناعي يثير الجدل والاتهامات

خلال الأسبوع الأول من سبتمبر 2024، تم الإعلان عن إطلاق نموذج ذكاء اصطناعي جديد من HyperWrite، يدعى Reflection 70B، والذي وُصف بأنه أقوى نموذج مفتوح المصدر في العالم. ورغم التوقعات…

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

You Missed

توليد و استنساخ أصوات بالعربيةمجانًا مع Fish audio

  • سبتمبر 16, 2024
توليد و استنساخ أصوات بالعربيةمجانًا مع Fish audio

اكتشف أداة Audio Overview من جوجل لتحويل النصوص إلى محادثات صوتية

  • سبتمبر 14, 2024
اكتشف أداة Audio Overview من جوجل لتحويل النصوص إلى محادثات صوتية

إطلاق قسم أدوات الذكاء الاصطناعي في Arab AI للمستخدمين مجانًا

  • سبتمبر 14, 2024
إطلاق قسم أدوات الذكاء الاصطناعي في Arab AI  للمستخدمين مجانًا

كل ما تحتاج معرفته عن نماذج OpenAI الثورية o1-preview و mini

  • سبتمبر 13, 2024
كل ما تحتاج معرفته عن نماذج OpenAI الثورية o1-preview و mini

إطلاق Reflection 70B | نموذج ذكاء اصطناعي يثير الجدل والاتهامات

  • سبتمبر 12, 2024
إطلاق Reflection 70B | نموذج ذكاء اصطناعي يثير الجدل والاتهامات

إطلاق Pixtral 12B: أول نموذج متعدد الوسائط من Mistral AI

  • سبتمبر 12, 2024
إطلاق Pixtral 12B: أول نموذج متعدد الوسائط من Mistral AI

DeepSeek-V2.5: هل هو مستقبل الذكاء الاصطناعي المفتوح المصدر؟

  • سبتمبر 11, 2024
DeepSeek-V2.5: هل هو مستقبل الذكاء الاصطناعي المفتوح المصدر؟

أوبن إيه آي تخطط لإطلاق نموذج Strawberry الجديد خلال أسبوعين

  • سبتمبر 11, 2024
أوبن إيه آي تخطط لإطلاق نموذج Strawberry الجديد خلال أسبوعين

سياسات محتوى الذكاء الاصطناعي باليوتيوب و أدوات جديدة لحماية المبدعين

  • سبتمبر 8, 2024
سياسات محتوى الذكاء الاصطناعي باليوتيوب و أدوات جديدة لحماية المبدعين