OpenAI o3-mini: اختبرت نموذج الذكاء الاصطناعي في سبع مهام، وإليك النتائج

طرحت شركة OpenAI نموذج o3-mini ضمن الإصدار المجاني من ChatGPT، وهي خطوة إيجابية من الشركة وفرصة للاستفادة من التطورات في مجال الذكاء الاصطناعي، خصوصًا في المهام التي تتطلب استدلالًا منطقيًا متقدمًا وحل المشكلات بطريقة منهجية.

ويعتمد النموذج على نهج تفكير داخلي، حيث يقوم بتقسيم المشكلات إلى خطوات مترابطة، ثم يعالجها بطريقة منظمة للحصول على نتائج أكثر دقة وموثوقية، لا سيما في المواقف المعقدة.

ورغم كونه نسخة مبسطة من نموذج o3 الأساسي، فإنه يتميز بسرعة أكبر وسعة معالجة أعلى، وهو ما يجعله خيارًا عمليًا لمهام البرمجة، الرياضيات، والعلوم.

وفي تحديث مؤخرًا، أعلنت أوبن إيه آي أن لن يتم إطلاق النموذج الأساسي من o3-mini، وأنها تعمل على إصدار نسخة موحدة تضم نماذج منصة ChatGPT في هيئة نموذج واحد، باسم GPT-5.

تحسن ملحوظ في البرمجة والرياضيات

حقق نموذج o3 أداءً قويًا في الاختبارات الخاصة بالبرمجة، حيث حصل على درجة 2727 Elo في منصة Codeforces، مما يضعه بين أفضل 2500 مبرمج عالميًا.

كما تفوق في اختبار SWE-bench Verified الخاص بحل المشكلات البرمجية الواقعية، إذ حصل على 71.7% مقارنة بسابقه o1 الذي سجل 48.9%.

أما في الرياضيات والعلوم، فقد أظهر دقة عالية في اختبار GPQA Diamond بنسبة 87.7%، وهو اختبار متخصص بأسئلة علمية معقدة غير متاحة للعامة.

بالإضافة إلى ذلك، تفوق o3 على o1 بثلاثة أضعاف في اختبار ARC-AGI الخاص بالتفكير المجرد، مما يعكس تطور قدراته في التحليل المنطقي.

مقارنة o3-mini مع GPT-4.5

أطلقت OpenAI مؤخرًا نموذجًا باسم GPT-4.5، والذي يأتي بتحسينات كبيرة على مستوى الدقة في تحليل السياق، والذكاء العاطفي في التعامل مع المستخدمين.

تعرف على مزايا GPT-4.5

ولكن ما الفرق بينه وبين o3-mini؟

الميزة	GPT-4.5	o3-mini
نهج التفكير	معرفي بديهي يعتمد على المعرفة	تحليل متسلسل واضح خطوة بخطوة
الدقة في المعلومات	أعلى	متوسطة
معدل الهلوسة	أقل	أعلى
الذكاء العاطفي	أعلى	أقل
الإبداع والكتابة	ممتاز	متوسط
سرعة الاستجابة	أسرع	أبطأ
ميزات المطورين	واجهات برمجة التطبيقات (API)، استدعاء الوظائف، التخطيط الذكي	واجهات برمجة التطبيقات (API)، التفكير المتسلسل

اختبار o3-mini عبر سبعة سيناريوهات

وللتأكد من كفاءة النموذج، قمنا باختباره باستخدام سبعة طلبات متنوعة تغطي مجالات البرمجة، الرياضيات، التحليل العلمي، والتفكير النقدي.

1. اختبار البرمجة

السؤال: «اكتب برنامجًا بلغة Python يحاكي نظامًا مصرفيًا بسيطًا يتيح الإيداع، السحب، والاستعلام عن الرصيد.»

قدرة OpenAI o3-mini في البرمجة، إنشاء برنامج لإدارة الحسابات المصرفية

يكشف هذا الطلب عن قدرة النموذج على التعامل مع البرمجة الكائنية، التحقق من المدخلات، ومعالجة الأخطاء. ولذلك يمكنك الاستفادة من o3-mini في إنشاء أكواد متكاملة وقابلة للتطبيق.

2. الإثبات الرياضي

السؤال: «قدّم برهانًا هندسيًا على نظرية فيثاغورس.»

كفاءة o3-mini في الرياضيات، إثبات نظرية فيثاغورس بطريقة هندسية

يتطلب هذا التمرين قدرة على تنظيم الأفكار وعرضها بطريقة منطقية.

وقد نجح النموذج في تقديم برهان واضح باستخدام مفاهيم هندسية متسلسلة. ويشير ذلك إلى مهارات o3-mini القوية في التفكير الرياضي المتقدم.

3. التفسيرات العلمية

السؤال: «اشرح بالتفصيل كيفية حدوث عملية التمثيل الضوئي.»

اختبار o3-mini في العلوم، النموذج يقدم شرح مفصل عن مراحل التمثيل الضوئي

أظهر النموذج قدرته على تقديم شرح دقيق ومتسلسل لهذه العملية البيولوجية المعقدة وأهميتها ونتائجها. ويبرز هذا إمكانياته في تنظيم المعلومات العلمية بطريقة واضحة ومنطقية.

4. التحليل التاريخي

السؤال: «ما الأسباب والنتائج الرئيسية للثورة الفرنسية؟»

اختبار في التاريخ، o3-mini يقدم تحليلًا تاريخيًا للثورة الفرنسية

هذا النوع من الأسئلة يحتاج إلى تحليل تاريخي عميق وربط للأحداث.

وقد تمكن النموذج من تقديم سرد متكامل يشمل العوامل السياسية والاجتماعية والاقتصادية التي أدت إلى الثورة وتأثيراتها اللاحقة.

5. النقد الأدبي

السؤال: «حلّل موضوعي الجنون والانتقام في مسرحية ‘هاملت’ لشكسبير.»

مهارة o3-mini في الأدب، النموذج يناقش قضايا الجنون والانتقام في "هاملت

نجح o3-mini في تقديم تحليل نقدي متماسك لأحد أكثر الأعمال الأدبية تعقيدًا.

حيث أنه ناقش كيف تطور هذان الموضوعان عبر أحداث المسرحية، مستندًا إلى اقتباسات داعمة وتحليل منطقي.

6. مهارة النقاشات الفلسفية

السؤال: «ناقش مفهوم النفعية وتأثيره على الأخلاق الحديثة.»

مهارة o3-mini في القضايا الفلسفية، تحليله لمفهوم النفعية وتأثيرها الأخلاقي

أظهر o3-mini كفاءة في الربط بين الفلسفات الكلاسيكية والسياقات الحديثة، حيث قدّم رؤية متوازنة حول النفعية وأثرها على القرارات الأخلاقية المعاصرة.

7. التخطيط الحضري

السؤال: «ضع استراتيجية متكاملة لتحسين وسائل النقل في مدينة سريعة النمو.»

قدرات ChatGPT o3-mini في التخطيط، حيث يقترح حلولًا لتحسين البنية التحتية للنقل الحضري

يتطلب هذا السؤال تفكيرًا متعدد الأبعاد يشمل التكنولوجيا، الاقتصاد، والاستدامة البيئية.

وقد قدم o3-mini خطة تفصيلية تتضمن تحسينات في البنية التحتية، استخدام الذكاء الاصطناعي لإدارة المرور، وتعزيز وسائل النقل العامة. وهو ما يبين قدرته على معالجة المشكلات الواقعية بأسلوب تحليلي.

الخلاصة

يُعتبر نموذج o3-mini إضافة قوية في الذكاء الاصطناعي المجاني، حيث يوفر أدوات متقدمة لحل المشكلات والتفكير المنطقي في مختلف المجالات.

ومن خلال اختباراته في البرمجة، الرياضيات، العلوم، الفلسفة، والأدب، أثبت النموذج أنه خيار قوي للمستخدمين الباحثين عن دعم ذكي وفعال في إنجاز المهام المعقدة.