
كشفت شركة OpenAI اليوم عن إطلاق نموذجين متقدمين هما "o3" و"o4-mini"، وهما جزء من سلسلة النماذج الاستدلالية التي تتيح للذكاء الاصطناعي التفكير المنطقي قبل تقديم الإجابات.
يأتي هذا الخبر ضمن سلسلة من التحديثات التي أعلن عنها رئيس الشركة التنفيذي -سام ألتمان- مؤخرًا، والتي توقعنا فيها إطلاق هذين الإصدارين.
قدرات وميزات o3 و o4-mini
تشير OpenAI إلى أن نموذج "o3" هو قمة ما توصلت إليه الشركة من قدرات في الاستدلال والبرمجة والرياضيات والعلوم والفهم البصري. ووصفته الشركة بأنه نموذجها الأكثر تطورًا في التفكير المنطقي.
وبحسب نتائج اختبار SWE-bench لقياس قدرة البرمجة، تفوق بوضوح على جميع النماذج في هذه الفئة، بما فيها "o3-mini" و"Claude 3.7 Sonnet".
وسجل "o3" نسبة أداء بلغت 69.1%، بينما حقق "o4-mini" نسبة قريبة منه وصلت إلى 68.1%.
أما من ضمن أبرز ميزات النماذج الجديدة هي قدرتها على "التفكير باستخدام الصور"، حيث تقوم بقراءة وتحليل الصور، حتى وإن كانت غير واضحة أو منخفضة الجودة.
ومن خلال هذه الميزة، تستطيع رفع رسومات أو مخططات أو صفحات من ملفات PDF، لتقوم النماذج بتحليل محتواها بصريًا ضمن سلسلة التفكير لزيادة دقة الإجابات.
ولأول مرة في نماذج OpenAI، يستطيع o3 استخدام جميع أدوات ChatGPT بشكل مستقل، بما في ذلك التصفح، تشغيل أكواد Python، فهم الصور، وتوليدها.
قد تكشف لنا هذه القدرة بشكل خاص عن تحوّل نحو ذكاء صناعي أكثر "وكالة"، أي إمكانية النموذج تنفيذ سلسلة من المهام دون تدخل مباشر من المستخدم، كما حدث في أحد العروض التجريبية حين قام "o3" بتحليل ملصق بحث علمي، ثم جمع معلومات من الإنترنت، واستخلص استنتاجًا غير مذكور في النص الأصلي.
تسعير o3 و o4-mini، وإصدار جديد منتظر
تتوفر النماذج الجديدة حاليًا لمشتركي خطط ChatGPT Plus وPro وTeam، مع نسخة محسّنة من "o4-mini" تُعرف باسم "o4-mini-high"، توفر دقة أكبر عبر تخصيص وقت أطول لمعالجة الإجابات.
ومن المنتظر أيضًا طرح نسخة "o3-pro" خلال الأسابيع المقبلة، حصريًا لمشتركي خطة Pro، وتستخدم هذه النسخة موارد حوسبة أكبر لتقديم أداء أعلى.
أما بالنسبة إلى المطورين، ستتيح لهم الشركة النماذج الجديدة عبر واجهات API، مع تسعير تنافسي يبلغ 10 دولارات لكل مليون "توكن" إدخال و40 دولارًا لكل مليون "توكن" إخراج لنموذج "o3".
بينما يُسعّر "o4-mini" بنفس تكلفة "o3-mini"، أي 1.10 دولار للإدخال و4.40 للإخراج.
أداة Codex CLI
وفي إطار تعزيز قدرات الذكاء الصناعي المحلي، أطلقت OpenAI أداة "Codex CLI".
تعمل هذه الأداة كوكيل برمجي مفتوح المصدر يمكن تشغيله محليًا في بيئة الطرفية، لربط النماذج الجديدة بملفات المستخدم وأنظمته الخاصة.
وتدعم Codex CLI نموذجي "o3" و"o4-mini"، كما سيتم دعم GPT-4.1 لاحقًا.
من ناحية أخرى، أطلقت الشركة مبادرة تمويل بقيمة مليون دولار لدعم المشاريع التجريبية التي تستخدم هذه النماذج، عبر منح تصل إلى 25 ألف دولار لكل مشروع.
وفي الختام، من المرجح أن "o3" و"o4-mini" سيكونان آخر نماذج الشركة في سلسلة التفكير، وفقًا لما أشار إليه سام ألتمان.
لذلك، من الواضح أن كل هذه الخطوات هي مرحلة أساسية تمهيدًا لإطلاق GPT-5، وهو النموذج المنتظر الذي سيجمع بين قدرات النماذج التقليدية ونماذج الاستدلال في نظام موحد.