احتفظت شركة OpenAI بمفاجئتها حتى أخر يوم من حدث "12 يومًا من OpenAI"، لتعلن عن واحدة من أكبر إنجازات هذا العام الملئ بالتطورات.
في ليلة أمس، كشفت الشركة عن أحدث نماذجها الذكية (o3 وo3-mini)، والتي تمثل خطوة جديدة نحو تطوير النماذج القادرة على التفكير العميق والتحليل المعقد.
ومن خلال هذا الإعلان الذي تم بثه عبر يوتيوب، أكدت الشركة على التطور الكبير الذي حققته في مجال الذكاء الاصطناعي، مع التركيز على تحسين مهارات التفكير المنطقي وحل المشكلات المعقدة.
ورغم أنه مازال لم يتم طرحه للاستخدام العام بعد -كما سنعرف بعد قليل- إلا أن الشركة يبدو أنها تجرى التجارب على بعض مستخدمي منصتها ChatGPT، حيث أتيح لي تجربته أثناء استخدامي للمنصة.
ما هو o3 من OpenAI، وما يميزه
يعتبر o3 بمثابة تطور ملحوظ عن كل النماذج السابقة، بما فيها نموذج التفكير الأسبق من نفس السلسة o1.
وقد سبق إطلاق o1 في سبتمبر الماضي كإصدار أولي باسم o1-preview، قبل أن تعلن الشركة عن الإطلاق الرئيسي للنموذج في وقت سابق من نفس الفعاليات التي أشرنا بالبداية.
ومثل o1، تعتمد نماذج o3 على منهجية التفكير المدروس التي تسمح للنموذج بمراجعة وتحليل المعلومات قبل تقديم الإجابة.
ولكن، تم تصميم o3 ليقضي وقتًا أطول في التفكير قبل الرد، مما يؤدي إلى دقة أعلى في الإجابات. بل ويسمح أيضًا بالتحكم في وقت الحساب سواء أسرع أو أبطأ، مع العلم أن زيادة هذا الوقت تعني الوصول لاستجابات أكثر دقة.
ويتضمن الإصدار الجديد خوارزميات تم تدريبها عبر التعلم التعزيزي، حيث يقوم بتقييم المهام المعقدة من خلال سلسلة من الخطوات المتسلسلة التي تهدف إلى الوصول إلى الحل الأمثل. وهذه العمليات لا تقتصر على تقديم الإجابة بشكل سريع، بل تضمن موثوقية أكبر في المجالات العلمية مثل الفيزياء والرياضيات.
وفي هذا الإطار، أكد سام ألتمان-الرئيس التنفيذي للشركة- بأن هذه النماذج تعد ثورة في القدرة على التفكير المنطقي، مشيرًا إلى قدرتها على تجاوز التحديات المعقدة التي تواجه العديد من الأنظمة الأخرى.
ومن أبرز المزايا التي تم التركيز عليها في هذه النماذج هو تحسن الأداء في البرمجة، حيث أظهرت كفاءة عالية جداً في مهام البرمجة. كما تم تزويدها بقدرة على فهم المشكلات البرمجية وتقديم حلول دقيقة، والتي تساهم في تحسين المشاريع البرمجية
وبينت الاختبارات الأولية تفوقًا كبيرًا للطراز الجديد على النماذج السابقة، خصوصًا في الدقة والمرونة في التعامل مع مجموعة متنوعة من المواقف.
وأظهرت نتائج هذه الاختبارات التي خضع لها تفوقه على كافة النماذج السابقة.
فقد تجاوز o3 أداء طرازات OpenAI السابقة في اختبارات البرمجة، مثل قياس دقّة حلّ مشكلات هندسة البرمجيات، وقياس مهارة البرمجة التنافسية عبر تصنيف ELO، والذي حقق به 2727.
إن هذا الإنجاز لا يجعله بتجاوز باقي الإصدارات فقط، بل يضعه ضمن أفضل 150 شخص بالعالم في الكفاءة البرمجية.
OpenAI o3 is 2727 on Codeforces which is equivalent to the #175 best human competitive coder on the planet.
— Deedy (@deedydas) December 20, 2024
This is an absolutely superhuman result for AI and technology at large. pic.twitter.com/l43DTJDTqR
وفي إحدى أصعب المسابقات الرياضية، تفوق o3 بشكل لافت، حيث تمكن من حل 25.2% من المسائل المعقدة، في حين أن أي نموذج آخر لم يتجاوز 2%.
هل هناك سر وراء غياب نموذج o2؟
بالنظر إلى التسمية التقليدية التي تتبعها OpenAI، دارت التساؤلات حول سبب تخطيها لنموذج o2.
أشار سام ألتمان بأن الشركة تجنبت هذه التسمية احترامًا لشركة الاتصالات البريطانية o2، حيث كانت ترغب في تجنب أي لبس قد ينشأ بسبب التشابه في الأسماء.
وعلى الرغم من هذه التساؤلات حول التسمية، أكدت OpenAI أن تركيزها الأكبر يكمن في تحسين القدرات التقنية للنماذج الجديدة. وقد أشار ألتمان مازحًا إلى أن الشركة لا تعير اهتمامًا كبيرًا لأسماء النماذج، بل تركز على تحسين أدائها.
متى يتم إطلاق نماذج o3
تخطط OpenAI لإطلاق النسخة الأصغر o3-mini في نهاية يناير 2025، ويليه إطلاق النموذج الكامل o3 في وقت لاحق.
وقد دعت شركة الشركة الباحثين في مجالات الأمان والسلامة للتقدم بطلبات للوصول المبكر، حيث تنتهي فترة التقديم في 10 يناير 2025. ومن المتوقع أن يتم إخطار الباحثين الذين تم اختيارهم في وقت قريب بعد ذلك.
وسيتمكن المشاركون في هذا البرنامج من تطوير أساليب جديدة لتقييم قدرات الذكاء الاصطناعي والمخاطر المحتملة المرتبطة به. كما سيعملون على إعداد تجارب محكومة لسيناريوهات قد تكون عالية المخاطر. وبالإضافة إلى ذلك، سيكون لديهم فرصة للمساهمة بوجهات نظر قيمة تساعد OpenAI في زيادة إطار الأمان الذي تعتمد عليه في تطوير تقنياتها.
هل يحقق o3 الذكاء الاصطناعي العام
إذا تطرقنا لمفهوم بسيط للذكاء الاصطناعي العام (AGI)، فهو قدرة الأنظمة على القيام بالمهام التي يستطيع الإنسان القيام بها.
وقد صاحب إعلان o3 ذلك الجدل الثائر منذ زمن في السعي نحو تحقيق ال AGI. وفي هذا السياق، أجريت بعض الإختبارات عليه لاكتشاف إمكانياته وقدراته.
وحقق الطراز تقدماً ملحوظاً بعد أن سجل نتيجة متميزة في اختبار تحدي التفكر المنطقي ARC (Abstraction and Reasoning Challenge).
وقد تم تصميم تحدي ARC في عام 2019 لقياس قدرة الذكاء الاصطناعي على اكتشاف الأنماط الصحيحة التي تربط بين الأزواج من الشبكات الملونة، وحل الألغاز المعقدة.
بمعنى آخر، تهدف هذه الألغاز البصرية إلى اختبار قدرة الذكاء الاصطناعي على إظهار شكل من أشكال الذكاء العام، التي يتطلب قدرة على التفكير العميق والتحليل، مشابهة للطريقة التي يفكر بها البشر.
ولكن، لتجنب حل الألغاز باستخدام القوة الحسابية فقط، يحدد التحدي قيوداً صارمة على قدرة الذكاء الاصطناعي في استخدام الحسابات.
وحقق أيضًا نتيجة 75.7% في اختبار "شبه خاص"، وهو نوع من الاختبارات التي يتم خلالها تحدي الأنظمة باستخدام عدد محدود من العمليات الحسابية.
وتعتبر هذه النتيجة جيدة جدًا، لأن النموذج استطاع التعامل مع الألغاز المعقدة ضمن الحدود الحسابية التي فرضها المنظمون، أي باستخدام قدرات معالجة محدودة.
ولكن، لم يتمكن من تحقيق النتيجة المطلوبة في اختبار "الخاص"، الذي يتطلب استخدام قوة حسابية أقل بكثير.
ومن ناحية أخرى، عندما تم اختبار النموذج باستخدام طاقة حسابية أكبر، استطاع تحقيق 87.5%، وهو رقم قريب من نتائج البشر الذين يحققون عادة 84% في هذا الاختبار.
وفقًا لفرانسوا شوليه، مهندس جوجل والمصمم الرئيسي لتحدي ARC، فإن o3 حقق زيادة كبيرة في القدرات مقارنة بنماذج GPT السابقة.
ورغم النتائج المدهشة التي قدمها، إلا أن المنظمين لتحدي ARC أكدوا أنهم لا يعتبرون أن النجاح في اجتياز هذا الاختبار يعني أن الذكاء الاصطناعي قد وصل إلى مستوى الذكاء البشري.
فهناك العديد من المهام البسيطة التي فشل النموذج في حلها، حتى عندما تم استخدام طاقة حسابية كبيرة للوصول إلى الدرجة غير الرسمية. لذلك، يظل الكثير من الخبراء مترددين في الاعتراف بأن هذا النموذج قد وصل إلى AGI.
وأضاف شوليه أنه "سيتم التأكد من وصول الذكاء الاصطناعي إلى مستوى بشري عندما تصبح عملية إنشاء مهام سهلة للبشر وصعبة على الذكاء الاصطناعي مستحيلة".
So, is this AGI?
— François Chollet (@fchollet) December 20, 2024
While the new model is very impressive and represents a big milestone on the way towards AGI, I don't believe this is AGI -- there's still a fair number of very easy ARC-AGI-1 tasks that o3 can't solve, and we have early indications that ARC-AGI-2 will remain…
بالختام، هذا يشير إلى أنه على الرغم من التقدم الكبير الذي أحرزته نماذج مثل o3، فإن الوصول إلى AGI ما زال يتطلب جهدًا لتحسين تلك الأدوات.
ولكننا نظل متفائلين بإمكانية بلوغ هذا الهدف يومًا ما، وقد يمثل إصدار o3 من OpenAI خطوة ملموسة نحو تحقيق ذلك.