
كشفت جوجل عن Gemini 2.5، الجيل الأحدث من نماذج الذكاء الاصطناعي القادرة على التفكير المنطقي قبل تقديم الإجابات.
وكبداية لهذه السلسلة، أطلقت الشركة إصدار Gemini 2.5 Pro Experimental.
التنافس المتزايد في مجال الذكاء الاصطناعي الاستدلالي
منذ أن قدمت OpenAI أول نموذج ذكاء اصطناعي يعتمد على التفكير المنطقي في سبتمبر 2024، دخلت الشركات التقنية الكبرى في سباق لتطوير نماذج منافسة.
واليوم، تمتلك شركات مثل Anthropic، DeepSeek، جوجل، وxAI نماذج تعتمد على هذه التقنية، حيث تتميز بقدرتها على مراجعة المعلومات والتحقق منها قبل إصدار أي إجابات.
يرى خبراء أن نماذج الاستنتاج المنطقي ستكون عنصرًا أساسيًا في تطوير "الوكلاء الأذكياء".
وتعتبر الوكلاء بمثابة أنظمة ذاتية يمكنها تنفيذ مهام متنوعة دون تدخل بشري كبير. لكن التحدي الرئيسي يكمن في التكلفة المرتفعة لهذه التقنيات مقارنة بالنماذج التقليدية.
ما هو Gemini 2.5 Pro؟
Gemini 2.5 Pro هو أول نموذج في الجيل الأحدث من نماذج التفكير بالذكاء الاصطناعي من جوجل، والتي تعتمد على تقنيات الاستدلال قبل تقديم الإجابات.
ومفهوم "الاستدلال" هنا يتخطى التصنيف والتنبؤ. فهو يشمل تحليل المعلومات بعمق، واستخلاص استنتاجات منطقية، وفهم السياق والفروق الدقيقة لاتخاذ قرارات صائبة.
وتبني هذه القدرة على جهود سابقة مثل التعلم المعزز ونموذج الشركة Gemini 2.0 Flash Thinking، الذي سبق وأن جربت هذه التقنية من خلاله في ديسمبر الماضي.
ويعتبر حاليًا في شكل نسخة تجريبية تحمل اسم gemini-2.5-pro-exp-03-25.
ويمثل أقوى محاولة من Google حتى الآن لمنافسة سلسلة نماذج o1 التي طورتها OpenAI.
وأفادت الشركة أنها ستقوم بتضمين هذه القدرات في جميع نماذجها القادمة.
تفوق على المنافسين في اختبارات الأداء
تشير جوجل أن Gemini 2.5 Pro هو أفضل نماذجها حتى الآن، حيث يتفوق على إصداراتها السابقة وكذلك على بعض النماذج الرائدة الأخرى في اختبارات متعددة.
وقد اختبرته الشركة سابقًا باسم "nebula" في ساحة Chatbot Arena قبل الكشف عن ماهيته، حيث يتصدر حاليًا قائمة LMArena لتفضيلات المستخدمين بفارق واضح.

كما قدم نتائج متقدمة في اختبارات الرياضيات (AIME 2025) والعلوم (GPQA diamond) دون الحاجة لأساليب تزيد التكلفة.

وفي اختبار Aider Polyglot، الذي يقيس كفاءة تحرير الأكواد البرمجية، سجل النموذج 68.6% متجاوزًا نماذج OpenAI وAnthropic وDeepSeek.
لكن، في اختبار SWE-Bench Verified لقدرات تطوير البرمجيات، حصل على 63.8%.
هذه النتيجة تتفوق على OpenAI o3-mini و DeepSeek R1، ولكنها أقل من 70.3% التي سجلها Claude 3.7 Sonnet من Anthropic.

وذكرت Google أن النموذج قادر على إنشاء لعبة فيديو كاملة من مجرد سطر أوامر واحد، كما هو موضح بالمقطع القادم.
أداء قوي في اختبارات المعرفة المتعددة
خضع النموذج لاختبار Humanity’s Last Exam، الذي يضم آلاف الأسئلة في مجالات الرياضيات، العلوم الإنسانية، والعلوم الطبيعية.
وفي هذا الاختبار، حقق نتيجة 18.8%، متفوقًا على معظم النماذج المنافسة.
مميزات Gemini 2.5 Pro Experimental
وإلى جانب قدراته في البرمجة والتفكير المنطقي، يتمتع Gemini 2.5 Pro Experimental بإمكانيات متقدمة، حيث:
1. يدعم الإدخال متعدد الوسائط، مما يعني إمكانية معالجة الصور والفيديوهات في الوقت الفعلي.
2. يستخدم أدوات مدمجة مثل بحث جوجل للحصول على معلومات إضافية عند الحاجة.
3. يستطيع تحليل 10,000 سطر من الأكواد دفعة واحدة.
4. يدعم جميع أطوال السياق، بمعدل 5 طلبات في الدقيقة للمستخدمين المدفوعين، و2 طلب في الدقيقة مع 50 طلبًا يوميًا في الخطة المجانية.
5. يعتمد على معرفة محدثة حتى يناير 2025.
6. يأتي مع سعة سياقية تصل إلى مليون توكن، وهو ما يتيح له استيعاب ما يقارب 750,000 كلمة في المرة الواحدة.
ومن المتوقع أن يتم توسيع هذه السعة قريبًا إلى مليوني توكن.
طريقة الوصول
يتوفر الآن عبر Google AI Studio، بالإضافة إلى تطبيق Gemini للمشتركين في خطة Gemini Advanced التي تبلغ تكلفتها 20 دولارًا شهريًا.
ولم تعلن جوجل حتى الآن عن أسعار واجهة برمجة التطبيقات (API) الخاصة بـ Gemini 2.5 Pro، لكنها أشارت إلى أنها ستكشف عن تفاصيل الأسعار قريبًا.