دليل مواقع وأدوات و تطبيقات الذكاء الاصطناعي

Gemini 2.5 Pro: جوجل تطلق أقوى نماذجها للتفكير بالذكاء الاصطناعي

كشفت جوجل عن Gemini 2.5، الجيل الأحدث من نماذج الذكاء الاصطناعي القادرة على التفكير المنطقي قبل تقديم الإجابات.

وكبداية لهذه السلسلة، أطلقت الشركة إصدار Gemini 2.5 Pro Experimental.

التنافس المتزايد في مجال الذكاء الاصطناعي الاستدلالي

منذ أن قدمت OpenAI أول نموذج ذكاء اصطناعي يعتمد على التفكير المنطقي في سبتمبر 2024، دخلت الشركات التقنية الكبرى في سباق لتطوير نماذج منافسة.

واليوم، تمتلك شركات مثل Anthropic، DeepSeek، جوجل، وxAI نماذج تعتمد على هذه التقنية، حيث تتميز بقدرتها على مراجعة المعلومات والتحقق منها قبل إصدار أي إجابات.

يرى خبراء أن نماذج الاستنتاج المنطقي ستكون عنصرًا أساسيًا في تطوير "الوكلاء الأذكياء".

وتعتبر الوكلاء بمثابة أنظمة ذاتية يمكنها تنفيذ مهام متنوعة دون تدخل بشري كبير. لكن التحدي الرئيسي يكمن في التكلفة المرتفعة لهذه التقنيات مقارنة بالنماذج التقليدية.

ما هو Gemini 2.5 Pro؟

Gemini 2.5 Pro هو أول نموذج في الجيل الأحدث من نماذج التفكير بالذكاء الاصطناعي من جوجل، والتي تعتمد على تقنيات الاستدلال قبل تقديم الإجابات.

ومفهوم "الاستدلال" هنا يتخطى التصنيف والتنبؤ. فهو يشمل تحليل المعلومات بعمق، واستخلاص استنتاجات منطقية، وفهم السياق والفروق الدقيقة لاتخاذ قرارات صائبة.

وتبني هذه القدرة على جهود سابقة مثل التعلم المعزز ونموذج الشركة Gemini 2.0 Flash Thinking، الذي سبق وأن جربت هذه التقنية من خلاله في ديسمبر الماضي.

ويعتبر حاليًا في شكل نسخة تجريبية تحمل اسم gemini-2.5-pro-exp-03-25.

ويمثل أقوى محاولة من Google حتى الآن لمنافسة سلسلة نماذج o1 التي طورتها OpenAI.

وأفادت الشركة أنها ستقوم بتضمين هذه القدرات في جميع نماذجها القادمة.

تفوق على المنافسين في اختبارات الأداء

تشير جوجل أن Gemini 2.5 Pro هو أفضل نماذجها حتى الآن، حيث يتفوق على إصداراتها السابقة وكذلك على بعض النماذج الرائدة الأخرى في اختبارات متعددة.

وقد اختبرته الشركة سابقًا باسم "nebula" في ساحة Chatbot Arena قبل الكشف عن ماهيته، حيث يتصدر حاليًا قائمة LMArena لتفضيلات المستخدمين بفارق واضح.

لقطة شاشة لقائمة صدارة Chatbot Arena تُظهر Gemini 2.5 Pro Experimental محتلًا المركز الأول بتقييمات المستخدمين.

كما قدم نتائج متقدمة في اختبارات الرياضيات (AIME 2025) والعلوم (GPQA diamond) دون الحاجة لأساليب تزيد التكلفة.

رسم بياني يظهر نتائج Gemini 2.5 Pro Exp مقارنة بنماذج منافسة في اختبارات الاستدلال والعلوم والرياضيات
التفوق في اختبارات الاستدلال والعلوم والرياضيات

وفي اختبار Aider Polyglot، الذي يقيس كفاءة تحرير الأكواد البرمجية، سجل النموذج 68.6% متجاوزًا نماذج OpenAI وAnthropic وDeepSeek.

لكن، في اختبار SWE-Bench Verified لقدرات تطوير البرمجيات، حصل على 63.8%.

هذه النتيجة تتفوق على OpenAI o3-mini و DeepSeek R1، ولكنها أقل من 70.3% التي سجلها Claude 3.7 Sonnet من Anthropic.

جدول مقارنة أداء Gemini 2.5 Pro Experimental مع نماذج منافسة أخرى عبر مجموعة متنوعة من اختبارات الذكاء الاصطناعي تشمل البرمجة والاستدلال.
أداء النموذج عبر مجموعة واسعة من معايير التقييم. المصدر: Google

وذكرت Google أن النموذج قادر على إنشاء لعبة فيديو كاملة من مجرد سطر أوامر واحد، كما هو موضح بالمقطع القادم.

أداء قوي في اختبارات المعرفة المتعددة

خضع النموذج لاختبار Humanity’s Last Exam، الذي يضم آلاف الأسئلة في مجالات الرياضيات، العلوم الإنسانية، والعلوم الطبيعية.

وفي هذا الاختبار، حقق نتيجة 18.8%، متفوقًا على معظم النماذج المنافسة.

مميزات Gemini 2.5 Pro Experimental

وإلى جانب قدراته في البرمجة والتفكير المنطقي، يتمتع Gemini 2.5 Pro Experimental بإمكانيات متقدمة، حيث:

1. يدعم الإدخال متعدد الوسائط، مما يعني إمكانية معالجة الصور والفيديوهات في الوقت الفعلي.

2. يستخدم أدوات مدمجة مثل بحث جوجل للحصول على معلومات إضافية عند الحاجة.

3. يستطيع تحليل 10,000 سطر من الأكواد دفعة واحدة.

4. يدعم جميع أطوال السياق، بمعدل 5 طلبات في الدقيقة للمستخدمين المدفوعين، و2 طلب في الدقيقة مع 50 طلبًا يوميًا في الخطة المجانية.

5. يعتمد على معرفة محدثة حتى يناير 2025.

6. يأتي مع سعة سياقية تصل إلى مليون توكن، وهو ما يتيح له استيعاب ما يقارب 750,000 كلمة في المرة الواحدة.

ومن المتوقع أن يتم توسيع هذه السعة قريبًا إلى مليوني توكن.

طريقة الوصول

يتوفر الآن عبر Google AI Studio، بالإضافة إلى تطبيق Gemini للمشتركين في خطة Gemini Advanced التي تبلغ تكلفتها 20 دولارًا شهريًا.

جرب النموذج مجانًا.

ولم تعلن جوجل حتى الآن عن أسعار واجهة برمجة التطبيقات (API) الخاصة بـ Gemini 2.5 Pro، لكنها أشارت إلى أنها ستكشف عن تفاصيل الأسعار قريبًا.

Related Posts

Gen-4: Runway تطلق أحد أكثر أدوات توليد الفيديو بالذكاء الاصطناعي تطورًا
  • مارس 31, 2025

كشفت شركة Runway، المتخصصة في تقنيات الذكاء الاصطناعي، عن نموذجها الجديد Gen-4، الذي يُعتبر أحد أكثر مولدات الفيديو تطورًا حتى الآن….

<<
Nova Act: أمازون تتحدى OpenAI بوكيل الذكاء الاصطناعي يتحكم في متصفحك
  • مارس 31, 2025

أعلنت أمازون عن Nova Act، وهو نموذج ذكاء اصطناعي جديد ووكيل رقمي قادر على تنفيذ المهام تلقائيًا داخل متصفحات الويب. وتعتبره…

<<

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

آخر المقالات

Gen-4: Runway تطلق أحد أكثر أدوات توليد الفيديو بالذكاء الاصطناعي تطورًا

    Gen-4: Runway تطلق أحد أكثر أدوات توليد الفيديو بالذكاء الاصطناعي تطورًا

    Nova Act: أمازون تتحدى OpenAI بوكيل الذكاء الاصطناعي يتحكم في متصفحك

      Nova Act: أمازون تتحدى OpenAI بوكيل الذكاء الاصطناعي يتحكم في متصفحك

      أفضل نماذج الذكاء الاصطناعي 2025 | دليل شامل

        أفضل نماذج الذكاء الاصطناعي 2025 | دليل شامل