Gemini-Exp-1114: هل هو أفضل نماذج جوجل؟

نموذج الذكاء الاصطناعي الجديد Gemini-Exp-1114 في Google AI Studio

أعلنت جوجل عن إصدار نموذجها التجريبي الجديد من سلسلة نماذج "جيميني"، والذي يحمل الاسم Gemini Experimental 1114.

وهذا النموذج -الذي استمد اسمه من تاريخ إعلانه 14 نوفمبر -لا يُعتبر تحديثًا جديدًا فقط في هذه السلسلة، بل يمثل خطوة كبيرة نحو تحسين الأداء في العديد من المهام المعقدة.

تفوق Gemini-Exp-1114 على نماذج الذكاء الاصطناعي الشهيرة

من خلال اختباره في Chatbot Arena الذي يعتمد على تصويت المستخدمين بناء على تجربتهم بدون معرفة اسم النموذج الذي يصوتون له- ظهر تفوقه على العديد من النماذج الأخرى.

Massive News from Chatbot Arena🔥@GoogleDeepMind's latest Gemini (Exp 1114), tested with 6K+ community votes over the past week, now ranks joint #1 overall with an impressive 40+ score leap — matching 4o-latest in and surpassing o1-preview! It also claims #1 on Vision… https://t.co/AgfOk9WHNZ pic.twitter.com/HPmcWE6zzI
— lmarena.ai (formerly lmsys.org) (@lmarena_ai) November 14, 2024

وقد تم هذا الاختبار بمشاركة أكثر من 6000 مستخدم، ليتصدر الترتيب جنبًا إلى جنب مع نموذج GPT-4o من OpenAI.

ومقارنة بالنموذج السابق، شهد Exp-1114 زيادة في الأداء، حيث ارتفعت نقاطه من 1301 إلى 1344.

كما أنه أظهر أداءً قويًا في حل المشكلات الرياضية المعقدة وتقديم حلول دقيقة في الرؤية الحاسوبية، متفوقًا على النماذج السابقة مثل o1-preview من OpenAI.

وبالإضافة إلى ذلك، تصدر أيضًا فئة الرؤية الحاسوبية، بينما جاء في المرتبة الثالثة في فئات البرمجة والمهام الصعبة مع التحكم في الأسلوب، حيث تصدر o1-preview فئة البرمجة.

مقارنة الإصدار الأخير بنماذج جيميني السابقة

الجدير بالذكر أن Exp 114 يأتي مع نافذة سياق بحجم 32k، وهو حجم أصغر بكثير مقارنةً بالنماذج الأخرى من نفس السلسلة.

كما يفتقر إلى قدرات البحث المتقدم عبر الويب التي قد تكون متاحة في بعض الإصدارات الأخرى. والتي كانت جوجل قد أطلقتها مؤخرًا فيما يعرف باسم Grounding.

تعرف على كيفية البحث عبر الانترنت باستخدام Gemini.

ووفقًا للمراجعات الأولية، يبدو أن هذا النموذج يتفوق في المهام التي تتطلب مهارات التفكير المنطقي، إلا أنه قد يستغرق وقتًا أطول قليلاً لمعالجة بعض المشاكل مقارنة بنماذج جيميني السابقة، كما ستلاحظ أنه يأتي بأسلوب أكثر إيجازًا، حيث يقدم متوسط إخراج أقل بنسبة 5-20% منهم.

أما في اللغة العربية -والتي أهتم بها بشكل خاص في تقييمات الأدوات الجديدة- فعند تجربته بعض الوقت، لم ألاحظ تحسنًا ملحوظًا عن الإصدارات السابقة للسلسلة.

ويمكنك أنت أيضًا تكوين انطباعك الشخصي عن Exp 1114، فقد أصبح متاحًا للاختبار من خلال منصة Google AI Studio، حيث يمكنك استكشاف قدرات هذا النموذج الجديد.

ووفقًا لتقرير بعض الأشخاص في منتدى جوجل للذكاء الاصطناعي، فإن الحد اليومي لاستخدامه هو ٥٠ طلب يوميًا.

تعرف على الوصول لنماذج Gemini في AI Studio.