
أعلنت جوجل عن تحديثات وإصدارات جديدة ضمن عائلة Gemini 2.0، وهي الجيل الثاني من نماذج الذكاء الاصطناعي.
ولكي نتعرف على ما هي تلك التحديثات، يجب أولًا إلقاء نظرة على الأحداث التي جرت خلال الشهرين الماضيين.
نماذج Gemini 2.0 الموجودة قبل التحديثات
بدأت Google منذ ديسمبر الماضي فيما دعته بـ "عصر الوكلاء" من خلال إطلاق الجيل الثاني من نماذج جيميني.
حيث أطلقت نسخة تجريبية من Gemini Flash 2.0، وهو نموذج سريع مع كفاءة محسنة لتناسب المطورين.
وفي الأسبوع الماضي، أصبحت النسخة الرئيسية من هذا الإصدار متاحة في تطبيق Gemini، وموقع المنصة عبر الويب.
وأشارت جوجل عبر مدونتها أنها تعمل بدءًا من اليوم على توفير هذه النسخة الرئيسية عبر منصتي AI Studio، و Vertex AI. حيث يمكن للمطورين استخدامه في بناء تطبيقاتهم.
بالإضافة إلى ذلك، أصدرت الشركة في ديسمبر نسخة "التفكير المتقدم" من هذا الجيل ("Thinking")، والتي قامت بتحديثها في يناير تحت اسم Flash Thinking Experimental 01-21.
وشمل هذا التحديث الجمع بين السرعة والقدرة على التفكير بشكل أفضل في المسائل المعقدة.
ومع إطلاق النموذج التجريبي 2.0 Flash Thinking، دخلت جوجل في عصر جديد من النماذج الذكية التي تستطيع "التفكير" في المشكلات المعقدة قبل تقديم الحلول.
حيث يعتمد هذا النموذج على تقسيم المشكلات إلى خطوات أصغر، مما يمكنه من تقديم إجابات دقيقة وأكثر موثوقية، رغم أن ذلك قد يتطلب وقتًا أطول لإتمامه مقارنة بالنماذج الأخرى.
وهذا النوع يماثل نماذج التفكير الأشهر حاليًا مثل DeepSeek R1 مفتوح المصدر و OpenAI o1.
التحديثات الجديدة في عائلة Gemini 2.0

ربط Flash Thinking مع YouTube والخرائط والبحث!
أعلن الرئيس التنفيذي لجوجل -سوندار بيتشاي- عبر منصة X عن تحديث جديد لتطبيق Gemini، من خلال دمج نموذج التفكير Gemini 2.0 Flash Thinking.
وشرح بيتشاي أن هذا النموذج سيعمل بتكامل وثيق مع خدمات جوجل الأساسية مثل خرائط Google وYouTube وGoogle Search.

وفي رأيي تعتبر هذه ميزة تنافسية قوية لصالح جوجل.
وسيكون من الصعب على الشركات الأخرى التي تفتقر إلى تلك المنظومة المتكاملة من البيانات والخدمات مجاراتها بنفس القوة في تقديم مثل هذه التجارب، وأعني هنا DeepSeek وOpenAI.
2.0 Flash
أصبح الآن برنامج Flash 2.0 متاحًا بشكل عام لعدد أكبر من الأشخاص عبر منتجات الذكاء الاصطناعي الخاصة بالشركة.
وذلك إلى جانب تحسن في الأداء في المعايير الرئيسية، مع إمكانية إنشاء الصور.
كما سيتم إضافة ميزة تحويل النص إلى كلام قريبًا في هذا النموذج.
Gemini 2.0 Pro: أقوى نموذج للبرمجة والتعامل مع المهام المعقدة
يعتبر Gemini 2.0 Pro من أبرز الإصدارات التي أعلنت عنها جوجل، حيث يركز على تحسين أداء البرمجة وزيادة كفاءة وقدرات التعامل مع التعليمات المعقدة.
وأشارت جوجل أنه يتميز بقدرته على تحليل وفهم المعرفة العالمية بشكل أفضل من أي نموذج آخر سبق وأن أصدرته الشركة.
كما يتمتع Gemini 2.0 Pro بقدرته على استقبال 2 مليون توكن، ما يسمح له بمعالجة نصوص ضخمة قد تصل إلى نحو مليون ونصف كلمة في المرة الواحدة.

الجدير بالذكر أنه ما زال في نطاق النسخة التجريبية باسم Gemini 2.0 Pro Experimental 02-05، ويمكن تجربته على AI Studio، و Vertex AI.
معلومات إضافية عن الإصدار
- معلوماته تتوقف عند أغسطس 2024
- الاستخدام المجاني في AI Studio حتى 50 رسالة يوميًا.
تعرف على كيفية استخدام نماذج جيميني مجانًا عبر AI Studio.
2.0 Flash-Lite: الأكثر فعالية من حيث التكلفة حتى الآن
تمكّن فريق جوجل من تحسين الأداء بشكل كبير مع تقديم النموذج 2.0 Flash-Lite، الذي اعتبرته الخيار الأكثر اقتصادية حتى الآن.
وأوضح الفريق أنه بناءً على ردود الفعل الإيجابية التي تلقاها النموذج السابق 1.5 Flash بخصوص سرعته وكفاءته من حيث التكلفة، قرر تطوير هذا الإصدار لتحقيق نفس السرعة والتكلفة، لكن بجودة أعلى.
وتمامًا مثل 2.0 Flash، يستطيع Flash-Lite معالجة كميات كبيرة من البيانات تصل إلى مليون كلمة توكن في المرة الواحدة، أي ما يعادل 750 ألف كلمة.
بالإضافة إلى ذلك، يدعم هذا الإصدار استقبال أنواع مختلفة من المدخلات، مثل النصوص والصور.
فعلى سبيل المثال، يمكنه توليد وصف مناسب لصورة واحدة من بين 40,000 صورة فريدة، بتكلفة تقل عن دولار واحد عند الدفع داخل Google AI Studio.
ويعتبر هذا النموذج الجديد حاليًا في النطاق التجريبي تحت اسم Gemini 2.0 Flash-Lite Preview 02-05.
معلومات إضافية عن الإصدار
- معلوماته تتوقف عند أغسطس 2024
- الاستخدام المجاني في AI Studio حتى 1500 رسالة يوميًا.
وفي الختام، تشير جوجل إلى أنها تواصل تعزيز جهودها لضمان استخدام آمن وموثوق لعائلة نماذج Gemini، مع التركيز على تطوير تدابير قوية لحماية المستخدمين.
وأضافت أنه تم تصميم نماذج Gemini 2.0 باستخدام تقنيات جديدة للتعلم المعزز، حيث يُستخدم النموذج نفسه لتقييم ردوده وتصحيحها.
وهذا التطور أدى إلى تحسين دقة التعليقات المستلمة وزيادة قدرة النموذج على التعامل مع الأسئلة الحساسة بكفاءة أكبر.
إضافة إلى ذلك، تستخدم الشركة تقنيات الاختبار التلقائي (Red Teaming) لتقييم المخاطر المتعلقة بالأمان، بما في ذلك مخاطر الهجمات الإلكترونية التي قد تعتمد على إخفاء تعليمات ضارة ضمن البيانات التي يسترجعها النظام.