دليل مواقع وأدوات و تطبيقات الذكاء الاصطناعي

جوجل تطلق Imagen 4: جودة صور فائقة وقدرة متقدمة على كتابة النصوص

أعلنت جوجل عن الجيل الجديد من نموذجها الخاص بتوليد الصور باستخدام الذكاء الاصطناعي تحت اسم Imagen 4، والذي تم عرضه للمرة الأولى خلال مؤتمر Google I/O 2025.

يقدم النموذج الجديد تحسينات كبيرة في جودة الصور ودقة التفاصيل، ويُظهر تطورًا واضحًا في قدرته على إدخال نصوص واضحة داخل الصور، وهي نقطة لطالما شكلت تحديًا لمعظم النماذج السابقة.

تفاصيل دقيقة وقدرات بصرية متقدمة

بحسب إلي كولينز، نائب رئيس المنتجات في Google DeepMind، يتميز Imagen 4 بقدرته على إنتاج صور ذات تفاصيل دقيقة تشمل الأنسجة المعقدة وقطرات الماء وحتى شعر الحيوانات. ويعمل بكفاءة في الأنماط الواقعية والتجريدية على حد سواء.

صورة عالية الجودة تم توليدها باستخدام نموذج Imagen 4، تظهر كلب يخرج رأسه من سيارة، تعكس دقة عالية في إبراز التفاصيل.
الحقوق: Google

وتضمنت العينات التي كشفت عنها جوجل صورًا ليلية لحيتان تقفز من المحيط، وأخرى لحرباء، وأكياس دقيق، وكلها أظهرت درجة عالية من الوضوح والانسجام البصري.

وعكست النتائج مدى التقدم الذي وصل إليه النموذج في التعامل مع العناصر المعقدة بصريًا.

تطور ملحوظ في كتابة النصوص داخل الصور

من ناحية أخرى، أشارت جوجل إلى أن Imagen 4 أصبح أفضل بشكل واضح في التعامل مع النصوص، وهو ما يسهل استخدامه في تصميم بطاقات المعايدة، والملصقات، والقصص المصورة. هذه النقطة كانت موضع نقاش واسع بين المتخصصين، خاصة وأن منافسين مثل OpenAI سبق وأن تحدثوا عن تحسينات مماثلة، لكن نماذجهم ما زالت تعاني أحيانًا من أخطاء إملائية.

كوميك قطة "Cat Comic"، يشمل عدة صور تبرز قدرة Imagen 4 على كتابة النصوص بكفاءة ودقة عالية.
الخقوق: جوجل

وشملت النماذج التي عرضتها جوجل خطوطًا واضحة قابلة للقراءة داخل ملصقات مصغّرة، وحتى ضمن تصميم طابع بريدي تجريبي، مما يعكس مستوى دقة غير معتادة في هذا الجانب.

توفر موسع وسرعة مضاعفة

يتوفر Imagen 4 بدءًا من 20 مايو ضمن تطبيق Gemini، وعلى منصات Whisk وVertex AI، كما أصبح مدمجًا في أدوات Google Workspace مثل Slides وDocs وVids.

ووفقًا لما صرح به مسؤولو جوجل، فإن إصدارًا أسرع من النموذج سيتم طرحه لاحقًا، بقدرة تصل إلى عشر مرات أسرع من الجيل السابق Imagen 3.

منافسة متصاعدة في مجال توليد الصور

رغم وجود نماذج متقدمة أخرى في السوق مثل Midjourney بنسخته السابعة، أو أدوات توليد الصور في ChatGPT، إلا أن Imagen 4 يبرز من حيث توازنه بين السرعة والجودة، إضافة إلى دعمه المتكامل داخل منتجات جوجل.

وفي تصريحات إضافية، قال جوش وودوارد، من فريق Google Labs، إن العمل على تحسين النصوص داخل الصور كان محورًا رئيسيًا في تطوير النسخة الجديدة، مؤكدًا أن الاستخدامات تتراوح بين إنشاء الشرائح التقديمية والدعوات وحتى تصميم المواد البصرية المعقدة.

Khaled B.

خبير في الذكاء الاصطناعي يتمتع بخبرة واسعة في تطوير وتنفيذ حلول متقدمة باستخدام أحدث تقنياته. مُتخصص في توظيف هذه الإمكانيات لتحسين الأعمال وتحقيق الأرباح من خلال الابتكار التكنولوجي. لديه شغف لإيجاد استراتيجيات وحلول مبتكرة تساعد الشركات والأفراد على تحقيق أهدافهم من خلال تسخير هذه التكنولوجيا.

اقرأ أيضًا

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *