
كشفت جوجل مؤخرًا عن بدء توافر أحدث نماذجها لتوليد الصور من النصوص، "Imagen 4، للمطورين كمعاينة مدفوعة عبر واجهة برمجة تطبيقات "جيميناي" (Gemini API)، مع إتاحة فرصة للاختبار المجاني المحدود ضمن "Google AI Studio" اعتبارًا من 24 يونيو 2025.
وتمثل هذه الخطوة إضافة جديدة لمجموعة أدوات جوجل الإبداعية في مجال الذكاء الاصطناعي.
نظرة على "Imagen 4" و"Imagen 4 Ultra": القدرات والتسعير
يقدم "Imagen 4" قدرة على إنشاء ما يصل إلى أربع صور بدقة 1024 × 1024 بكسل لكل طلب، ويستقبل أوامر نصية تصل إلى 480 وحدة رمزية (tokens).
في هذا السياق، تبلغ تكلفة إنشاء الصورة الواحدة حوالي 0.04 دولار أمريكي. إلى جانب النسخة الأساسية، أعلنت جوجل عن إصدار أكثر دقة هو "Imagen 4 Ultra، والذي يصل سعره إلى حوالي 0.06 دولار أمريكي للصورة، ويقدم تجاوبًا أدق مع الأوامر النصية المعقدة.
ووفقًا لجوجل، كلا النموذجين يشتمل على علامات مائية رقمية غير مرئية بتقنية "SynthID" لتعزيز الشفافية، ويوفر سرعة إنشاء شبه فورية.
ويتميز "Imagen 4 Ultra" بقدرات إضافية، منها محاذاة أكثر إحكامًا مع الأوامر النصية للمستخدم وإمكانية تصدير الصور بدقة 2K عبر منصة "Vertex AI".
كيفية الوصول وحدود الاستخدام
بالنسبة للمطورين، سيكون الوصول إلى هذه النماذج عبر نفس نقطة النهاية /generate
المستخدمة لنماذج "Gemini".
وقد أشارت جوجل إلى إمكانية طلب حدود استخدام أعلى خلال فترة المعاينة، علمًا أن الحد الافتراضي يبلغ 20 طلبًا في الدقيقة لكل مشروع.
ويمكنك تجربة النماذج مجانًا عبر الرابط التالي
https://aistudio.google.com/app/prompts/new_image

تجارب أولية: "Imagen 4" و"Ultra" قيد الاختبار
وقد بدأ بعض المستخدمين الأوائل بمشاركة تجاربهم ومقارناتهم على منصات التواصل الاجتماعي، حيث أشاروا إلى تحسن في وضوح النصوص المولدة داخل الصور وتقليل التشوهات البصرية مقارنة بالإصدار السابق "Imagen 3".
وتوضح التجارب العملية قدرات النماذج الجديدة؛ فعلى سبيل المثال، عندما استخدمنا أحد المطالبات النصية، استطاع نموذج "Imagen 4" إنشاء صورة تعكس هذا المشهد الليلي الممطر بواقعية، مظهرًا اللافتة النيون وانعكاسها.

وفي تجربة أخرى تستهدف قدرات "Imagen 4 Ultra" على توليد نصوص أكثر تعقيدًا ضمن سياقات فنية، استخدمنا الأمر التالي:

أظهر "Imagen 4 Ultra" قدرة على تجسيد هذا المشهد المليء بالألوان والتفاصيل، مع إبراز العبارة المطلوبة بوضوح وسط رسومات الجرافيتي المتعددة.
تأتي هذه الإطلاقات في إطار سعي جوجل لتعزيز مجموعتها من الأدوات الإبداعية القائمة على الذكاء الاصطناعي، والتي تضم أيضًا نماذج "Veo" وعائلة نماذج "Gemini".
وتهدف الشركة من خلال توفير مستويات استخدام مجانية سخية ونظام تسعير مرن قائم على الاستخدام عبر "Google Cloud" إلى استقطاب المطورين والمؤسسات على حد سواء.
رغم ذلك، يرى بعض المتابعين أن الصور الناتجة، مع جودتها العالية ودقتها في اتباع الأوامر، قد تفتقر أحيانًا إلى اللمسة الفنية المميزة أو تبدو كأنها من صنع الآلة بشكل واضح.
ويبقى أن نرى كيف سيستقبل المجتمع الإبداعي والتقني هذه الأدوات الجديدة، وما إذا كانت ستحدث بالفعل نقلة نوعية في مجال توليد الصور بالذكاء الاصطناعي، خصوصًا مع توجه جوجل لإتاحتها بشكل عام خلال الأسابيع القادمة.