
أعلنت Google رسميًا عن إتاحة نموذجها Veo 2 لتوليد الفيديوهات بالذكاء الاصطناعي بشكل مجاني على منصة Google AI Studio.
كما أصبح النموذج متاحًا الآن للمستخدمين عبر واجهة Gemini API، وفقًا لتحديثات الشركة أمس.
ويمثل Veo 2 الجيل الأحدث من أدوات الشركة المتقدمة لإنشاء الفيديوهات بالاعتماد على النصوص والصور.
ويتميز هذا الإصدار في مجال تحويل الأوامر النصية أو المرئية إلى مقاطع فيديو قصيرة لا تتجاوز ثماني ثوانٍ، مع دقة في محاكاة الحركة والفيزياء، وتنوع بصري يواكب مختلف الأساليب السينمائية.
كيفية الوصول المجاني والمدفوع لأداة Google Veo-2
كما أشرنا أمس، يمكن الوصول إلى نموذج Veo-2 مع Gemini، عبر خدمة Gemini Advanced، التي تتوفر للمشتركين المدفوعين.
كذلك يمكنك استخدامه في تحويل صورك إلى مقطع متحرك، باستخدام أداة Whisk Animate التي تم إطلاقها أمس، لكنها تقتصر حاليًا على مشتركي Google One AI Premium.
لكن المميز هنا، والذي نجده طريقة تسويقية ممتازة, هو فكرة إتاحته للمستخدمين للاختبار بشكل مجاني عبر واجهة المطورين الشهيرة AI Studio، وذلك من خلال خيار "Video Gen" في القائمة اليسري داخل المنصة.
والحقيقة في قوة هذه الخطوة هي استهداف المطورين والراغبين في دمج نموذج جوجل في تطبيقاتهم.
ولتقديم مستوى خدمة أفضل، تتوافر مزايا لتجربة الأوامر وتعديل الإعدادات مثل مدة الفيديو ونسب الأبعاد، ومشاهدة النتائج مباشرة
وبعد هذه التجربة، إن أعجبتك، تستطيع الانتقال إلى المستوى المدفوع في Gemini API، بسعر 0.35 دولار أمريكي للثانية.
تعرف على تفاصيل دمج Veo-2 مع Gemini وWhisk.
مميزات وقدرات Veo-2
يسمح Veo-2 بإنشاء مقاطع فيديو بدقة 720p ومدة تصل إلى ثماني ثوانٍ باستخدام أوامر نصية فقط.
ويتم عرض هذه المقاطع بصيغة أفقية بنسبة 16:9، ويمكن للمستخدمين التحكم الكامل في تفاصيل المشهد من خلال التعليمات المكتوبة، مهما بلغت درجة تعقيدها.
ووفقًا لما نشرته Google، فإن Veo 2 يعتمد على فهم أعمق لحركة الأجسام وقوانين الفيزياء الواقعية، لإنتاج مشاهد طبيعية وحركة شخصيات أكثر سلاسة.
ويدعم النموذج طريقتين رئيسيتين لإنشاء الفيديوهات:
- تحويل النص إلى فيديو (t2v)، حيث تعتمد على الأوصاف النصية لتحويلها إلى مشاهد متحركة.
- تحويل الصور إلى فيديو (i2v)، والتي تبدأ من صورة ثابتة يتم تحريكها بأسلوب يتماشى مع النص المصاحب في حال وجوده.
نصائح جوجل لتوليد أفضل مقاطع الفيديو
أشارت Google إلى أهمية صياغة الأوامر بطريقة دقيقة ووافية من أجل الحصول على نتائج واقعية ومبهرة.
فكلما كان الوصف أوضح، كلما زادت جودة الفيديو الناتج.
في هذا الإطار، تنصح الشركة الممارسين بتحديد عناصر مثل الموضوع الرئيسي، الحدث الجاري، مكان المشهد، زاوية الكاميرا، الإضاءة، والأسلوب الجمالي المطلوب.

ومن الأمثلة التي عرضتها جوجل هو مشهد ترويجي لزجاجة عطر، حيث أظهرت النتائج المولدة تفاصيل دقيقة مثل انعكاسات الضوء على سطح الكريستال، حركة قطرة تتدحرج على الزجاج، وتوزيع العناصر في الخلفية لتشكيل مزاج أنيق وفاخر.
مقارنة Veo-2 مع Sora
إذا تطرقنا إلى المقارنة بين Veo 2 من Google ونموذج Sora التابع لـ OpenAI، سنجد في واقع الأمر أن كليهما يقدمان خصائص متقاربة من حيث الجودة والدقة الزمنية.
فعبر ChatGPT Plus، يستطيع Sora توليد مقاطع فيديو بدقة 720p ولمدة تصل إلى عشر ثوانٍ.
بينما تقدم Veo 2 عبر Gemini Advanced مقاطع بنفس الدقة ولكن لمدة ثماني ثوانٍ.
لكن يبقى الحكم الفاصل بين النموذجين مرهونًا بجودة النتائج الفعلية، وهو ما سيتضح بشكل أكبر من خلال تجارب المستخدمين والمراجعات المتخصصة لاحقًا.
الاستخدامات العملية
في السياق العملي، نوهت جوجل إلى بدء بعض الشركات مثل AlphaWave وTrakto بدمج Veo 2 في أدواتها الداخلية لإنتاج محتواها التسويقي.
وأشارت إلى أن شركة تسويق علامات الأزياء والتجزئة AlphaWave أصبحت تستخدمه لتحويل الصور الثابتة إلى فيديوهات ترويجية يمكن نشرها بسرعة واختبار فعاليتها ضمن حملات تسويق المنتجات.
أما شركة Trakto المختصة بالتسويق والتصميمات، فتوظف Veo 2 ضمن أداة Trakto Director لتحويل السيناريوهات النصية إلى إعلانات جاهزة بمستوى احترافي، بالاعتماد على الدمج بين النماذج النصية والبصرية.
اطلع على الخبر وطرق الوصول من مدونة الشركة.