كشفت Meta مؤخرًا عن إطلاق MovieGen، نموذج الذكاء الاصطناعي الجديد لتحويل النصوص إلى مقاطع فيديو قابلة للتخصيص بسهولة.
و جاء هذا الإعلان في إطار الفيديو الذي نشره مارك زوكربيرغ يوم الرابع من أكتوبر، حيث ظهر يستخدم آلة تمرين الأرجل في الصالة الرياضية التي تتحول بمرور الوقت إلى نسخ مبتكرة في بيئات مختلفة مثل نمط السايبربانك والنمط الروماني القديم، وكل ذلك تم باستخدام هذا النموذج الجديد.
و MovieGen ليس نموذجًا واحدًا، بل مجموعة من النماذج المميزة التي يمكنها إنشاء مقاطع فيديو وأصوات بمجرد كتابة بضع كلمات.
كما تجعل مقاطع الفيديو الخاصة بك أكثر متعة من خلال إضافة تأثيرات خاصة وأزياء وتغيير الخلفيات أو إضافة أصوات، كل ذلك عن طريق كتابة ما تريد.
وتبدو هذه التقنيات قوية من خلال الإعلانات التي شاهدناها من شركة ميتا عنها.
ما هي نماذج MovieGen من Meta AI
تشتمل MovieGen على أربع موديلات أساسية لتوليد الفيديو والصور والصوت.
١. توليد الفيديو بالذكاء الاصطناعي "MovieGen Video"
هذا النموذج يستخدم في تحويل النصوص إلى فيديو، ولكن يبدو أنه ليس كباقي الأدوات المنافسة.
و عندما تريد معرفة قوة مثل هذه البرامج والمقارنة بينها، عليك التركيز أولًا على ثلاث عناصر رئيسية.
وهي "الجودة والدقة، مدة المقطع التي يمكن للأداة توليدها، وعدد الإطارات خلال الثانية الواحدة".
و بالنظر إلى تطبيق شركة Meta فإنه ينتج مقطعًا يصل إلى 16 ثانية مع معدل 16 إطارًا في الثانية الواحدة ودقة 1080p.
نعم، هناك بعض الأدوات التي ظهرت مؤخرًا تقدم أداءً مقاربًا، مثل MiniMax Video-01، والذي يشير مطوروه أنه يصل إلى جودة مقارنة مع عدد 24 إطارًا في الثانية.
اكتشف طريقة توليد الفيديو بالذكاء الاصطناعي مجانًا باستخدام MiniMax Video-01.
ولكن حسبما أشارت ميتا في ورقتها البحثية، أن MovieGen تتفوق على المنافسين الرائدين في هذا المجال بما في ذلك Runway Gen 3 وLuma Dream Machine وOpenAI Sora وKling 1.5 في العديد من تقييمات الجمهور لعناصر مختلفة مثل الاتساق وطبيعية الحركة.
أحد الأسباب الرئيسية لقوة MovieGen Video هو احتواؤه على 30 مليار معلمة، والتي تساعده على فهم وإنشاء مقاطع الفيديو.
لكن و برغم هذه المزايا، إلا أن النموذج الحالى لا يمتلك إمكانية توليد الصوت أثناء إنشاء المقطع الذي يقوم بتوليده.
و ربما كان للشركة رأي ما في ذلك. فرغم أن تقنيات توليد الأصوات حاليًا أصبحت منتشرة بكثافة وليست بالشيء الصعب، إلا أن الصعب -وأعتقد أن هذا ما دفعهم لتأجيل الأمر- هو إنشاء صوت يستطيع مزامنة الشفاه وحركات الوجه في الوقت الفعلي مع هذا العدد من الإطارات الضخم في الثانية.
وقد يكون تركيب الأصوات سهلًا حاليًا على المقاطع الموجودة بالفعل، ولكنه تحدٍّ في أن تقوم أداة بتصميم مقطع فيديو مدعوم بصوت متزامن بشكل ممتاز، خاصةً مع الحركات السريعة كالموجودة في إصدار ميتا.
فهل ترى أنهم لم يقدموا هذه الميزة حاليًا حتى الوصول إلى مستوى الإبهار الكامل؟
لكن على أية حال هم لم ينسوا تلك التقنية تمامًا، فإليك النموذج الخاص بها في النقطة التالية.
٢. إنشاء الصوت مع MovieGen Audio
وهو نموذج يحتوي على 13 مليار معلمة لإنشاء الأصوات بدقة وجودة عالية، ولمدة تصل إلى 45 ثانية.
و يعمل عن طريق التقاط مقطعك الذي ترفعه ويقوم بتحليله للتمكن من عمل تطابق الصوت مع الفيديو بشكل طبيعي.
كما يستطيع توليد مؤثرات صوتية وموسيقى خلفية تتناسب مع هذا المحتوى المرئي.
٣. عمل تخصيصات داخل المقاطع Personalized MovieGen Video.
الأمر بغاية البساطة والروعة في هذه الميزة. ارفع صورتك للأداة واكتب مطالبة نصية بما تريده، وستقوم بتوليد فيديو بالذكاء الاصطناعي لك.
مثلا: اكتب للنموذج بعد رفع صورتك: "رجل يجرى وراء أسد"، ودع الأداة تقوم بالأمر.
نعم، هناك الكثير حاليًا من التطبيقات المشابهة. ولكن منافسة ميتا في هذا المجال تجعل السباق يشتعل لكي تقدم كل شركة أفضل ما لديها، والمستخدم هو الفائز.
٤. تحرير الفيديوهات بالذكاء الاصطناعي MovieGen Edit
وهي أداة لتحرير الفيديو والصور بمرونة لتعديل العناصر التي تحددها دون إعادة إنشاء الفيديو بالكامل.
و يمكن لهذا النموذج
- تغيير العناصر، مثل الألوان
- إزالة أي شيء غير مرغوب بالمحتوى، أو إضافة الأشياء.
- بالإضافة إلى التغييرات الشاملة، مثل تبديل الخلفية.
وكل ذلك بناءً على تعليمات نصية بسيطة.
وفي الختام، فقد أشارت Meta AI أن السلامة أولوية قصوى في كل ما يتعلق بالذكاء الاصطناعي التوليدي، وخصوصًا مع احتمالية إساءة استخدام هذه الأدوات في إنتاج محتوى مضلل أو غير أخلاقي.
ولهذا السبب، حرصت الشركة على عدم إصدار MovieGen للجمهور العام حاليًا، وأبقت عليه كنموذج بحثي فقط.
ومن المتوقع أن يتم دمج MovieGen في منصة Instagram بحلول عام 2025، مما سيجعل هذه التكنولوجيا في متناول الجميع بشكل أوسع.
كما تعتزم ميتا التعاون مع صناع المحتوى لتحسين الميزات وضمان تلبيتها لاحتياجات المستخدمين.