FLUX.1 Kontext: بديل فوتوشوب لتعديل الصور بالذكاء الاصطناعي بسرعات فائقة

في خطوة ينتظر أن تعيد تشكيل مفاهيم التعامل مع الصور الرقمية، أعلنت مختبرات «بلاك فورست» (Black Forest Labs) عن إطلاق مجموعتها الجديدة من نماذج توليد الصور FLUX.1 Kontext.

تقدم هذه التقنية الجديدة قدرات فريدة في إنشاء الصور وتعديلها ضمن السياق، فاتحة الباب أمام المستخدمين لتوليد الصور وتنقيحها وتحسينها بشكل متكرر بالاعتماد على مدخلات نصية ومرئية معًا، دون الحاجة إلى عمليات ضبط دقيقة معقدة أو مسارات تحرير مطولة.

ووفقًا لروبن رومباخ، الرئيس التنفيذي والمشارك في تأسيس «Black Forest Labs»، فإن «FLUX.1 Kontext يمثل تحولًا جوهريًا عن أساليب التحرير التقليدية من خلال توحيد عمليتي توليد الصور وتحريرها في بنية تدفق متطابقة واحدة.»

وأردف رومباخ أن هذا النهج، المعتمد على تدريب بسيط لمطابقة التدفق، قد أثمر عن «تناسق استثنائي للشخصيات عبر تعديلات متعددة المراحل، مع الحفاظ على سرعات استدلال تفاعلية تتراوح بين 3 إلى 5 ثوانٍ بدقة 1 ميغابكسل.»

لقطة شاشة من صفحة الإعلان الرسمي لمختبرات بلاك فورست، تُظهر شبكة من أربع صور توضح قدرات نماذج FLUX.1 Kontext لتوليد الصور بالذكاء الاصطناعي، مع التركيز على تناسق الشخصيات والتعديل السياقي عبر مشاهد وبيئات متنوعة. — الإعلان الرسمي لمختبرات بلاك فورست

تم تصميم حزمة FLUX.1 Kontext لتلبية احتياجات المبدعين والمطورين والشركات الباحثة عن الدقة والتحكم الإبداعي الكامل.

فبمقدور النموذج فهم واستخلاص المفاهيم المرئية من الصور، والحفاظ على الاتساق الأسلوبي والشخصي عبر مشاهد متعددة، وتطبيق تعديلات موضعية بدقة فائقة.

يمهد هذا الأمر الطريق لسرد قصص مرئية سلس، وتوليد أفكار سريع، وإنشاء محتوى مستهدف للغاية، كل ذلك بسرعات استدلال قد تفوق البدائل الرائدة بما يصل إلى ثماني مرات.

وداعًا للفوتوشوب: تحرير الصور بالأوامر المباشرة

لطالما شكلت عملية إجراء تعديلات بسيطة على الصور تحديًا غير مبرر. فالحاجة لتعلم أدوات معقدة مثل فوتوشوب، وقضاء وقت طويل في فهم وظيفة كل أداة، جعلت من أبسط التغييرات مهمة تستغرق ساعات.

ورغم الوعود التي قدمتها الموجة الأخيرة من أدوات الذكاء الاصطناعي، إلا أن معظمها أوجد مشكلات جديدة، حيث ظل المستخدم مضطرًا لوصف كل ما يرغب به بالتفصيل، وفي كثير من الأحيان، كانت هذه الأدوات تغير جوانب لم يطلب المستخدم المساس بها.

يأتي FLUX.1 Kontext ليغير هذه المعادلة بالكامل. فبدلاً من وصف الصورة النهائية المراد إنشاؤها، يكتفي المستخدم بإخبار النموذج بما يرغب في تغييره.

هل تحتاج إلى تغيير لون سيارة إلى الأحمر؟ ببساطة قل «غير لون السيارة إلى الأحمر». هل ترغب في تحديث نص على لافتة؟ أخبره «غير عبارة ‘للبيع’ إلى ‘تم البيع'»، وسيتولى النموذج الباقي مع الحفاظ على كل شيء آخر كما هو تمامًا.

وبذلك، تتجاوز نماذج FLUX.1 Kontext مفهوم تحويل النص إلى صورة التقليدي.

فعلى عكس النماذج السابقة التي تسمح فقط بالتوليد المعتمد على النص، تستطيع نماذج FLUX.1 Kontext أيضًا فهم الصور الموجودة والإنشاء منها.

ويمكنك تعديل صورة مُدخلة عبر تعليمات نصية بسيطة، الأمر الذي يسمح بتحرير مرن وفوري للصور دون الحاجة لضبط دقيق أو مسارات عمل معقدة.

القدرات الأساسية لنموذج FLUX.1 Kontext

١. تناسق الشخصيات: الحفاظ على العناصر الفريدة للصورة، مثل شخصية مرجعية أو كائن في صورة ما، عبر مشاهد وبيئات متعددة.

٢. التحرير الموضعي: إجراء تعديلات مستهدفة على عناصر محددة في الصورة دون التأثير على بقيتها.

٣. المرجعية الأسلوبية: إنشاء مشاهد جديدة مع الحفاظ على الأساليب الفريدة من صورة مرجعية، بتوجيه من الأوامر النصية.

٤. السرعة التفاعلية: زمن انتقال ضئيل للغاية لكل من توليد الصور وتحريرها، الأمر الذي يسمح بعمليات إبداعية تكرارية كانت مستحيلة في السابق بسبب الانحراف البصري وقيود زمن الانتقال.

٥. التكرار والتحسين التدريجي: يمنح Flux.1 Kontext القدرة على إضافة المزيد من التعليمات بشكل متكرر والبناء على التعديلات السابقة. يعمل ذلك على تحسين النتائج خطوة بخطوة بزمن انتقال ضئيل، مع الحفاظ على جودة الصورة وتناسق الشخصيات.

مجموعة متكاملة لتلبية مختلف الاحتياجات

تقدم حزمة FLUX.1 Kontext نموذجين متميزين: Kontext [Pro] و Kontext [Max].

صُمم Kontext [Pro] لسير عمل التحرير التكراري، حيث يقوم بتوليد الصور من نصوص أو صور مرجعية ويدعم التعديلات المحلية وتحويلات المشاهد والتحسينات متعددة الخطوات مع الحفاظ على تناسق الشخصيات والأسلوب.

في المقابل، يقدم Kontext [Max] أداءً أقصى، جامعًا بين الالتزام الفائق بالأوامر النصية، والتعامل المتقدم مع النصوص المكتوبة (Typography)، وجودة عرض ممتازة دون أي مساومة على السرعة.

معًا، تقدم هذه النماذج مخرجات واقعية بأقل زمن انتقال وتدعم نطاقًا واسعًا من التطبيقات بدءًا من توليد الأفكار السريع وصولاً إلى الإنتاج الإبداعي عالي الجودة.

منصة «Playground» لتقييم الشركات

كجزء من الإطلاق، تقدم «Black Forest Labs» منصة «Playground»، وهي بيئة عرض تجريبية قائمة على المتصفح مصممة لمستخدمي الأعمال لاستكشاف الإمكانات الكاملة لمجموعة نماذج FLUX.1.

واجهة المستخدم في منصة Flux Playground، مع خيار تحرير الصور بالذكاء الاصطناعي من خلال الأوامر النصية، وخيار رفع الصورة المراد تعديلها. — واجهة المستخدم في منصة Flux Playground

وتتيح هذه المنصة -المصممة خصيصًا لتقييم الشركات- للفرق التحقق من حالات الاستخدام الداخلية، وعرض الوظائف لأصحاب المصلحة، وتجربة توليد الصور المتقدم في الوقت الفعلي.

تجربة عملية: قوة «FLUX.1 Kontext»

قمنا بتجربة عملية لاختبار قدرات FLUX.1 Kontext.

وكما تظهر الصور المرفقة، بدأنا بصورة لسيارة رياضية فضية اللون تقف تحت جسر في مشهد ليلي (الصورة الأولى).

بعد ذلك، وجهنا للنظام أمرًا نصيًا (برومبت) يتضمن: «غير لون السيارة إلى الأحمر وحول المشهد إلى وضح النهار».

والنتيجة، كما نشاهدها في الصورة الثانية، هي تحول السيارة بدقة إلى اللون الأحمر وانتقال المشهد بالكامل إلى أجواء نهارية مشرقة، مع الحفاظ التام على تفاصيل السيارة الأصلية وموقعها.

توضح هذه التجربة كيف يمكن للأوامر البسيطة أن تحدث تعديلات معقدة ودقيقة بكفاءة عالية.

لقطة شاشة من واجهة FLUX Playground، تُظهر سيارة رياضية فضية (الصورة الأصلية) تتحول إلى حمراء في مشهد نهاري (النتيجة)، بناءً على أمر نصي. — تجربة عملية داخل منصة Flux Playground

اختبر قدرات النموذج في منصة Playground، من هنا.

FLUX.1 Kontext [dev]: نسخة مفتوحة الاوزان

تشير «Black Forest Labs» إلى إيمانها العميق بأن البحث المفتوح ومشاركة الأوزان (open-weights) أمران أساسيان للابتكار التكنولوجي الآمن.

ولذلك، طورت الشركة نسخة مفتوحة الوزن، FLUX.1 Kontext [dev]، وهو محول انتشار خفيف الوزن مناسب للتخصيص ومتوافق مع كود الاستدلال السابق لـ FLUX.1 [dev].

وسيكون هذا النموذج متاحًا في البداية كإصدار تجريبي خاص للاستخدام البحثي واختبارات السلامة، على أن يتم توزيعه لاحقًا عبر شركاء مثل FAL وReplicate وRunware وDataCrunch وTogetherAI وHuggingFace.

يأتي إطلاق Kontext بعد النجاح الذي حققه FLUX.1 Dev، أحد أكثر نماذج Hugging Face شيوعًا بأكثر من 30 مليون عملية تنزيل.

وحتى الآن، ولدت عائلة نماذج FLUX.1 ما مجموعه 700 مليون صورة عبر واجهة برمجة التطبيقات (API).