دليل مواقع وأدوات و تطبيقات الذكاء الاصطناعي

SeeDream 3.0: مولد الصور السحري من بايت دانس- تجربة وتقييم واستخدام مجاني

كشفت شركة ByteDance، وهي الشركة المعروفة جداً بفضل تطبيق TikTok، الشهر الماضي عن نموذج جديد لإنشاء الصور باستخدام الذكاء الاصطناعي.

يحمل هذا النموذج اسم Seedream 3.0، وهو متخصص في توليد الصور من مجرد كتابة نص، ليطرح نفسه كمنافس مباشر لنماذج قوية في الساحة مثل GPT-4o من OpenAI وImagen 3 من جوجل.

ويتميز SeeDream 3.0 بقدرته على تصميم صور عالية الدقة تصل إلى 2K، إلى جانب ميزة بالغة الأهمية: كتابة النصوص بدقة داخل الصور، وهو تحدٍ لطالما واجه العديد من النماذج السابقة.

للاطلاع عن كثب على قدرات هذا النموذج، قمنا بتجربته بشكل عملي على موقع Dreamina التابع لـ CapCut، والذي يتيح تجربة SeeDream 3.0 مجاناً في الوقت الراهن.

فكيف كان أداء مولد الصور في اختباراتنا؟ وهل يفي بوعوده؟

ما هو Seedream 3.0؟

ببساطة، Seedream 3.0 هو برنامج ذكاء اصطناعي يستطيع تحويل الكلمات التي تكتبها إلى صور.

وهو نسخة أحدث وأفضل من نموذج سابق للشركة اسمه Seedream 2.0. والشيء المميز أنه يفهم ويتعامل مع النصوص باللغتين الصينية والإنجليزية.

يستند بناء هذا النموذج الجديد على بيانات تدريب أكثر بكثير مقارنة بالإصدار السابق، فقد زادت قاعدة البيانات المستخدمة بحوالي 100%.

كما اعتمد المطورون على طرق تدريب متقدمة لزيادة كفاءته وقدرته على فهم طلبات المستخدم المختلفة وترجمتها إلى صور دقيقة.

القدرات الرئيسية ل Seedream 3.0

يتمتع مولد الصور الجديد بعدة قدرات مهمة تجعله منافساً قوياً:

١. صور واضحة جداً، حيث يستطيع إنتاج صور بدقة عالية جداً تصل إلى 2K.

هذه الدقة الكبيرة تضمن أن تكون الأعمال الفنية الناتجة تكون واضحة المعالم، مليئة بالتفاصيل الدقيقة، وتحمل جودة بصرية ممتازة تناسب الاستخدامات الاحترافية.

٢. سرعة في العمل: بحسب ما أعلن المطورون، ينجز النموذج مهامه بسرعة أكبر بكثير مقارنة بالإصدارات السابقة.

هذا يعني أن المستخدمين يحصلون على الصور التي يطلبونها في وقت أقصر، مما يزيد من فاعلية عملية التوليد.

٣. براعة في كتابة النصوص: يظهر النموذج قدرة لافتة في تضمين النصوص داخل الصور، خاصة النصوص المعقدة باللغة الصينية.

ويشير البعض إلى أنه يتفوق في هذا الجانب على نماذج أخرى، والتي قد تواجه بعض الصعوبات أو تنتج نصوصاً مشوشة عند محاولة دمج الكتابة في الصور.

٤. جودة بصرية عامة: تذكر ByteDance أن الصور التي يولدها Seedream تتميز بألوانها الجيدة، ووضوحها العالي، وشكلها الجمالي العام، مقارنة ببعض النماذج الأخرى التي قد تنتج صوراً بألوان باهتة أو بها بعض التشويش.

مقارنة مع المنافسين

أفادت ByteDance بأن Seedream 3.0 ينافس بقوة كبرى النماذج في السوق.

وأشارت تقييمات أولية صدرت عن منصات مستقلة متخصصة في تحليل نماذج الذكاء الاصطناعي، مثل "Artificial Analysis Image Arena Leaderboard"، إلى أن أداء النموذج الجديد يقترب كثيراً من أداء GPT-4o في جودة إنشاء الصور العامة.

قائمة Artificial Analysis Image Arena Leaderboard، حيث يظهر SeaDream 3.0 في المركز الثاني بفارق ضئيل عن GPT-4o صاحب المركز الأول.

كما أنه يظهر تفوقاً واضحاً على نموذج Imagen 3 في جوانب معينة.

التجربة العملية على Dreamina.com: خطوة بخطوة

للتعرف عن قرب على قدرات SeeDream 3.0، قمنا بتجربته مباشرة على موقع Dreamina.com.

يمتلك الموقع -التابع لـ CapCut- واجهة سهلة الاستخدام لتصميم الصور بالذكاء الاصطناعي.

١. الوصول إلى المولد: تبدأ التجربة بالانتقال إلى قسم "Image Generator" على الموقع.

صورة واجهة موقع Dreamina تُظهر أقسام توليد المحتوى المختلفة. يظهر سهم ودائرة حمراء حول زر "Generate" تحت عنوان "Image generator" في الزاوية العلوية اليسرى، للإشارة إلى خطوة البدء في توليد الصور باستخدام النموذج.

٢. اختيار النموذج: من قائمة النماذج المتاحة، نختار "SeeDream 3" (أو قد يظهر باسم "Bay Sdream 3") مع تحديد الجودة المطلوبة.

وهنا اخترنا "High 2K" لاختبار قدرات النموذج القصوى.

يتوفر أيضاً خيار "Standard (1K)" لمن يحتاجون سرعة أكبر أو دقة أقل.

صورة تعرض واجهة موقع Dreamina المخصصة لتوليد الصور. توضح الخطوات لاختيار نموذج 'Image 3.0 by Seedream 3.0' وتحديد إعداد الدقة العالية 'High (2K)' أسفله. يبرز سهم ودائرتان حمراوان هذين الخيارين الهامين في قائمة الإعدادات على يسار الشاشة لتوجيه المستخدم.

٣. تحديد الأبعاد: قبل التوليد، نحدد أبعاد الصورة المطلوبة.

اخترنا أبعاد 16:9 في بعض التجارب، وهي أبعاد شائعة في المشاهد السينمائية، وكذلك 9:16 في تجارب أخرى.

٤. إدخال الوصف (prompt): هنا نكتب النص الذي يصف الصورة التي نريدها.

استخدمنا أوصافاً متنوعة لاختبار جوانب مختلفة من قدرات النموذج.

٥. التوليد: نضغط على زر "Generate" وننتظر النتيجة. يقوم الموقع بتوليد مجموعة من الصور (عادة أربع صور في التجربة المجانية).

خمس أوامر لاختبار SeaDream 3.0

أجرينا سلسلة من التجارب باستخدام أوامر نصية متنوعة.

الهدف هو رؤية كيفية تعامل النموذج مع أنواع مختلفة من الطلبات، بدءاً من المشاهد المعقدة وصولاً إلى التفاصيل الدقيقة وإدراج النصوص.

كتبنا بالأسفل المطالبة المستخدمة باللغة الإنجليزية مع ترجمتها للعربية للتوضيح. وإليكم نتائج هذه الاختبارات:

1: مشهد سينمائي عالي الدقة

الأمر: Cinematic shot of a lone astronaut standing on a misty alien planet, distant nebula in the sky, dramatic lighting, high detail, 2K resolution.

لقطة سينمائية لرائد فضاء وحيد يقف على كوكب غريب ضبابي، سديم بعيد في السماء، إضاءة درامية، تفاصيل عالية، دقة 2K.

صورة تم توليدها باستخدام نموذج SeeDream 3.0: رائد فضاء يرتدي بزلته يقف على سطح كوكب أحمر ضبابي، تظهر في الخلفية سديم لامع وكواكب بعيدة في الفضاء.

الهدف: استخدمنا هذا الأمر لاختبار قدرة النموذج على خلق مشهد معقد بأجواء وإضاءة محددة.

النتيجة: الصور التي صدرت كانت لافتة جداً، خصوصاً من حيث وضوح التفاصيل في بدلة رائد الفضاء وتجسيد الضباب والسديم.

ظهرت الألوان حيوية، كما أعطت الإضاءة الدرامية للمشهد طابعاً سينمائياً حقيقياً. وبدا أثر دقة 2K واضحاً في دقة العناصر الصغيرة.

التقييم: أظهرت النتيجة أن النموذج يتمكن من فهم الطلبات التي تحوي تفاصيل فنية معقدة وتجسيدها بصرياً بجودة مرتفعة.

2. التركيز على التفاصيل والواقعية

الأمر: Close-up portrait of an old man with deep wrinkles and kind eyes, natural outdoor lighting, photo-realistic, detailed skin texture, 2K.

صورة مقربة لرجل عجوز بتجاعيد عميقة وعينين حنونتين، إضاءة طبيعية خارجية، واقعية التصوير، تفاصيل دقيقة لنسيج البشرة، 2K.

لقطة مقربة جداً لوجه رجل مسن، تظهر فيها التجاعيد العميقة بوضوح مع تفاصيل دقيقة لبشرة الوجه والرقبة، وخلفية خارجية هادئة غير واضحة

الهدف: في هذا الاختبار، أردنا رؤية مدى قدرة النموذج على محاكاة الواقعية والتركيز على تفاصيل وجه الإنسان.

النتيجة: الصور التي حصلنا عليها كانت مقنعة للغاية.

وكانت التفاصيل في (التجاعيد، ملمس البشرة، ولمعة العينين) دقيقة وذات جودة عالية.

التقييم: يتعامل النموذج بكفاءة مع التفاصيل الدقيقة للوجوه عند طلب أسلوب واقعي.

3: القدرة على كتابة نصوص بسيطة

الأمر: A white ceramic mug on a wooden table, steam rising, text on the mug says "Morning Coffee", soft lighting, shallow depth of field.

كوب قهوة سيراميك أبيض على طاولة خشبية، بخار يتصاعد، النص على الكوب يقول "Morning Coffee"، إضاءة ناعمة، عمق ميدان ضحل.

كوب سيراميك أبيض يحوي قهوة ساخنة، يرتفع منه البخار، وعليه عبارة "Morning Coffee" مكتوبة بخط واضح. يجلس الكوب على طاولة خشبية، وتظهر الخلفية بإضاءة ناعمة وغير مركزة

الهدف: اختبار الميزة البارزة لـ SeeDream 3.0، وهي كتابة النصوص. لذا، طلبنا نصاً بسيطاً بالإنجليزية.

النتيجة: في بعض من الصور الناتجة، ظهر النص "Morning Coffee" مكتوباً بشكل واضح وصحيح على الكوب، وبخط مقبول.

لم تكن الكتابة مشوشة أو تحتوي على أخطاء إملائية أو تركيبية كما يحدث مع نماذج أخرى.

التقييم: يتميز SeeDream 3.0 في التعامل مع النصوص الإنجليزية داخل الصور بكفاءة.

4. تصميم مشهد بتفاصيل خلفية معقدة

الأمر: futuristic cyberpunk city at night, neon lights, rain on the pavement, detailed background, reflections, 2K.

مشهد شارع مزدحم في مدينة سايبربانك مستقبلية ليلاً، أضواء نيون، مطر على الرصيف، خلفية مفصلة، انعكاسات، 2K.

شارع مدينة مزدحم يظهر ليلاً في جو سايبربانك، يهطل فيه المطر بغزارة على الرصيف المبلل. أضواء نيون زاهية باللونين الوردي والأزرق تضيء المباني العالية، وتنعكس هذه الأضواء على المياه في الشارع. أشخاص عدة يسيرون وهم يحملون مظلات ملونة لحماية أنفسهم من المطر.

الهدف: هذا الأمر يجمع بين التفاصيل المعقدة في الخلفية والأجواء الخاصة (ليلاً، مطر، نيون).

النتيجة: بدت الصور الناتجة غنية بالتفاصيل البصرية. وظهرت الأضواء المنعكسة على الرصيف المبلل بالمطر بشكل واقعي.

تفاصيل المباني والخلفية المعقدة كانت واضحة نسبياً أيضًا.

التقييم: يمتلك SeeDream 3.0 قدرة عالية على إدارة مشاهد تحتوي على عناصر بصرية كثيرة ومتداخلة.

5. إدراج نص معقد أو بلغة أخرى (محاكاة للصينية)

الأمر: A traditional Chinese painting style image of a mountain landscape, with a red stamp on the bottom left corner containing complex Chinese characters, delicate brushstrokes, subtle colors.

صورة بأسلوب الرسم الصيني التقليدي لمنظر طبيعي جبلي، مع ختم أحمر في الزاوية اليسرى السفلية يحوي حروفاً صينية معقدة، ضربات فرشاة رقيقة، ألوان هادئة.

لوحة بأسلوب الرسم الصيني التقليدي تُظهر مناظر جبلية وتلالاً مغطاة بالأشجار الصغيرة، بألوان مائية هادئة وتفاصيل دقيقة لضربات الفرشاة. يوجد ختم أحمر مربع الشكل في الركن الأيسر السفلي، يحوي رموزاً صينية معقدة.

يحاكي هذا الاختبار قدرة الأداة على التعامل مع النصوص المعقدة، وخصوصاً الصينية التي يتميز بها.

وبالنظر إلى قدرات النموذج المعلنة، من المتوقع أن تكون الصور الناتجة قد نجحت في دمج الختم الأحمر بحروفه الصينية بشكل أكثر دقة ووضوحاً مقارنة بنماذج أخرى قد تجد صعوبة بالغة في توليد مثل هذه التفاصيل النصية المعقدة وغير اللاتينية. 

كذلك، أظهر النموذج قدرة على محاكاة الأسلوب الفني التقليدي (الرسم الصيني) ببراعة.

التقييم الإجمالي ومزايا إضافية لتحسين وتعديل النتائج

بعد الانتهاء من التجربة، إليك عدة ملاحظات حول أداء SeeDream 3.0 وأدوات أخرى داخل Dreamina يمكن دمجها مع نتائج النموذج للحصول على مزيد من المعالجات.

١. جودة 2K: الصور الناتجة بهذه الدقة قدمت بالفعل مستوى جيداً من التفاصيل والوضوح.

 ٢. كتابة النصوص:

نجح SeeDream 3.0 في كتابة النص بوضوح ودقة داخل الصورة في عدد من النتائج التي قدمها، مؤكداً المزاعم حول براعته في هذا المجال، والذي يعتبر نقطة ضعف شائعة في نماذج أخرى.

٣. ميزة Upscale: يوفر Dreamina ميزة "Upscale" (تحسين الجودة) التي عملت على زيادة دقة الصورة المختارة وتفاصيلها بشكل أكبر. وهي إضافة قيمة متاحة بشكل مجاني في الوقت الحالي.

٤. أدوات التعديل (Inpaint): جربنا أيضاً أداة التعديل داخل الصورة، حيث أزلنا عنصراً وطلبنا استبداله.

استجابت الأداة وقامت بالتغيير المطلوب، ولكن النتائج قد تحتاج إلى بعض الدقة في بعض السيناريوهات المعقدة.

فرصة ذهبية: الاستخدام المجاني حالياً على Dreamina

من أبرز نقاط التجربة هو أن استخدام نموذج SeeDream 3.0 وبعض أدواته المرافقة، مثل Upscale، متاح حالياً على موقع Dreamina.com مجاناً وبشكل غير محدود في بعض المناطق، بما في ذلك المنطقة العربية.

يمثل هذا فرصة ممتازة لأي شخص يرغب في تجربة النموذج وتقييم قدراته بنفسه دون أي تكلفة.

ومع ذلك، من المهم جداً إدراك أن هذا الوضع (الاستخدام المجاني وغير المحدود) متاح في بعض المناطق منها المنطقة العربية وقد لا يستمر طويلاً.

كما أن النماذج القوية والمتقدمة مثل SeeDream 3.0 تتطلب موارد حوسبة ضخمة، وعادة ما تنتقل الشركات لتقديم خدماتها بناءً على خطط اشتراك أو دفع مقابل الاستخدام بعد فترة تجريبية أو لفترة محدودة.

وبعد هذه التجربة، يمكن القول إن SeeDream 3.0 يمثل نموذجاً واعداً بالفعل في مجال توليد الصور بالذكاء الاصطناعي.

بالإضافة إلى ذلك، فإن قدرته على إنتاج صور بدقة 2K وكفاءته اللافتة في دمج النصوص داخل الصور يضعانه بقوة على خريطة المنافسة مع النماذج الرائدة.

ويوفر الموقع الداعم Dreamina.com واجهة سهلة للوصول إليه وتجربته.

الاستخدام المجاني الحالي فرصة ممتازة لاستكشاف إمكانيات هذا الوافد الجديد من ByteDance.

Khaled B.

خبير في الذكاء الاصطناعي يتمتع بخبرة واسعة في تطوير وتنفيذ حلول متقدمة باستخدام أحدث تقنياته. مُتخصص في توظيف هذه الإمكانيات لتحسين الأعمال وتحقيق الأرباح من خلال الابتكار التكنولوجي. لديه شغف لإيجاد استراتيجيات وحلول مبتكرة تساعد الشركات والأفراد على تحقيق أهدافهم من خلال تسخير هذه التكنولوجيا.

اقرأ أيضًا

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *