أعلنت "ElevenLabs" عن إطلاق ميزة "Voice Design"، التي تسمح للأشخاص بإنشاء أصوات فريدة باستخدام الذكاء الاصطناعي من أوصاف نصية فقط.
فرغم انتشار أدوات تحويل النص إلى كلام (Text-to-Speech)، إلا أن هذه الأدوات أصبحت محدودة الابتكار ومتشابهة في معظم الخصائص
ولذلك تأتي هذه الأداة لتمنح حرية تحديد خصائص الصوت بناءً على احتياجاتك المختلفة تمامًا.
ما هي ميزة Voice Design؟
عندما تحدثنا عن إمكانية عمل مقاطع صوتية بناءً على وصف نصي بسيط -ودون الحاجة إلى تسجيل صوتي مرجعي أو إعدادات معقدة- فالمقصود هنا والجديد هو وصف الصوت نفسه.
حيث يمكنك وصف العمر، اللهجة، النبرة، أو حتى خصائص الشخصية المطلوبة لإنشاء كلام مسموع يناسب الاحتياجات الخاصة. وبذلك، تحصل على أصوات جديدة تمامًا خلال ثوانٍ قليلة.
ورغم أن ElevenLabs ليست حديثة العهد في هذا المجال، وتوفر بالفعل مكتبة تضم أكثر من 3000 صوت عالي الجودة، إلا أننا قد نحتاج إلى أصوات فريدة لا توجد ضمن هذه المكتبة.
وهنا تظهر أهمية الأداة الجديدة، والتي تمنحنا المرونة الكاملة لتصميم المقطع الصوتي الذي نتخيله، بما في ذلك نبرات الشخصيات الخيالية.
كيفية استخدام ميزة "تصميم الصوت" من ElevenLabs
١. التسجيل وبدء الاستخدام:
- ادخل إلى الميزة الجديدة في موقع ElevenLabs وانقر على تصميم صوت مجاني "Design Voice Free".
- تأكد من تسجيل الدخول للوصول إلى لوحة التحكم.
- بعد الدخول اختر "Voices" من القائمة الجانبية، أو "Add a new voice" من الواجهة.
- بعد ذلك اختر "Voice Design" .
٢. تخصيص الصوت والنص
عند الوصول إلى الأداة، يمكنك إدخال وصف دقيق للصوت المرغوب. على سبيل المثال: "رجل بريطاني مسن، صوته عميق ومريح"، أو "قزم صغير بصوت حاد وحماسي".
ثم أدخل النص الذي تريد أن يتحدثه المعلق الصوتي.
ملحوظة: عند استخدام أدوات ال TTS في النصوص العربية، فمن الأفضل تشكيل الحروف قبل وضعها. استخدم أحد مواقع التشكيل، أو روبوتات الدردشة مثل "ChatGPT" لتحقيق ذلك.
هكذا ستحصل على نطق سليم بدون أخطاء.
٣. توليد الأصوات
بعد إدخال المعلومات، اضغط على زر "Generate Voice".
وستقدّم الأداة ثلاثة خيارات صوتية مختلفة يمكنك اختيار الأنسب من بينها.
٤. حفظ النتيجة
بمجرد اختيار الصوت المناسب، قم بتسميته وإضافة وصف مخصص له، ثم حفظه في قسم الأصوات الشخصية لاستخدامه في أي وقت لاحق.
الجدير بالذكر أن الباقة المجانية تسمح لك بإدخال عشرة آلاف حرف، وذلك كافٍ جدًّا لتجربة الأداة بشكل ممتاز بدون أي تكاليف.
إمكانية تصميم الأصوات بدقة
أوضحت ElevenLabs أن الأوصاف التفصيلية تساعد بشكل مباشر في دقة النتائج.
لذا أقدم لك مجموعة من العناصر التي عليك استهدافها أثناء كتابة الوصف، وذلك لتَحَكُّم أكبر مثل أن يكون صوتًا طفوليًا ناعمًا أو صوتًا حادًا لشخصية شريرة، مثل:
- العمر: (طفل، مراهق، بالغ، مسن).
- الجنسية أو اللهجة: (عربية، مصرية، خليجية، عراقية،...).
- الجنس: (ذكر، أنثى).
- النغمة: (غامضة، ناعمة، حادة، مريحة...).
- السرعة والانفعال: (بطيء، سريع، غاضب، هادئ).
أمثلة على استخدام Voice Design
رجل عربي مسنّ، ذو نبرة خشنة ومريحة، يتمتع بهدوء وثقة.
فتاة مغربية شابة، بنبرة مريحة، تتحدث بهدوء وبطء.
شخصية خيالية مثل عفريت أو قزم، بنبرة متقطعة وغريبة.
دمج الأداة الجديدة في مشروعك
إحدى الميزات المهمة التي من المنتظر إطلاقها قريبًا هي واجهة برمجة التطبيقات (API)، والتي تسمح للأفراد دمج هذه الميزة في مشاريعهم بشكل سهل.
فمثلًا تستطيع استخدام هذه الأصوات إلى جانب أدوات إنتاج الفيديو بالذكاء الاصطناعي، وبالتالي تطوير محتوى متكامل يتضمن شخصيات وحوارات تتناسب مع المشاهد المختلفة.
وبالختام، فإن ElevenLabs تواصل تطوير أدواتها بشكل مستمر، لتظل في ريادة هذا المجال.
وقد أطلقت تطبيقها "Reader App" للاستخدام المجاني في أغسطس الماضي، ليتجاوز عدد مستخدميه النصف مليون في هذه الفقرة القصيرة.
كما أنها حصدت في نفس هذا الشهر أكثر من 28 مليون زيارة لتستمر كأكثر مواقع ال TTS استخدامًا.
والآن تأتي لنا بهذه المزايا المبتكرة، والتي تجعل عملية صناعة الأصوات تأخذ منحنى آخر من ناحية الواقعية والحرية في التخصيص.
فاليوم تناولنا قدرات Runwayml في إخراج الفيديوهات، والآن نحن بصدد تطور آخر.
ببساطة، كل ما كنا نبذله من وقت وجهد في التصميم بات يتحقق في بضعة نقرات فقط.