Fish Speech | النص إلى صوت عربي و استنساخ الأصوات بال AI مجانًا

أطلقت Fish Audio النسخة 1.4 من Fish Speech، النموذج المتقدم لتحويل النص إلى صوت (TTS) و استنساخ وتقليد الأصوات (Voice Cloning)، و الذي يوفر ميزات جديدة تدعم احتياجاتنا كمستخدمين، باحثين، أو مطورين حول العالم.

و يعتبر هذا الإصدار إضافة جديدة في تكنولوجيا توليد الأصوات بالذكاء الاصطناعي، حيث تم تحسين أدائه بشكل كبير وتوسيع قاعدة بياناته لتشمل لغات أكثر.

في هذه المقالة، سنتحدث عن هذه التطورات، و ما يميز النموذج، كما سنتعرف على كيفية الوصول و الاستخدام المجاني بالخطوات.

تحسينات تكنولوجيا تحويل النصوص إلى أصوات في Fish Speech 1.4

واحدة من التحسينات الرئيسية التي تأتي مع Fish Speech 1.4 هي زيادة البيانات التدريبية بشكل ملحوظ.

حيث تمت توسعة قاعدة البيانات لتصل إلى 700,000 ساعة من بيانات الصوت المتعددة اللغات، وهو ما يزيد من دقة النموذج في معالجة الأصوات، اللهجات، واللغات المختلفة بشكل طبيعي.

بالإضافة إلى دعم اللغات، يشمل النموذج دعمًا لثمان لغات مختلفة، بما في ذلك الإنجليزية، الصينية، الألمانية، اليابانية، الفرنسية، الإسبانية، الكورية، والعربية.

و هذا التوسع يجعل Fish Speech ملائمًا للاستخدام في التطبيقات، حيث يقدم أداءً جيدا في تحويل الكلام المكتوب إلى مسموع بأي من هذه اللغات.

اكتشف أيضًا أداة Audio Overview من جوجل لتحويل النصوص إلى محادثات صوتية.

أهم الميزات الجديدة من شركة Fish Audio

يأتي الإصدار الأخير بميزات متقدمة تدعم احتياجات المستخدمين المختلفة. أبرزها:

١. التحويل الفوري من النص إلى صوت

ما يميز Fish Speech 1.4 في تقنية تحويل النص إلى صوت هو القدرة على تقديم أداء عالى بدعم لغات متعددة مع الحفاظ على دقة الصوت. كما يتمتع النموذج بمعالجته السريعة.

٢. استنساخ الأصوات فورًا

حيث يمكن للمستخدمين الآن تقليد الأصوات بشكل فوري تقريبًا باستخدام كميات قليلة من البيانات مثل مقطع صوتي صغير.

يجعل ذلك مجالات توليد الأصوات المخصصة يتم بشكل أسهل، مثل استخدام صوتك و تركيبه على مقاطع الفيديو.

بالإضافة إلى ذلك، يوفر Fish Speech 1.4 مرونة في الاستخدام، حيث يستطيع للمستخدمين إما استضافة النموذج على أجهزتهم المحلية أو استخدام خدمة السحابة الخاصة بـ Fish Audio، أو حتى الاستخدام المباشر أونلاين من خلال الموقع الرسمي للشركة.

و في رأيي أن هذه المرونة إضافة قوية، حيث أنها تمنح الأفراد القدرة على الحفاظ على الخصوصية باستخدام أجهزتهم الخاصة أو الاستفادة من سهولة ومرونة الخدمات السحابية.

نموذج مفتوح المصدر ومتعدد الاستخدامات من Fish Audio

أحد العناصر الفريدة التي تقدمها شركة Fish Audio في Fish Speech 1.4 هو أنه مفتوح المصدر بالكامل، و هو ما يتيح للمطورين والباحثين الابتكار وتخصيص النموذج وفقًا لاحتياجاتهم الخاصة.

كما تزيد أيضًا من فرص استخدام النموذج في المجالات المختلفة سواء التعليمية أو البحثية، و بالتالى يؤدي لمزيد من التطور في التطبيقات الصوتية المبنية على تكنولوجيا TTS.

و قد قامت شركة Fish Audio بتوفير نسخة تجريبية على منصة Hugging Face.

جرب النسخة التجريبية لتحويل النص إلى كلام مسموع و استنساخ الاصوات.

لقطة شاشة للنسخة التجريبية من Fish Speech 1.4 على منصة Hugging Face، تظهر واجهة المستخدم لتحويل النص إلى صوت واستنساخ الأصوات باللغة العربية.

و لكن ماذا عن النسخة الأصلية؟ دعونا الآن ننتقل إلى موقع Fish Audio.

تحويل النص إلى صوت و استنساخ و تقليد الأصوات بالعربي مجانًا بالذكاء الاصطناعي

من الأشياء المميزة في هذه المنصة هي أنك يمكنك توليد أو استنساخ الصوت مجانًا.

حيث يتلقى المستخدمون المجانيون يوميًا باقة تمكنهم من إنشاء 50 مقطع. كما يشمل إنشاء المقطع الواحد إدخال نص بحدود 500 حرف.

و بالتالى تستطيع تحويل النصوص حتي 25000 حرف فاليوم الواحد، و هذا شئ ممتاز جدا.

أما إن كنت تريد الترقية، فسوف تحصل في الباقة المدفوعة علي حصة يومية قدرها 1000 مقطع. مع زيادة في عدد الحروف بالمقطع الواحد تصل إلى 5000 حرفا.

والآن فلنبدأ في خطوات توليد مقاطع صوتية مجانية.

١. اذهب إلى اذهب إلى Fish Audio ، و قم بالتسجيل باستخدام الميل الخاص بك.

٢. استنساخ أصوات المشاهير بالذكاء الاصطناعي

كما ترى بالصورة التالية، توفر لك المنصة ميزة استخدام عشرات من أصوات المشاهير و السياسيين و المطربين، بل وأصوات شخصيات الإنمي الشهيرة.

لقطة شاشة من Fish Speech تظهر قائمة نماذج أصوات المشاهير المتاحة للاستنساخ، بما في ذلك أصوات دونالد ترامب، إيلون ماسك، وشخصية Raiden Shogun من أنمي Genshin Impact.

٣. تحويل الكلام المكتوب إلى مقاطع صوتية

من القائمة اضغط على خيار Text to Speech، و ذلك لتحويل كلامك المكتوب إلى مقطع صوتي.

أدخل النص الخاص بك في مربع ال «text».
اضغط على زر select voice model، و الذي يسمح لك إما باستخدام أصوات المشاهير كما ذكرنا سابقًا، او باستخدام صوتك.
اضغط «Create» و سيتم المقطع الصوتي لك على الفور.

لقطة شاشة لواجهة تحويل النص إلى صوت في Fish Speech، تظهر مربع إدخال النص، وخيار تحديد نموذج الصوت، وزر إنشاء المقطع الصوتي.

و لكن كيف سأضع صوتي؟ هذا ما سنعرفه بالخطوة التالية.

٤. توليد مقاطع صوتية من خلال استنساخ صوتك Voice Cloning

من أجل تدريب النموذج على الصوت الخاص بك، افتح القائمة الرئيسية، ثم اختر «Build Voice»، ستفتح لك واجهة كما بالصورة التالية.

لقطة شاشة لواجهة استنساخ الصوت في Fish Speech، تظهر خيارات تحديد نوع الصوت، وإضافة صورة واسم ووصف، ورفع ملف صوتي أو تسجيل الصوت مباشرةً.

1. اختر نوع الصوت الذي تريده.

عام: سيكون صوتك متاحاً للجميع على الموقع.
غير مدرج: لن يظهر صوتك في قائمة الأصوات العامة، ولكن يمكن الوصول إليه عبر رابط مباشر.
خاص: لن يكون صوتك متاحاً إلا لك.

2. صورة الغلاف (اختياري): يمكنك إضافة صورة غلاف لصوتك (مثلاً، صورة لك أو صورة رمزية).

3. الاسم: اكتب اسمًا لصوتك (مثلاً، «صوتي» أو «صوت محمد»).

4. الوصف (اختياري): أضف وصف لصوتك (مثلاً، «صوتي الطبيعي» أو «صوت مرح»،»جاد» أو «وثائقي»).

5. تصنيف صوتك tags (اختياري): أضف علامات تُساعد في تصنيفه، مثل «ذكر»، «أنثى»، «لغة عربية».

6. رفع الصوت:

سواء من خلال التحميل من جهازك: اختر ملفًا صوتيًا بجودة عالية من جهازك (MP3 أو WAV).

أو التسجيل المُباشر: سجّل صوتك مباشرةً عبر الموقع.

نصيحتين مهمين:

التسجيل يكون بجودة عالية، مدته من 10 لـ 90 ثانية.
أفضل مدة 25 ثانية تقريبًا عشان النتيجة تبقى ممتازة.

بعدها قم بالضغط على «Create»، حيث سيتم إضافة صوتك بحسابك، و يمكنك استخدامه في أي وقت.

عيوب قابلة للتحسين المستمر، و كيفية التغلب عليها

رغم كل ما ذكرناه عن تميز هذه الأداة في تحويل النص إلى صوت و استنساخ و تقليد الأصوات، إلا أنه دائمًا ما يكون هناك بعض النوافذ المفتوحة للتحسين المستمر.

و من تجربتنا يمكننا الإشارة إلى هذه النقاط

١. الأداة قدمت تحسينات رائعة على استخدامها باللغة العربية، إلا أنه ما زال هناك قدر منتظر من التطوير.

٢. إذا أدخلت صوتك بشكل غير واضح، سيكون من الصعب على النموذج تقليده بشكل كافي. لذا اتبع ارشاداتنا السابقة.

٣. في أي أداة تقوم بتحويل النص إلى صوت، من المهم جدًا أن تضع النص بالتشكيل إن كان عربيًا.

اكتب ببحث جوجل «تشكيل الكلمات» و سيظهر لك العديد من المواقع التي تؤدي هذه المهمة بسهولة.

٤. يجب عليك إدخال النص بلغة واحدة فقط، فإن كان على سبيل المثال بالعربي و به بضع كلمات بالانجليزية، استبدل هذه الكلمات كما تنطق باللغة العربية.

مثال: استبدل كلمة «Magic» إلى «ماجيك».

تنويه هام

في موقعنا، نؤمن بأن أدوات الذكاء الاصطناعي مثل Fish Speech توفر لنا فرصًا رائعة لتحسين حياتنا. ولكن، يجب علينا استخدام هذه التقنيات بشكل مسؤول وعادل، بما يحقق مصلحة الجميع ويحترم حقوق الآخرين.

بالختام، فإن إصدار Fish Speech 1.4 يمثل خطوة أخرى في تكنولوجيا توليد و استنساخ الأصوات باستخدام ال AI، مع مزايا متقدمة.

كما يتيح هذا إلاصدار -بفضل كونه مفتوح المصدر- للمطورين والباحثين فرصة استكشاف المزيد من التطبيقات والابتكارات في مجال التكنولوجيا الصوتية.