أعلنت شركة ElevenLabs -المتخصصة في تطوير تقنيات الصوت بالذكاء الاصطناعي- عن إطلاق ميزة جديدة تحمل اسم GenFM عبر تطبيق ElevenLabs Reader على نظام iOS.
وتتيح هذه الأداة تحويل أنواع متعددة من المحتوى، مثل مقاطع فيديو يوتيوب والنصوص والوثائق، إلى بودكاست متعدد القنوات بأسلوب طبيعي يشابه الحوار البشري.
مميزات GenFM لإنشاء محادثات تفاعلية
تتميز أداة GenFM بدعمها 32 لغة مختلفة، من بينها الإنجليزية، الهندية، البرتغالية، الصينية، الإسبانية، الفرنسية، الألمانية، واليابانية، والعربية.
وتسمح هذه الخاصية للمستخدم برفع المحتوى المطلوب، ليقوم التطبيق باختيار صوتين تلقائيًا لتصميم حوار تفاعلي، مع توفر مجموعة واسعة من الأصوات للاختيار بينها.
وما يجعل هذه التقنية قوية هو قدرتها على إضافة عناصر بشرية مثل التوقفات والضحكات والتنهدات، مما يمنح البودكاست طابعًا أقرب إلى التفاعل البشري الحقيقي.
وفقًا لتصريحات جاك مكدرموت -المسؤول عن تطوير تطبيقات الهواتف المحمولة في ElevenLabs- فإن الهدف من إضافة هذه العناصر هو تحقيق توازن مثالي بين الواقعية وسهولة الاستخدام، مما يسح بتقديم محتوى ثري وممتع للمستمعين.
وتأتي هذه الخطوة في وقت تسعى فيه الشركات الكبرى مثل Google وMeta إلى تعزيز قدراتها في تقنيات البودكاست المدعومة بالذكاء الاصطناعي.
فعلى سبيل المثال، طورت جوجل في سبتمبر الماضي خاصية NotebookLM مع إضافة أداة Audio Overview التي تسمح بإنشاء محادثات تفاعلية اعتمادًا على مصادر يتم رفعها من قبل المستخدمين، وأتاحت في وقت لاحق خيارات تخصيص أوسع لإنتاج بودكاست يناسب احتياجاتهم.
ومن جانبها، أعلنت ElevenLabs عن استثمار بقيمة 11 مليون دولار لدعم منظومة الشركات الناشئة في بولندا وافتتاح مركز للبحث والتطوير في وارسو لجذب المواهب المحلية في مجال الذكاء الاصطناعي.
وبالإضافة إلى ذلك، وسّعت الشركة نطاقها ليشمل السوق الهندية من خلال تعيين فريق محلي يهدف إلى تحسين تقنياتها وتقديم دعم أفضل للغات الهندية.
مستقبل صناعة البودكاست بالذكاء الاصطناعي
لا تقتصر جهود ElevenLabs على خاصية GenFM فقط، بل تشمل أيضًا تطوير وكلاء ذكاء اصطناعي للمحادثات ومكتبة أصوات متنوعة.
وتسعى الشركة إلى توسيع خيارات التخصيص لتشمل دمج مصادر متعددة وإنشاء محتوى أكثر تعقيدًا.
ويبدو أن التوجه العام في الصناعة يسعي نحو تحسين نماذج الصوت لتصبح أقرب للواقعية، كما هو الحال مع شركات مثل PlayAI التي طورت تقنية PlayDialog، والتي تضيف سياقات كاملة ومؤثرات صوتية تجعل المحتوى الصوتي أكثر تفاعلية.
تؤكد هذه التطورات أن تقنيات الصوت الذكية لم تعد مجرد أداة مساعدة، بل أصبحت وسيلة لإعادة تعريف طريقة إنتاج المحتوى الرقمي وتقديمه، مع تحسين تجربة المستخدم وجعلها أكثر قربًا من الحوار البشري الطبيعي.
تعرف أيضًا على طريقة إنتاج بودكاست بالعربية مجانًا باستخدام Inpodcast AI