دليل مواقع وأدوات و تطبيقات الذكاء الاصطناعي

شركة عربية تطلق نموذج متقدم: Falcon Mamba 7B لِمعالجة النصوص الطويلة

منذ أيام قليلة، أطلق معهد الابتكار التكنولوجي التابع لمجلس أبحاث التكنولوجيا المتقدمة في أبوظبي نموذجاً لغوياً كبيراً جديداً ضمن سلسلة "فالكون" باسم "Falcon Mamba 7B".

والذي يُعتبر حالياً أفضل نموذج مفتوح المصدر عالمياً من نوع State Space Language Model (SSLM)، و ذلك وفقًا لتقارير المعهد و التي سوف نذكرها لاحقًا.

وفي هذه المقالة سوف نشرح بشكل شامل ومبسط:

  • ما هو هذا النموذج
  • ما الذي يجعله مميزاً
  • مقارنته مع النماذج الأخرى
  • كيفية الإستخدام 
  • كما سأنقل لكم تجربتي الشخصية مع النموذج

ما هو Falcon Mamba 7B؟

فالكون مامبا هو نموذج لغة يعتمد على تصميم جديد يُعرف بـ State Space Language Model (SSLM).

تُساعد طريقة عمل SSLM على تحسين أداء النظام ، و تُمكنه من معالجة النصوص الطويلة بشكل أكثر فعالية. حيث يمكن لهذا النموذج معالجة النصوص التي تتجاوز طاقة معالجة نماذج "الترانسفورمر" ، مثل الكتب والوثائق الطويلة.

هذا التصميم يمكن تشبيهه بطريقة عمل جديدة تتيح للنموذج قراءة وفهم النصوص الطويلة بفاعلية أكبر، دون الحاجة إلى ذاكرة ضخمة.

وهو ما سنشرحه بالتفصيل في الفقرة القادمة.

ما الذي يميز Falcon Mamba 7B؟

تجربة Falcon Mamba 7B مع نص طويل باللغة الإنجليزية
تُظهر هذه الصورة فالكون مامبا و هو يُقدم ملخصًا مُفصّلًا لتاريخ الإمبراطورية الرومانية باللغة الإنجليزية ، وهو ما يُبين قدرة النموذج على التعامل مع النصوص الطويلة.

ما يُميّز "فالكون مامبا" عن النماذج الأخرى هو عدة عوامل، منها:

١. كفاءة في التعامل مع النصوص الطويلة: عادةً ما تعاني النماذج التقليدية من صعوبة في معالجة النصوص الطويلة بسبب الحاجة إلى ذاكرة كبيرة. ولكن هذا النموذج الجديد يمكنه التعامل مع هذه النصوص بسلاسة وبدون استهلاك كبير للذاكرة.

 

دعني أوضح لك هذا الأمر بطريقة أبسط.

النماذج التقليدية مثل "المحولات - Transformers" تعتمد على مقارنة الكلمات ببعضها البعض لفهم النصوص.

فعلى سبيل المثال، إذا كنت تقرأ جملة، يقوم النموذج التقليدي بالنظر إلى الكلمات بجانب بعضها ومحاولة استنتاج المعنى من خلال تلك المقارنة.

لكن في نموذج Falcon Mamba 7B، الأمور مختلفة. هذا النموذج يستخدم مفهوم يُسمى (SSLM).

تخيل أن النموذج يقوم بتحديث نفسه باستمرار بينما يقرأ النص، كما لو كان يتابع نص طويل بخطوة ثابتة ويتذكر كل التفاصيل بشكل منظم.

هذه القدرة تمنحه ميزة التعامل مع نصوص طويلة جدًا بدون الحاجة إلى ذاكرة ضخمة.

 

حسناً، وبم يفيد هذا؟

هذا يعني أنه يمكن لهذا النموذج معالجة وفهم النصوص الكبيرة بشكل أسرع وأكثر فعالية، مما يجعله مثاليًا للاستخدامات التي تتطلب التعامل مع كميات كبيرة من البيانات النصية، مثل تحليل الوثائق الكبيرة أو الترجمة الآلية.

 

وسأطرح عليك مثالاً لكى تصل لك الأمور بشكل جيد، إذا أعطيت هذا النموذج مستند طويل أو كتاب ، فإنه لديه ذاكرة قوية جدًا.

حيث يستطيع تذكر كل شيء يقرأه بدون أن ينسى التفاصيل حتى لو كان نص الكتاب طويلًا جدًا. هذا ما يجعل هذا الإصدار مميزًا ويتيح له أداء أفضل مقارنة بالنماذج الأخرى.

 

٢. أداء عالي: في الاختبارات القياسية، تغلب Falcon Mamba 7B على نماذج معروفة مثل Llama 3.1 8B و Mistral 7B، مما يثبت أنه أكثر كفاءة في فهم النصوص وتحليلها.

و بفضل هذه الميزات، يمكن استخدام Falcon Mamba 7B في مجموعة واسعة من التطبيقات، بدءًا من تحليل النصوص الكبيرة وحتى توليد النصوص الطويلة بشكل مستمر.

تعرف أيضًا على مزايا نموذج الذكاء الاصطناعي Qwen2-Math من Alibaba.


 

مقارنة مع النماذج الأخرى

أداء Falcon Mamba 7B يتفوق على Llama 3.1 8B و Mistral 7B في مهام مختلفة
المصدر: TII

لتوضيح قوة Falcon Mamba 7B، يمكننا النظر إلى الجدول المرفق في الصورة السابقة و الذي نشره معهد الابتكار التكنولوجي (TII)، حيث يظهر نتائجه مقارنة مع نماذج أخرى مثل Mistral 7B و Llama 3.1 8B.

تُظهر البيانات أن Falcon Mamba 7B يتفوق في العديد من المهام مثل IFEval و BBH و MATH Lvl 5.

بالإضافة إلى ذلك، تُوضّح صورة الرسم البياني التالية أنه يمكن للنموذج التعامل مع أطوال سياقية أكبر على وحدة معالجة الرسومات NVIDIA A10 بسعة 24 جيجابايت، مما يعزز من كفاءته في التعامل مع النصوص الطويلة.

Falcon Mamba 7B يُمكنه التعامل مع نصوص أطول من نماذج لغة أخرى على معالج رسومات واحد

كيفية استخدام Falcon Mamba 7B، و التجربة الشخصية

النموذج متاح على منصة Hugging Face، مما يجعله في متناول الجميع من باحثين، مطورين، وحتى الأشخاص العاديين الذين يرغبون في استكشاف قدراته.

يمكنك الاطلاع على النموذج و تجربته من هنا.

تجربة Falcon Mamba 7B مع نص طويل باللغة العربية
تُظهر الصورة Falcon Mamba 7B يُقدم ردًا غير مُناسب لمُطالبة باللغة العربية، وهو ما يُبين أنّ النموذج لا يزال في مرحلة التطوير و يحتاج إلى تحسينات.

و قد لاحظت خلال تجربتي أنّ أداء النموذج في اللغة العربية لم يكن على نفس مستوى الأداء في اللغة الإنجليزية. فقد وجدت أنّ النموذج يُمكنه معالجة نصوص طويلة باللغة الإنجليزية بشكل أفضل.

وهذا يُشير إلى أنّ النموذج لا يزال في مرحلة تطوير، ويحتاج إلى تحسينات لِضمان أداء أفضل في اللغات المُختلفة.

Khaled B.

خبير في الذكاء الاصطناعي يتمتع بخبرة واسعة في تطوير وتنفيذ حلول متقدمة باستخدام أحدث تقنياته. مُتخصص في توظيف هذه الإمكانيات لتحسين الأعمال وتحقيق الأرباح من خلال الابتكار التكنولوجي. لديه شغف لإيجاد استراتيجيات وحلول مبتكرة تساعد الشركات والأفراد على تحقيق أهدافهم من خلال تسخير هذه التكنولوجيا.

Related Posts

كل ما تحتاج معرفته عن نماذج OpenAI الثورية o1-preview و mini

في عالم الذكاء الاصطناعي، كل تحديث أو نموذج جديد يجلب معه تحولًا كبيرًا في القدرات والاحتمالات. في الأشهر الـ 18 الماضية، أثار إصدار نموذج GPT-4 من OpenAI ضجة كبيرة، حيث…

إطلاق Reflection 70B | نموذج ذكاء اصطناعي يثير الجدل والاتهامات

خلال الأسبوع الأول من سبتمبر 2024، تم الإعلان عن إطلاق نموذج ذكاء اصطناعي جديد من HyperWrite، يدعى Reflection 70B، والذي وُصف بأنه أقوى نموذج مفتوح المصدر في العالم. ورغم التوقعات…

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

You Missed

توليد و استنساخ أصوات بالعربيةمجانًا مع Fish audio

  • سبتمبر 16, 2024
توليد و استنساخ أصوات بالعربيةمجانًا مع Fish audio

اكتشف أداة Audio Overview من جوجل لتحويل النصوص إلى محادثات صوتية

  • سبتمبر 14, 2024
اكتشف أداة Audio Overview من جوجل لتحويل النصوص إلى محادثات صوتية

إطلاق قسم أدوات الذكاء الاصطناعي في Arab AI للمستخدمين مجانًا

  • سبتمبر 14, 2024
إطلاق قسم أدوات الذكاء الاصطناعي في Arab AI  للمستخدمين مجانًا

كل ما تحتاج معرفته عن نماذج OpenAI الثورية o1-preview و mini

  • سبتمبر 13, 2024
كل ما تحتاج معرفته عن نماذج OpenAI الثورية o1-preview و mini

إطلاق Reflection 70B | نموذج ذكاء اصطناعي يثير الجدل والاتهامات

  • سبتمبر 12, 2024
إطلاق Reflection 70B | نموذج ذكاء اصطناعي يثير الجدل والاتهامات

إطلاق Pixtral 12B: أول نموذج متعدد الوسائط من Mistral AI

  • سبتمبر 12, 2024
إطلاق Pixtral 12B: أول نموذج متعدد الوسائط من Mistral AI

DeepSeek-V2.5: هل هو مستقبل الذكاء الاصطناعي المفتوح المصدر؟

  • سبتمبر 11, 2024
DeepSeek-V2.5: هل هو مستقبل الذكاء الاصطناعي المفتوح المصدر؟

أوبن إيه آي تخطط لإطلاق نموذج Strawberry الجديد خلال أسبوعين

  • سبتمبر 11, 2024
أوبن إيه آي تخطط لإطلاق نموذج Strawberry الجديد خلال أسبوعين

سياسات محتوى الذكاء الاصطناعي باليوتيوب و أدوات جديدة لحماية المبدعين

  • سبتمبر 8, 2024
سياسات محتوى الذكاء الاصطناعي باليوتيوب و أدوات جديدة لحماية المبدعين