شهدت نماذج اللغة الكبيرة (LLMs) تطورًا ملحوظًا في مجالات تحليل النصوص وتوليدها، حيث أحدثت تأثيرًا عميقًا في معالجة اللغات الطبيعية (NLP).
إلا أن اللغة العربية بقيت -رغم ثرائها الثقافي وتنوع لهجاتها- تعاني من نقص التمثيل الكافي في هذه النماذج. تعقيداتها اللغوية، بما في ذلك تنوع تراكيبها وقواعدها، جعلتها تحديًا دائمًا أمام تطوير نماذج فعالة.
فأغلب النماذج المتقدمة تركز على الإنجليزية كلغة أساسية، مما أدى إلى وجود نماذج عربية إما ضخمة وصعبة التشغيل، أو أخرى تفتقر إلى فهم عميق للخصوصيات الثقافية. على سبيل المثال، نماذج مثل Jais وAceGPT تتجاوز 7 مليارات معامل، وتقدم أداءً قويًا، لكنها تتطلب موارد تقنية هائلة يصعب توفيرها للاستخدام الواسع.
واستجابة لهذه الفجوة، أطلقت شركة Stability AI نموذج Arabic Stable LM 1.6B، المتوفر بنسختين: الأساسية والدردشة.
هذا النموذج المصمم خصيصًا للغة العربية استطاع تحقيق توازن فريد بين الأداء العالي والكفاءة في استهلاك الموارد. وبفضل تدريبه على أكثر من 100 مليار رمز نصي عربي، أصبح قادرًا على تمثيل العربية الفصحى واللهجات المحلية بشكل دقيق.
فقد أظهرت نسخة الدردشة من النموذج أداءً قويًا في الاختبارات الثقافية، حيث استطاعت فهم النصوص والسياقات بدقة ملحوظة. ويعود هذا النجاح إلى مزج بيانات حقيقية بأخرى صناعية، فأصبح قادرًا على التعامل مع استفسارات المستخدمين العرب بشكل متقدم، مع الحفاظ على إمكانية استخدامه في مهام متنوعة.
سر قوة Stable LM 1.6B في العربية
يعتمد نموذج Stable LM 1.6B على هيكلية تدريب متقدمة تأخذ بعين الاعتبار خصائص اللغة العربية. ومن أبرز ميزاته:
١. تحسين التقطيع النصي، حيث يعتمد النموذج على أداة Arcade100k التي تُوازن بين حجم المفردات ودقة التقطيع، والذي بدوره يقلل من مشكلة التقطيع الزائد للنصوص العربية.
٢. تنوع مصادر البيانات، فقد اعتمد مطوروه على مجموعة واسعة من النصوص في تدريبه، من المقالات الإخبارية إلى الكتب الإلكترونية، وهو ما ساعده على إتقان اللغتين الفصحى والعامية.
٣. دربه المطورون أيضًا على أمثلة إضافية، مثل إعادة كتابة حوارات كاملة أو طرح أسئلة تتطلب اختيار الإجابة الصحيحة، وذلك لتحسين قدرته على فهم واستيعاب الثقافة العربية.
وبالتطرق إلى الأداء، حقق النموذج نتائج قوية في اختبارات معيارية مثل ArabicMMLU وCIDAR-MCQ، وفقًا لورقة المشروع.
فعلى سبيل المثال، سجلت نسخة الدردشة نسبة 45.5% في اختبار ArabicMMLU -والذي يقيس نماذج اللغة على الفهم في مختلف المجالات باللغة العربية- متفوقة على نماذج أخرى تحتوي على ما بين 700 مليون و1.3 مليار معامل.
كما أنه أظهر أداءً مميزًا بنسبة 46% في اختبار فهم السياقات الثقافية العربية و الاستدلال المنطقي CIDAR-MCQ.
وتجدر الإشارة هنا إلى أن النموذج تمكن من تحقيق هذه النتائج رغم حجمه الصغير مقارنة بنماذج أخرى تتجاوز 7 مليارات معامل، ويعكس ذلك قوة تصميمه والبيانات المستخدمة.
ورغم هذه الإنجازات الكبيرة، يواجه النموذج تحديات تحتاج إلى تحسين النتائج. من أبرزها الأدوات التي يستخدمها لتحليل الكلمات والجمل إلى أجزاء أصغر أثناء معالجة النصوص، حيث يؤثر ذلك على دقة وسرعة الأداء. كما أن هناك حاجة لتوسيع الاختبارات المخصصة للغة العربية لتشمل المزيد من الموضوعات، لتتماشى مع أفضل المعايير العالمية. بالإضافة إلى ذلك، يتطلب الاعتماد على البيانات المصطنعة مراجعة دقيقة للتأكد من جودتها وصحتها.
بالختام، فإن نموذج Stable LM 1.6B يقدم حلًا عمليًا لمعالجة تحديات الكفاءة والمواءمة الثقافية في اللغة العربية.
وبصفتي باحثًا عن دمج أدوات جديدة في تطبيقاتي، أرى أن مثل هذه البرامج تحديدًا توفر فرصة حقيقية لتطوير تقنيات تخدم المستخدمين العرب بشكل أفضل، وتسهل إنشاء تطبيقات ذكاء اصطناعي عملية وفعّالة تستفيد من إمكانيات لغتنا الجميلة بشكل فعال.
ورقة المشروع: https://arxiv.org/abs/2412.04277
صفحة النموذج الأساسي في HuggingFace:
https://huggingface.co/stabilityai/ar-stablelm-2-chat