
أعلنت شركة التكنولوجيا الصينية العملاقة "علي بابا" عن إطلاق عائلة نماذج الذكاء الاصطناعي الجديدة Qwen3، والتي تهدف إلى منافسة كبرى الشركات مثل OpenAI وGoogle في مضمار الذكاء الاصطناعي المتقدم.
وتتميّز هذه النماذج بقدرتها على التوفيق بين التفكير العميق والاستجابات السريعة، في إطار ما تصفه الشركة بـ"الهندسة الهجينة"، ما يجعلها قادرة على التعامل مع المهام المعقدة والبسيطة بكفاءة عالية.
وتتراوح نماذج Qwen3 من حيث الحجم بين 0.6 مليار إلى 235 مليار معامل، وتتوفر معظمها بترخيص مفتوح المصدر عبر منصات GitHub وHugging Face.
وتشير "علي بابا" إلى أن النماذج الجديدة تقدم أداءً منافسًا لأفضل ما في السوق حاليًا، متفوقةً أحيانًا على نماذج مثل o3-mini من OpenAI وGemini 2.5 Pro من Google في اختبارات رياضية وبرمجية معقّدة مثل AIME وBFCL.

نماذج Qwen3 التي تم إطلاقها
كجزء من إطلاق Qwen3، قررت الشركة توفير مجموعة من النماذج للاستخدام المفتوح.
وتضمنت هذه المجموعة نموذجين يعتمدان على بنية 'خبير-الخليط' (MoE):
√ نموذج Qwen3-235B-A22B الكبير، الذي يمتلك 235 مليار معامل إجمالي (22 مليار منها فعال)
√ نموذج Qwen3-30B-A3B الأصغر حجماً بإجمالي 30 مليار معامل (3 مليارات منها فعال).
بالإضافة إلى ذلك، تم أيضاً إتاحة ستة نماذج تقليدية (كثيفة)، وهي: Qwen3-32B، Qwen3-14B، Qwen3-8B، Qwen3-4B، Qwen3-1.7B، وQwen3-0.6B.
بيانات تدريب ضخمة
تم تدريب Qwen3 على قاعدة بيانات ضخمة تضم 36 تريليون "رمز"، وهي وحدة البيانات التي يتم استخدامها في تدريب نماذج اللغة.
وتُغطي هذه الرموز 119 لغة ولهجة، من ضمنها العربية.

وتضمنت البيانات موادًا تعليمية، وأكواد برمجية، وأسئلة وأجوبة، وحتى بيانات مولّدة من نماذج ذكاء اصطناعي أخرى، وهو ما يعزز من قدراتها في مجالات متعددة.
وتعتمد بعض نماذج Qwen3 على بنية "مزيج الخبراء" (Mixture of Experts)، وهي تقنية تُقسّم المهام إلى أجزاء فرعية تُعالج بواسطة نماذج متخصصة، وذلك يجعلها أكثر كفاءة في استهلاك الموارد الحسابية.
نهج النموذج الهجين
أبرز ما يميز Qwen3 هو اعتماده على نظام "الوضعيات الهجينة" في معالجة المهام:
√ وضعية التفكير: حيث يأخذ النموذج وقتًا إضافيًا لتحليل المسألة خطوة بخطوة، ما يناسب المشكلات المعقدة.
√ الوضعية السريعة: حيث يعطي إجابات فورية للأسئلة البسيطة.
وهذه المقاربة تمنح المستخدمين القدرة على التحكّم في "ميزانية التفكير"، أي كمية الموارد والوقت التي يتم تخصيصها لكل مهمة، لتحقيق توازن مثالي بين الكفاءة والجودة.
وقد بدأت بعض الشركات بالفعل مؤخرًا في استخدام هذا النهج "الهجين" في نماذجها الجديدة، مثل Claude 3.7 Sonnet من Anthropic، و Gemini 2.5 Flash من جوجل.
وتقول علي بابا إن Qwen3 يقدم أداءً محسّنًا في مجالات الترميز والرياضيات والتفكير المنطقي، ويُظهر أداءً قويًا في اتباع التعليمات وتنفيذ المهام المستندة إلى تنسيقات بيانات دقيقة.
كما تم تطويره ليعمل بكفاءة مع تقنيات الذكاء الاصطناعي التفاعلية والبيئات الديناميكية.
رحلة بناء متعددة المراحل
تم تدريب النماذج عبر أربع مراحل شملت:
1. تدريب أولي على سلاسل طويلة من التفكير المنطقي.
2. تحسينات مستندة إلى التعلم التعزيزي
3. دمج قدرات التفكير مع الاستجابات السريعة.
4. تحسين الأداء العام على أكثر من 20 مهمة متنوعة، تتضمن اتباع التعليمات والعمل كوكلاء مستقلين.
الوصول إلى Qwen3
أتاحت علي بابا للمستخدمين الوصول إلى بعض نماذج Qwen3 عبر منصتها chat.qwen.ai، حيث يمكنك التجربة المباشرة.

وتوفر الشركة أيضًا نماذج Qwen3 عبر مزودات خدمات سحابية مثل Fireworks AI وHyperbolic.
كذلك يمكن للمطورين استخدام أدوات محلية مثل Hugging Face وOllama لتجريب النماذج أو دمجها في مشاريعهم.
وتتيح واجهات برمجية متوافقة مع OpenAI لتسهيل النشر والتكامل في بيئات العمل المختلفة.
وفي ظل تصاعد القيود الأمريكية على توريد الشرائح المتقدمة إلى الصين، يبدو أن "علي بابا" تراهن على الانفتاح والمصدر المفتوح لتعزيز موقعها عالميًا، في خطوة يرى فيها خبراء القطاع تحديًا حقيقيًا للنماذج المغلقة من الشركات الأمريكية.