أعلنت شركة DeepSeek الصينية عن إطلاق نسخة مفتوحة المصدر من نموذجها "DeepSeek-R1"، والتي وصفتها بأنها نموذج تفكير ينافس نموذج OpenAI o1 في الأداء على عدد من الاختبارات المتقدمة.
وأصبحت هذه النسخة متاحة عبر منصة Hugging Face في صفحة النموذج الرئيسية، بموجب ترخيص MIT، مما يسمح باستخدامه تجارياً بدون قيود.
ما الذي يجعل نماذج التفكير متفوقة؟
تختلف نماذج التفكير عن النماذج الأخرى كونها تأخذ وقتاً أكبر قبل الرد، حيث تستخدم عملية التفكير المتسلسلة لمعالجة مشكلة ما، وتتحقق من صحة إجاباتها لتجنب الأخطاء الناتجة عن النماذج التقليدية
وقد بدأت OpenAI في طرح هذا النوع من خلال إطلاقها لنسختها الأولى o1-preview، قبل أن تطلق شركات عديدة نماذج التفكير الخاصة بها مثل Gemini 2.0 Flash Thinking من جوجل، و R1-Lite-Preview من ديب سيك.
ولكن المميز في الموضوع الآن كون الشركة الصينية تقدم هذا النوع من النماذج بشكل مفتوح المصدر، في ظل احتفاظ OpenAI وGemini بسرية بيانات نماذج التسلسل المنطقي الخاصة بها.
تعرف على نموذج DeepSeek R1-Lite-Preview ، وكيف تستخدم ميزة التفكير العميق والبحث مجانًا.
ماذا يضيف DeepSeek R1، وهل يتفوق على OpenAI o1
في الاختبارات التي نشرتها الشركة، أظهر نموذج الذكاء الاصطناعي "DeepSeek-R1" تفوقه على نماذج OpenAI في اختبارات البرمجة (SWE-bench Verified)، وحلّ المسائل المعقدة (AIME 2024 و GPQA Diamond)، وكذلك في اختبار المعرفة العامة (MMLU).
توضح لنا هذه الاختبارات قدرة النموذج العالية على التعامل مع المسائل الرياضية المعقدة ومهام البرمجة، مع ميزة إضافية تتمثل في التحقق الذاتي من الحلول لتجنب الأخطاء الشائعة.
ويُعتبر "DeepSeek-R1" خطوة مهمة نحو الذكاء الاصطناعي العام (AGI).
حيث يجمع بين التعلم التعزيزي من خلال التجربة والمكافأة، والتدريب الموجه بالإستفادة من التوجيهات المباشرة من المطورين، لتحسين قدرات التفكير والتعلم الذاتي.
وأظهرت النتائج أن النموذج يُجري عمليات تفكير أكثر دقة وموثوقية في مجالات مثل الفيزياء والرياضيات.
وتمثل النسخة المحسنة "R1" تطوراً كبيراً عن نموذجها السابق "R1-Zero"، الذي اعتمد بشكل كامل على التعلم التعزيزي دون بيانات موجهة.
واستخدمت الشركة أسلوباً متعدد المراحل لتطوير النموذج، مما أدى إلى تحسين أدائه بشكل ملحوظ في اختبارات التفكير وحل المشكلات.
بالإضافة إلى ذلك، يتميز "R1" بحجمه الكبير، حيث يحتوي على 671 مليار معلمة، مما يجعله من بين النماذج الأكثر تطوراً في السوق.
كما أطلقت الشركة نسخاً مختزلة تتراوح بين 1.5 مليار و70 مليار معلمة، يمكن تشغيلها حتى على الأجهزة البسيطة، بينما تتطلب النسخة الكاملة تجهيزات تقنية متقدمة.
ومع ذلك، النموذج متاح عبر واجهة API بتكلفة أقل بنسبة 90%-95% مقارنة بنموذج OpenAI o1.
القيود الصينية في الذكاء الاصطناعي
وعلى الرغم من ميزاته، يخضع "DeepSeek-R1" -مثل معظم النماذج الصينية- للتنظيم الصارم من قبل السلطات الصينية لضمان توافقه مع "القيم الاشتراكية الأساسية".
وهذا يعني أن النموذج يتجنب الإجابة عن أسئلة حساسة مثل أحداث ساحة تيانانمن أو استقلال تايوان.
وذلك ما جعل منصة مثل HuggingFace تحذر بشأن استخدام النماذج الصينية.
كما يأتي إطلاق "R1" في وقت تشهد فيه العلاقات بين الصين والولايات المتحدة توتراً بشأن تقنيات الذكاء الاصطناعي.
وقد فرضت الإدارة الأمريكية قيوداً على تصدير التكنولوجيا المتقدمة إلى الصين، مما قد يؤثر على تطور النماذج المستقبلية.