شهدت صناعة الذكاء الاصطناعي أمس إطلاق نموذج جديد من شركة DeepSeek الصينية، يُعرف بـ DeepSeek-R1 أو R1-Lite-Preview، والذي يُعتبر أحد النماذج الأولى المخصصة للتفكير العقلاني (Reasoning) الذي يهدف إلى منافسة النموذج الشهير o1 من OpenAI.
كما يعتبر هذا النموذج تطورًا كبيرًا في مجال الذكاء الاصطناعي، حيث يعتمد على أسلوب التفكير المعقد لتقديم إجابات دقيقة وأكثر استنارة.
ما هو DeepSeek-R1؟
تم إطلاق DeepSeek-R1 من قبل شركة DeepSeek، وهي شركة بحثية في مجال الذكاء الاصطناعي تدعمها مجموعة High-Flyer Capital Management الصينية، والمعروفة بتطبيق الذكاء الاصطناعي في قراراتها الاستثمارية.
ويتسم هذا النموذج بقدرته على التفكير المعمق قبل تقديم الإجابات، وهو ما يجعله مميزًا عن باقي النماذج التي تعتمد على سرعة الاستجابة.
وعلى عكس النماذج التقليدية، يعمل R1-Lite-Preview على فحص الإجابات والتحقق من صحتها خلال عملية اتخاذ القرار. هذه الميزة تزيد من دقة النموذج وتقلل من الأخطاء الشائعة التي قد تظهر في النماذج الأخرى.
كيف يعمل R1-Lite-Preview؟
كما هو الحال مع o1، يعتمد DeepSeek-R1 على أسلوب "التفكير المتسلسل" (Chain-of-Thought) في معالجة الاستفسارات.
وهذا الأسلوب يسمح للنموذج بتفسير كيفية الوصول إلى الإجابة من خلال سلسلة من الخطوات التي تتضمن تخطيطًا مسبقًا واتخاذ إجراءات منطقية للوصول إلى النتيجة النهائية.
وقد يستغرق هذا الأمر بعض الوقت؛ فالنموذج قد يحتاج إلى عدة ثوانٍ من التفكير قبل تقديم الإجابة.
المقارنة مع OpenAI o1
أظهر DeepSeek-R1-Lite-Preview أداءً قويًا في عدة معايير مقارنة مع النموذج o1-preview من OpenAI. في اختبارات مثل AIME (اختبار الرياضيات الأمريكي) و MATH (مجموعة من مسائل الرياضيات) التي تُستخدم لتقييم الأداء.
المصدر: تقرير الشركة.
فقد أظهر الإصدار الجديد قدرة مشابهة لـ o1 في حل المشكلات المعقدة.
ولكن بعض المراجعات لاحظت أنه يواجه صعوبة في حل مسائل منطقية بسيطة مثل لعبة "تيك تاك تو"، وهي مشكلة مشابهة لتلك التي يواجهها o1 أيضًا.
التحديات والقيود والتوسع
وعلى الرغم من تقدم الإصدار الصيني، إلا أنه لا يخلو من التحديات. حيث تم ملاحظة أن النموذج يواجه صعوبة في الإجابة على بعض الأسئلة ذات الطبيعة السياسية الحساسة.
فعلى سبيل المثال، رفض النموذج الإجابة على أسئلة تتعلق بالزعيم الصيني شي جين بينغ أو أحداث ميدان تيانانمن، وهو ما قد يكون ناتجًا عن الرقابة الحكومية على الذكاء الاصطناعي في الصين.
من جهة أخرى، يُعتبر DeepSeek-R1 سهل الاختراق (jailbreaking)، مما يعني أنه يمكن التلاعب به ليقدم إجابات تتجاوز القيود الموضوعية المفروضة عليه.
ومن الميزات المميزة لـ DeepSeek-R1 هو القدرة على إظهار "سلسلة التفكير" الخاصة به عند تقديم الإجابات.
وهذا يسمح للمستخدمين بمتابعة كيفية وصول النموذج إلى قراراته بطريقة شفافة، مما يزيد من ثقة المستخدم في النموذج.
وفي اختباراتي السريعة للنموذج، كان قادرًا على تقديم إجابات دقيقة حتى في أسئلة معقدة، كالسؤال الشهير "كم عدد حروف الـ R في كلمة "Strawberry؟".
أعلنت DeepSeek عن خططها لإتاحة النموذج مفتوح المصدر في المستقبل، وهو ما يعكس لنا التزام الشركة بالتطوير الشفاف والداعم للمجتمع المفتوح في مجال الذكاء الاصطناعي.
حيث سيتم إتاحة هذه الخطوة للمطورين والمختصين فرصة فحص وتحليل النموذج بشكل أعمق وتقديم تحسينات إذا لزم الأمر.
التأثير على صناعة الذكاء الاصطناعي
يعد R1-Lite-Preview جزءًا من الاتجاه المتزايد نحو تحسين النماذج لتكون أكثر ذكاءً وقادرة على التفكير العميق والتخطيط بعيد المدى، وهو ما يتحدى النظريات التقليدية المتعلقة بتوسيع القدرات عبر زيادة البيانات والموارد الحاسوبية.
وبالإضافة إلى ذلك، فإنه يُعتبر نموذجًا رائدًا في تطبيق اختبارات الزمن (Test-Time Compute)، وهي طريقة تمنح النماذج وقتًا إضافيًا لمعالجة البيانات واتخاذ قرارات دقيقة.
الوصول إلى النموذج
أصبح من الممكن الوصول لاستخدام هذا الإصدار من خلال chat.deepseek.com، وهو مجاني للاستخدام، ولكن وضع التفكير المتقدم له حد يومي حتى 50 رسالة يوميًا.
بالختام، تواصل DeepSeek أدائها القوى منذ إطلاق آخر نماذجها DeepSeek-V2.5، والذي شمل تحسينات كبيرة في سرعة الاستدلال واتباع التعليمات.
والآن يأتيDeepSeek-R1 كواحد من النماذج المبتكرة التي تفتح آفاقًا جديدة في مجال الذكاء الاصطناعي، حيث يجمع بين التفكير العقلاني والتكنولوجيا المفتوحة المصدر.
ومن الممكن أن يشكل هذا النموذج منافسة قوية لنماذج مثل o1 من OpenAI، ويزيد من التنافس في هذا المجال.
ومع التزام الشركة بإتاحة النموذج بشكل مفتوح، قد يكون لهذا الابتكار دور كبير في المستقبل في تعزيز الأداء والشفافية في الذكاء الاصطناعي.