Arab AI: الذكاء الاصطناعي بالعربية
AI Arab AI Logo
واجهة إصدار الذكاء الاصطناعي DeepSeek V3 على منصة DeepSeek

DeepSeek V3: نموذج ذكاء اصطناعي يتحدى الجميع ويعتقد أنه ChatGPT

٢٧ جمادى الآخرة ١٤٤٦ هـ / ٢٨ ديسمبر ٢٠٢٤
4 دقائق

أطلقت شركة DeepSeek الصينية نموذجًا جديدًا باسم DeepSeek V3، والذي يعتبر من أبرز المنافسين في فئته.

فقد حقق نتائج مبهرة على مستوى المعايير العامة، ويعد من أفضل النماذج «المفتوحة» التي تم تطويرها حتى الآن. ويتميز بقدرته على أداء مجموعة واسعة من المهام النصية المعقدة مثل البرمجة، الترجمة، وكتابة المقالات أو رسائل البريد الإلكتروني بناءً على وصف مختصر.

Advertisement

كما أنه يأتي بسرعة 60 رمزًا في الثانية، أي ثلاثة أضعاف سرعة الإصدار الأسبق V2.

كفاءة وسرعة استجابة نموذج الذكاء الاصطناعي DeepSeek V3 بمعدل 60 رمزًا في الثانية

ولكن أبرز ما يميزه عن غيره من النماذج هو الأداء المتفوق في الاختبارات المقارنة.

Advertisement

ففي بعض المسابقات البرمجية الشهيرة مثل Codeforces، تفوق DeepSeek V3 على نماذج قوية مثل GPT-4 من OpenAI وLlama 3.1 من Meta.

وفي اختبارات أخرى مثل Aider Polyglot، التي تقيس قدرة النموذج على دمج أكواد جديدة ضمن أكواد قائمة، أثبت الإصدار الجديد جدارته أيضًا، محققًا نسبة نجاح تقارب ال 50%. إن هذه النسبة تشير لمدى تطور هذا الإصدار مقارنة بالإصدارات السابقة للشركة مثل DeepSeek-V2.5، والذي بلغ معدل نجاحه 17% فقط.

مقارنة أداء DeepSeek V3 مع Llama3.1 و GPT-4o

تم تدريب النموذج باستخدام قاعدة بيانات ضخمة تتكون من 14.8 تريليون رمز (token)، وهو ما يعادل حوالي 750,000 كلمة لكل مليون رمز.

وذلك بالإضافة إلى الحجم الهائل للإصدار نفسه الذي يحتوي على 671 مليار معلمة (parameter)، وهو ما يعادل تقريبًا 1.6 ضعف حجم نموذج Llama 3.1 405B.

وعلى الرغم من الحجم الكبير، فإن قدرة DeepSeek V3 على التكيف مع المهام المعقدة تجعله واحدًا من أبرز النماذج في السوق.

ومع ذلك، فإنه يعتبر غير عملي بعض الشيء، حيث يتطلب معدات ضخمة مثل وحدات معالجة الرسومات (GPUs) عالية الأداء للعمل بكفاءة.

ولكن الشركة الصينية تمكنت من تدريبه باستخدام مركز بيانات يحتوي على وحدات Nvidia H800 GPUs خلال فترة زمنية قصيرة لا تتجاوز الشهرين، بتكلفة إجمالية قدرها 5.5 مليون دولار فقط، وهي تكلفة منخفضة مقارنة بتكاليف تدريب نماذج أخرى مثل GPT-4.

لكن، هناك جانب آخر يجب مراعاته عند الحديث عن DeepSeek V3. إذ لا يخفى على أحد أن الإصدارات الصينية تواجه بعض القيود السياسية.

فعلى سبيل المثال، إذا تم السؤال عن أحداث تاريخية حساسة مثل مذبحة ساحة تيانانمن، فإنه يرفض الإجابة.

ولقد تحدثنا عن هذا الأمر سابقًا عندما تم إطلاق نموذج التفكير DeepSeek-R1 الخاص بالشركة، بالإضافة إلى روبوتات صينية أخرى مثل QwQ-32B-Preview

لقطة شاشة تُظهر استجابات نموذج QwQ-32B و DeepSeek-R1 حول موضوع تايوان، حيث تتبني وجهة النظر الصينية

هذه القيود ليست مفاجئة، نظرًا لأن النموذج تعمل في إطار بيئة خاضعة للرقابة من الحكومة الصينية، التي تشترط أن تتماشى الإجابات مع «القيم الاشتراكية الأساسية». وذلك ما جعل منصة شهيرة مثل HuggingChat تحذر من خطر النماذج الصينية.

الجانب الغريب: هل DeepSeek V3 هو ChatGPT؟

إحدى المفاجآت التي ظهرت مع DeepSeek V3 هي أن النموذج يبدو أنه يعتقد أنه نسخة من ChatGPT.

وعندما تم سؤاله عن هويته، رد روبوت الدردشة الصيني بأنه نسخة من نموذج GPT-4 الذي أطلقته OpenAI في 2023.

This actually reproduces as of today. In 5 out of 8 generations, DeepSeekV3 claims to be ChatGPT (v4), while claiming to be DeepSeekV3 only 3 times.

Gives you a rough idea of some of their training data distribution. https://t.co/Zk1KUppBQM pic.twitter.com/ptIByn0lcv– Lucas Beyer (bl16) (@giffmana) December 27, 2024

هذا الادعاء أثار العديد من التساؤلات حول ما إذا كان الإصدار قد تم تدريبه على نصوص تم إنشاؤها بواسطة ChatGPT، مما يثير شكوكًا حول دقة المعلومات التي يقدمها.

ويقول الخبراء إنه من المحتمل أن يكون DeepSeek V3 قد تم تدريبه جزئيًا على بيانات من مصادر مفتوحة تحتوي على مخرجات من نماذج مثل GPT-4. وهذا قد يفسر سبب التشابه في الإجابات التي يقدمها، بما في ذلك بعض النكات والردود المتشابهة تمامًا مع تلك التي يقدمها GPT-4.

وعلى الرغم من أن DeepSeek V3 يحقق تقدمًا ملحوظًا في مجال الذكاء الاصطناعي، إلا أن هذه الممارسات يمكن أن تؤثر سلبًا على جودة النموذج، مما يؤدي إلى ما يُعرف بـ «الهلاوس» أو الإجابات غير الدقيقة.

وتعد هذه الممارسات مشكلة شائعة عند تدريب النماذج على مخرجات نماذج أخرى، حيث يمكن أن تتداخل البيانات وتؤدي إلى تشويه الواقع.

وإلى جانب هذه الجوانب التقنية، يواجه DeepSeek V3 تحديات أخرى تتمثل في تكاليف تطوير النماذج ذات الحجم الكبير، والحاجة إلى أجهزة حوسبة متطورة لتشغيلها.

ومع ذلك، يبقى DeepSeek V3 مثالًا بارزًا على الإنجازات التي حققتها الشركات الصينية في مجال الذكاء الاصطناعي، ويشير إلى اتجاهات جديدة في تطوير نماذج مفتوحة المصدر تستطيع التنافس مع الأسماء الكبيرة مثل OpenAI وMeta.

ومع الوقت، قد نرى المزيد من النماذج المماثلة التي تقدم مزيجًا من القوة والأداء العالي مع إمكانية الوصول المفتوح للمطورين والمستخدمين.

الوصول إلى DeepSeek V3:

١. عبر منصة هاجنج فيس

https://huggingface.co/deepseek-ai/DeepSeek-V3

٢. استخدمه مباشرة مجانًا من المنصة الرسمية

https://chat.deepseek.com

مقالات ذات صلة

التعليقات

لا توجد تعليقات بعد

كن أول من يعلق على هذا المحتوى.