
DeepSeek-OCR: نموذج DeepSeek الجديد لمعالجة البيانات الضخمة
DeepSeek تكشف عن تقنية ثورية لمعالجة البيانات: كيف يغير نظام OCR الجديد قواعد اللعبة في الذكاء الاصطناعي؟
في خطوة تقنية متقدمة، كشفت شركة الذكاء الاصطناعي الصينية DeepSeek عن نظامها المبتكر «DeepSeek-OCR»، الذي يقدم أسلوبًا جديدًا بالكامل في طريقة تعامل الأنظمة الذكية مع المستندات الضخمة والمعقدة. يأتي هذا الإعلان في وقت تبرز فيه الشركة كلاعب رئيسي في الساحة التقنية، ليؤكد طموحاتها في قيادة موجة الابتكار القادمة.
حل لمعضلة البيانات الكبيرة
تواجه نماذج الذكاء الاصطناعي اللغوية تحديًا كبيرًا يعرف بمشكلة «السياق الطويل»، حيث ترتفع تكاليف المعالجة بشكل هائل عند التعامل مع كميات كبيرة من المعلومات. في هذا الإطار، يأتي نظام DeepSeek-OCR ليقدم حلاً جذريًا لهذه المشكلة. تعتمد التقنية الجديدة على فكرة فريدة، وهي استخدام «الإدراك البصري» كوسيلة لضغط النصوص.
بدلًا من معالجة الكلمات حرفيًا، يقوم النظام بتحويل المستندات إلى تمثيلات بصرية مضغوطة. وبحسب تصريحات فريق البحث في DeepSeek-AI، فإن هذا الأسلوب يخفض حجم البيانات التي تحتاج إلى معالجة بما يتراوح بين 7 إلى 20 مرة، وهو إنجاز يفتح الباب أمام تحليل كميات هائلة من المعلومات بكفاءة وسرعة غير مسبوقة.
آلية عمل متطورة وبسيطة
يعتمد النظام في جوهره على مكونين رئيسيين يعملان بتناغم تام. الأول هو المشفر «DeepEncoder»، الذي يعمل كنواة حسابية تقوم بتحويل الصور عالية الدقة للمستندات إلى صيغة مضغوطة بأقل قدر من النشاط الحسابي.
أما المكون الثاني، فهو مفكك الشفرة «DeepSeek3B-MoE-A570M»، وهو نموذج ذكاء اصطناعي متخصص يستند إلى بنية «خليط الخبراء». هذه البنية تقسم الشبكة العصبية إلى شبكات فرعية مستقلة، يتخصص كل «خبير» منها في جزء معين من البيانات، ليعملوا معًا على استعادة النص الأصلي بدقة فائقة.
أداء يضع معايير جديدة
أثبت نظام DeepSeek-OCR قدراته الفائقة في الاختبارات المعيارية. فقد حقق دقة في استعادة البيانات تصل إلى 97%، وحتى عند أعلى مستويات الضغط (20 مرة)، احتفظ النموذج بنحو 60% من المعلومات الأصلية.
وعلى صعيد متصل، تفوق النظام على نماذج رائدة أخرى في اختبار «OmniDocBench» المخصص لتقييم فهم المستندات المتنوعة، كل ذلك مع استخدام عدد أقل بكثير من الرموز المميزة. وذكرت تقارير أن النظام يستطيع إنتاج بيانات تدريبية بحجم يتجاوز 200 ألف صفحة يوميًا باستخدام وحدة معالجة رسوميات واحدة، الأمر الذي يجعله أداة قوية لدعم وتطوير نماذج الذكاء الاصطناعي الأخرى.
هذا الابتكار يفتح آفاقًا واسعة لتطبيقات عملية في قطاعات حيوية مثل التمويل والبحث العلمي، حيث يستطيع النظام تحليل التقارير المالية المعقدة، والأوراق البحثية المليئة بالمعادلات والرسوم البيانية بسهولة وفعالية.