
أعلنت شركة "كوهير" المتخصصة في تقنيات الذكاء الاصطناعي عن إطلاق نموذجها الجديد "Embed 4"، المصمم لتحسين عمليات البحث داخل المؤسسات عبر تحليل البيانات النصية والمرئية معًا.
ويتميز النموذج بمعالجة مستندات تصل إلى 200 صفحة، مع قدرة على فهم وتحليل سياق واسع جدًا من المعلومات يصل إلى ما يعادل 128 ألف وحدة نصية في المرة الواحدة.
وبذلك يبرز كحل مناسب للشركات التي تتعامل مع كميات كبيرة من المعلومات غير المنظمة (مثل المستندات النصية، رسائل البريد الإلكتروني، الصور، ومقاطع الفيديو).
تم تصميم هذا الإصدار خصيصًا للقطاعات التي تتطلب سرية عالية وتلتزم بقوانين صارمة مثل الرعاية الصحية والتمويل، حيث يوفر دقة عالية في استخراج البيانات من المستندات المعقدة كالتقارير الطبية والعقود القانونية.
وعلى عكس النماذج السابقة، يتفادى "Embed 4" الحاجة إلى عمليات معالجة مسبقة للبيانات مثل إعادة تنسيقها قبل تحليلها. وذلك حتى مع وجود أخطاء إملائية أو تنسيق غير منتظم، وفقًا لتصريحات الشركة.
وأشارت تجارب أحد العملاء، مثل منصة "أجورا" للتجارة الإلكترونية، إلى تحسن ملحوظ في دقة نتائج البحث بنسبة 47% مقارنة بالإصدارات السابقة.
ويرى فريق عمل المنصة أن سبب هذا التحسن هو قدرة النموذج على دمج أوصاف المنتجات المكتوبة والمرئية في صيغة رقمية موحدة يفهمها النظام، وبالتالي تسريع عمليات البحث وتقليل التكاليف التشغيلية.
من ناحية أخرى، يركز النموذج على ضغط البيانات المُستخرجة لتقليل تكاليف التخزين بنسبة تصل إلى 83%، مع الحفاظ على جودة النتائج.
وتعتبر هذه الميزة أساسية للشركات الكبرى التي تعتمد على أنظمة الذكاء الاصطناعي في إدارة مهام مثل تحليل التقارير المالية أو دعم قرارات الاستثمار.
كما يدعم "Embed 4" أكثر من 100 لغة، بما في ذلك العربية واليابانية والكورية، وهو ما يسهل على المؤسسات العالمية البحث عبر مستندات متعددة اللغات دون عوائق.
بالإضافة إلى ذلك، يتكامل النموذج مع منصات مثل "Microsoft Azure" و"Amazon SageMaker". ويتم توفير خيارات لتثبيت وتشغيل النموذج تناسب متطلبات الأمان العالية، سواء بتخزين البيانات داخل الشركة (محليًا) أو على خوادم سحابية خاصة.
على جانب آخر، يأتي هذا التطور ليدعم تقنية هامة في الذكاء الاصطناعي تُعرف باسم 'التوليد المعزز بالاسترجاع' (RAG)."
هذه التقنية تساعد أنظمة الذكاء الاصطناعي (مثل روبوتات الدردشة المتقدمة) على البحث عن أدق المعلومات وأحدثها ضمن بيانات المؤسسة لتقديم إجابات أفضل وأكثر موثوقية، بدلاً من الاعتماد فقط على معرفتها المخزنة مسبقًا.
ومع تزايد الاعتماد على الأنظمة الآلية في الأعمال، من المتوقع أن تلعب نماذج مثل "Embed 4" دورًا محوريًا في تحويل الكم الهائل من البيانات التي كان يصعب البحث فيها سابقًا إلى معلومات قيمة يمكن للشركات الاستفادة منها بسهولة.