دليل مواقع وأدوات و تطبيقات الذكاء الاصطناعي

نموذج LLaVA v1.5 7B من Groq | مقارنة مع GPT-4 و كيفية الاستخدام

كشفت شركة Groq عن إطلاق نموذجها المبتكر LLaVA V1.5 7B عبر منصة GroqCloud.

هذا النموذج يُعتبر إضافة قوية في مجال الذكاء الاصطناعي متعدد الوسائط، حيث يجمع بين معالجة الصور، الصوت، والنصوص في منصة واحدة.

في هذا المقال، سنتعرف أكثر على هذا الإصدار الجديد، و مميزاته، ثم سنتطرق إلى كيفية الوصول و الاستخدام.

ما هو LLaVA V1.5 7B؟

LLaVA هو اختصار لـ Large Language and Vision Assistant، وهو نموذج متعدد الوسائط يجمع بين الرؤية الحاسوبية ومعالجة اللغة الطبيعية.

تعرف أكثر على شرح مفاهيم الذكاء الاصطناعي ببساطة.

تم بناء هذا النموذج على تقنية CLIP من OpenAI ونموذج Llama 2 7B من Meta.

و يستخدم النموذج أسلوب "التعليم البصري" لتحسين قدرته على التعامل مع التعليمات القائمة على الصور والقيام بمهام مثل:

  • الإجابة على الأسئلة البصرية: حيث يجيب على أسئلة اعتمادًا على محتوى الصور.
  • توليد التسميات التوضيحية: يمكنك رفع الصورة إليه و سيقوم بتوليد نصوص تصف الصور بشكل دقيق.
  • التعرف على النصوص من الصور: استخراج النصوص من الصور (OCR).
  • الحوار متعدد الوسائط: إجراء محادثات تجمع بين النصوص والصور.
واجهة نموذج LLaVA v1.5 7B على GroqCloud™ Developer Console، مع تجربة استخدام برفع صورة و سؤاله عن محتواها.
واجهة نموذج LLaVA v1.5 7B، مع تجربة رفع صورة و سؤاله عن محتواها

هل يتفوق إصدار Groq الجديد على GPT-4؟

تم تدريب النموذج في سبتمبر 2023 وحقق أداءً متميزًا على سبعة معايير، من بينها خمسة اختبارات أكاديمية متعلقة بالإجابة على الأسئلة البصرية (VQA).

و هذا يدل على قدرة النموذج في فهم وتوليد النصوص بناءً على المدخلات البصرية.

و السؤال هو ما مدى تميز النموذج و هل يتفوق على النماذج الاخرى مثل GPT-4؟

يجيب عن هذا السؤال حساب موقع "Artificial Analysis" عبر منصة X و المتخصص في تحليل نماذج الذكاء الاصطناعي.

حيث يؤكد تفوق نموذج Groq بسرعة تتجاوز 4 أضعاف سرعة GPT-4 في التعامل مع الاستفسارات.

و كانت Groq قد أعلنت مؤخرًا عن شراكتها مع Meta لتوفير أحدث نماذج Llama 3.1، بما في ذلك 405B Instruct و 70B Instruct و 8B Instruct.

تعرف أكثر على: إعلان شركة Groq عن توافر الإصدار الأحدث Llama-3.1 405B، و ميزة التحدث الصوتي مجانًا.

و يأتي هذا التعاون ليفتح الباب أمام المجتمع لاختبار النماذج على منصة GroqCloud بسرعة وكفاءة عاليتين.

 

كيف تبدأ مع LLaVA V1.5 7B على GroqCloud؟

إذا كنت مطورًا أو تدير شركة تعتمد على الذكاء الاصطناعي أو لديك فضول بالتجربة، فإن هذا الإصدار متاح الآن في وضع المعاينة (Preview Mode) عبر منصة GroqCloud Developer Console.

لذا يمكنك البدء في بناء تطبيقات تعتمد على المدخلات متعددة الوسائط بسرعة فائقة من خلال دمج الصور والنصوص والأصوات.

Khaled B.

خبير في الذكاء الاصطناعي يتمتع بخبرة واسعة في تطوير وتنفيذ حلول متقدمة باستخدام أحدث تقنياته. مُتخصص في توظيف هذه الإمكانيات لتحسين الأعمال وتحقيق الأرباح من خلال الابتكار التكنولوجي. لديه شغف لإيجاد استراتيجيات وحلول مبتكرة تساعد الشركات والأفراد على تحقيق أهدافهم من خلال تسخير هذه التكنولوجيا.

Related Posts

كل ما تحتاج معرفته عن نماذج OpenAI الثورية o1-preview و mini

في عالم الذكاء الاصطناعي، كل تحديث أو نموذج جديد يجلب معه تحولًا كبيرًا في القدرات والاحتمالات. في الأشهر الـ 18 الماضية، أثار إصدار نموذج GPT-4 من OpenAI ضجة كبيرة، حيث…

إطلاق Reflection 70B | نموذج ذكاء اصطناعي يثير الجدل والاتهامات

خلال الأسبوع الأول من سبتمبر 2024، تم الإعلان عن إطلاق نموذج ذكاء اصطناعي جديد من HyperWrite، يدعى Reflection 70B، والذي وُصف بأنه أقوى نموذج مفتوح المصدر في العالم. ورغم التوقعات…

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

You Missed

توليد و استنساخ أصوات بالعربيةمجانًا مع Fish audio

  • سبتمبر 16, 2024
توليد و استنساخ أصوات بالعربيةمجانًا مع Fish audio

اكتشف أداة Audio Overview من جوجل لتحويل النصوص إلى محادثات صوتية

  • سبتمبر 14, 2024
اكتشف أداة Audio Overview من جوجل لتحويل النصوص إلى محادثات صوتية

إطلاق قسم أدوات الذكاء الاصطناعي في Arab AI للمستخدمين مجانًا

  • سبتمبر 14, 2024
إطلاق قسم أدوات الذكاء الاصطناعي في Arab AI  للمستخدمين مجانًا

كل ما تحتاج معرفته عن نماذج OpenAI الثورية o1-preview و mini

  • سبتمبر 13, 2024
كل ما تحتاج معرفته عن نماذج OpenAI الثورية o1-preview و mini

إطلاق Reflection 70B | نموذج ذكاء اصطناعي يثير الجدل والاتهامات

  • سبتمبر 12, 2024
إطلاق Reflection 70B | نموذج ذكاء اصطناعي يثير الجدل والاتهامات

إطلاق Pixtral 12B: أول نموذج متعدد الوسائط من Mistral AI

  • سبتمبر 12, 2024
إطلاق Pixtral 12B: أول نموذج متعدد الوسائط من Mistral AI

DeepSeek-V2.5: هل هو مستقبل الذكاء الاصطناعي المفتوح المصدر؟

  • سبتمبر 11, 2024
DeepSeek-V2.5: هل هو مستقبل الذكاء الاصطناعي المفتوح المصدر؟

أوبن إيه آي تخطط لإطلاق نموذج Strawberry الجديد خلال أسبوعين

  • سبتمبر 11, 2024
أوبن إيه آي تخطط لإطلاق نموذج Strawberry الجديد خلال أسبوعين

سياسات محتوى الذكاء الاصطناعي باليوتيوب و أدوات جديدة لحماية المبدعين

  • سبتمبر 8, 2024
سياسات محتوى الذكاء الاصطناعي باليوتيوب و أدوات جديدة لحماية المبدعين