شهد الأسبوع الثاني من يناير أحداثًا متنوعة في مجال الذكاء الاصطناعي.
فمن إثارة الجدل إلى إطلاق نماذج وأدوات جديدة، يعكس هذا قوة التنافس بين الشركات الذي يزداد يوما بعد يوم في هذا المجال. والنتيجة في النهاية تصب في مصلحة المستخدم.
لنستكشف سويًا أبرز الأحداث التي جرت الأيام الماضية.
مسؤولو Meta AI مهووسون بالتغلب على GPT-4
وفقًا لوثائق قضائية حديثة، ظهر التنافس الشديد داخل شركة "ميتا" في محاولتها التفوق على النماذج المتقدمة للذكاء الاصطناعي مثل "GPT-4" الخاص بـ"OpenAI".
وكشفت رسائل داخلية عن سعي الشركة لتحقيق هذا الهدف أثناء تطوير نموذج "Llama 3"، حيث وصف أحمد الضاحلي -نائب رئيس قسم الذكاء الاصطناعي التوليدي في ميتا- النموذج المنافس بأنه المعيار الذي يجب تجاوزه.
وقد واجهت الشركة ضغوطًا كبيرة لتسريع تطوير نماذجها، حتى أنها ناقشت استخدام بيانات محمية بحقوق الطبع لتحسين نتائجها، وهو ما أثار جدلًا قانونيًا واسعًا.
وعبّر الرئيس التنفيذي، مارك زوكربيرغ، عن ثقته في تفوق "Llama 3" على نماذج مغلقة من منافسين مثل "Anthropic" و"Google"
Luma AI تطلق نموذج توليد الفيديو بالذكاء الاصطناعي Ray2
كشفت شركة Luma AI (المعروفة أيضًا ب Luma Labs) عن نموذجها الجديد Ray2 لتوليد الفيديوهات عبر منصة Dream Machine.
يأتي هذا الإطلاق في وقت يشهد فيه المجال تطورات سريعة خلال الأشهر القليلة الماضية، مع ظهور نماذج أخرى مثل Runway وKling وSora من OpenAI وVeo2 من Google.
ويتميز نموذج Ray2 بقوة معالجة أكبر بعشر مرات من سابقه Ray1، وفقًا لما صرّح به أميت جاين، المؤسس المشارك والرئيس التنفيذي لشركة Luma AI.
وأضاف أن هذا النموذج يقدم حركات طبيعية وسلسة بمعدل نجاح مرتفع في إنتاج فيديوهات جاهزة للاستخدام الاحترافي.
ورغم إشادة المستخدمين بجودة الإضاءة والواقعية، إلا أن بعض الطلبات المعقدة قد تنتج نتائج غير متوقعة.
ويتوفر Ray2 حاليًا للمشتركين المدفوعين، مع خطط لإضافة ميزات جديدة قريبًا.
وللاحتفال بالإطلاق، أقامت الشركة مسابقة بجوائز تصل إلى 7,000 دولار، إلى جانب برنامج تسويق بالعمولة لتشجيع المبدعين.
Grok متاحًا عبر الويب بدون حساب على X
أعلنت شركة xAI التابعة لإيلون ماسك عن إطلاق النسخة الويب من روبوت المحادثة الذكي Grok،
ويمكن للمستخدمين الوصول إلى ميزاته المتقدمة دون الحاجة إلى امتلاك حساب على منصة X، وذلك من خلال زيارة موقع grok.com والتفاعل مع الروبوت ببساطة عبر إدخال سنة الميلاد.
يرجى العلم أنه عند الوصول للموقع قد تجد كلمة "Coming Soon"، حيث ما زالت هذه الخدمة غير متوفرة للجميع، ومن المنتظر أن تصبح متاحة في جميع المناطق خلال وقت قريب.
ويوفر Grok إمكانيات متعددة مثل الإجابة عن الأسئلة وجمع المعلومات في الوقت الفعلي، بالإضافة إلى توليد الصور. كما يتيح خيار "الوضع المؤقت" لضمان خصوصية المحادثات ومنع استخدامها في تدريب النموذج.
وكانت xAI قد أعلنت الشهر الماضي عن إتاحة Grok مجانًا لجميع مستخدمي منصة X، حيث يمكنك استخدامه مباشرة إن كان لديك حساب على المنصة.
تحديثات شركة Minimax
أطلقت شركة Minimax الصينية مؤخرًا مجموعة من الابتكارات في مجال الذكاء الاصطناعي، بما في ذلك ميزة "Subject Reference" الجديدة ضمن منصة Hailuo Video، التي تسمح بإنشاء مقاطع فيديو بدقة عالية باستخدام صورة واحدة فقط.
وتضمن هذه التقنية استمرارية ملامح الشخصيات مهما تغيرت الزوايا أو حركة الكاميرا، مما يعزز من مرونة المشاهد وجودتها.
كما طرحت الشركة أيضًا سلسلة النماذج المفتوحة المصدر MiniMax-01، التي تشمل نماذج متقدمة مثل MiniMax-Text-01 وMiniMax-VL-01، والتي تحقق تقدمًا كبيرًا في معالجة السياقات الطويلة والنصوص متعددة الوسائط.
مع هذه الابتكارات، تواصل Minimax توسيع حضورها في سوق الذكاء الاصطناعي، مع تقديم حلول متميزة تسهم في تطور تكنولوجيا الفيديو والنماذج اللغوية المفتوحة المصدر.
ميزة "المهام" في ChatGPT
أعلنت شركة "OpenAI" عن ميزة جديدة داخل منصة ChatGPT تسمح بتحديد تذكيرات مجدولة أو طلبات متكررة.
وبدأت هذه الخاصية المعروفة باسم "المهام - Tasks" بالانتشار تدريجيًا للمستخدمين من خطط Plus وTeam وPro حول العالم.
ومن خلال هذه الميزة، يمكن للمستخدمين إنشاء تذكيرات بسيطة مثل معرفة موعد انتهاء صلاحية جواز السفر أو الحصول على تحديثات يومية مثل نشرات الأخبار أو خطط عطلة نهاية الأسبوع بناءً على الموقع وحالة الطقس.
o1 يفكر بلغات متعددة حتى لو كان سؤالًا بالانجليزية
ومازال الحديث عن OpenAI مستمرًا، وهذه المرة مع نموذج التفكير o1 الخاص بالشركة.
حيث أثار o1 الجدل هذا الأسبوع عندما لوحظ أنه يقوم أحيانًا بالتفكير بلغات مختلفة مثل الصينية أو الفارسية، رغم أن السؤال قد طُرح عليه باللغة الإنجليزية.
وهذا السلوك الغريب دفع البعض للتساؤل عن سبب ذلك، خاصة أن النموذج يستخدم خطوات متعددة للوصول إلى استنتاجاته.
تفاعل بصوتك مع الذكاء الاصطناعي في NotebookLM
أضافت Google ميزة جديدة لأداة توليد البودكاست بالذكاء الاصطناعي "Audio Overview" داخل تطبيقها NotebookLM.
حيث أصبح بإمكان المستخدمين التفاعل مع المضيف الصوتي للبودكاست، وطرح أسئلة والحصول على إجابات مخصصة أثناء الاستماع إلى التلخيصات الصوتية
ولاستخدامها، يجب على المستخدمين أولاً إنشاء ملخص صوتي جديد، ثم تفعيل وضع "التفاعل" (بيتا)، والضغط على زر "الانضمام" لطرح الأسئلة، حيث سيرد المضيف بناءً على الأسئلة المطروحة.
الميزة حالياً في مرحلة تجريبية ومتاحة فقط للملخصات الصوتية الجديدة، مع تنبيه من Google بأن الإجابات قد تتأخر أو تكون غير دقيقة أحيانًا.
الجدير بالذكر أن أداة إنشاء البودكاست حققت شعبية كبيرة منذ إطلاقها في سبتمبر الماضي، حيث أنتج المستخدمون أكثر من 350 سنة من محتوى التلخيص الصوتي منذ إطلاقها في سبتمبر.
LlamaV-o1: إنجاز عربي في الذكاء الاصطناعي
طور باحثون في جامعة محمد بن زايد نموذج LlamaV-o1، الذي يقدم تحليلاً خطوة بخطوة لحل المشكلات المعقدة في مجالات مثل الطب والتمويل.
ويتميز النموذج باستخدام تقنيات مثل التعلم المنهجي وBeam Search لتحسين الأداء، مما يسمح بتقديم تفسيرات واضحة للقرارات المتخذة.
وتفوق LlamaV-o1 في التقييمات، محققًا نتائج أعلى من نماذج أخرى مثل Llava-CoT وClaude 3.5-Sonnet في اختبارات متعددة. كما يوفر النموذج كفاءة عالية في الحسابات مع سرعة أكبر من منافسيه، مما يجعله خيارًا مثاليًا للشركات التي تتطلب حلولًا دقيقة وسريعة.
تسابق الشركات على شراء المحتوى غير المستخدم
تم الكشف مؤخرًا عن أن شركات الذكاء الاصطناعي مثل OpenAI وGoogle تعرض شراء مقاطع فيديو غير منشورة من صناع المحتوى، وذلك مقابل 1 إلى 2 دولار لكل دقيقة.
ويتم التركيز على الفيديوهات التي لم تُنشر بعد على منصات مثل يوتيوب وإنستجرام. ويرتفع السعر إذا كانت الفيديوهات بجودة عالية، مثل 4K أو لقطات بالطائرات الدرون.
ويعتبر هذا الأمر فرصة لصناع المحتوى لكسب المال من فيديوهاتهم التي لم يتم نشرها أبداً، مما يساعدهم على تعويض تكاليف الإنتاج.
Sky-T1: نموذج بتكلفة تدريب منخفضة ينافس o1
أطلق فرق NovaSky في جامعة كاليفورنيا نموذج Sky-T1-32B-Preview.
ويتميز النموذج بكفاءة عالية في اختبارات الأداء الرئيسية بتكلفة تدريب منخفضة جدًا، لا تتجاوز 450 دولارًا.
ويعد Sky-T1-32B-Preview أول نموذج استدلال مفتوح المصدر بالكامل، حيث أتاح الفريق مجموعة البيانات وكود التدريب بشكل علني، مما يسمح بتكرار النموذج من الصفر.
وعلى عكس النماذج السابقة التي كانت تكلفة تدريبها تصل إلى ملايين الدولارات، تم تقليل التكاليف بفضل استخدام البيانات الاصطناعية.
ورغم أن Sky-T1 تفوق على بعض النسخ الأولية لنموذج OpenAI o1 في اختبارات الرياضيات والبرمجة، إلا أنه لم يتفوق في جميع المجالات مثل الأسئلة العلمية.
Transformer²: نظام يتكيف على المهام الجديدة بطريقة رائعة
قدّمت شركة Sakana AI تقنية جديدة تُعرف باسم Transformer²، وهي نظام ذكاء اصطناعي قادر على التكيف مع أي مهمة يُطلب منه القيام بها.
ويعتمد هذا النظام على فكرة بسيطة لكنها قوية: عندما يُطلب من النظام تنفيذ مهمة معينة، مثل كتابة الأكواد أو حل مسائل رياضية، فإنه يبدأ بتحليل المهمة لفهم احتياجاتها.
وبعد ذلك، يقوم بتعديل طريقة عمله ليُحقق أفضل النتائج الممكنة.
الميزة الأبرز في هذا النظام أنه يتعلّم بطريقة مشابة للطريقة التي يعمل بها العقل البشري. فهو يستطيع تقسيم العمل إلى أجزاء صغيرة، والتركيز على الأجزاء الأكثر أهمية لكل مهمة.
فعلى سبيل المثال، إذا كانت المهمة تتعلق بالرياضيات، فإنه يعطي الأولوية للأجزاء المتعلقة بهذه المهارة، بينما يهتم بجوانب أخرى إذا كانت المهمة تتطلب فهم النصوص أو البرمجة.
وأظهرت التجارب أن Transformer² يتفوق على الأنظمة التقليدية لأنه يمكنه تعديل نفسه للتعامل مع أي مهمة جديدة، دون الحاجة إلى إعادة تدريبه من البداية.
Codestral 25.01: كفاءة عالية في البرمجة
أطلقت شركة Mistral AI نموذجها الجديد Codestral 25.01 لتحسين تجربة كتابة ومعالجة الأكواد البرمجية.
يدعم النموذج أكثر من 80 لغة برمجة، ويتميز بسرعة مضاعفة مقارنة بالإصدارات السابقة بفضل تحسينات معمارية وتقنية.
بالإضافة إلى ذلك، يوفر ميزات مثل إكمال الأكواد، تصحيح الأخطاء، توليد الاختبارات البرمجية، وملء الفراغات البرمجية بدقة عالية. وأظهرت اختبارات الأداء تفوقه في السرعة والدقة مقارنة بنماذج أخرى.
ويتوافر Codestral 25.01 حاليًا عبر منصات مثل Google Vertex AI وAzure AI Foundry، مع إمكانية تجربته مجانًا من خلال إضافات VS Code وJetBrains.