في خطوةٍ كان الجميعُ ينتظرُها، قامت شركةُ xAI، التي أسّسها إيلون ماسك، بإطلاقِ النسخةِ التجريبيةِ من نموذجِ الذكاءِ الاصطناعيِّ الجديدِ Grok-2 للدردشةِ و توليدِ الصور، والذي يُمثّلُ تقدُّمًا كبيرًا مُقارنةً بالإصدارِ السابقِ Grok 1.5.
وقد وصفت شركةُ xAI هذا الإصدارَ عبرَ صفحةِ النموذجِ على موقعِهم الرسميِّ بأنّه "خطوةٌ كبيرةٌ إلى الأمامِ".
وبالإضافةِ إلى Grok-2، أعلنتِ الشركةُ عن إطلاقِ Grok-2 mini، وهو نسخةٌ مُصغّرةٌ لكنْ ذاتُ إمكانياتٍ قويةٍ.
يأتي هذا التطويرُ في وقتٍ حرجٍ يَشهَدُ فيه سوقُ الذكاءِ الاصطناعيِّ تنافسًا شديدًا بينَ عُملاقةِ التكنولوجيا، مثلِ OpenAI و Google. فالكلُّ أصبحَ يَسعى إلى الريادةِ في هذا السوقِ الذي نَتَوَقّعُ أن يُشَكِّلَ مُستقبلَنا جميعًا.
ولكن ما يُميّزُ Grok-2 عن مُنافسيهِ هو الحُرّيةُ الأكبرُ التي يُتيحُها في توليدِ الصور، بما في ذلكَ الصورُ التي تَتَناولُ شخصياتٍ سياسيةٍ وعلاماتٍ تجاريةٍ محميةٍ بحقوقِ الطبعِ والنشر مما أثار جدلا واسعًا. وهو ما سنتحدثُ عنه لاحقًا في هذهِ المقالةِ.
بالإضافةِ إلى تفوّقِ هذا النموذجِ على النماذجِ الشهيرةِ وهو ما سنُوضّحُهُ أيضًا بالتفصيلِ.
ولكنْ أوّلًا علينا معرفةُ ما الجديدُ في هذا النموذجِ -والذي يُعتَبرُ الإصدارَ الثاني- عن سابقهِ.
ما الجديد في Grok-2 عن سابقه؟ أداء النموذج في المهام المختلفة
يُمثّلُ Grok-2 تطورًا كبيرًا مُقارنةً بنموذجِ Grok-1.5 السابقِ.
فقد خضعت نماذجُ Grok-2 و Grok-2 mini لتقييمٍ شاملٍ عبرَ معاييرَ أكاديميةٍ مُتعددةٍ مثلِ reasoning وفهمِ النصوصِ والرياضياتِ والعلومِ والبرمجةِ.
أظهرت هذهِ النماذجُ تحسيناتٍ ملحوظةٍ مُقارنةً بنموذجِ Grok-1.5، مُحققةً مُستوياتِ أداءٍ تُنافسُ النماذجَ الرائدةَ في مجالاتٍ مثلِ المعرفةِ العلميةِ (GPQA)، المعرفةِ العامةِ (MMLU)، ومشاكلِ المُسابقاتِ الرياضيةِ (MATH).
علاوةً على ذلك، تميّزَ هذا النموذجُ التجريبيُّ في المهامِّ القائمةِ على الرؤيةِ، مع تقديمِ أداءٍ مُتميّزٍ في reasoning الرياضيِّ البصريِّ (MathVista) والإجابةِ على الأسئلةِ القائمةِ على الوثائقِ (DocVQA).
ببساطةٍ ولتلخيصِ هذا الأمرِ، بمُقارنتهِ بالإصدارِ السابقِ، فإنَّ Grok-2 أكثرُ سهولةٍ في الاستخدامِ، وقابليةٍ للتوجيهِ، مُتعددُ الاستخداماتِ في مجموعةٍ واسعةٍ من المهامِّ، سواءٌ كُنتَ تبحثُ عن إجاباتٍ، أو تُتعاونُ في الكتابةِ، أو تحُلُّ مهامَّ البرمجةِ.
فهل هذا الأداءُ الذي يتميّزُ بهِ النموذجُ الجديدُ كافٍ للتفوّقِ على نماذجِ الذكاءِ الاصطناعيِّ المعروفةِ؟
هذا ما سنتحدثُ عنهُ بالفقرةِ التاليةِ.
مقارنة Grok-2 beta مع نماذج الذكاء الاصطناعي الأخرى
يتمتّعُ Grok-2 بقدراتٍ مُتقدمةٍ في الدردشةِ والبرمجةِ (reasoning)، مع أداءٍ يتفوّقُ على كُلٍّ من Claude 3.5 Sonnet و GPT-4-Turbo وفقًا لمؤشرِ LMSYS.
حيثُ تمَّ اختبارُ إصدارٍ مُبكرٍ من هذهِ النسخةِ الجديدةِ تحتَ اسمِ "sus-column-r" وأثبتَ تفوّقَهُ في قائمةِ تصنيفِ LMSYS، ما يعكسُ تقدُّمَهُ الكبيرَ في التّعاملِ معَ المحتوىِ وإعطاءِ المعلوماتِ الدقيقةِ.
و الآن بعد شرح هذا الإصدار التجريبي الرائع بشكل مفصل، نأتي إلى أحد أكبر مزايا النموذج التي أثارت الجدال في العالم مؤخرًا، و هي ميزة "توليد الصور"، دعونا نتعرف على هذا الموضوع الآن.
ميزة توليد الصور باستخدام Grok-2
كما أشرنا في مُقدّمةِ المقالِ عن وصفِ الشركةِ للنموذجِ بأنّه "خطوةٌ هامّةٌ إلى الأمامِ"، حيثُ يتميّزُ بإمكانياتِ توليدِ الصُّوَرِ بجودةٍ عاليةٍ وبحُرّيةٍ أكبرَ مُقارنةً بمُنافسيهِ مثلِ DALL-E و Stable Diffusion.
دعونا نُقسّمُ الجملةَ ونشرحُها لكي نفهمَها أكثرَ. ما سببُ الجودةِ العاليةِ؟ وما معنى "حُرّيةٍ أكبرَ"؟ وما سببُ الجدلِ في هذا؟
1. جودة صور Grok-2، و الشراكة مع black forest labs
في اعتقادي أنّ واحدةً من الأسبابِ القويةِ لجودةِ الصُّوَرِ العاليةِ التي يتمُّ إنشاؤُها بواسطةِ Grok-2 هي الشراكةُ التي كانت أعلنت عنها شركةُ xAI مع شركةِ Black Forest Labs.
هذهِ الشركةُ التي أذهلتنا جميعًا مُؤخّرًا بإصدارِها لنموذجِ إنشاءِ الصُّوَرِ Flux.1 الذي أصبحَ حديثَ الأوساطِ بسببِ ما يتميّزُ بهِ من جودةٍ عاليةٍ جدًا.
اقرأ بالتفصيلِ مقالتَنا عن نموذجِ توليدِ صُوَرِ الذكاءِ الاصطناعيِّ Flux.1.
وقد علّقت xAI عن هذهِ الشراكةِ مُوضّحةً أنّها تستهدفُ زيادةَ قدراتِ Grok-2 في توليدِ الصُّوَرِ.
2. الجدل حول الحرية الكبيرة للنموذج في إنشاء الصور
أثارَ إطلاقُ Grok-2 نقاشًا واسعًا حولَ الحُدودِ الأخلاقيةِ والقانونيةِ لتوليدِ الصُّوَرِ باستخدامِ الذكاءِ الاصطناعيِّ.
فبالمُقارنةِ مع مُنافسيهِ -كما وضحنا في بدايةِ المقالِ- فإنَّ هذا الإصدارَ يُقدّمُ حُرّيةً أكبرَ للمُستخدمينَ في توليدِ صُوَرٍ تَتَناولُ موضوعاتٍ حسّاسةٍ مثلَ الشخصياتِ السياسيةِ والعلاماتِ التجاريةِ المحميةِ بحقوقِ الطبعِ والنشرِ.
وبالرغمِ من أنّ النموذجَ يُقدّمُ إمكانياتٍ واسعةً لتوليدِ الصُّوَرِ بجودةٍ عاليةٍ كما بالفقرةِ السابقةِ، فإنّهُ لا يخلو من التحدّياتِ. ولذا من المُتوقّعِ أن يُواجهَ هذا النموذجُ تحدّياتٍ تتعلّقُ بالأمانِ والمساءلةِ.
فعلى سبيلِ المثالِ، إذا قامَ المُستخدمونَ بتوليدِ صُوَرٍ تُشوّهُ سُمعةَ شخصياتٍ مُعيّنةٍ أو تُستخدَمُ بشكلٍ غيرِ قانونيٍّ.
وأيضًا صُوَرًا تُظهِرُ شخصياتٍ سياسيةٍ بارزةٍ في أوضاعٍ مُثيرةٍ للجدلِ، مثلِ صورةِ دونالد ترامب وهو يحملُ سلاحينِ.
والسؤالُ هنا، من يتحمّلُ المسؤوليةَ في هذهِ الحالةِ؟ هل تقعُ المسؤوليةُ على المُستخدمينَ؟
فمن ضمن وجهات النظر ، يري البعض اعتبار هذه الخطوة بمثابة محاولة للتأكيد على حرية التعبير والابتكار في عالم الذكاء الاصطناعي.
حيث يرى ماسك ومؤيدوه أن فرض القيود الصارمة على توليد الصور يحول دون تحقيق إمكانيات الذكاء الاصطناعي الكاملة.
ولكن هذا التوجه قد يواجه تحديات قانونية تتعلق بانتهاك حقوق الطبع والنشر واستخدام صور الشخصيات العامة بطريقة قد تثير الجدل.
و بالحديث عن إيلون ماسك، فقد وصف نموذج "Grok" عبر حسابه الرسمي على منصة 𝕏 بأنه الأكثر متعة في العالم".
Grok is the most fun AI in the world! https://t.co/5ZS2iDkwim
— Elon Musk (@elonmusk) August 14, 2024
والآنَ لننتقلْ إلى السؤالِ الأخيرِ، كيفَ يُمكنُ استخدامُ النسخةِ التجريبيةِ من Grok-2 حاليًا؟
كيف يمكنك استخدام Grok-2 في الدردشة و إنشاء الصور؟
الإصدارُ التجريبيُّ من Grok-2 أصبحَ مُتاحًا بالفعلِ على منصةِ X لمُستخدمي 𝕏 Premium و Premium+.
يُوفّرُ هذا الإصدارُ تجربةً مُحسّنةً بفضلِ واجهةٍ جديدةٍ وميزاتٍ إضافيةٍ.
كما يتفوّقُ في فهمِ النصوصِ والرؤيةِ، ويُتيحُ الوصولَ إلى معلوماتٍ حقيقيةٍ في الوقتِ الفعليِّ عبرَ منصةِ 𝕏. كما تُوفّرُ النسخةُ الجديدةُ واجهةً أكثرَ بديهيةً وقابلةً للتوجيهِ، ممّا يُعزّزُ من قُدرتها على تقديمِ إجاباتٍ دقيقةٍ وحلولٍ فعّالةٍ لمهامٍ مُتعدّدةٍ مثلِ الكتابةِ وحلِّ المُشكلاتِ البرمجيةِ.