
أطلقت شركة "Hugging Face" أداة جديدة تعتمد على الذكاء الاصطناعي وتعمل عبر السحابة، تحمل اسم "Open Computer Agent"، وتتيح للمستخدمين تنفيذ مهام رقمية من خلال بيئة افتراضية تعتمد على نظام لينكس.
تمثل هذه الأداة -رغم بطئها أحيانًا ووقوعها في أخطاء- خطوة مهمة في عالم الأتمتة الذكية، إذ تُمكّن الذكاء الاصطناعي من التفاعل مع جهاز كمبيوتر بطريقة تشبه استخدام الإنسان له.
وتشبه فكرة الأداة إلى حد كبير أداة "Operator" التي طورتها OpenAI، حيث يمكن للمستخدم كتابة تعليمات نصية، ويتولى الوكيل تنفيذها داخل جهاز افتراضي كما لو كان مستخدمًا حقيقيًا.
على سبيل المثال، يمكنه فتح متصفح "Firefox"، الدخول إلى خرائط جوجل، والبحث عن عنوان معين. يعتمد في ذلك على قدرته على رؤية الشاشة والتفاعل معها بصريًا.
We're launching Computer Use in smolagents! 🥳
— m_ric (@AymericRoucher) May 6, 2025
-> As vision models become more capable, they become able to power complex agentic workflows. Especially Qwen-VL models, that support built-in grounding, i.e. ability to locate any element in an image by its coordinates, thus to… pic.twitter.com/mI8MuWZkIS
لكن قدراته ما زالت محدودة. فعند اختبار الأداة، تبيّن أنها تتعامل جيدًا مع المهام البسيطة، لكنها تتعثر عند التعامل مع المهام المعقدة أو الاستجابات التي تتطلب التفاعل مع اختبارات "كابتشا" التي تعيق أداءها بشكل كبير.
كما أن تشغيل الأداة يتطلب الانتظار في طابور رقمي قد يستغرق بضع ثوانٍ أو دقائق، حسب الضغط على الخوادم.
من جهة أخرى، لم يكن الهدف من تطوير هذه الأداة إطلاق منتج نهائي متكامل، بل تقديم عرض عملي يُظهر التقدم السريع الذي تحققه النماذج المفتوحة المصدر في مجال الذكاء الاصطناعي.
وبحسب "إيمريك روشير"، أحد أعضاء فريق الوكلاء في "هاجينج فيس"، فإن الأداة تستفيد من نماذج رؤية قادرة على تحديد أي عنصر على الشاشة باستخدام الإحداثيات، ما يسمح لها بالنقر والتفاعل المباشر مع العناصر المرئية داخل الجهاز الافتراضي.
ورغم التحديات التقنية، إلا أن الاهتمام بتقنيات "الذكاء الاصطناعي الوكيلي" يتزايد بشكل لافت.
وتشير بيانات صادرة عن "KPMG" إلى أن 65٪ من الشركات بدأت بالفعل في تجربة هذا النوع من الوكلاء الذكيين لتحسين الإنتاجية وأداء المهام المتكررة.
وتوقعت دراسة من "Markets and Markets" أن ينمو هذا القطاع من 7.84 مليار دولار في عام 2025 إلى أكثر من 52 مليار دولار بحلول عام 2030، وهو ما يعكس إيمانًا واسعًا بإمكاناته المستقبلية.
كما يعكس إطلاق "Open Computer Agent" أيضًا تحوّلًا واضحًا في طريقة تفاعل الذكاء الاصطناعي مع العالم الرقمي، ويمثل تجربة واعدة في مسار تطوير أدوات مفتوحة المصدر قادرة على تنفيذ مهام حقيقية في بيئة رقمية.
ومع استمرار تطور نماذج الرؤية ورفع كفاءة البنية التحتية، من المتوقع أن تتحسن هذه الوكلاء وتصبح أكثر موثوقية واعتمادًا في المستقبل.