دليل مواقع وأدوات و تطبيقات الذكاء الاصطناعي

تحويل الكتابة اليدوية إلى نص رقمي باستخدام تقنية InkSight من جوجل

كشفت جوجل عن تقنية تعتمد على الذكاء الاصطناعي لتحويل الكتابة اليدوية إلى نص رقمي، تحت اسم "InkSight".

ببساطة، التقط صورة لكتاباتك، وسيقوم النموذج بفهم الكلمات وإعادة إنشائها رقمياً، مع محاكاة أسلوب خط يدك، بدلاً من مجرد استخراجها كصورة.

نص رقمي باستخدام InkSight من جوجل
مثال في هاجنج فيس

كيف يعمل InkSight؟ وما الفارق بينه وبين الطرق التقليدية

الفارق الأساسي بين InkSight والتقنيات القديمة مثل OCR هو أن التقنية الأولى تُحاكي أسلوب الكتابة اليدوية الفعلي-من خلال عملية تعرف باسم derendering- عن طريق تحليل الضربات بشكل تسلسلي لإعادة بناء النص، وليس فقط قراءة الأحرف كصورة ثابتة كما يحدث بال OCR الذي فقط يتعرف على الكلام المكتوب وينقله لنا كقالب ثابت.

وبخلاف التقنيات التقليدية، تم تدريب الأداة لتتعرف على النصوص المكتوبة يدوياً بمرونة عالية، بحيث يمكنه التعامل مع ظروف تصوير مختلفة، مثل الإضاءة غير المثالية أو وجود عناصر غير مرغوب فيها في الصورة.

وهذا يمنح المستخدمين تجربة أقرب للكتابة الأصلية، إذ تقدم الأداة بإعادة تمثيل أسلوب الكتابة نفسه بتفاصيله.

وإليك هذا المثال الذي تم توضيحه في صفحة نموذج InkSight على هاجنج فيس.

نص مكتوب يدويًا قبل تحويله إلى نص رقمي
صورة لكتابة يدويًة تم تحويلها إلى كتابة حبر رقمية ياستخدام InkSight

ويقدم هذا النموذج حلاً عملياً للعديد من المستخدمين، خاصة في مجالات تتطلب توثيقاً دقيقاً للنصوص اليدوية مثل الأبحاث الأكاديمية، وتوثيق الملاحظات في الميدان.

كما يمكن للأكاديميين والعلماء الذين يعتمدون على الكتابة اليدوية الاحتفاظ بملاحظاتهم الشخصية وتحريرها بسهولة دون الحاجة إلى معدات متقدمة.

دور الذكاء الاصطناعي في تحويل الكتابة اليدوية إلى حبر رقمي

أوضحت جوجل في مدونتها أن تطوير نموذج قادر على "قراءة وكتابة" النصوص المكتوبة بخط اليد يدوياً تطلب التغلب على عقبات كبيرة، منها قلة البيانات المتاحة لتدريب النموذج، وضرورة معالجة الصور ذات الأحجام الكبيرة دون التأثير على الأداء

وللتغلب على ذلك، اعتمدت الشركة على نموذج يجمع بين عدة مهام، مثل التعرف على الكلمات وتحويل كل كلمة إلى مسار رقمي مشابه لحركة القلم. وهذا ساعد في تحسين أداء النموذج وتقليل حاجته إلى بيانات تدريب مزدوجة.

بناءً على نتائج جوجل، أظهرت النماذج المدربة دقة عالية في محاولة مطابقة النصوص المكتوبة بخط اليد للكتابة الرقمية، حيث حقق النموذج الأكبر نسبة نجاح 87% في إنتاج نص رقمي يشبه الكتابة اليدوية الأصلية.

وهذه النتائج خطوة نحو سد الفجوة بين العالمين الورقي والرقمي دون الحاجة إلى معدات خاصة.

بالختام. فإن Inksight تسعى إلى توفير حلًّا مميّزًا للاحتفاظ بخطوط كتاباتنا في أشكال رقمية مماثلة. ونحن نتطلع دائمًا إلى المزيد من هذه التطورات التي تساعدنا في الدمج بين الكتابة التقليدية والتكنولوجيا الحديثة.

Khaled B.

خبير في الذكاء الاصطناعي يتمتع بخبرة واسعة في تطوير وتنفيذ حلول متقدمة باستخدام أحدث تقنياته. مُتخصص في توظيف هذه الإمكانيات لتحسين الأعمال وتحقيق الأرباح من خلال الابتكار التكنولوجي. لديه شغف لإيجاد استراتيجيات وحلول مبتكرة تساعد الشركات والأفراد على تحقيق أهدافهم من خلال تسخير هذه التكنولوجيا.

Related Posts

DimensionX لتحويل الصور إلى مشاهد ثلاثية ورباعية الأبعاد مجانًا

كثيرًا ما نبحث عن طرق لتحويل صورنا إلى مشاهد حركية تبدو واقعية. وفي هذا الاطار…

اقرأ المزيد

GenChess من جوجل: صمم قطع الشطرنج باستخدام Imagen 3

طرحت شركة جوجل تجربة جديدة باسم “GenChess” التي تسمح للمستخدمين بتصميم قطع شطرنج فريدة باستخدام…

اقرأ المزيد

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

مقالات قد تهمك

Bagoodex: محرك بحث مجاني يغنيك عن جوجل مع أدوات صور وإنتاجية

    Bagoodex: محرك بحث مجاني يغنيك عن جوجل مع أدوات صور وإنتاجية

    Hugging Face تحذر من مخاطر استخدام النماذج الصينية

      Hugging Face تحذر من مخاطر استخدام النماذج الصينية

      DimensionX لتحويل الصور إلى مشاهد ثلاثية ورباعية الأبعاد مجانًا

        DimensionX لتحويل الصور إلى مشاهد ثلاثية ورباعية الأبعاد مجانًا

        MyTimeMachine: التنبؤ بمظهرك في أعمار مختلفة بدقة عالية

          MyTimeMachine:  التنبؤ بمظهرك في أعمار مختلفة بدقة عالية

          ماسك يسعى قضائيًا لإيقاف تحول OpenAI إلى كيان ربحي

            ماسك يسعى قضائيًا لإيقاف تحول OpenAI إلى كيان ربحي