دليل مواقع وأدوات و تطبيقات الذكاء الاصطناعي

تحويل الكتابة اليدوية إلى نص رقمي باستخدام تقنية InkSight من جوجل

كشفت جوجل عن تقنية تعتمد على الذكاء الاصطناعي لتحويل الكتابة اليدوية إلى نص رقمي، تحت اسم "InkSight".

ببساطة، التقط صورة لكتاباتك، وسيقوم النموذج بفهم الكلمات وإعادة إنشائها رقمياً، مع محاكاة أسلوب خط يدك، بدلاً من مجرد استخراجها كصورة.

نص رقمي باستخدام InkSight من جوجل
مثال في هاجنج فيس

كيف يعمل InkSight؟ وما الفارق بينه وبين الطرق التقليدية

الفارق الأساسي بين InkSight والتقنيات القديمة مثل OCR هو أن التقنية الأولى تُحاكي أسلوب الكتابة اليدوية الفعلي-من خلال عملية تعرف باسم derendering- عن طريق تحليل الضربات بشكل تسلسلي لإعادة بناء النص، وليس فقط قراءة الأحرف كصورة ثابتة كما يحدث بال OCR الذي فقط يتعرف على الكلام المكتوب وينقله لنا كقالب ثابت.

وبخلاف التقنيات التقليدية، تم تدريب الأداة لتتعرف على النصوص المكتوبة يدوياً بمرونة عالية، بحيث يمكنه التعامل مع ظروف تصوير مختلفة، مثل الإضاءة غير المثالية أو وجود عناصر غير مرغوب فيها في الصورة.

وهذا يمنح المستخدمين تجربة أقرب للكتابة الأصلية، إذ تقدم الأداة بإعادة تمثيل أسلوب الكتابة نفسه بتفاصيله.

وإليك هذا المثال الذي تم توضيحه في صفحة نموذج InkSight على هاجنج فيس.

نص مكتوب يدويًا قبل تحويله إلى نص رقمي
صورة لكتابة يدويًة تم تحويلها إلى كتابة حبر رقمية ياستخدام InkSight

ويقدم هذا النموذج حلاً عملياً للعديد من المستخدمين، خاصة في مجالات تتطلب توثيقاً دقيقاً للنصوص اليدوية مثل الأبحاث الأكاديمية، وتوثيق الملاحظات في الميدان.

كما يمكن للأكاديميين والعلماء الذين يعتمدون على الكتابة اليدوية الاحتفاظ بملاحظاتهم الشخصية وتحريرها بسهولة دون الحاجة إلى معدات متقدمة.

دور الذكاء الاصطناعي في تحويل الكتابة اليدوية إلى حبر رقمي

أوضحت جوجل في مدونتها أن تطوير نموذج قادر على "قراءة وكتابة" النصوص المكتوبة بخط اليد يدوياً تطلب التغلب على عقبات كبيرة، منها قلة البيانات المتاحة لتدريب النموذج، وضرورة معالجة الصور ذات الأحجام الكبيرة دون التأثير على الأداء

وللتغلب على ذلك، اعتمدت الشركة على نموذج يجمع بين عدة مهام، مثل التعرف على الكلمات وتحويل كل كلمة إلى مسار رقمي مشابه لحركة القلم. وهذا ساعد في تحسين أداء النموذج وتقليل حاجته إلى بيانات تدريب مزدوجة.

بناءً على نتائج جوجل، أظهرت النماذج المدربة دقة عالية في محاولة مطابقة النصوص المكتوبة بخط اليد للكتابة الرقمية، حيث حقق النموذج الأكبر نسبة نجاح 87% في إنتاج نص رقمي يشبه الكتابة اليدوية الأصلية.

وهذه النتائج خطوة نحو سد الفجوة بين العالمين الورقي والرقمي دون الحاجة إلى معدات خاصة.

بالختام. فإن Inksight تسعى إلى توفير حلًّا مميّزًا للاحتفاظ بخطوط كتاباتنا في أشكال رقمية مماثلة. ونحن نتطلع دائمًا إلى المزيد من هذه التطورات التي تساعدنا في الدمج بين الكتابة التقليدية والتكنولوجيا الحديثة.

Khaled B.

خبير في الذكاء الاصطناعي يتمتع بخبرة واسعة في تطوير وتنفيذ حلول متقدمة باستخدام أحدث تقنياته. مُتخصص في توظيف هذه الإمكانيات لتحسين الأعمال وتحقيق الأرباح من خلال الابتكار التكنولوجي. لديه شغف لإيجاد استراتيجيات وحلول مبتكرة تساعد الشركات والأفراد على تحقيق أهدافهم من خلال تسخير هذه التكنولوجيا.

Related Posts

تحريك الوجوه مجانًا مع AdvancedLivePortrait عبر Google Colab

نموذج AdvancedLivePortrait-WebUI هو أداة قوية لتحويل الصور الثابتة للوجوه إلى صور (بورتريهات) متحركة واقعية ونابضة…

اقرأ المزيد

تجربة الدردشة الصوتية مع كوبايلوت: دعم للعربية وتنوع في اللهجات

مع بداية شهر أكتوبر الماضي، كشفت شركة مايكروسوفت عن إصدار جديد من تطبيق كوبايلوت “Copilot”…

اقرأ المزيد

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

مقالات قد تهمك

Namify: صمم اسم مشروعك وشعارك بسهولة مجانًا

    Namify: صمم اسم مشروعك وشعارك بسهولة مجانًا

    منصة X تطلق نسخة مجانية من روبوت الدردشة Grok

      منصة X تطلق نسخة مجانية من روبوت الدردشة Grok

      تحريك الوجوه مجانًا مع AdvancedLivePortrait عبر Google Colab

        تحريك الوجوه مجانًا مع AdvancedLivePortrait عبر Google Colab

        أحدث تطورات OpenAI: انتصارات قانونية، أعطال تقنية، ونمو ChatGPT

          أحدث تطورات OpenAI: انتصارات قانونية، أعطال تقنية، ونمو ChatGPT

          VoiceChanger: أداة مجانية لإنشاء وتغيير الأصوات العربية

            VoiceChanger: أداة مجانية لإنشاء وتغيير الأصوات العربية