أعلنت جامعة مصر للمعلوماتية عن إطلاق برنامج تقني جديد يهدف إلى تقديم ترجمة فورية للغة الإشارة، مما يسهم في دمج شريحة واسعة من ذوي الهمم في المجتمع المصري وتسهيل حياتهم اليومية.
يتيح هذا البرنامج لمستخدميه التواصل مع الأفراد الذين فقدوا القدرة على التحدث، سواء كانوا من المصابين بالصمم أو ضعاف السمع، والذين يجيدون استخدام لغة الإشارة.
ويعتبر هذا البرنامج خطوة مهمة في تذليل العقبات التي تواجه هذه الفئة، حيث يعاني العديد منهم من صعوبات في التعامل مع الخدمات الحكومية وممارسة حياتهم بشكل طبيعي.
وأكدت الدكتورة هدى مختار، عميد كلية علوم الحاسب والمعلومات، أن فكرة المشروع تتماشى مع رؤية وأهداف الكلية التي تهدف إلى تشجيع الطلاب والخريجين على الاستفادة من المحتوى العلمي في تطبيقات عملية تحقق فوائد اقتصادية واجتماعية للمجتمع.
وأضافت أن البرنامج الإلكتروني تم تصميمه من قِبل فريق من طلاب الكلية، يتكون من أربعة طلاب في الفرقة الثالثة، وهم أحمد سامح، نور هاني، ليلى خالد، وياسمين محمد. وقد أطلق على البرنامج اسم "مترجم لغة الإشارة" (SLI)، وهو نموذج تعلم عميق يستخدم تقنيات الذكاء الاصطناعي لتوفير نظام سريع ودقيق يعمل في الوقت الفعلي، يقوم بتحويل لغة الإشارة إلى نصوص مكتوبة. ويواجه المصابون بالصمم وضعاف السمع تحديات كبيرة في التواصل مع الآخرين الذين لا يجيدون استخدام لغة الإشارة، مما يعكس الحاجة الملحة لتطوير تقنيات إلكترونية أكثر فعالية.
وأشارت الكلية إلى أنها دعمت مشاريع طلابها وباحثيها من خلال إتاحة استخدام معامل متخصصة تحتوي على الموارد الحاسوبية اللازمة للبحث، حيث تم تجهيز هذه المعامل بأفضل المعدات والبرامج التقنية، مما ساعد الفريق في استكمال البحث وتطوير البرنامج الجديد وتحقيق نتائج متميزة.
من جانبها، أوضحت نور هاني، أحد أعضاء الفريق والطالب بالفرقة الثالثة، أن المشروع اعتمد على نهج من مرحلتين:
- التعرف على الحروف باستخدام تقنيات الرؤية الحاسوبية (Computer Vision) لتحديد الإشارات اليدوية لكل حرف.
- التعرف على الكلمات من خلال تحليل مقاطع الفيديو لاستخراج إيماءات اليد وحركات الجسم، واستخدام الذكاء الاصطناعي (AI) ومعالجة البيانات الزمنية.
وأفادت بأن البرنامج الحالي يتعرف على جميع الحروف الإنجليزية وعدد كبير من الكلمات، معتمدًا على قاعدة بيانات تحتوي على 2268 صورة تمت معالجتها لتقليل حجمها وتطبيعها، باستخدام نموذج ميديابايب (Mediapipe) وشبكة عصبية (Neural Networks)، محققةً دقة بنسبة 93.33٪.
وأضافت أن الفريق استخدم قاعدة بيانات تحتوي على أكثر من 12 ألف فيديو للتعرف على الكلمات، حيث تم إنتاج 46 فيديو لكل كلمة. وبعد تجربة عدة آليات انتباه، توصل الفريق إلى آلية "LSTM with Attention" التي تفوقت على النماذج الأخرى بدقة بلغت 90٪.
وأوضحت أن الفريق يعمل حاليًا على توسيع قاعدة بيانات البرنامج لزيادة دقة النتائج، ويسعى لترقية البرنامج إلى المستوى التالي مع تدريبه على لغة الإشارة المصرية.
كما يهدف الفريق إلى تعريب البرنامج في المرحلة المقبلة، بحيث تشمل الترجمة اللغتين العربية والإنجليزية، مما يسهل تسويق البرنامج دوليًا ويخدم السياح الأجانب من الصم وضعاف السمع أثناء زيارتهم لمصر.