يوتيوب تطور الترجمة التلقائية للصوت

كتب : إيناس النني

كشفت ليات كافير، مديرة منتج في جوجل، إن ميزة الترجمة النصية التلقائية للحوار الصوتي في الفيديوهات على منصة "يوتيوب" قد حققت نجاحًا كبيرًا خلال السنوات الأخيرة، وإن عدد الفيديوهات التي استخدم فيها الميزة قد تجاوز مليار فيديو، كما كشفت عن نية الشركة إجراء تطويرات مستقبلية في ميزة الترجمة النصية التلقائية التي توفرها بعشر لغات مختلفة.

الترجمة النصية التلقائية للحوار الصوتي قد ساعدت كثير من مستخدمي "يوتيوب"، سواء من فاقدي حاسة السمع أو من غير المتحدثين للغة الفيديو الأساسية، في معرفة ما يجري في الفيديوهات التي يشاهدونها، جاء ذلك وفقا لما كشفته كافير مؤكدة أن عدد مرات مشاهدة الفيديوهات المصحوبة بترجمة نصية تلقائية للحوار الصوتي يتجاوز 15 مليون مشاهدة كل يوم.

وأضافت أن التقنيات الجديدة التي تم إدخالها على الميزة، والتي تعتمد بشكل أساسي على تقنية التعرف التلقائي على الحوار الصوتي التي طورتها جوجل، قد حسنت من نظام الترجمة النصية التلقائية في "يوتيوب" بصورة كبيرة.

وكانت جوجل قد أطلقت نظام التعليق النصي على الفيديوهات أول مرة في 2006، قبل أن تدمجه في "يوتيوب" بشكل مطور نتج عنه ميزة الترجمة النصية التلقائية في عام 2009.

وأشارت كافير أنه بفضل تقنيات مثل التعرف التلقائي على الحوار الصوتي ولوغاريتمات تعلم الآلة والبيانات التي يتم تحليلها يوميا لتطوير هذه الميزة، فإنها قد شهدت تحسنًا في دقتها لتحليل الحوار الصوتي باللغة الإنجليزية وتحويله لنص بنسبة بلغت 50%.

وتسعى "يوتيوب" للوصول بهذه الميزة خلال السنوات المقبلة إلى نسبة خطأ تتساوى مع نسب الخطأ البشرية عند تحويل حوار صوتي إلى ترجمة نصية، معتمدة في ذلك بشكل أساسي على التعلم من التعديلات التي يُدخلها صناع المحتوى لتحسين الترجمة التلقائية على فيديوهاتهم.

يذكر أن ميزة الترجمة النصية التلقائية للحوار الصوتي في فيديوهات "يوتيوب" متوافرة بعشر لغات مختلفة هم الإنجليزية، والألمانية، والفرنسية، والإسبانية، واليابانية والهولندية والإيطالية والكورية والبرتغالية والروسية، وتعد المنصة بتوسيع قاعدة اللغات المدعومة مستقبلا.