Multimodal Emotion Recognition from Video Using Deep Feature Fusion
تفاصيل العمل
هذا المشروع يحتوي على نظام متكامل من البداية إلى النهاية لاكتشاف العواطف متعددة الوسائط (Multimodal Emotion Detection)، تم تصميمه لتصنيف مشاعر الإنسان بدقة من مقاطع الفيديو من خلال تحليل كل من البيانات الصوتية والمرئية. يُنفّذ المشروع خط معالجة متقدّم يقوم باستخراج الميزات العميقة من تعابير الوجه والخصائص الصوتية من الكلام، ثم يتم دمج هذه الميزات باستخدام نموذج دمج متعدد الرؤى (Multi-View Fusion) مبتكر. وأخيرًا، يتم تدريب مُصنّف تجميعي متراص (Stacking Ensemble Classifier) على البيانات المدمجة لتحقيق أداء عالٍ في التعرف على العواطف.
مهارات العمل
بطاقة العمل
طلب عمل مماثل