مشروع يستخدم التعلم الآلي للتنبؤ بما إذا كانت أغنية ستصل إلى قائمة أكثر 100 أغنية شعبيةً في عام إصدارها، بناءً على المقطع الذي يتكرر في الأغنية. حيث قمت بـ:
- جمع قائمة بأسماء الأغاني التي وصلت إلى Hot 100 وتلك التي لم تصل من نفس الفنانين.
- تنزيل كل أغنية واستخراج المقطع المتكرر وتحويله إلى سمات إحصائية صوتية.
- عرض وتحليل البيانات لاكتشاف خطوات معالجة البيانات المطلوبة.
- تنفيذ معالجة البيانات وتنظيفها وإعدادها
- اختبار عدة نماذج باستخدام معيار F1-score واختيار نموذج Random Forest كصاحب أفضل أداء.
- إعداد ملف (Module) به الدوال اللازمة للقيام بالخطوات السابقة في أي وقت لاحق لإضافة المزيد من البيانات للنموذج.
- إضافة خط سير (Pipeline) للملف (Module) يستخدم دواله في عملية الحصول على الأغنية وتنزيلها ومعالجتها وإعدادها لتقديمها للنموذج.
- إنشاء واجهة استخدام تتناول الأغنيات من روابط YouTube وSpotify معطاة، أو عبر رفع ملفات صوتية.