تحليل وتصوّر وتصنيف الأفلام الأعلى إيرادًا في الهند باستخدام Python وMachine Learning
تفاصيل العمل
تحليل البيانات (Data Analysis & Visualization): استيراد مجموعة بيانات شاملة لأفلام بوليوود، تتضمن اسم الفيلم، النوع، الإيرادات، مدة العرض، اللغة، سنة الإصدار، وغيرها. تنظيف البيانات والتأكد من جودتها وصحة القيم. تحليل الاتجاهات مثل: أكثر الأنواع التي تحقق أرباحًا (أكشن، دراما، رومانسية...) العلاقة بين مدة الفيلم والإيرادات. تغير الإيرادات بمرور السنوات. أعلى الأفلام من حيث الإيرادات. تصور البيانات باستخدام رسوم بيانية احترافية مثل: Bar Charts، Pie Charts Line Graphs، Heatmaps Boxplots & Violin plots بناء نموذج تعلم آلي (Machine Learning): الهدف من النموذج: تصنيف الأفلام حسب النوع أو التوقع المسبق لنجاح الفيلم بناءً على مدخلاته. النماذج المستخدمة: Decision Tree Random Forest K-Nearest Neighbors Logistic Regression تحسين الأداء: تقسيم البيانات إلى تدريب واختبار. استخدام GridSearchCV لضبط المعاملات. تقييم النموذج باستخدام Accuracy وF1-Score وConfusion Matrix.
مهارات العمل
بطاقة العمل
طلب عمل مماثل