تحليل بيانات الحملات التسويقية وبناء نماذج تنبؤية باستخدام تعلم الآلة
تفاصيل العمل
مشروع تحليل بيانات وتعلم آلة (Machine Learning) يهدف إلى التنبؤ بعدد المشتريات الإجمالية (NumTotalPurchases) من خلال بناء ومقارنة عدة نماذج Regression على نفس مجموعة البيانات، لاختيار النموذج الأفضل أداءً بناءً على التحليل الكمي والبصري للأخطاء. يشمل المشروع: تنظيف البيانات ومعالجة القيم المفقودة تنفيذ Feature Engineering وتحويل المتغيرات التعامل مع البيانات الفئوية واكتشاف القيم الشاذة تقسيم البيانات وتطبيق Feature Scaling تدريب ومقارنة عدة نماذج تنبؤية: Linear Regression كنموذج أساسي Random Forest Regressor Gradient Boosting Regressor XGBoost Regressor تقييم النماذج باستخدام: MAE MSE RMSE R² Score تحليل أخطاء التنبؤ باستخدام Residual Plot لفهم سلوك النموذج بناءً على نتائج التقييم والتحليل، تم اختيار Random Forest Regressor كأفضل نموذج من حيث الدقة والاستقرار. تم تنفيذ المشروع باستخدام Python ومكتبات Pandas، NumPy، Scikit-learn، XGBoost، وMatplotlib، مع تنظيم الكود والنتائج لضمان الوضوح وقابلية إعادة الاستخدام.
مهارات العمل
بطاقة العمل
طلب عمل مماثل