مشروع تعلم آلي شامل لتحليل بيانات Airbnb وبناء نماذج تصنيف وتنبؤ بالأسعار
تفاصيل العمل
مشروع متكامل في مجال Machine Learning & Data Science يهدف إلى تحليل بيانات Airbnb في مدينة نيويورك لعام 2019 وبناء نظام ذكي لاكتشاف الأنماط والتنبؤ بالأسعار. 🔍 فكرة المشروع تم التعامل مع البيانات كـ Unlabeled Dataset في البداية، ثم: استخدام K-Means Clustering لاكتشاف Segments طبيعية تحويلها إلى Labels (Budget / Mid / Premium / Luxury) تدريب SVM Classifier للتصنيف بناء Regression Models للتنبؤ بالسعر ⚙️ مراحل العمل 1️⃣ Data Preprocessing تنظيف البيانات ومعالجة Missing Values إزالة Outliers باستخدام IQR Encoding (Label + One-Hot + Frequency Encoding) 2️⃣ Feature Engineering تم إنشاء Features قوية مثل: dist_to_center (المسافة من مركز المدينة) review_velocity popularity_score host_tier 3️⃣ Clustering (K-Means) تحديد أفضل K باستخدام: Elbow Method Silhouette Score تقسيم البيانات إلى 4 Segments 4️⃣ Classification (SVM) استخدام GridSearchCV + StratifiedKFold تحقيق: Accuracy > 82% F1 Score > 0.82 5️⃣ Regression Models تم تجربة: Ridge Regression Random Forest SVR XGBoost (الأفضل 🎯) 📊 النتائج: MAE ≈ $28 R² ≈ 0.80 📊 مخرجات المشروع تحليل كامل للبيانات Visualization احترافي (PCA + Confusion Matrix + ROC) Feature Importance Residual Analysis Models جاهزة للاستخدام (Saved باستخدام joblib)
مهارات العمل
بطاقة العمل
طلب عمل مماثل