تطوير نموذج تعلم آلة متقدم للتنبؤ بأسعار إيجار المنازل في المدن الكبرى، يعتمد النظام على تحليل مجموعة من العوامل المؤثرة مثل المساحة، الموقع، نوع التأثيث، وعدد الغرف. تم تتويج المشروع بإنشاء تطبيق ويب (Web App) يتيح للمستخدمين تقدير قيمة الإيجار العادلة بدقة عالية.
المميزات التقنية والمعالجة:
تنقية البيانات (Data Refinement): التعامل مع بيانات حقيقية من منصة Kaggle، شمل ذلك تنظيف القيم المفقودة وتحليل القيم الشاذة (Outliers) باستخدام تقنية IQR لضمان عدم تأثر دقة النموذج بالعقارات ذات الأسعار غير المنطقية.
الترميز الهندسي (Categorical Encoding): استخدام استراتيجيات ترميز متنوعة (Label & One-Hot Encoding) لتحويل البيانات النصية مثل (اسم المدينة، نوع المستأجر المفضل) إلى بيانات رقمية يفهمها الموديل.
معايرة البيانات (Feature Scaling): تطبيق StandardScaler لتوحيد المقاييس الرقمية، مما حسن من سرعة استجابة النماذج ودقتها.
النماذج والنتائج:
تم اختبار ترسانة من الخوارزميات (8 نماذج مختلفة) تشمل Linear Regression, XGBoost, SVR.
النموذج الفائز: حقق نظام Gradient Boosting Regressor أفضل أداء بعد عمليات تحسين مكثفة عبر GridSearchCV.
التطبيق العملي (Streamlit App):
بناء واجهة مستخدم احترافية تسمح لأي شخص بإدخال مواصفات منزله والحصول على سعر تقريبي فوراً، مع مراعاة التفاصيل الدقيقة مثل "رقم الدور" و"تفضيلات المالك للمستأجر".
الأدوات المستخدمة:
البيانات والتحليل: Pandas, NumPy, Seaborn.
التعلم الآلي: Scikit-learn, Gradient Boosting.
الواجهة والتطوير: Streamlit, Pickle.