Forest Cover Type Classification
تفاصيل العمل
في المشروع ده استخدمت بيانات Covertype Dataset من UCI للتنبؤ بنوع الغطاء الحرجي (7 أنواع) بالاعتماد على متغيرات جغرافية وكارتوغرافية زي: الارتفاع، الميل، المسافات الأفقية والرأسية للمسطحات المائية، المسافة للطرق ونقاط الحرائق، قياسات الإضاءة (Hillshade)، بالإضافة لمعلومات عن نوع التربة والمناطق البرية. الخطوات: تنظيف البيانات والتأكد من خلوها من القيم المفقودة والمكررة. تحليل استكشافي للبيانات (EDA) باستخدام الرسوم البيانية والمصفوفات الحرارية لفهم الأنماط والعلاقات. اختيار أهم الخصائص (Feature Selection) باستخدام Decision Tree, Random Forest, XGBoost. بناء وتدريب النماذج (Decision Tree, Random Forest, XGBoost) مع ضبط المعلمات (Hyperparameter Tuning). تقييم النماذج باستخدام Accuracy, F1-score, Classification Report, Confusion Matrix. النتائج: نموذج XGBoost حقق أفضل أداء بدقة 95% وأعلى F1-score. نموذج Random Forest أداؤه قوي وقريب من XGBoost. نموذج Decision Tree أبسط لكنه أقل دقة مقارنة بالنماذج التجميعية. الأدوات والتقنيات: Python, Pandas, NumPy, Matplotlib, Seaborn, Scikit-learn, XGBoost.
مهارات العمل
بطاقة العمل
طلب عمل مماثل