تصنيف معدل الدخل السنوي
تفاصيل العمل
هل يمكن للذكاء الاصطناعي التنبؤ بمستوى دخلك؟ قمت ببناء نموذج تعلم آلي كامل يعتمد على مجموعة بيانات التعداد السكاني الأمريكية (UCI Adult Dataset) لتصنيف ما إذا كان دخل الشخص أكثر من 50 ألف دولار سنويًا — والنتائج كانت مدهشة! ️ الأدوات المستخدمة: Python · Pandas · Scikit-learn · Seaborn · Matplotlib أهداف المشروع: بناء نظام تنبؤ قابل للتفسير وقابل للتوسيع مقارنة أداء 6 خوارزميات تعلم آلي التعامل مع تحديات البيانات الواقعية: القيم المفقودة وعدم توازن الفئات ️ مراحل التنفيذ: تنظيف البيانات ومعالجتها (LabelEncoder, StandardScaler) تحويل الهدف إلى قيمة ثنائية (الدخل → 0 أو 1) تدريب النماذج التالية: • الانحدار اللوجستي • شجرة القرار • الغابة العشوائية • آلة الدعم الناقل (SVM) • أقرب الجيران (KNN) • نايف بايز Gaussian التقييم باستخدام: • الدقة، الاسترجاع، الدقة النوعية، وF1-score • مصفوفة الالتباس (Heatmap) • مقياس ROC AUC • مخطط مقارنة بين النماذج أهم النتائج: نموذج الغابة العشوائية (Random Forest) حقق أعلى دقة ️ لكن عدم توازن البيانات أثر على استرجاع الفئة ذات الدخل الأعلى — مما أبرز أهمية استخدام مقاييس تقييم مناسبة. هذا المشروع ساعدني على تطوير مهاراتي في: تنظيف البيانات، اختيار النماذج، وتحليل الأداء وتقديم النتائج بشكل بصري ومهني.
مهارات العمل
بطاقة العمل
طلب عمل مماثل