Heart Disease Prediction
تفاصيل العمل
نظرة عامة: تم بناء نموذج تعلم آلي للتنبؤ بوجود أمراض القلب باستخدام بيانات سريرية وديموغرافية للمرضى. البيانات: مجموعة بيانات أمراض القلب من UCI (303 عينة، 14 خاصية) سير العمل (Pipeline): تنظيف البيانات والمعالجة المسبقة ترميز الخصائص وتوحيد المقاييس التحليل الاستكشافي للبيانات (EDA) اختيار الخصائص وتقليل الأبعاد النماذج المستخدمة: الانحدار اللوجستي LR شجرة القرار DT الغابة العشوائية RF آلة المتجهات الداعمة (SVM) التقنيات: اختيار الخصائص باستخدام Random Forest وRFE واختبار كاي تربيع تقليل الأبعاد باستخدام PCA ضبط المعاملات (Hyperparameter Tuning) باستخدام GridSearchCV وRandomizedSearchCV النتائج: حقق نموذج الغابة العشوائية أفضل أداء بدقة تقارب 94٪ مع قيمة ROC-AUC قوية ساهم تقليل الخصائص في تحسين استقرار النماذج النشر / المخرجات: تصدير النموذج المدرّب بصيغة .pkl لإعادة الاستخدام الأدوات المستخدمة: Python، Pandas، NumPy، Scikit-learn، Matplotlib، Seaborn
مهارات العمل