تحليل بيانات سفينة تيتانيك والتنبؤ بنسبة النجاة تفاصيل العمل
تفاصيل العمل
تم تحليل مجموعة بيانات تيتانيك باستخدام Pandas وMatplotlib وSeaborn للكشف عن أنماط البقاء على قيد الحياة. الخطوات الرئيسية: - تنظيف البيانات: معالجة القيم المفقودة وحذف الأعمدة غير ذات الصلة. - تحليل البيانات الاستكشافي (EDA): تمثيل توزيع الأعمار، ومعدلات البقاء حسب الجنس والطبقة، وخرائط الارتباط الحرارية. - هندسة الميزات: استخراج ألقاب الركاب من الأسماء وإنشاء ميزات إضافية مفيدة. - النمذجة التنبؤية: بناء مُصنِّف غابة عشوائية للتنبؤ بمعدلات البقاء على قيد الحياة، وتحليل أهمية الميزات. النتيجة: حقق النموذج دقة عالية، وسلط الضوء على الجنس والطبقة والعمر كأقوى عوامل تنبؤ بالبقاء على قيد الحياة. بايثون
مهارات العمل
بطاقة العمل
طلب عمل مماثل