استكشاف وتنظيف وتصفية بيانات 'titanic dataset' سفينة تيتانيك
تفاصيل العمل
يتضمن المشروع استكشاف البيانات (891 صف و12 عمود) وتحليل القيم المفقودة، حيث تم التعامل مع البيانات الناقصة في الأعمدة المختلفة باستخدام Median و Mode، مع حذف الأعمدة غير المفيدة مثل Cabin. خطوات العمل 1- استيراد واستكشاف البيانات 2- تنظيف البيانات ومعالجة القيم المفقودة 3- هندسة واستحداث الميزات (Feature Engineering) 4-تصفية البيانات (Data Filtering) تم تنفيذ خطوات Data Cleaning كاملة لضمان جودة البيانات، بالإضافة إلى Feature Engineering مثل إنشاء عمود لحجم العائلة (FamilySize) وتحديد ما إذا كان الراكب يسافر بمفرده (IsAlone)، واستخراج الألقاب (Title) من الأسماء ومعالجتها. كما يشمل المشروع عمليات تصفية البيانات (Filtering) لاستخراج معلومات محددة مثل ركاب الدرجة الأولى أو فئات عمرية معينة. المشروع يوضح مهارات قوية في: Data Cleaning – Data Preprocessing – Feature Engineering باستخدام Pandas و NumPy.
مهارات العمل
بطاقة العمل
طلب عمل مماثل