المعالجة المسبقة والتصوير لداتا تايتنك
تفاصيل العمل
قمت بتنفيذ مشروع تحليل بيانات استكشافي (EDA) باستخدام لغة Python على مجموعة بيانات Titanic الشهيرة، بهدف فهم البيانات، اكتشاف الأنماط، وتحليل العوامل المؤثرة على بقاء الركاب. شمل المشروع الخطوات التالية: استيراد البيانات باستخدام مكتبة Seaborn استعراض البيانات وهيكلها العام (head, info) تحليل إحصائي شامل للخصائص العددية والوصفية (describe) فحص القيم المفقودة (Missing Values) تحليل توزيع المتغيرات الأساسية مثل: الجنس العمر فئة التذكرة الأجرة عدد أفراد العائلة إنشاء رسوم بيانية توضيحية لفهم العلاقات بين المتغيرات باستخدام Matplotlib وSeaborn دراسة تأثير الجنس، العمر، والدرجة الاجتماعية على نسبة النجاة استخراج ملاحظات واستنتاجات تساعد في فهم سلوك البيانات واتجاهاتها الأدوات والتقنيات المستخدمة: Python Pandas NumPy Matplotlib Seaborn نتيجة المشروع: تحليل بصري وإحصائي واضح يوضح أهم العوامل التي أثّرت على نجاة الركاب، مع تنظيم الكود بشكل نظيف وقابل لإعادة الاستخدام والتطوير لاحقًا لبناء نموذج تعلم آلة للتنبؤ بالنجاة.
مهارات العمل
بطاقة العمل
طلب عمل مماثل