التحليل الاستكشافي لبيانات "تيتانيك" وتجهيز البيانات التحليل الاستكشافي لبيانات "تيتانيك" وتجهيز البيانات التحليل الاستكشافي لبيانات "تيتانيك" وتجهيز البيانات التحليل الاستكشافي لبيانات "تيتانيك" وتجهيز البيانات التحليل الاستكشافي لبيانات "تيتانيك" وتجهيز البيانات التحليل الاستكشافي لبيانات "تيتانيك" وتجهيز البيانات التحليل الاستكشافي لبيانات "تيتانيك" وتجهيز البيانات التحليل الاستكشافي لبيانات "تيتانيك" وتجهيز البيانات التحليل الاستكشافي لبيانات "تيتانيك" وتجهيز البيانات
تفاصيل العمل

المشروع ده تطبيق عملي متكامل على واحدة من أشهر مجموعات البيانات في مجال علم البيانات (Titanic Dataset)، واللي بتضم بيانات 1309 راكب. الهدف كان أعمل تحليل استكشافي دقيق (EDA) علشان أفهم العوامل الديموغرافية والاجتماعية اللي أثرت على فرص نجاة الركاب. المشروع بيوضح قدرتي على التعامل مع بيانات خام، تنظيفها، وتحويل الأرقام لرؤى واضحة ومدعومة برسوم بيانية مفهومة. المهام اللي اتنفذت: 1- تنظيف وتجهيز البيانات (Data Cleaning): فحص البيانات واكتشاف المشاكل التعامل مع القيم الناقصة (خصوصًا عمود العمر) اكتشاف وحذف حوالي 200 صف مكرر إزالة الأعمدة اللي ملهاش تأثير مباشر على التحليل وده ضمن إن التحليل يكون دقيق ونتايجه موثوقة. 2- التحليل الاستكشافي (EDA): تحليل متغيرات مهمة زي: العمر – الجنس – سعر التذكرة – ميناء الصعود استخدام الرسوم البيانية لفهم توزيع البيانات ودراسة العلاقة بين العوامل المختلفة وقرار النجاة 3- هندسة واختيار الميزات (Feature Engineering): تجهيز البيانات بحيث تكون جاهزة لبناء نماذج تصنيف مستقبلًا لو حابين نحول المشروع لتوقعات (Classification Models) أهم النتائج والرؤى (Key Insights): تأثير الجنس: الإناث كان عندهم فرصة نجاة أعلى بوضوح من الذكور، وده بيعكس سياسة "النساء والأطفال أولاً". تأثير الدرجة الاجتماعية: ركاب الدرجة الأولى كانت فرص نجاتهم أعلى بكتير، بينما ركاب الدرجة الثالثة سجلوا أعلى معدلات وفاة، وده يوضح تأثير الوضع الاقتصادي على فرص النجاة. التركيبة العمرية: أغلب الركاب كانوا من الشباب والبالغين، والعمر كان له تأثير مباشر على فرص النجاة.

شارك
بطاقة العمل
تاريخ النشر
منذ يوم
المشاهدات
7
المستقل
Ali Mohamed
Ali Mohamed
مهندس ذكاء اصطناعي
طلب عمل مماثل
شارك
مركز المساعدة