Data Cleaning & Analysis of the Titanic Dataset Data Cleaning & Analysis of the Titanic Dataset Data Cleaning & Analysis of the Titanic Dataset Data Cleaning & Analysis of the Titanic Dataset Data Cleaning & Analysis of the Titanic Dataset
تفاصيل العمل

يهدف هذا المشروع إلى إجراء عملية تنظيف وتحليل شاملة لبيانات الركاب الخاصة بسفينة RMS Titanic sinking باستخدام بيانات Titanic Dataset الشهيرة في مجال تحليل البيانات وتعلم الآلة. تم في البداية استيراد البيانات باستخدام لغة البرمجة Python والاعتماد على مكتبات تحليل البيانات مثل Pandas وNumPy لفحص هيكل البيانات والتعرف على أنواع المتغيرات والقيم المفقودة. بعد ذلك تم تنفيذ عمليات تنظيف البيانات التي تضمنت معالجة القيم المفقودة في بعض الأعمدة مثل العمر ومكان الصعود، وحذف الأعمدة التي لا تحتوي على معلومات مفيدة في التحليل مثل Cabin، بالإضافة إلى تحويل المتغيرات النصية مثل الجنس وميناء الصعود إلى متغيرات رقمية لتسهيل عملية التحليل. بعد مرحلة التنظيف تم إجراء تحليل استكشافي للبيانات لفهم الأنماط والعلاقات بين المتغيرات المختلفة مثل العلاقة بين جنس الراكب ونسبة النجاة، وتأثير درجة التذكرة على فرص النجاة، وكذلك تحليل توزيع الأعمار وأسعار التذاكر. تم استخدام مكتبة Matplotlib لإنشاء الرسوم البيانية التي تساعد على توضيح هذه العلاقات بشكل بصري. يوضح هذا المشروع كيفية التعامل مع البيانات الخام وتحويلها إلى بيانات منظمة وقابلة للتحليل، بالإضافة إلى استخراج معلومات مهمة يمكن استخدامها لاحقًا في بناء نماذج تعلم آلي للتنبؤ بالنتائج.

مهارات العمل
شارك
بطاقة العمل
تاريخ النشر
منذ 3 ساعات
المشاهدات
2
القسم
المستقل
طلب عمل مماثل
مهارات العمل
شارك
مركز المساعدة