Titanic Survival Prediction Project
تفاصيل العمل
في هذا المشروع عملت على Titanic Dataset بهدف تحليل بيانات الركاب والتنبؤ بإمكانيةنجاتهم من الحادث. بدأت بتنفيذ مرحلة المعالجة المسبقة للبيانات (Data Preprocessing) لضمان جودة البيانات قبل بناء نموذج تعلم الآلة. شمل العمل: فحص جودة البيانات واكتشاف المشكلات مثل: القيم المفقودة (Missing Values) خاصة في متغيرات مثل العمر وأجرة التذكرة البيانات غير المنطقية أو غير المتسقة السجلات المكررة (Duplicates) معالجة هذه المشكلات باستخدام تقنيات مناسبة لضمان دقة النتائج. تحويل المتغيرات النصية مثل الجنس وميناء الصعود إلى متغيرات رقمية باستخدام Encoding. تطبيق Scaling على المتغيرات الرقمية عند الحاجة. التعامل مع القيم الشاذة (Outliers) وتحليل توزيع البيانات إحصائيًا. إجراء تحليل استكشافي للبيانات (EDA) لفهم العلاقات بين المتغيرات وتأثيرها على معدل النجاة. بعد تجهيز البيانات، قمت بـ: تقسيم البيانات إلى بيانات تدريب واختبار (Train/Test Split). تنفيذ عملية اختيار الخصائص المؤثرة (Feature Selection) لتحسين أداء النموذج. بناء نموذج تصنيف باستخدام خوارزمية Decision Tree للتنبؤ بنجاة الركاب. تقييم أداء النموذج باستخدام مقاييس مثل Accuracy و Precision و Recall. كان الهدف من المشروع بناء نموذج تنبؤي يساعد على فهم العوامل الرئيسية التي أثرت على نجاة الركاب، وتطبيق تقنيات تعلم الآلة على بيانات حقيقية لتحسين مهارات تحليل البيانات وبناء النماذج.
مهارات العمل