تحليل مجموعة بيانات Titanic تحليل مجموعة بيانات Titanic تحليل مجموعة بيانات Titanic تحليل مجموعة بيانات Titanic تحليل مجموعة بيانات Titanic
تفاصيل العمل

تحليل مجموعة بيانات Titanic باستخدام لغة بايثون لأغراض تعليمية. يمر تحليل هذه البيانات بعدة مراحل رئيسة بدءاً من تحليل البيانات وصولاً الى بناء نموذج التعلم الالي: 1- فهم البيانات: تحتوي المجموعة على عدة متغيرات (أعمدة) أساسية لكل راكب، مثل اسمه، نجاته، الدرجة التي ركب فيها، جنسه، و اخرى. 2- التنظيف و معالجة البيانات Data Preprocessing: معالجة القيم المفقودة، ترميز المتغيرات الفئوية (Encoding Categorical Variables)، انشاء السمات الجديدة (Feature Engineering). 3- التحليل الاستكشافي للبيانات (Exploratory Data Analysis - EDA): يتضمن هذا الجزء استخدام أدوات مثل Python (Pandas, Matplotlib, Seaborn) لكشف الأنماط والرؤى مثل معدل النجاة الإجمالي، تحليل حسب الجنس، تحليل حسب الدرجة التي ركب فيها الراكب. 4- بناء نموذج التعلم الآلي (Machine Learning Modeling): في هذه المرحلة، الهدف هو تدريب نموذج للتنبؤ بفرصة النجاة: يتم تقسيم مجموعة البيانات إلى مجموعة تدريب (Training Set) لتعليم النموذج ومجموعة اختبار (Testing Set) لتقييم أدائه. اختيار الخوارزمية: اختيار خوارزمية تصنيف (Classification) مناسبة، مثل: الانحدار اللوجستي (Logistic Regression). التدريب والتقييم: تدريب النموذج على مجموعة التدريب ثم تقييم أدائه على مجموعة الاختبار باستخدام مقاييس مثل الدقة (Accuracy).

شارك
بطاقة العمل
تاريخ النشر
منذ يوم
المشاهدات
6
المستقل
طلب عمل مماثل
شارك
مركز المساعدة