تحليل بيانات Titanic باستخدام Python | EDA + Preprocessing + نموذج تنبؤي تحليل بيانات Titanic باستخدام Python | EDA + Preprocessing + نموذج تنبؤي تحليل بيانات Titanic باستخدام Python | EDA + Preprocessing + نموذج تنبؤي تحليل بيانات Titanic باستخدام Python | EDA + Preprocessing + نموذج تنبؤي تحليل بيانات Titanic باستخدام Python | EDA + Preprocessing + نموذج تنبؤي تحليل بيانات Titanic باستخدام Python | EDA + Preprocessing + نموذج تنبؤي تحليل بيانات Titanic باستخدام Python | EDA + Preprocessing + نموذج تنبؤي تحليل بيانات Titanic باستخدام Python | EDA + Preprocessing + نموذج تنبؤي تحليل بيانات Titanic باستخدام Python | EDA + Preprocessing + نموذج تنبؤي تحليل بيانات Titanic باستخدام Python | EDA + Preprocessing + نموذج تنبؤي تحليل بيانات Titanic باستخدام Python | EDA + Preprocessing + نموذج تنبؤي
تفاصيل العمل

في هذا المشروع، قمت بتحليل بيانات العملاء باستخدام نموذج RFM (Recency, Frequency, Monetary) بهدف تقسيم العملاء إلى فئات مختلفة بناءً على سلوكهم الشرائي، مما يساعد في تحسين استراتيجيات التسويق وزيادة العائد. ما الذي تم تنفيذه: تم تنظيف البيانات وتجهيزها للتحليل، ثم إنشاء متغيرات RFM والتي تشمل Recency (آخر عملية شراء)، وFrequency (عدد مرات الشراء)، وMonetary (قيمة المشتريات)، وبعد ذلك تم حساب RFM Scores لكل عميل، ثم تطبيق Rule-Based Segmentation لتقسيم العملاء إلى فئات مثل High-Value Customers وLoyal Customers وAt Risk وLost Customers، بالإضافة إلى إنشاء Visualizations لعرض النتائج مثل Bar Charts وHeatmaps. النتائج: تم تحديد الفئات الأكثر قيمة، واكتشاف العملاء المعرضين للفقد، وفهم سلوك العملاء داخل كل Segment بشكل واضح. القيمة العملية: يساعد هذا التحليل في تحسين الحملات التسويقية، واستهداف العملاء بشكل أدق، وزيادة معدل الاحتفاظ بالعملاء، وتعظيم الأرباح من العملاء الحاليين. الأدوات المستخدمة: Python وPandas وNumPy وMatplotlib وSeaborn. في هذا المشروع، قمت بتنفيذ تحليل بيانات متكامل (End-to-End Data Analysis) على بيانات Titanic بهدف اكتشاف العوامل المؤثرة في نجاة الركاب وبناء نموذج تنبؤي يعتمد على هذه البيانات، وذلك ضمن تدريب عملي مع التركيز على تطبيق أفضل ممارسات تحليل البيانات ومعالجة البيانات قبل استخدامها في نماذج التعلم الآلي. ما الذي قمت به في المشروع: قمت بإجراء تحليل استكشافي شامل (EDA) لفهم طبيعة البيانات والعلاقات بينها، ثم تحليل معدلات النجاة بناءً على عدة عوامل مثل الجنس (Gender) ودرجة السفر (Pclass) والعمر (Age) وحجم العائلة، بالإضافة إلى تنظيف البيانات ومعالجة المشاكل مثل القيم المفقودة (Missing Values) والقيم الشاذة (Outliers)، ثم تنفيذ Feature Engineering لإنشاء متغيرات جديدة مثل Family Size وIs Alone، وبعد ذلك تحويل البيانات لتكون مناسبة للنماذج باستخدام Encoding وScaling، وأخيرًا بناء نموذج Machine Learning باستخدام Logistic Regression للتنبؤ بنجاة الركاب. النتائج: تم تحقيق دقة تصل إلى 76.9% على بيانات الاختبار، كما أظهر التحليل أن الإناث لديهم معدل نجاة أعلى بشكل واضح، وأن ركاب الدرجة الأولى أكثر نجاة، بالإضافة إلى أن العائلات الصغيرة لديها فرصة نجاة أفضل. الأدوات والتقنيات المستخدمة: Python وPandas وNumPy وMatplotlib وSeaborn وScikit-learn وJupyter Notebook. قيمة المشروع: يوضح هذا المشروع قدرتي على التعامل مع البيانات من البداية للنهاية، واستخراج Insights حقيقية تدعم اتخاذ القرار، وتجهيز البيانات بشكل احترافي لنماذج Machine Learning، بالإضافة إلى بناء نموذج تنبؤي عملي وقابل للتطوير.

شارك
بطاقة العمل
تاريخ النشر
منذ يوم
المشاهدات
7
القسم
المستقل
طلب عمل مماثل
شارك
مركز المساعدة