تجزئة العملاء
تفاصيل العمل

يهدف هذا المشروع إلى معالجة وتحسين بيانات العملاء من أجل إعدادها لعمليات التحليل المتقدم مثل التقسيم (Clustering) أو النمذجة التنبؤية. تم تنفيذ المشروع باستخدام مكتبات Python مثل: pandas لمعالجة البيانات numpy للحسابات datetime لاستخراج الخصائص الزمنية streamlit لعرض البيانات بشكل تفاعلي ? خطوات العمل داخل المشروع 1️⃣ تنظيف البيانات (Data Cleaning) إزالة القيم المفقودة (Missing Values) حذف البيانات المكررة (Duplicates) 2️⃣ استخراج خصائص زمنية (Time-Based Feature Engineering) تم تحويل عمود تاريخ تسجيل العميل Dt_Customer إلى صيغة تاريخ، ثم استخراج: Year (سنة التسجيل) Month (شهر التسجيل) Day (يوم التسجيل) Quarter (الربع السنوي) Day of Week (اليوم في الأسبوع) Weekend Indicator (تحديد إذا كان التسجيل في عطلة نهاية الأسبوع) 3️⃣ حساب عمر العميل (Customer Age) تم حساب عمر العميل باستخدام: Age = Current Year - Year_Birth 4️⃣ تقليل الأعمدة غير الضرورية تم حذف الأعمدة غير المهمة للتحليل الحالي مثل: البيانات التعريفية (ID) بيانات الإنفاق التفصيلية بيانات الحملات التسويقية متغيرات ديموغرافية غير مطلوبة وذلك للحصول على Dataset نظيف ومناسب للتحليل. 5️⃣ عرض البيانات تم استخدام Streamlit لإنشاء واجهة تفاعلية تعرض البيانات بعد المعالجة، مما يسهل: استكشاف البيانات تحليل الاتجاهات تجهيز البيانات للتقسيم أو النمذجة

شارك
بطاقة العمل
تاريخ النشر
منذ يومين
المشاهدات
6
المستقل
حازم فاروق
حازم فاروق
مهندس تعلم الآلة
طلب عمل مماثل
شارك
مركز المساعدة