بدأت مشروع تنظيف و تحليل لبيانات المبيعات علي الانترنت، مع التركيز على فهم البيانات بشكل كامل من البداية وحتى استخراج Insights مفيدة.
في البداية عملت استكشاف البيانات (541,909 صف و 8 أعمدة)، وتحليل جودة البيانات من حيث القيم الناقصة (Nulls) والتكرارات (Duplicates)
و القيم البعيدة (outliers)
و الأعمدة الي محتاجة اشتغل عليها بعد كدة رحت لمرحلة تنظيف البيانات.
Data Cleaning:
معالجة القيم الناقصة، خاصة في عمود Description باستخدام StockCode (Mapping)
هنا جبت وصف المنتجات من الكود بتاعها و مليت القيم الناقصة في الوصف.
إزالة البيانات المكررة (Duplicates)
التعامل مع القيم الشاذة (Outliers) في Quantity و UnitPrice
تحويل عمود التاريخ وفصل التاريخ عن الوقت لتسهيل التحليل
إنشاء عمود جديد (TotalPrice) لحساب إجمالي قيمة كل عملية
? Data Analysis:
تحليل أكثر المنتجات مبيعًا (Top Products)
تحديد المنتجات الأعلى من حيث الإيرادات (Top Revenue)
تحليل أفضل العملاء (Top Customers)
دراسة المبيعات مع الوقت (يومي وساعي)
تحديد الدول الأكثر مساهمة في الإيرادات
حساب متوسط قيمة الطلب (Average Order Value)
? Visualization: تم استخدام الرسوم البيانية لتوضيح النتائج بشكل أفضل، مثل:
المبيعات عبر الزمن
أفضل المنتجات
أفضل العملاء
أهم النتائج (Insights):
بعض المنتجات تحقق مبيعات عالية من حيث الكمية ولكنها ليست الأعلى ربحًا
نسبة صغيرة من العملاء تساهم بجزء كبير من إجمالي الإيرادات
وجود أوقات ذروة محددة خلال اليوم ترتفع فيها المبيعات بشكل ملحوظ
الأدوات المستخدمة: Python – Pandas – Matplotlib