ETL using python
تفاصيل العمل
تنفيذ مشروع ETL باستخدام Python لمعالجة وتحليل بيانات المبيعات، شمل تنظيف البيانات، معالجة القيم المفقودة، تحويل أنواع البيانات، إنشاء أعمدة مشتقة من التاريخ، وتحليل المبيعات حسب المنتج والمنطقة والزمن لاستخلاص مؤشرات تساعد في اتخاذ القرار. قمت بتنفيذ مشروع ETL (Extract, Transform, Load) باستخدام Python لتحليل وتنظيف بيانات المبيعات، حيث شمل المشروع المراحل التالية: Extract قراءة البيانات من ملف CSV باستخدام Pandas. استكشاف البيانات من خلال عرض أول الصفوف وعينات عشوائية. فحص أبعاد البيانات وأنواع الأعمدة وهيكل الـ DataFrame. Transform تنظيف البيانات من القيم المفقودة والتعامل معها بطرق مناسبة. اكتشاف السجلات المكررة ومعالجتها. تحويل أنواع البيانات (Numeric / Datetime) لضمان دقة التحليل. استخراج أعمدة جديدة (اليوم، الشهر، السنة) من عمود التاريخ. إزالة الأعمدة غير الضرورية مثل Retailer ID. توحيد أسماء المناطق (Region) ومعالجة الأخطاء الإملائية وعدم الاتساق. Load & Analysis حساب إجمالي المبيعات. تحليل متوسط المبيعات حسب المنطقة والمنتج. تحديد أكثر وأقل المنتجات أداءً. تحليل عدد المنتجات المباعة سنويًا. دراسة تطور المبيعات عبر السنوات. تحليل التغير الشهري في المبيعات (Month-over-Month Analysis). تم تنفيذ المشروع بالكامل باستخدام Python و Pandas مع التركيز على جودة البيانات، التحليل الدقيق، واستخلاص مؤشرات تساعد في اتخاذ القرار.
مهارات العمل
بطاقة العمل
طلب عمل مماثل