يتناول هذا المشروع تحليل بيانات استهلاك الطاقة لتحديد الأنماط والكشف عن القيم الشاذة التي قد تشير إلى استهلاك غير طبيعي أو أخطاء في القياس.
تم تنفيذ المشروع باستخدام لغة Python من خلال خطوات متكاملة تشمل:
تنظيف البيانات ودمجها من ملفات Excel وCSV.
تحليل استهلاك الطاقة وتوزيع التكلفة حسب الأيام والمناطق.
إجراء اختبارات إحصائية (مثل T-Test وANOVA) لاكتشاف الفروق بين المواقع والأيام.
تطبيق خوارزميات الكشف عن الشذوذ (Anomaly Detection) مثل IQR وMAD لتحديد القيم غير الطبيعية.
استبدال القيم الشاذة بالقيم الوسيطة (Median Imputation) وتحليل تأثيرها على التكلفة.
إنشاء تصور بياني يوضح الفروقات قبل وبعد المعالجة، مع اقتراح عتبة (Threshold) لتقليل الاستهلاك وتحقيق وفورات في التكلفة.