يهدف هذا المشروع إلى تحليل البيانات التاريخية للطقس في عواصم العالم، بهدف اكتشاف الأنماط المناخية، دراسة العلاقات بين العوامل الجوية، وبناء نماذج تساعد على التنبؤ بعناصر الطقس المستقبلية. كما تم إنشاء واجهة تفاعلية باستخدام Streamlit لعرض النتائج بطريقة مرئية وسهلة الاستخدام.
خطوات التنفيذ:
-تنظيف البيانات (Data Cleaning):
معالجة القيم المفقودة والتعامل مع القيم الشاذة (Outliers).
توحيد تنسيقات البيانات وضمان سلامتها.
-معالجة البيانات (Preprocessing):
ترميز المتغيرات الفئوية (Encoding) باستخدام Label Encoding / One-Hot Encoding.
تطبيق التطبيع (Normalization) أو التوحيد (Standardization) حسب الحاجة.
-التحليل الاستكشافي (Exploratory Data Analysis - EDA):
تحليل التوزيعات باستخدام Box Plot, Violin Plot, KDE Plot.
تحليل العلاقات باستخدام Pair Plot, Correlation Heatmap, وBubble Chart.
استخراج الأنماط والعلاقات بين درجة الحرارة والرطوبة وسرعة الرياح.
النماذج المستخدمة (Models Used):
Linear Regression: للتنبؤ بدرجات الحرارة بناءً على المتغيرات الأخرى.
Decision Tree Regressor: لاكتشاف العلاقات غير الخطية بين العوامل الجوية.
Random Forest: لتحسين دقة التنبؤ وتقليل الخطأ.
K-Means Clustering: لتجميع المدن أو الدول حسب تشابه الظروف المناخية.
Correlation Analysis: لدراسة قوة واتجاه العلاقة بين المتغيرات.
-تقييم النماذج (Model Evaluation):
استخدام مقاييس مثل R² Score, MAE, RMSE لتقييم دقة النماذج.
-الواجهة التفاعلية (Interactive Dashboard):
تم تطوير واجهة باستخدام Streamlit تتيح للمستخدم رفع ملف البيانات، تنظيفه، عرض الرسوم التوضيحية، واختبار النماذج التنبؤية بشكل مباشر.
الأدوات والتقنيات المستخدمة:
Python – Pandas – NumPy – Matplotlib – Seaborn – Scikit-learn – Streamlit – Jupyter Notebook