مشروع متخصص يركز على أهم مراحل تحليل البيانات: تنظيف ومعالجة البيانات (Data Cleaning & Preprocessing).
الهدف: استلام مجموعة بيانات أولية (Raw Data) لأداء الطلاب، وتطبيق عمليات تنظيف وهيكلة شاملة لجعلها صالحة للتحليل الإحصائي وبناء النماذج.
الخطوات الرئيسية:
استكشاف البيانات: فحص البيانات الأولية وتحديد القيم المفقودة (Missing Values)، التكرارات (Duplicates)، والبيانات غير المنطقية.
تنظيف البيانات: معالجة القيم المفقودة، إزالة التكرارات، وتصحيح الأخطاء.
معالجة البيانات (Preprocessing): تحويل أنواع البيانات وهندسة الميزات (Feature Engineering) لتهيئتها للتحليل.
التحليل: استخدام (Jupyter Notebook) لإجراء تحليل أولي على البيانات النظيفة.
الأدوات المستخدمة:
Python
Pandas: المكتبة الأساسية لعمليات التنظيف والمعالجة.
Jupyter Notebook: لتوثيق الخطوات وإجراء التحليل.
هذا المشروع يبرز الخبرة في التعامل مع البيانات "الفوضوية" (MessY Data) وتحويلها إلى بيانات نظيفة ومنظمة جاهزة للاستخدام."