في هذا المشروع قمت بتطوير نموذج Machine Learning للتنبؤ المبكر بأداء الطلاب الأكاديمي اعتمادًا على تحليل البيانات التعليمية. الهدف من المشروع هو مساعدة المؤسسات التعليمية على تحديد الطلاب المعرضين لانخفاض الأداء أو الرسوب في مرحلة مبكرة حتى يمكن اتخاذ إجراءات دعم مناسبة لتحسين نتائجهم.
بدأت العمل بمرحلة تحليل البيانات الاستكشافي (EDA) لفهم طبيعة البيانات واكتشاف الأنماط والعلاقات بين المتغيرات المختلفة مثل درجات الاختبارات، معدل الحضور، مستوى مشاركة الطلاب، والأنشطة الدراسية. بعد ذلك قمت بتنفيذ عملية تنظيف ومعالجة البيانات (Data Preprocessing) والتي تضمنت التعامل مع القيم المفقودة، تحويل المتغيرات الفئوية إلى متغيرات رقمية، وتجهيز البيانات لتكون مناسبة لبناء النماذج.
تم بعد ذلك تطبيق عدة خوارزميات من Machine Learning لبناء نموذج تنبؤي قادر على تصنيف أداء الطلاب، مثل:
Logistic Regression
Decision Tree
Random Forest
وقمت بمقارنة أداء النماذج باستخدام مجموعة من مقاييس التقييم مثل:
Accuracy
Precision
Recall
F1 Score
كما قمت بإنشاء تحليلات بصرية للبيانات لتوضيح العوامل الأكثر تأثيرًا على أداء الطلاب، مما يساعد في فهم أعمق للبيانات واتخاذ قرارات تعليمية أفضل.
تم تنفيذ المشروع باستخدام Python والعديد من مكتبات تحليل البيانات مثل:
Pandas
NumPy
Scikit-learn
Matplotlib
النتيجة النهائية كانت نموذج تنبؤي يمكن استخدامه لدعم عملية اتخاذ القرار في المؤسسات التعليمية وتحسين الأداء الأكاديمي للطلاب من خلال التدخل المبكر.