قمت بتطوير نظام متقدم لتحليلات الموارد البشرية يهدف إلى التنبؤ بمعدل ترك الموظفين للعمل (Attrition) باستخدام مجموعة بيانات IBM. يجمع المشروع بين التحليل الاستكشافي العميق للبيانات وتعلم الآلة لمساعدة الشركات على تحسين استراتيجيات الاحتفاظ بالموظفين.
1. تحليل البيانات واستخراج الرؤى (EDA):
عوامل الاستقالة: أجريت تحليلاً شاملاً لـ 35 ميزة لتحديد المحركات الرئيسية للاستقالة، مثل العمر، الدخل الشهري، العمل الإضافي، وسنوات الخبرة.
التمثيل البصري: صممت رسومًا بيانية تفصيلية (Heatmaps, Histograms, Boxplots) باستخدام مكتبات Seaborn و Matplotlib للكشف عن الارتباطات بين الرضا الوظيفي، التوازن بين العمل والحياة، وقرار ترك العمل.
هندسة الميزات: قمت بتحويل المتغيرات الفئوية مثل "مجال التعليم" و"القسم" إلى صيغ رقمية مناسبة لنماذج التنبؤ.
2. خط معالجة تعلم الآلة (ML Pipeline):
المعالجة المسبقة: قمت بتنظيف البيانات، ومعالجة القيم المفقودة، وتنسيق الميزات لضمان دقة النموذج.
بناء النموذج: طورت نموذج تصنيف (Classification) مصمم للتنبؤ بدقة بما إذا كان الموظف يخطط للبقاء أو المغادرة.
مقاييس الأداء: قيمت النموذج باستخدام مقاييس الدقة (Precision) والاستدعاء (Recall) لضمان تقديم نتائج موثوقة لمتخذي القرار في الموارد البشرية.
3. القيمة التجارية للمشروع:
استراتيجية الاحتفاظ: قدمت رؤى قابلة للتنفيذ عبر تحديد المجموعات الأكثر عرضة للخطر (مثل الموظفين الذين يعملون ساعات إضافية مكثفة).
قرارات قائمة على البيانات: تحويل بيانات الموظفين الخام إلى أداة تنبؤية تساعد الإدارة على اتخاذ تدابير استباقية لتقليل تكاليف دوران العمالة.
التقنيات المستخدمة:
اللغة: Python.
المكتبات: Pandas, NumPy, Scikit-Learn, Matplotlib, Seaborn.
المجال: تحليلات الموارد البشرية (HR Analytics)، النمذجة التنبؤية.