نموذج تنبؤي لتشخيص مرض الزهايمر باستخدام التعلم الآلي (Machine Learning) – مشروع متكامل من التحليل إلى النشر
تفاصيل العمل
قمت بتطوير مشروع متكامل لتوقع وتشخيص الإصابة بمرض الزهايمر اعتمادًا على بيانات سريرية منظمة، من خلال تنفيذ دورة تعلم آلي كاملة تبدأ من تحليل البيانات وتنتهي باختيار أفضل نموذج تنبؤي بدقة عالية. ركز المشروع على بناء أداة تنبؤية تدعم التشخيص المبكر وتساعد في تحسين دقة القرار الطبي وتسريع عملية التقييم. تفاصيل البيانات: تم العمل على قاعدة بيانات تضم 2149 سجلًا طبيًا و34 متغيرًا تنبؤيًا تشمل العمر، مؤشر كتلة الجسم، ضغط الدم، درجات MMSE، التاريخ العائلي، وعوامل سريرية وديموغرافية أخرى. المتغير الهدف Diagnosis كان ثنائيًا: 0 لحالة طبيعية إدراكيًا 1 لحالة إصابة بالزهايمر البيانات كانت نظيفة وخالية من القيم المفقودة أو التكرار، كما أن توزيع الفئات كان متوازنًا تقريبًا مما ساعد في تقييم عادل للنماذج. منهجية التنفيذ: تم تنفيذ المشروع وفق Pipeline احترافي يشمل: - فحص البيانات وتحليل بنيتها - إجراء تحليل استكشافي شامل EDA لدراسة التوزيعات والارتباطات وتوازن الفئات - تحديد أقوى المتغيرات تأثيرًا مثل MMSE والعمر والتاريخ العائلي - حذف الأعمدة غير المؤثرة - تقسيم البيانات إلى 80% تدريب و20% اختبار - تطبيق StandardScaler على المتغيرات العددية - تدريب وتقييم 10 نماذج تصنيف مختلفة - مقارنة الأداء باستخدام F1-Score و Accuracy لاختيار النموذج الأفضل النماذج التي تم اختبارها: Logistic Regression Support Vector Machine K-Nearest Neighbors Decision Tree Random Forest AdaBoost Gaussian Naive Bayes XGBoost Bagging Classifier Stacking Classifier النتائج: أظهرت النتائج تفوقًا واضحًا لنماذج Ensemble مقارنة بالنماذج الفردية. حقق نموذج XGBoost أفضل أداء بنسبة: F1-Score بلغت 92.6% Accuracy بلغت 94.8% وجاء Random Forest و Stacking Classifier في المراتب التالية بأداء قريب، مما أكد كفاءة الأساليب المعتمدة على الأشجار في التقاط الأنماط الطبية المعقدة. أبرز التحليلات أظهرت أن درجات MMSE والعمر والتاريخ العائلي من أقوى المؤشرات المرتبطة بالتشخيص. القيمة العملية للمشروع - بناء نموذج تنبؤي دقيق يدعم برامج الفحص المبكر - إبراز قوة Ensemble Methods في التطبيقات الطبية - استخراج عوامل الخطر الرئيسية عبر التحليل الإحصائي - إمكانية تطوير النموذج ليعمل كتطبيق ويب للتنبؤ الفوري التقنيات المستخدمة Python Pandas NumPy Scikit-learn XGBoost Matplotlib Seaborn يعكس هذا المشروع قدرتي على تنفيذ دورة تعلم آلي متكاملة في قطاع حساس مثل الرعاية الصحية، بدءًا من فهم البيانات وتحليلها، مرورًا بتجهيزها وتدريب عدة نماذج، وصولًا إلى اختيار النموذج الأمثل وتقييمه باحترافية عالية مع التركيز على الأثر العملي والتطبيقي.
مهارات العمل
بطاقة العمل
طلب عمل مماثل