نبذة عن المشروع:
مشروع PneumoScan AI هو تطبيق ويب متكامل (End-to-End) يعتمد على التعلم العميق (Deep Learning) لتشخيص واكتشاف "استرواح الصدر" (Pneumothorax) من خلال صور الأشعة السينية (X-rays) بدقة طبية عالية.
دوري والعمل المنجز:
بصفتي مهندسة تعلم آلة (Machine Learning Engineer)، قمت بتصميم وتطوير مسار البيانات بالكامل (Data Engineering Pipeline). في التطبيقات الطبية، جودة النموذج تعتمد بنسبة 100% على جودة البيانات، لذلك كان التركيز الأساسي على تجهيز بيئة بيانات خالية من العيوب.
أبرز ما تم تنفيذه في المشروع:
تحليل ومعالجة البيانات (EDA & IQA): قمت بتطوير سكريبت مخصص لتحليل جودة الصور (Image Quality Analysis) لتقييم مستويات التباين، السطوع، والضوضاء (SNR) لاستبعاد البيانات التالفة.
المعالجة المسبقة المتقدمة (Advanced Preprocessing): تنظيف وتحويل أقنعة التجزئة (Segmentation Masks) إلى قيم ثنائية صارمة، وتوحيد أحجام الصور.
التحسين المشروط للبيانات (Conditional Data Augmentation): بناء بايبلاين مخصص لزيادة البيانات. تم تطبيق تحسينات مكثفة (مثل CLAHE, Gaussian Noise, Affine, Normalization) على الحالات الإيجابية لرفع كفاءة النموذج، وتطبيق تحسينات طفيفة على الحالات السلبية لتجنب إدخال تشوهات.
هيكلة النموذج (Deep Learning Architecture): تدريب نموذج متقدم يعتمد على (Swin-Unet) قادر على اكتشاف أدق الإصابات (حتى 0.4% من مساحة الرئة).
تقسيم البيانات الصارم (Data Splitting): تطبيق خوارزمية تقسيم تمنع تماماً تسرب البيانات (Zero-leakage) لضمان دقة التقييم.
هذا المسار القوي للبيانات أدى إلى تدريب نموذج عالي الدقة، تم ربطه لاحقاً بواجهة مستخدم تفاعلية (React + FastAPI) تتيح للأطباء استخراج تقارير طبية فورية بصيغة PDF.
الأدوات والتقنيات المستخدمة:
Python, PyTorch, OpenCV
Pandas, NumPy, SciPy
Scikit-learn, matplotlib, seaborn
Data Preprocessing & Augmentation
FastAPI & React.js