تحليل بيانات سرطان الثدي وبناء نموذج تعلم آلي لتصنيف الحالات
تفاصيل العمل
وصف المشروع الاحترافي: يهدف هذا المشروع إلى تحليل وتصنيف بيانات سرطان الثدي باستخدام تقنيات التعلم الآلي، من خلال مجموعة من الخطوات المنهجية تشمل: تحليل البيانات الاستكشافي (EDA): استكشاف خصائص البيانات لاكتشاف الأنماط والعلاقات بين المتغيرات، وتحديد القيم الشاذة (anomalies) لفهم طبيعة البيانات بشكل أعمق. تنظيف البيانات (Data Cleaning): إزالة القيم المكررة، ومعالجة القيم المفقودة باستخدام الأساليب الإحصائية المناسبة لضمان جودة البيانات قبل النمذجة. تهيئة البيانات للنمذجة (Model Preprocessing): تحويل البيانات إلى الشكل المناسب لبناء نماذج التعلم الآلي، من خلال التطبيع (scaling) وتقسيم البيانات إلى مجموعات تدريب واختبار. بناء النماذج وتقييم الأداء: إنشاء أكثر من نموذج تعلم آلي لتصنيف حالات سرطان الثدي، ثم مقارنة أداء النماذج باستخدام مؤشرات مثل الدقة (accuracy) والاستدعاء (recall) وF1-score لتحديد النموذج الأمثل.
مهارات العمل
بطاقة العمل
طلب عمل مماثل