تصنيف سرطان الثدي باستخدام التعلم الآلي
تفاصيل العمل
نظرة عامة على المشروع يهدف هذا المشروع إلى بناء نماذج تعلم آلي وتقييمها لتصنيف الحالات الطبية. ويتضمن المشروع معالجة البيانات الأولية، واختيار الميزات، وتدريب النموذج، وتقييم الأداء. التقنيات المستخدمة بايثون NumPy باندا ماتبلوتليب Scikit-learn دفتر ملاحظات جوبيتر مجموعة البيانات مجموعة البيانات المستخدمة هي مجموعة بيانات سرطان الثدي في ولاية ويسكونسن، والمقدمة من مكتبة scikit-learn. تحتوي هذه المجموعة على 569 عينة مع 30 خاصية تصف خصائص نواة الخلية. النماذج المستخدمة مصنف شجرة القرار الانحدار اللوجستي معايير التقييم دقة تقرير التصنيف مصفوفة الارتباك منحنى ROC درجة AUC نتائج شجرة القرار : الدقة = 91.23%، مساحة تحت منحنى ROC = 0.9206 الانحدار اللوجستي : الدقة = 95.61%، ROC-AUC = 0.9950 يتفوق الانحدار اللوجستي على خط الأساس لشجرة القرار في هذه المجموعة من البيانات.
مهارات العمل