تصنيف درجة الائتمان باستخدام Decision Tree تصنيف درجة الائتمان باستخدام Decision Tree تصنيف درجة الائتمان باستخدام Decision Tree تصنيف درجة الائتمان باستخدام Decision Tree
تفاصيل العمل

نظرة عامة في هذا المشروع، قمت ببناء نموذج شجرة قرار (Decision Tree) لتصنيف العملاء إلى ثلاث فئات ائتمانية: Poor, Standard, Good. التحدي الأكبر كان في معالجة البيانات المتسخة التي تحتوي على قيم مفقودة، قيم شاذة، وتنسيقات غير متسقة. 1.البيانات مجموعة بيانات تحتوي على 100,000 عميل و28 عمودًا، تشمل: معلومات شخصية: العمر، المهنة، الدخل السنوي. معلومات مصرفية: عدد الحسابات، عدد بطاقات الائتمان، الديون المستحقة. تاريخ ائتماني: مدة التاريخ الائتماني، التأخير في السداد، سلوك الدفع. 2.خطوات المعالجة (Data Cleaning) إزالة الأعمدة غير المفيدة (ID, Name, SSN). تشفير الشهور يدويًا. معالجة العمر: إزالة القيم السالبة وملء المفقود بالوسيط لكل عميل. تجميع المهن إلى فئات (Professional, Education, Media, Business) وتطبيق one-hot encoding. تنظيف الأعمدة الرقمية: إزالة الشرطة السفلية "_"، تحويل إلى numeric، إزالة القيم السالبة، ملء المفقود باستخدام forward/backward fill لكل عميل ثم الوسيط. تحديد القيم القصوى المعقولة لكل عمود وإزالة القيم الشاذة. معالجة Credit_Mix: استبدال "_" بـ NaN، ملء بالـ mode. تحويل Credit_History_Age من نص إلى عدد أشهر. معالجة Payment_Behaviour: استبدال القيم غير الصالحة، ملء المفقود، ثم ترميزها. تشفير الهدف (Credit_Score) إلى أرقام. 3.النموذج والنتائج النموذج: DecisionTreeClassifier (max_depth=9) دقة التدريب: 73.2% دقة الاختبار: 72.0%

شارك
بطاقة العمل
تاريخ النشر
منذ 3 أسابيع
المشاهدات
18
المستقل
جني الاسكندراني
جني الاسكندراني
مهندسة ذكاء اصطناعي
طلب عمل مماثل
شارك
مركز المساعدة