عالجة بيانات Iris باستخدام Python و Scikit-learn
تفاصيل العمل
في هذا المشروع قمت بمعالجة وتحضير مجموعة بيانات Iris Dataset باستخدام لغة Python ومكتبات Pandas و Scikit-learn. الخطوات التي تم تنفيذها: قراءة البيانات من ملف CSV والتأكد من صحتها. التعامل مع القيم المفقودة باستخدام المتوسط الحسابي. ترميز الأعمدة النصية (Label Encoding) لتحويل الفئات إلى قيم رقمية. تطبيع البيانات (Normalization) باستخدام StandardScaler. تقسيم البيانات إلى مجموعات تدريب واختبار مع الحفاظ على التوزيع الصحيح للفئات (Stratified Split). عرض ملخص إحصائي وتوزيع الفئات بين المجموعتين. النتيجة: حصلت على مجموعة بيانات نظيفة ومجهزة يمكن استخدامها مباشرةً لتدريب نماذج تعلم الآلة. هذا المشروع يوضح خبرتي في: معالجة البيانات (Data Preprocessing) التعامل مع القيم المفقودة الترميز والتطبيع تقسيم البيانات بشكل صحيح
مهارات العمل
بطاقة العمل
طلب عمل مماثل