# النص الأول (كمطور Machine Learning):
السلام عليكم ورحمة الله وبركاته،
أقدم لكم هذا المشروع الذي يعرض خبرتي العملية في مجال تعلم الآلة (Machine Learning)، حيث شاركت مع فريقي في تصميم وتطبيق خوارزمية Naive Bayes لبناء نموذج تصنيف قادر على التنبؤ بما إذا كان الفطر صالحًا للأكل أو سامًا اعتمادًا على خصائصه المختلفة.
-- آلية التنفيذ والعمل المنجز:
- دراسة الخوارزمية وفهم آلية عملها:
بدأ المشروع بدراسة خوارزمية Naive Bayes باعتبارها واحدة من أشهر خوارزميات التصنيف الاحتمالي (Probabilistic Classification) المبنية على نظرية Bayes.
-تقوم الخوارزمية بحساب احتمالية انتماء البيانات إلى فئة معينة بناءً على خصائصها، مع افتراض استقلالية الخصائص عن بعضها البعض.
-تجهيز وتنظيف البيانات (Data Preprocessing).
-قمنا باستخدام Mushroom Dataset التي تحتوي على خصائص مختلفة للفطر مثل اللون والرائحة والشكل.
--تم تنفيذ عدة خطوات لمعالجة البيانات:
* تحميل البيانات باستخدام مكتبة Pandas
* تحليل بنية البيانات وعدد الأعمدة
* التأكد من عدم وجود قيم مفقودة
* تحويل القيم الفئوية إلى قيم رقمية باستخدام LabelEncoder
--اختيار أهم الخصائص (Feature Selection):
قمنا باستخدام خوارزمية **Chi-Squared** لاختيار الخصائص الأكثر تأثيرًا على نتيجة التصنيف.
يساعد هذا الأسلوب على تحديد المتغيرات التي لها علاقة قوية بالمتغير الهدف (صالح للأكل أو سام).
-- بناء نموذج التعلم الآلي:
قمنا بتطبيق نموذج Categorical Naive Bayes باستخدام مكتبة scikit-learn.
تم تقسيم البيانات إلى:
* بيانات تدريب (Training Data).
* بيانات اختبار (Test Data).
ثم تم تدريب النموذج باستخدام دالة `.fit()` ليقوم بحساب احتمالات كل خاصية بالنسبة لكل فئة.
-- تقييم أداء النموذج:
بعد تدريب النموذج تم تقييم أدائه باستخدام عدة مقاييس مثل:
* Accuracy
* Confusion Matrix
* Classification Report
وذلك لمعرفة مدى دقة النموذج في التنبؤ بالبيانات الجديدة.
-- النتائج:
تم بناء نموذج تصنيف فعال باستخدام خوارزمية Naive Bayes قادر على تحليل خصائص الفطر والتنبؤ بما إذا كان صالحًا للأكل أو سامًا. يبرز هذا المشروع قدرتي على العمل مع خوارزميات التعلم الآلي وتنفيذ خطوات معالجة البيانات وبناء النماذج وتحليل النتائج.
-- المهارات والأدوات المستخدمة:
* Machine Learning
* Naive Bayes Algorithm
* Data Preprocessing
* Feature Selection
* Python Programming
* Scikit-learn
* Pandas
* Model Evaluation