فلترة البريد الإلكتروني باستخدام الشبكات العصبية العميقة (LSTM)
تفاصيل العمل
وصف المشروع: Email Spam Classifier using Deep Learning (LSTM) الهدف: تطوير نموذج ذكاء اصطناعي قادر على تمييز رسائل البريد الإلكتروني المهمة (Ham) من الرسائل المزعجة (Spam) تلقائيًا، باستخدام نموذج شبكة LSTM مبني على التعلم العميق (Deep Learning). الميزات الرئيسية للعمل: تحليل بيانات حقيقية: تم استخدام مجموعة بيانات واقعية (SMS Spam Collection Dataset) تحتوي على آلاف الرسائل المصنفة يدويًا. الرسائل تنقسم إلى "ham" (مهمة) و "spam" (غير مرغوب بها). معالجة البيانات النصية: تنظيف وتشفير النصوص باستخدام تقنيات: Tokenizer لتحويل الكلمات إلى أرقام. Pad Sequences لجعل جميع الرسائل بنفس الطول. ? نموذج LSTM فعال: يعتمد على شبكة ذاكرة طويلة المدى (LSTM) التي تتفوق في فهم تسلسل الكلمات والسياق النصي. النموذج يحتوي على طبقة Embedding لفهم الكلمات، تليها LSTM و Dropout و Dense. ? تدريب دقيق مع تقسيم البيانات: تقسيم البيانات إلى مجموعة تدريب واختبار بنسبة 80/20 لضمان تقييم موضوعي لأداء النموذج. رسوم بيانية تفاعلية: تم رسم منحنيات الدقة (Accuracy) و الخسارة (Loss) لكل حقبة تدريب. الرسوم باللغة الإنجليزية وتُظهر تطور النموذج بوضوح. ️ قابلية التخصيص والتوسع: يمكن تعديل النموذج بسهولة لدعم لغات مختلفة أو أنواع رسائل أخرى. الكود مصمم ليكون مرنًا لأي إضافات مستقبلية (مثل استخدام CNN أو Attention). كفاءة الأداء: يستخدم Tokenizer مع عدد كلمات محدود (max_words=5000) لتحقيق توازن بين الأداء والذاكرة. تم ضبط حجم الطبقات والعشوائية (Dropout) لمنع فرط التعلّم (Overfitting). ️ التقنيات المستخدمة: الفئةالأدوات تحليل البياناتpandas, numpy, sklearn التعلم العميقTensorFlow, Keras التصور البيانيmatplotlib معالجة اللغة الطبيعيةTokenizer, PadSequences
مهارات العمل
بطاقة العمل
طلب عمل مماثل