نموذج لغة ثلاثي الكلمات (Trigram) مع قياس التعقيد وتقنية تسوية لابلاس – معالجة اللغة الطبيعية (NLP)
تفاصيل العمل
يقوم هذا المشروع بتنفيذ نموذج لغة ثلاثي الكلمات (Trigram) باستخدام لغة بايثون وتقنيات معالجة اللغة الطبيعية. يقوم المشروع بمعالجة مجموعة نصوص، توليد ثلاثيات الكلمات (Trigrams)، حساب احتمالاتها باستخدام تسوية لابلاس (Laplace Smoothing)، وتقييم أداء النموذج من خلال قياس التعقيد (Perplexity). كما يتضمن المشروع تطبيق ويب باستخدام Streamlit يتيح للمستخدمين إدخال جمل والحصول على توقعات للكلمة التالية بناءً على احتمالات الثلاثيات. يعرض هذا المشروع مهارات معالجة النصوص، نمذجة الـ n-grams، تقدير الاحتمالات، وبناء تطبيقات تفاعلية لمعالجة اللغة الطبيعية لتوقع الكلمات وتحليل النصوص بشكل مباشر.
مهارات العمل
بطاقة العمل
طلب عمل مماثل