قمت بتنفيذ مشروع لاستخراج الكلمات والعبارات الأكثر شيوعًا من أي صفحة ويب باستخدامWeb Scraping و (NLP).
المشروع يعتمد على واجهة مستخدم بسيطة مبنية باستخدام HTML, CSS, JavaScript مع Flask (Backend)، بالإضافة إلى خوارزميات تحليل النصوص.
تفاصيل العمل:
استخراج المحتوى النصي من أي رابط يضعه المستخدم عبر تقنيات Web Scraping.
تنظيف النصوص وإزالة العناصر غير المهمة مثل علامات HTML، علامات الترقيم، كلمات الوقف (Stop Words).
تطبيق خطوات NLP مثل Tokenization – Lemmatization لتحسين جودة النتائج.
تحليل تكرار الكلمات واستخراج الكلمات الأكثر استخدامًا (Hot Keywords).
عرض النتائج بشكل واضح في واجهة ويب تفاعلية.