مشروع Web Scraping لاستخراج بيانات منتجات (Python)
تفاصيل العمل
قمت بتطوير حل Web Scraping احترافي لاستخراج بيانات منتجات بشكل منظم ودقيق من موقع Parts Europe، مع التركيز على السرعة، الاستقرار، وجودة البيانات. 🔧 تفاصيل التنفيذ: Scraping متعدد المهام باستخدام ThreadPoolExecutor (حتى 25 Thread) لزيادة سرعة التنفيذ إدارة الجلسات (Session Management) مع Connection Pooling لتحسين الأداء Headers مخصصة + Retry Logic للتعامل مع Rate Limiting تحليل HTML باستخدام BeautifulSoup4 معالجة أخطاء شاملة + التحقق من صحة البيانات تتبع التقدم باستخدام TQDM حفظ البيانات تدريجيًا في CSV كل 100 سجل لتقليل فقدان البيانات 📊 البيانات المستخرجة: رابط المنتج اسم ووصف المنتج السعر والعملة حالة التوفر حسب الدولة مسار التصنيف (Breadcrumb) جميع خصائص المنتج مجمعة 📁 المخرجات: ملف CSV نظيف ومنظم (9 أعمدة) استخراج بيانات من عدة فئات (خوذات – معدات حماية) تصدير البيانات إلى Google Sheets لسهولة التحليل والمشاركة 🛠️ التقنيات المستخدمة: Python – Requests – BeautifulSoup4 – ThreadPoolExecutor – CSV – Google Colab
مهارات العمل
بطاقة العمل
طلب عمل مماثل