Web Scraping — استخراج بيانات منتجات بطاريات شمسية من SunWatts
تفاصيل العمل

نبذة مختصرة نفذت مشروع استخراج بيانات احترافي من صفحة منتجات بطاريات شمسية على موقع SunWatts، وجمعت الحقول الرئيسية لكل منتج (الاسم، الكود، التوفر، السعر، رابط الصورة، الوصف، النوع، إلخ) ثم نظفتها وصنفتها وصدرتهـا بصيغ جاهزة للاستخدام (Excel / CSV / SQL). ما تم عمله (تفاصيل) تحليل بنية صفحات المنتجات على الموقع وتحديد مواقع الحقول: Title, Full Title, SKU, MPN, Availability, Shipping, Price, Image URL, Description, Type. استخراج النصوص متعددة الأسطر (وصف طويل) ومعالجة الفواصل والروابط داخلها. تحويل أسعار العملات وصياغة القيم (مثلاً: ر.س.‏2,800.00) إلى قيمة رقمية قابلة للمعالجة. تحميل أو حفظ روابط الصور (Image URL) وتجهيز مسار تنزيل إن طُلب. تنظيف البيانات (trim، إزالة أسطر فارغة، تصحيح الترميز/UTF-8) وإزالة التكرارات. تصدير النتائج إلى Excel/CSV وكتابة سكربت قابل لإعادة التشغيل لتحديث البيانات لاحقًا. التحديات الفنية التي تم التعامل معها أوصاف منتجات متعددة الأسطر تحتوي على نص تسويقي وروابط — تطلبت قواعد تنظيف متقدمة. صيغ أسعار تحمل رموز عملة محلية — تحويلها لقيم رقمية قياسية. ضمان ثبات الاستخلاص عند اختلاف تموضع الحقول ضمن صفحات المنتجات. ملف Excel/CSV منظم يحتوي الحقول: Title, Full Title, SKU, MPN, Availability, Shipping, Price (numeric), Image URL, Description, Type. نسخة عينة (sample) مكونة من عدة صفوف لمعاينة الجودة. خيار: تنزيل الصور في مجلد منظم حسب SKU أو حفظ الروابط فقط. قيمة العميل تسليم بيانات منظمة جاهزة للتحليل، عرض الأسعار، مقارنة المنتجات أو إدخالها في متجر/قاعدة بيانات. توفير وقت وجهد البحث اليدوي ودقة أعلى في النتائج.

شارك
بطاقة العمل
تاريخ النشر
منذ 22 ساعة
المشاهدات
8
القسم
المستقل
طلب عمل مماثل
شارك
مركز المساعدة