قمت بتنفيذ مشروع Web Scraping احترافي لاستخلاص بيانات شركات ومكاتب معمارية ومشاريعها من موقع Archello، مع تنظيم البيانات في شكل منسق وقابل للاستخدام في التحليل أو الإدخال في أنظمة أخرى.
المشروع يركز على جمع بيانات عامة متاحة (Public Data) مع معالجة النصوص وتنظيفها لضمان جودة النتائج ودقتها.
هدف المشروع
تمكين العميل من:
بناء قاعدة بيانات لشركات ومكاتب معمارية.
تحليل المشاريع المنفذة لكل شركة.
استخدام البيانات في الأبحاث، التسويق، أو أنظمة داخلية.
البيانات التي تم استخراجها
تم سحب وتنظيم الحقول التالية لكل شركة:
Profile URL (رابط الصفحة)
Title (اسم الشركة / المكتب)
Meta Description
Open Graph Description
Profile Name
About Text (نبذة عن الشركة)
Number of Projects (عدد المشاريع المرتبطة)
Office Website
Office Location (الدولة – المدينة)
Office Phone
Raw Office Data (البيانات الخام للفرع كما تظهر بالموقع)
التحديات التي تم التعامل معها
اختلاف بنية الصفحات بين الشركات.
وجود بيانات ناقصة أو غير موحدة.
تنظيف النصوص من الفراغات والأسطر الزائدة.
استخراج البيانات من عناصر HTML متعددة المستويات.
الحل التقني
تحليل هيكل صفحات Archello لكل Brand.
استخدام أدوات Web Scraping لاستخلاص البيانات بدقة.
معالجة البيانات (Data Cleaning) وتوحيد الصيغة.
تصدير النتائج في ملف منظم وجاهز للاستخدام.
عينة من البيانات (Sample Output)
Company: Origami Studio
Location: Riyadh, Saudi Arabia
Projects: 1
Profile URL: https://archello.com/bran...
قيمة المشروع للعميل
✅ توفير وقت وجهد البحث اليدوي
✅ بيانات دقيقة ومنظمة
✅ جاهزة للتحليل أو الاستخدام التجاري
✅ إمكانية التوسع وسحب آلاف الصفحات بنفس الأسلوب
ملاحظة مهمة (Legal & Ethics)
تم تنفيذ المشروع على بيانات متاحة للعامة فقط (Publicly Available Data) مع الالتزام بالاستخدام المسؤول للبيانات.