استخراج وتنظيف وتحليل بيانات الكتب من موقع ويب باستخدام Python
تفاصيل العمل
نبذة عن المشروع مشروع يركز على تحليل وتنظيف مجموعة بيانات للكتب تم جمعها عبر API، بهدف تحسين جودة البيانات وتجهيزها للتحليل الإحصائي واستخلاص الرؤى. تم تنفيذ المشروع باستخدام Python وأدوات تحليل البيانات مثل Pandas وNumPy، مع تطبيق تقنيات التحليل الاستكشافي للبيانات (EDA) لاكتشاف مشكلات جودة البيانات ومعالجتها. شمل العمل: فحص أنواع البيانات ونسب القيم المفقودة. حذف الأعمدة قليلة القيمة التحليلية. معالجة البيانات المركبة والتعامل مع القيم الشاذة. توحيد تنسيقات البيانات وإعادة هيكلتها. النتيجة كانت تحويل بيانات خام غير منظمة إلى Dataset نظيفة وموثوقة وجاهزة للتحليل أو النمذجة، مما يعكس القدرة على تطبيق منهجيات Data Cleaning وData Preparation بشكل عملي واحترافي.
مهارات العمل