وصف المشروع:
يهدف هذا المشروع إلى تحليل واستكشاف البيانات الخاصة بالكتب الأكثر مبيعاً على موقع أمازون، وذلك باستخدام أدوات تحليل البيانات بلغة البرمجة Python مثل Pandas وNumPy، بالإضافة إلى مكتبات التصوير البياني مثل Matplotlib وSeaborn.
تتضمن مراحل المشروع ما يلي:
تحميل البيانات ومعالجتها:
قراءة ملف CSV الذي يحتوي على بيانات الكتب.
تنظيف البيانات من القيم المفقودة وتوحيد التنسيقات (مثل تحويل التقييمات إلى أرقام والأسعار إلى قيم عشرية).
التحليل الاستكشافي:
استخدام الرسوم البيانية مثل:
مخططات Box Plot لتحليل الأسعار والتقييمات حسب النوع الأدبي.
Scatter Plot لاستكشاف العلاقة بين التقييمات وعدد المراجعات.
Heatmap للكشف عن الترابط بين الحقول الرقمية.
الإجابة على أسئلة تحليلية مهمة مثل:
من هم أعلى المؤلفين من حيث التقييم؟
ما هي أكثر الكتب مراجعة؟
ما الاتجاهات التي تظهرها الأنواع الأدبية عبر السنوات؟
ما هو توزيع التقييمات؟
هل هناك علاقة بين السعر وعدد المراجع
الأدوات المستخدمة:
Python
Pandas, NumPy
Matplotlib, Seaborn
Jupyter Notebook (للتوثيق التفاعلي)
الهدف:
تقديم نظرة شاملة تساعد في فهم توجهات القراء وسلوكياتهم على منصة أمازون، وتحديد العوامل التي تميز الكتب الناجحة.