في هذا المشروع قمت بالعمل على مجموعة بيانات خاصة بمبيعات سيارات BMW على مستوى العالم خلال الفترة من 2018 إلى 2025. الهدف من المشروع كان تحليل البيانات واستخراج بعض الأنماط المهمة المتعلقة بالمبيعات والإيرادات.
بدأت بتنظيف البيانات ومعالجة القيم المفقودة وتجهيزها للتحليل باستخدام لغة Python. بعد ذلك قمت بإجراء تحليل استكشافي للبيانات لفهم توزيع المبيعات ومتوسط الأسعار وأداء المبيعات في المناطق المختلفة.
كما تم استخدام الرسوم البيانية لتوضيح الاتجاهات والعلاقات بين المتغيرات المختلفة مثل عدد السيارات المباعة ومتوسط السعر وبعض المؤشرات الاقتصادية.
وفي النهاية قمت ببناء نموذج بسيط باستخدام Logistic Regression للتنبؤ بما إذا كانت الإيرادات مرتفعة أو منخفضة بناءً على مجموعة من المتغيرات الموجودة في البيانات.
المشروع يوضح القدرة على التعامل مع البيانات الواقعية وتنظيفها وتحليلها واستخدامها في بناء نموذج تنبؤي.