في هذا المشروع، قمتُ بتحليل مجموعة بيانات من Kaggle تحتوي على أكثر من 16 ألف سجل و11 عمودًا، تشمل اسم اللعبة، المنصة، سنة الإصدار، النوع، الناشر، والمبيعات في مناطق مثل أمريكا الشمالية وأوروبا واليابان والعالم. بدأتُ أولًا بمرحلة تنظيف البيانات باستخدام Pandas، حيث أزلت القيم المفقودة ليصبح لدي 16,327 صفًا صالحًا للتحليل.
ثم انتقلتُ إلى التحليل الاستكشافي للبيانات (EDA) مستخدمًا مكتبات Matplotlib وSeaborn لتوضيح الأنماط والعلاقات بين المتغيرات. أظهرت النتائج أن Nintendo وElectronic Arts وActivision كانت الناشرين الأكثر إنتاجًا، وأن أنواع الأكشن والرياضة والتصويب كانت الأكثر شيوعًا. كما كشفت الرسوم أن أمريكا الشمالية كانت السوق الأكبر، وأن المبيعات العالمية بلغت ذروتها بين عامي 1995 و2008 قبل أن تبدأ بالانخفاض التدريجي.
لتحليل الاتجاهات بصريًا، أنشأتُ لوحات تفاعلية ورسومًا بيانية مثل Line Chart لعرض تطور المبيعات عبر السنوات، وPie Chart لتوزيع الأنواع، وBar Chart يوضح أكثر الناشرين مبيعًا، بالإضافة إلى Heatmap أظهرت ترابطًا قويًا بين مبيعات أمريكا وأوروبا (≈0.8).
بعد ذلك، استخدمت خوارزميات التنبؤ الزمني ARIMA وProphet لتوقّع المبيعات المستقبلية. قمتُ ببناء نموذج ARIMA(2,1,2)، وضبطت المعاملات لتحقيق أفضل أداء، ثم قارنت نتائجه بنموذج Prophet الذي يعتمد على موسمية سنوية. استخدمت مقياس RMSE لتقييم الأداء على مجموعة الاختبار، حيث تفوقت ARIMA بدقة أعلى (302.7) مقارنة بـ Prophet (408.0).
📈 النتيجة النهائية:
أظهر التحليل أن مبيعات ألعاب الفيديو وصلت لأعلى مستوياتها عام 2008 ثم شهدت انخفاضًا تدريجيًا لاحقًا. كما أثبتت النتائج أن Nintendo هي الناشر الأقوى، وأن أنواع الأكشن والرياضة هي الأكثر تحقيقًا للمبيعات، بينما تفوقت خوارزمية ARIMA في التنبؤ بالمستقبل بدقة أكبر.