تحليل إحصائي ومكاني لأكثر من 1.18 مليون سجل من البيانات الرسمية لجرائم مدينة شيكاغو. عملت ضمن فريق تقني لتحويل هذه البيانات الضخمة إلى رؤى بيانية واضحة تساعد في فهم أنماط الجريمة وتوزيعها الزمني والجغرافي.
دوري في الفريق (Data Cleaning):
كنت المسؤول عن المرحلة الأكثر حرجاً وهي تنظيف وتجهيز البيانات، حيث قمت بـ :
حذف السجلات الفاقدة للإحداثيات الجغرافية لضمان دقة التحليل المكاني والخرائط.
معالجة القيم المفقودة (Nulls) في أعمدة هامة مثل "الاعتقالات" و"الجرائم المنزلية" وتعبئتها بدقة.
تصحيح أنواع البيانات (Data Types) وتحويل التواريخ لصيغ برمجية صحيحة لتسريع عملية المعالجة.
أبرز النتائج:
تحديد ذروة الجرائم زمنياً (ساعات المساء وفصل الصيف) وجغرافياً (الشوارع والمناطق السكنية).
تحليل معدلات الاعتقال وتصنيف الجرائم الأكثر شيوعاً مثل السرقة والاعتداء.
الأدوات المستخدمة:
Python (Pandas, NumPy)
API Data Collection