تحويل وتنظيف بيانات مرورية خام من ملف نصي إلى جدول جاهز للتحليل
تفاصيل العمل
في هذا العمل قمت بالعمل على ملف بيانات مرورية خام بصيغة .txt يحتوي على قراءات حساسات الطريق (توقيت، محطة، اتجاه السير، السرعة، التدفق… إلخ) في صورة قيم مفصولة بفواصل وغير مرتّبة. الخطوات التي قمت بها شملت: قراءة الملف النصي الخام ومعالجة طريقة الفصل بين القيم. ترتيب الأعمدة وتسميتها بشكل واضح مثل: timestamp, station, district, avg_speed, totflow … تحويل أنواع البيانات (مثل التاريخ والوقت، القيم العددية). معالجة القيم المفقودة والصفرية غير المنطقية. تجهيز جدول نهائي منظّم يمكن استخدامه في التحليل الإحصائي أو بناء نماذج تعلم آلي لاحقًا. النتيجة كانت ملف بيانات نظيف ومنسّق يسهل التعامل معه واستخراج المؤشرات منه بدل الاعتماد على الملف الخام المعقّد.
مهارات العمل
بطاقة العمل
طلب عمل مماثل