UK Train Data Analysis Dashboard
تفاصيل العمل
🚆 UK Train Data Analysis Dashboard DEPI-NTI graduation project After 7 months of studying, experimenting and working on different data. 🔍 Tools Used: Power BI, Pandas, SQL 📊 Goal: Optimize insight into train delays, performance, and passenger trends. During this project, I processed raw UK train data and transformed it into an interactive dashboard using Power BI. Here's a breakdown of my data pipeline and insights: 🔧 Data Preparation (Python & Pandas): df = pd.read_csv('uk_train_data.csv') df['Delay'] = df['Actual Arrival Time'] - df['Scheduled Arrival Time'] df.dropna(subset=['Delay', 'Station', 'Date'], inplace=True) df['Date'] = pd.to_datetime(df['Date']) df['Month'] = df['Date'].dt.to_period('M') 🔹 Removed null values 🔹 Calculated delay time 🔹 Extracted month for trend analysis 🧠 SQL Aggregation: SELECT Station, COUNT(*) AS Total_Trips, AVG(Delay_Minutes) AS Avg_Delay FROM train_data GROUP BY Station ORDER BY Avg_Delay DESC; 🔹 Identified worst-performing stations 🔹 Used average delay and trip volume for ranking 📊 Visualization in Power BI: Delay trend line chart by month 📈 Station-wise delay heatmap 🗺️ Passenger volume comparison bar chart 📊 KPIs: On-time rate %, Avg Delay, Total Trips ✅ Key Insights: ❗ Certain stations consistently experience >15 min average delays 🚀 Passenger volume increases didn’t always correlate with delays 📅 Delays spiked in winter months This project helped me sharpen my end-to-end data skills — from cleaning & transformation with Pandas, to querying with SQL, to building dynamic dashboards in Power BI. 🚆 مشروع تحليل بيانات قطارات المملكة المتحدة 🛠️ الأدوات المستخدمة: Power BI، Pandas، SQL 🎯 الهدف: فهم أداء القطارات والتأخيرات واتجاهات عدد الركاب. خلال المشروع ده، قمت بتنظيف وتحويل بيانات خام عن القطارات في بريطانيا إلى لوحة معلومات تفاعلية باستخدام Power BI. 🔧 تجهيز البيانات باستخدام Python وPandas: 🔹 تم حذف القيم الفارغة 🔹 حساب التأخيرات 🔹 استخراج الشهر لتحليل الاتجاهات الزمنية 🧠 تجميع البيانات باستخدام SQL: 🔹 تحديد المحطات التي تعاني من أكبر متوسط تأخير 🔹 ترتيب المحطات حسب الأداء 📊 التقارير باستخدام Power BI: رسم بياني زمني للتأخيرات حسب الشهور خريطة حرارية حسب المحطة مقارنة عدد الركاب مؤشرات أداء: نسبة الوصول في الوقت، المتوسط، إجمالي الرحلات ✅ أهم النتائج: ❗ بعض المحطات تأخيراتها أكثر من 15 دقيقة بشكل ثابت 🚀 الزيادة في عدد الركاب لا تعني دائمًا زيادة التأخير 📅 الازدحام والتأخيرات زادت في الشهور الشتوية المشروع ده زوّدني بخبرة كاملة في دورة حياة تحليل البيانات: من التنظيف والمعالجة باستخدام Pandas، إلى SQL، ثم تصميم داشبورد تفاعلي في Power BI. 🔗 شرفني بالتواصل وتبادل الأفكار في مجال البيانات!
مهارات العمل
بطاقة العمل
طلب عمل مماثل