UK Train Data Analysis Dashboard UK Train Data Analysis Dashboard UK Train Data Analysis Dashboard UK Train Data Analysis Dashboard
تفاصيل العمل

🚆 UK Train Data Analysis Dashboard DEPI-NTI graduation project After 7 months of studying, experimenting and working on different data. 🔍 Tools Used: Power BI, Pandas, SQL 📊 Goal: Optimize insight into train delays, performance, and passenger trends. During this project, I processed raw UK train data and transformed it into an interactive dashboard using Power BI. Here's a breakdown of my data pipeline and insights: 🔧 Data Preparation (Python & Pandas): df = pd.read_csv('uk_train_data.csv') df['Delay'] = df['Actual Arrival Time'] - df['Scheduled Arrival Time'] df.dropna(subset=['Delay', 'Station', 'Date'], inplace=True) df['Date'] = pd.to_datetime(df['Date']) df['Month'] = df['Date'].dt.to_period('M') 🔹 Removed null values 🔹 Calculated delay time 🔹 Extracted month for trend analysis 🧠 SQL Aggregation: SELECT Station, COUNT(*) AS Total_Trips, AVG(Delay_Minutes) AS Avg_Delay FROM train_data GROUP BY Station ORDER BY Avg_Delay DESC; 🔹 Identified worst-performing stations 🔹 Used average delay and trip volume for ranking 📊 Visualization in Power BI: Delay trend line chart by month 📈 Station-wise delay heatmap 🗺️ Passenger volume comparison bar chart 📊 KPIs: On-time rate %, Avg Delay, Total Trips ✅ Key Insights: ❗ Certain stations consistently experience >15 min average delays 🚀 Passenger volume increases didn’t always correlate with delays 📅 Delays spiked in winter months This project helped me sharpen my end-to-end data skills — from cleaning & transformation with Pandas, to querying with SQL, to building dynamic dashboards in Power BI. 🚆 مشروع تحليل بيانات قطارات المملكة المتحدة 🛠️ الأدوات المستخدمة: Power BI، Pandas، SQL 🎯 الهدف: فهم أداء القطارات والتأخيرات واتجاهات عدد الركاب. خلال المشروع ده، قمت بتنظيف وتحويل بيانات خام عن القطارات في بريطانيا إلى لوحة معلومات تفاعلية باستخدام Power BI. 🔧 تجهيز البيانات باستخدام Python وPandas: 🔹 تم حذف القيم الفارغة 🔹 حساب التأخيرات 🔹 استخراج الشهر لتحليل الاتجاهات الزمنية 🧠 تجميع البيانات باستخدام SQL: 🔹 تحديد المحطات التي تعاني من أكبر متوسط تأخير 🔹 ترتيب المحطات حسب الأداء 📊 التقارير باستخدام Power BI: رسم بياني زمني للتأخيرات حسب الشهور خريطة حرارية حسب المحطة مقارنة عدد الركاب مؤشرات أداء: نسبة الوصول في الوقت، المتوسط، إجمالي الرحلات ✅ أهم النتائج: ❗ بعض المحطات تأخيراتها أكثر من 15 دقيقة بشكل ثابت 🚀 الزيادة في عدد الركاب لا تعني دائمًا زيادة التأخير 📅 الازدحام والتأخيرات زادت في الشهور الشتوية المشروع ده زوّدني بخبرة كاملة في دورة حياة تحليل البيانات: من التنظيف والمعالجة باستخدام Pandas، إلى SQL، ثم تصميم داشبورد تفاعلي في Power BI. 🔗 شرفني بالتواصل وتبادل الأفكار في مجال البيانات!

شارك
بطاقة العمل
تقييم المستقل
تاريخ النشر
منذ شهر
المشاهدات
23
المستقل
Mohamed Ayman
Mohamed Ayman
مبرمج تطبيقات ومواقع
طلب عمل مماثل
شارك
مركز المساعدة