تطبيق تفاعلي بسطر الأوامر باستخدام Python لرؤية بيانات مشاركة الدراجات في الولايات المتحدة
تفاصيل العمل
نظرة عامة هذا المشروع عبارة عن تطبيق تفاعلي يعمل من خلال واجهة سطر الأوامر يتيح للمستخدمين استكشاف وتحليل بيانات مشاركة الدراجات في الولايات المتحدة. يسمح التطبيق بتصفية البيانات حسب المدينة والشهر واليوم، ثم يقوم بحساب إحصاءات الاستخدام الرئيسية مثل أكثر أوقات السفر تكرارًا، والمحطات الأكثر شعبية، ومقاييس مدة الرحلة، وإحصاءات المستخدمين الديموغرافية. الميزات - مرشحات دخول المستخدم: يطلب البرنامج من المستخدم تحديد مدينة (شيكاغو، نيويورك، واشنطن)، الشهر واليوم. - تحميل البيانات والمعالجة المبدئية: يقوم بقراءة البيانات من ملفات CSV، وتحويل أعمدة التواريخ إلى نوع datetime، واستخراج الشهر واليوم والساعة. - إحصاءات الوقت: يحدد أكثر شهر، ويوم، وساعة استخدام شيوعًا. - إحصاءات المحطات: يبحث عن أكثر المحطات استخدامًا كنقاط انطلاق ووصول، وكذلك تحليل تركيباتها. - تحليل مدة الرحلة: يقوم بحساب إجمالي مدة الرحلات ومتوسطها. - إحصاءات المستخدم: يلخص عدد أنواع المستخدمين، وتصنيفاتهم حسب الجنس، ويستخلص رؤى حول سنوات الميلاد. التثبيت - تأكد من تثبيت Python 3.x. - قم بتثبيت المكتبات المطلوبة: pip install pandas numpy - ضع ملفات بيانات CSV (مثل: chicago.csv، new_york_city.csv، washington.csv) في دليل المشروع أو قم بتعديل مسارات CITY_DATA حسب الحاجة. الاستخدام - شغّل البرنامج من خلال سطر الأوامر: python your_script_name.py - اتبع التعليمات المعروضة على الشاشة لتحديد المدينة والشهر واليوم للتحليل. سيقوم التطبيق بعرض الإحصاءات المحسوبة ومقاييس الأداء. هيكل المشروع - الدالة main(): تنسق سير عمل التطبيق التفاعلي. - الدالة get_filters(): تحصل على مدخلات المستخدم مع التحقق من صحتها. - الدالة load_data(): تقوم بتحميل وتصفية البيانات بناءً على اختيارات المستخدم. - الدوال time_stats()، station_stats()، trip_duration_stats()، user_stats(): تحسب وتعرض الإحصاءات ذات الصلة.
مهارات العمل