🚗 التنبؤ بأسعار السيارات المستعملة | Used Car Price Prediction 🚗 التنبؤ بأسعار السيارات المستعملة | Used Car Price Prediction 🚗 التنبؤ بأسعار السيارات المستعملة | Used Car Price Prediction 🚗 التنبؤ بأسعار السيارات المستعملة | Used Car Price Prediction 🚗 التنبؤ بأسعار السيارات المستعملة | Used Car Price Prediction 🚗 التنبؤ بأسعار السيارات المستعملة | Used Car Price Prediction
تفاصيل العمل

يهدف هذا المشروع إلى بناء نموذج تعلم آلي للتنبؤ بأسعار السيارات المستعملة اعتمادًا على مجموعة من خصائص السيارة مثل سنة الصنع، نوع الوقود، قوة المحرك، وعدد الكيلومترات المقطوعة. مع النمو السريع لسوق السيارات المستعملة وغياب معايير تسعير ثابتة، يهدف هذا المشروع إلى تقديم نظام تسعير موضوعي يعتمد على البيانات بدلاً من التقديرات العشوائية. يغطي المشروع دورة علم البيانات كاملة، بدءًا من معالجة البيانات وتنظيفها، مرورًا بالتحليل الاستكشافي، وهندسة الخصائص، وانتهاءً ببناء نماذج التنبؤ وتقييم أدائها. أهداف المشروع يركز المشروع على: تحليل العوامل الرئيسية التي تؤثر على أسعار السيارات المستعملة معالجة مشاكل البيانات الواقعية مثل القيم المفقودة والحقول النصية غير المنظمة مقارنة نماذج الانحدار المختلفة لتحديد النموذج الأكثر دقة بناء نموذج قابل للتفسير ويمكن تطبيقه عمليًا مجموعة البيانات تم استخدام بيانات من منصة Kaggle تحتوي على إعلانات سيارات مستعملة في عدة مدن داخل الهند. تتضمن البيانات متغيرات مثل: اسم السيارة والطراز المدينة سنة التصنيع عدد الكيلومترات المقطوعة نوع الوقود نوع ناقل الحركة عدد الملاك السابقين كفاءة استهلاك الوقود سعة المحرك وقوته عدد المقاعد المتغير الهدف هو سعر السيارة. معالجة البيانات تم تنفيذ عدة خطوات لتحسين جودة البيانات، منها: حذف الأعمدة غير المهمة معالجة القيم المفقودة باستخدام الوسيط (Median) تنظيف المتغيرات النصية مثل Mileage و Engine و Power إنشاء متغير جديد يمثل اسم السيارة والطراز إزالة القيم الشاذة باستخدام IQR ترميز المتغيرات الفئوية توحيد القيم باستخدام StandardScaler التحليل الاستكشافي للبيانات تم إجراء تحليل شامل لفهم توزيع البيانات والعلاقات بينها باستخدام الرسوم البيانية والإحصاءات الوصفية، مثل: تحليل توزيع الأسعار دراسة تأثير المتغيرات الفئوية تحليل العلاقة بين المتغيرات باستخدام خريطة الارتباط إنشاء تصورات تفاعلية باستخدام Plotly أهم النتائج أظهر التحليل أن: السيارات الأحدث عادةً ما تكون أكثر سعرًا السيارات ذات ناقل الحركة الأوتوماتيكي غالبًا أعلى سعرًا قوة المحرك وسنة التصنيع من أهم العوامل المؤثرة في السعر نماذج التعلم الآلي تم تطبيق نموذجين رئيسيين للتنبؤ بالأسعار: Linear Regression يستخدم كنموذج مرجعي بسيط يعتمد على العلاقات الخطية بين المتغيرات. Decision Tree Regressor قادر على التقاط العلاقات غير الخطية والتفاعلات بين المتغيرات بشكل أفضل. تقييم النماذج تم تقييم النماذج باستخدام عدة مقاييس مثل: MAE MSE RMSE معامل التحديد R² أظهرت النتائج أن Decision Tree Regressor قدم أداءً أفضل مقارنةً بنموذج الانحدار الخطي، حيث استطاع تمثيل العلاقات المعقدة بين المتغيرات بدقة أعلى. الأدوات المستخدمة Python Pandas – NumPy Matplotlib – Seaborn – Plotly Scikit-learn XGBoost – CatBoost يوضح هذا المشروع كيف يمكن استخدام تقنيات تعلم الآلة لتحليل بيانات السوق وبناء نظام تنبؤي يساعد في تقدير أسعار السيارات المستعملة بشكل أكثر دقة وموضوعية.

شارك
بطاقة العمل
تاريخ النشر
منذ يوم
المشاهدات
4
المستقل
Mohammed Salah
Mohammed Salah
محلل بيانات
طلب عمل مماثل
شارك
مركز المساعدة