تحليل بيانات التأمين الصحي والتنبؤ بالتكاليف الطبية
تفاصيل العمل
تحليل مجموعة بيانات التأمين الصحي لتحديد العوامل التي تؤثر على التكاليف الطبية باستخدام تقنيات علم البيانات والتعلم الآلي. يتضمن المشروع: - استكشاف البيانات وتحليلها (EDA). - تنظيف البيانات والتعامل مع القيم المفقودة. - بناء نموذج تنبؤي يعتمد على الانحدار الخطي أو الأشجار العشوائية. - تقييم أداء النموذج باستخدام مقاييس مثل RMSE و R². - نشر النموذج باستخدام Streamlit لتمكين المستخدمين من إدخال بيانات جديدة والحصول على التوقعات بشكل تفاعلي. 🛠️ الأدوات والتقنيات: - تحليل البيانات: Python (Pandas, NumPy, Scikit-learn, Matplotlib, Seaborn) - تطوير النموذج: Scikit-learn و XGBoost - النشر (Deployment): - Streamlit لإنشاء واجهة ويب تفاعلية - رفع التطبيق على Streamlit Cloud أو خدمة استضافة أخرى - التصور البياني:* Streamlit Charts & Matplotlib 📂 المرفقات والملاحظات: - ملف البيانات: `insurance.csv` - تقرير PDF يشمل التحليل والنتائج - رابط التطبيق المنشور على Streamlit 🚀 الهدف: توفير أداة سهلة الاستخدام لشركات التأمين الصحي تتيح لها إدخال بيانات العملاء والحصول على توقعات دقيقة لتكاليفهم الطبية مباشرةً عبر واجهة تفاعلية.
مهارات العمل
بطاقة العمل
طلب عمل مماثل