تنظيف وتحليل بيانات باستخدام python
تفاصيل العمل
بصفتي مهندسة ذكاء اصطناعي (AI) و علوم بيانات (Data Science)، أقدم خدمة متكاملة لـ تنظيف ومعالجة البيانات (Data Wrangling)، وهي المرحلة الأكثر حسماً لضمان دقة ونجاح نماذج التعلم الآلي الخاصة بك. خبرتي تتجاوز التنظيف السطحي؛ حيث أُجهز بياناتك بخطوات هندسة ميزات متقدمة (Feature Engineering) لتقليل التحيز وزيادة قوة التنبؤ. ماذا ستحصل مقابل 5$ (الخدمة الأساسية)؟ مقابل سعر الخدمة الأساسي (لمجموعة بيانات صغيرة/متوسطة تصل إلى 5000 سجل)، سأقوم بالتالي: اكتشاف وإزالة التكرارات: استخدام تقنيات Pandas لحساب وتحديد وحذف جميع السجلات المكررة تماماً (كما تم في إزالة 937 تكرار من بيانات النبيذ). توحيد الهيكل: توحيد أسماء الأعمدة وتنظيف البيانات الأولية لضمان التنسيق الصحيح. تقرير جودة البيانات: تقرير موجز يحدد نسبة القيم المفقودة وحجم البيانات النظيفة النهائي. المعالجة الذكية للقيم المفقودة تطبيق استراتيجيات متقدمة مثل الملء بالمتوسط الشرطي (groupby().transform()) بدلاً من المتوسط العام، لتقليل التحيز. هندسة الميزات المتقدمة (إضافة قوية) إنشاء ميزات جديدة (مثل تصنيف الأداء High/Medium/Low) وتحويل الأعمدة الزمنية (date) إلى تنسيق datetime، و تجهيزها لـ نمذجة التصنيف معالجة البيانات الكبيرة التعامل مع مجموعات بيانات تتجاوز 10,000 سجل.
مهارات العمل
بطاقة العمل
طلب عمل مماثل