النموذج المرفق هو تقرير تحليل بيانات يعرض تحليلاً شاملًا لبيانات تم تحميلها من ملف بيانات خام (مثل CSV أو Excel)، ويتضمن ما يلي:
محتوى التقرير:
نظرة عامة عامة: عدد الصفوف، عدد الأعمدة، القيم الفارغة، المكررة، والقيم المميزة.
تحليل وصفي لكل عمود:
النوع (رقمي، نصي، تاريخ، إلخ)
القيم الأكثر تكرارًا
القيم المفقودة والنسبة المئوية لها
الإحصائيات (المتوسط، الوسيط، الانحراف المعياري، القيم القصوى والدنيا)
رسوم بيانية تفاعلية:
توزيعات القيم
العلاقات بين المتغيرات (correlation matrix)
تحذيرات عن البيانات غير النظيفة أو غير الطبيعية (مثل outliers)
أمثلة مفيدة للقرارات: تحديد الأعمدة غير المفيدة، أو التي تحتاج إلى تنظيف قبل استخدامها في النماذج.
استخدامات هذا النوع من التقارير:
استكشاف البيانات قبل النمذجة (EDA)
التحضير لمشاريع تعلم الآلة
مراجعة جودة البيانات
دعم اتخاذ القرار بناءً على فهم أعمق للبيانات
تحليل العلاقات والارتباطات
الارتباطات العددية - العددية
يبلغ الارتباط بين الإنفاق التسويقي والإيرادات 0.09.
ويبلغ الارتباط بين رقم المتجر والإنفاق التسويقي 0.05.
ويبلغ الارتباط بين رقم المتجر والإيرادات 0.01.
? العلاقات الفئوية - العددية
يُظهر رقم المتجر تباينًا عبر فئات المدينة. أعلى متوسط في ثاوزند أوكس.
يُظهر الإنفاق التسويقي تباينًا عبر فئات المدينة. أعلى متوسط في أماريلو.
يُظهر الإيرادات تباينًا عبر فئات المدينة. أعلى متوسط في ليتل روك.
يُظهر رقم المتجر تباينًا عبر فئات الولاية. أعلى متوسط في رود آيلاند.
يُظهر الإنفاق التسويقي تباينًا عبر فئات الولاية. أعلى متوسط في ويسكونسن.
يُظهر الإيرادات تباينًا عبر فئات الولاية. أعلى متوسط في أركنساس.
يُظهر رقم المتجر تباينًا عبر فئات منطقة المبيعات. أعلى متوسط في المنطقة ١.
يُظهر الإنفاق التسويقي تباينًا بين فئات منطقة المبيعات. أعلى متوسط في المنطقة ٢.
يُظهر الإيرادات تباينًا بين فئات منطقة المبيعات. أعلى متوسط في المنطقة ١.
يُظهر مُعرّف المتجر تباينًا بين فئات التوسعة الجديدة. أعلى متوسط في المنطقة الجديدة.
يُظهر الإنفاق التسويقي تباينًا بين فئات التوسعة الجديدة. أعلى متوسط في المنطقة الجديدة.
يُظهر الإيرادات تباينًا بين فئات التوسعة الجديدة. أعلى متوسط في المنطقة الجديدة.