Duckdb_AirFlow_WebScraping
تفاصيل العمل

المشروع يهدف إلى جمع بيانات من مواقع الويب بشكل آلي ومنظّم، ثم تنظيفها وتحويلها باستخدام DBT، وأخيرًا جدولتها وتشغيلها دوريًا بواسطة Airflow. بمعنى آخر، المشروع يُنشئ نظام بيانات متكامل (Data Pipeline) يبدأ من الإنترنت وينتهي في قاعدة بيانات نظيفة وجاهزة للتحليل أو العرض في لوحة بيانات (Dashboard).

شارك
بطاقة العمل
تاريخ النشر
منذ يومين
المشاهدات
7
المستقل
Shehab Ahmed
Shehab Ahmed
مهندس بيانات
طلب عمل مماثل
شارك
مركز المساعدة