Duckdb_AirFlow_WebScraping
تفاصيل العمل
المشروع يهدف إلى جمع بيانات من مواقع الويب بشكل آلي ومنظّم، ثم تنظيفها وتحويلها باستخدام DBT، وأخيرًا جدولتها وتشغيلها دوريًا بواسطة Airflow. بمعنى آخر، المشروع يُنشئ نظام بيانات متكامل (Data Pipeline) يبدأ من الإنترنت وينتهي في قاعدة بيانات نظيفة وجاهزة للتحليل أو العرض في لوحة بيانات (Dashboard).
مهارات العمل
بطاقة العمل
طلب عمل مماثل