تطبيق ذكاء اصطناعي لوصف الصور (Image Captioning) باستخدام BLIP
تفاصيل العمل
الفكرة بتتمثل في تطوير تطبيق يستقبل صورة من المستخدم ويقوم بتحليلها تلقائيًا باستخدام نموذج BLIP (Bootstrapping Language-Image Pre-training)، ثم يولّد وصفًا نصيًا دقيقًا لمحتوى الصورة. آلية العمل (Workflow): يرفع المستخدم صورة للتطبيق. نموذج BLIP يحلل محتوى الصورة ويربطه بالمعاني اللغوية. يولد التطبيق جملة أو أكثر تصف العناصر داخل الصورة (مثل: "A dog sitting on a chair"). يمكن للمستخدم حفظ أو مشاركة الوصف الناتج.
بطاقة العمل
طلب عمل مماثل