شات بوت يقبل الصور و الصوت و ملفات (PDF) باستخدام ال(RAG)
تفاصيل العمل
طبيق دردشة مدعوم بالذكاء الاصطناعي يستخدم النص والصوت والصور لتقديم استجابات واعية بالسياق. يدمج نماذج اللغة وقواعد البيانات المتجهية لتعزيز قدرات التوليد المعزز بالاسترجاع (RAG)، مما يجعله أداة متعددة الاستخدامات للمحادثات الذكية. الميزات تحويل النص إلى كلام: تحويل الاستجابات النصية إلى صوت باستخدام gTTS. تحويل الكلام إلى نص: معالجة الملفات الصوتية ونسخها باستخدام speech_recognition و Wav2Vec2. الإجابة على الأسئلة المرئية: الإجابة على الأسئلة بناءً على الصور المرفوعة باستخدام BLIP. قاعدة معرفة من ملفات PDF: تحميل ملفات PDF لتعزيز قاعدة المعرفة وتقديم استجابات أكثر دقة. استجابات واعية بالسياق: استخدام سجل المحادثات لتقديم إجابات أكثر صلة.
مهارات العمل
بطاقة العمل
طلب عمل مماثل