📋 نظرة عامة على المشروع
هذا المشروع عبارة عن تطبيق ويب تفاعلي يستخدم الذكاء الاصطناعي للإجابة على الأسئلة المستخرجة من ملفات PDF. التطبيق يقوم بتحليل محتوى المستندات ويتيح للمستخدمين طرح أسئلة والحصول على إجابات دقيقة بناءً على محتوى الملف.
🎯 المميزات الرئيسية
1. رفع وتحليل ملفات PDF
إمكانية رفع أي ملف PDF
استخراج النصوص تلقائياً من جميع صفحات المستند
معالجة الملفات الكبيرة بكفاءة
2. البحث الذكي (RAG - Retrieval Augmented Generation)
تقسيم النص إلى أجزاء صغيرة ومترابطة للمعالجة الأفضل
تحويل النصوص إلى تمثيل رقمي (Embeddings) باستخدام FastEmbed
تخزين البيانات في قاعدة بيانات متجهة (Vector Store) باستخدام Chroma
3. الإجابة على الأسئلة بالذكاء الاصطناعي
استخدام نموذج Llama 3.1 عبر منصة Groq للسرعة الفائقة
البحث عن الأجزاء الأكثر صلة بالسؤال
توليد إجابات دقيقة ومبنية على محتوى المستند فقط
4. واجهة مستخدم بسيطة وسهلة
تصميم نظيف وبديهي باستخدام Streamlit
تجربة مستخدم سلسة ومباشرة
لا تحتاج لخبرة تقنية للاستخدام
🛠️ التقنيات المستخدمة
المكتبات والأدوات:
Streamlit: لبناء واجهة الويب التفاعلية
PyPDF2: لقراءة واستخراج النصوص من ملفات PDF
LangChain: إطار عمل متقدم لتطبيقات الذكاء الاصطناعي
FastEmbed: لتوليد التمثيلات الرقمية بسرعة عالية
Chroma: قاعدة بيانات متجهة للبحث الدلالي
Groq + Llama 3.1: نموذج ذكاء اصطناعي قوي وسريع
💼 حالات الاستخدام
مناسب للشركات والأفراد:
الباحثون والطلاب: تحليل الأوراق البحثية والمستندات الأكاديمية
المحامون: البحث في العقود والوثائق القانونية
الشركات: تحليل التقارير والعقود والمستندات التجارية
الأطباء: البحث في المراجع الطبية والدراسات
أي شخص: يحتاج لاستخراج معلومات من مستندات PDF طويلة
⚙️ كيفية العمل
رفع الملف: المستخدم يرفع ملف PDF
المعالجة: النظام يستخرج النص ويقسمه لأجزاء
الفهرسة: يتم تحويل الأجزاء لتمثيلات رقمية وتخزينها
السؤال: المستخدم يكتب سؤاله
البحث: النظام يبحث عن الأجزاء الأكثر صلة
الإجابة: الذكاء الاصطناعي يولد إجابة دقيقة
🚀 المزايا التنافسية
سرعة فائقة: استخدام Groq لاستجابة شبه فورية
دقة عالية: الإجابات مبنية على محتوى المستند فقط
سهولة الاستخدام: لا حاجة لخبرة تقنية
مجاني ومفتوح المصدر: يمكن تخصيصه حسب الحاجة
خصوصية: المعالجة تتم محلياً
🔧 إمكانيات التطوير
يمكن توسيع المشروع ليشمل:
دعم ملفات Word و Excel
حفظ تاريخ الأسئلة والأجوبة
دعم لغات متعددة
تصدير الإجابات
واجهة API للتكامل مع أنظمة أخرى
نظام مستخدمين متعدد