نشر المشروع
تلقي العروض
تنفيذ المشروع
استلام المشروع
تفاصيل المشروع

I have a fully-labeled collection of WAV recordings and need a compact solution that can 1) tell whether an input clip is a human voice and 2) identify which speaker from the dataset is talking. My preference is to work with MFCC features fed into a Convolutional Neural Network; if you believe another architecture will reliably hit the 90 % accuracy mark, feel free to explain why. Scope of work • Write a clean training script that reads the WAV files, extracts MFCCs, and trains the model. • Validate on a held-out set and document the accuracy; target ≥ 90 %. • Provide the final weights, an inference script that accepts a single audio file and prints the predicted speaker name (or “unknown” if outside the set), and a short README with setup and run commands. Please keep the code lightweight—TensorFlow, PyTorch, or similar mainstream libraries are fine—and emphasize reproducibility so I can retrain with future data.

تقييم المشروع
ترشح للآخرين
الإحترافية بالتعامل
سرعة التواصل
جودة العمل
الخبرة بمجال العمل
إحترام موعد التسليم
التعامل مرة اخرى
Mahmoud Refaat   منذ 8 ساعات
Human Voice Classification Model
تسليم في الموعد وكواليتي شغل عالية ... ولا غلطة
أضف عرضك الآن
العروض المقدمة
Mohammed Mostafa
منذ 23 ساعة    

I found your project really interesting — I’ve worked with MFCCs and CNN-based classification before, and I’d love to help you build a lightweight,...

شارك
بطاقة المشروع
حالة المشروع
مكتمل
تاريخ النشر
منذ 23 ساعة
المدة المتاحة
3 أيام
الميزانية
10 - 25 $
عدد المتقدمين
1
صاحب المشروع
Mahmoud Refaat
Mahmoud Refaat
مهندس ذكاء اصطناعي
منفذ المشروع
Mohammed Mostafa
Mohammed Mostafa
مهندس ذكاء اصطناعي
شارك
مركز المساعدة