1507- بررسی و ارزیابی چند روش تشخیص جنسیت گوینده از روی گفتار
مقاله شبیه سازی شده
کد پروژه:1507
موضوع:پردازش گفتار
بررسی و ارزیابی چند روش تشخیص جنسیت گوینده از روی گفتار
شامل:مقاله اصلی +گزارش کاملی از ده مقاله در این مورد و شبیه سازی با متلبMatlab
عنوان مقالات:
1-A Comparative Study of Gender and Age Classification in Speech Signals
2-Age and Gender Classification using Fusion of Acoustic and Prosodic Features
3-Age and Gender Recognition from Speech Patterns Based on Supervised Non-Negative Matrix Factorization
4-Age and Gender Classification using Fusion of Acoustic and Prosodic Features
5-Combining Five Acoustic Level Modeling Methods for Automatic Speaker Age and Gender Recognition
6-COMPARISON OF FOUR APPROACHES TO AGE AND GENDER RECOGNITION FOR TELEPHONE APPLICATIONS
7-تشخيص جنسيت به كمك شبكه عصبي mpl و شبکه عصبی ژنتیک و شبکه anfis
8-Genderr ecognitionfr oms peechP. art I: Coarsea nalysis
9-تشخيص جنسيت گوينده صدا با استفاده از فرآيندهاي تصادفي
چکیده:
مطالعات پزشکی نشان می دهد که دستگاه صوتی آقایان بزرگتر از خانم هاست و از آنجایی که بسیاری از ویژگی های صوتی ناشی از اندازه و شکل اندام گویایی است پس این تفاوت مطمئنا باید (حداقل) در یک ویژگی صوتی تاثیر بگذارد. یکی از این تاثیرها روی تفاوت فرکانسی است. فرکانس گفتار خانم و آقا یکسان نیست؛ فرکانس خانمها بالاتر و در محدوده 250-450هرتز و آقایان پایین تر و در محدوده 50-250 است. بنابراین اگر فرکانس پایه گفتار را در صوت تشخیص بدهیم بنابر محدوده فرکانسی گفتار قادر به تشخیص جنسیت گوینده هستیم که با روشهای مختلفی می توان این فرکانس پایه را بدست آورد.
هم چنین در این مقاله از روش های دیگری نظیر انواع شبکه های عصبی و استفاده از انرژی جنبشی صوت و مخزوط گوسی نیز بررسی شده و همینطور ترکیب چند روش در کنارهم برای بهبود کارآیی و دقت و سرعت سیستم مطرح شده است.
کلمات کلیدی:
تشخیص جنسیت ؛ فرکانس پایه ؛ مدل مخلوط گاوسی ؛ شبكه عصبي MLP؛ شبكه عصبي ANFIS؛ ضرایب MFCC؛ ضرایب LPCC
گروه فنی و مهندسی پندار