Please use this identifier to cite or link to this item:
http://hdl.handle.net/11452/12213
Title: | Effect of language mismatch on turkish speaker verification |
Other Titles: | Türkçe konuşmacı doğrulamada dil uyumsuzluğunun etkisi |
Authors: | Hanilçi, Cemal |
Keywords: | Turkish speaker recognition Language mismatch Türkçe konuşmacı doğrulama Dil uyumsuzluğu |
Issue Date: | 21-Apr-2017 |
Publisher: | Uludağ Üniversitesi |
Citation: | Hanilçi, C. (2017). "Effect of language mismatch on turkish speaker verification". Uludağ Üniversitesi Mühendislik Fakültesi Dergisi, 22(1), 189-196. |
Abstract: | In this paper, effect of language mismatch between background data and evaluation data is analyzed for text-independent speaker recognition in particular for Turkish spoken language. Gaussian mixture model with universal background model (GMM-UBM) classifier is utilized using Mel-frequency cepstral coefficients (MFCCs) as speaker-specific features. Experiments conducted on a Turkish speech database consisting of 47 male and 26 female speakers reveals that Turkish speaker recognition performance dramatically degrades in case of language mismatch between UBM and the evaluation data. For example 1.73% and 12.34% equal error rates (EERs) are obtained for male speakers when UBM is trained using Turkish and English data, respectively. Bu çalışmada, arkaplan verisi ile gerçekleştirme verisi arasında konuşulan dil anlamında bir uyumsuzluk olması durumunda Türkçe konuşmalar için konuşmacı tanıma performansı incelenmiştir. Gauss karışım modeli - genel arkaplan modeli sınıflandırıcısı ile mel-frekansı kepstral katsayıları konuşmacılara özgü öznitelikler olarak seçilmiştir. 47 erkek ve 26 bayan konuşmacıdan oluşan Türkçe veritabanı ile yapılan deneylerde görülmüştür ki arkaplan modelini eğitmek için kullanılan seslerin dili ile konuşmacı doğrulama deneylerinde kullanılan dil farklı olduğunda konuşmacı doğrulama performansı dramatik bir şekilde düşmektedir. Örneğin, erkek konuşmacılar için Türkçe ses verileri ile arkaplan modeli eğitildiğinde %1.73 eşit hata oranı elde edilirken, İngilizce sesler ile eğitildiğinde %12.34 eşit hata oranı elde edilmiştir. |
URI: | https://dergipark.org.tr/tr/download/article-file/298313 http://hdl.handle.net/11452/12213 |
ISSN: | 2148-4147 2148-4155 |
Appears in Collections: | 2017 Cilt 22 Sayı 1 |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
22_1_16.pdf | 722.09 kB | Adobe PDF | View/Open |
This item is licensed under a Creative Commons License