Bu öğeden alıntı yapmak, öğeye bağlanmak için bu tanımlayıcıyı kullanınız:
http://hdl.handle.net/11452/12045
Başlık: | Effects of background data duration on speaker verification performance |
Diğer Başlıklar: | Arkaplan veri süresinin konuşmacı doğrulama performansına etkisi |
Yazarlar: | Uludağ Üniversitesi/Mühendislik-Mimarlık Fakültesi/Elektronik Mühendisliği Bölümü. Hanilçi, Cemal Ertaş, Figen |
Anahtar kelimeler: | Speaker verification Gaussian mixture model Vector quantization Universal background model Konuşmacı doğrulama Gauss karışım modeli Vektör nicemleme Genel arka plan modeli |
Yayın Tarihi: | 21-Ara-2012 |
Yayıncı: | Uludağ Üniversitesi |
Atıf: | Hanilçi, C. ve Ertaş, F. (2013). "Effects of background data duratıon on speaker verification performance". Uludağ Üniversitesi Mühendislik-Mimarlık Fakültesi Dergisi, 18(1), 111-119. |
Özet: | Gaussian mixture models with universal background model (GMM-UBM) and vector quantization with universal background model (VQ-UBM) are the two well-known classifiers used for speaker verification. Generally, UBM is trained with many hours of speech from a large pool of different speakers. In this study, we analyze the effect of data duration used to train UBM on text-independent speaker verification performance using GMM-UBM and VQ-UBM modeling techniques. Experiments carried out NIST 2002 speaker recognition evaluation (SRE) corpus show that background data duration to train UBM has small impact on recognition performance for GMM-UBM and VQ-UBM classifiers. Gauss karışım modeli genel arka plan modeli (GKM-GAM) ve vektör nicemleme genel arka plan modeli (VN-GAM) konuşmacı doğrulamada sık kullanılan iki yöntemdir. Genellikle GAM modeli fazla sayıda farklı konuşmacının bulunduğu bir kümeden seçilen saatlerce uzunluktaki ses işaretleri kullanılarak eğitilir. Bu çalışmada, GAM modelinin eğitiminde kullanılan veri miktarının metinden bağımsız konuşmacı doğrulama performansına etkisi incelenmektedir. NIST 2002 konuşmacı tanıma değerlendirme veritabanı ile GKM-GAM ve VN-GAM yöntemleri kullanılarak yapılan deneysel çalışmalar arka plan modelini eğitmek için kullanılan veri miktarının konuşmacı tanıma performansına çok fazla etkisinin olmadığı görülmüştür. |
URI: | https://dergipark.org.tr/tr/download/article-file/202638 http://hdl.handle.net/11452/12045 |
ISSN: | 2148-4147 2148-4155 |
Koleksiyonlarda Görünür: | 2013 Cilt 18 Sayı 1 |
Bu öğenin dosyaları:
Dosya | Açıklama | Boyut | Biçim | |
---|---|---|---|---|
18_1_9.pdf | 464.65 kB | Adobe PDF | Göster/Aç |
Bu öğe kapsamında lisanslı Creative Commons License