Arama motorlarında yeni konu tanılamada karakter n-gram ve yapay sinir ağları uygulaması

Bu öğeden alıntı yapmak, öğeye bağlanmak için bu tanımlayıcıyı kullanınız: http://hdl.handle.net/11452/11951

Başlık:	Arama motorlarında yeni konu tanılamada karakter n-gram ve yapay sinir ağları uygulaması
Diğer Başlıklar:	Character n-gram and neural network application for new topic identification in search engines
Yazarlar:	Uludağ Üniversitesi/Mühendislik-Mimarlık Fakültesi/Endüstri Mühendisliği Bölümü. Özmutlu, H. Cenk Çağlar, Burcu
Anahtar kelimeler:	İnternet madenciliği Arama motoru kullanıcı davranışları Karakter n-gram metodolojisi Web mining Search engine users behaviors Character n-gram methodology
Yayın Tarihi:	2009
Yayıncı:	Uludağ Üniversitesi
Atıf:	Özmutlu, H. C. ve Çağlar, B. (2009). "Arama motorlarında yeni konu tanılamada karakter n-gram ve yapay sinir ağları uygulaması". Uludağ Üniversitesi Mühendislik-Mimarlık Fakültesi Dergisi, 14(2), 75-91.
Özet:	Günümüzde, arama motorlarının kullanımının artmasıyla beraber kullanıcı davranışlarının tahmini önem kazanmıştır. Bugüne kadar anlam bazlı olmayan pek çok yöntem yeni konu tanılamada kullanılmıştır. Bazı çalışmalardan iyi sonuçlar elde edilmesine rağmen, genelde çalışmaların yazım farklılığı içeren sorgularda hatalı tahminler yaptığı gözlenmiştir. Bu çalışmada, anlam bazlı olmayan, karakter n-gram yöntemi, yeni konu tanılamada kullanılmıştır. Bununla beraber karakter n-gram yöntemiyle önceki anlam bazlı olmayan çalışmaları iyileştirmek hedeflenmiştir. Önceki çalışmalar incelendiğinde yapay sinir ağları yönteminin diğerlerinden daha iyi sonuçlar verdiği gözlenmiştir. Bu yüzden, çalışmada yapay sinir ağları yönteminin tahminleri kullanılmış ve yazım yanlışlarından kaynaklanan hatalı tahminlerin giderilmesi için karakter n-gram yöntemi kullanılmıştır. Nowadays, the estimate of web users’ behaviors has been important due to the web search engine usage increase. To date, many content-ignorant studies have been performed for automatic new topic identification. Although, some studies performed well, it was observed that they often made mistakes when queries had spelling differences. In this study the character n-gram methodology, which is content ignorant, was used for new topic identification. In addition, it was aimed to improve previous content-ignorant studies. Consideration of previous studies it was observed that the neural network applications gave better results than the other studies. Thus, the neural network method’s estimations were used in this study and character n-gram methodology was used in order to eliminate wrong estimations, because of spelling errors.
URI:	https://dergipark.org.tr/tr/download/article-file/202718 http://hdl.handle.net/11452/11951
ISSN:	2148-4147
Koleksiyonlarda Görünür:	2009 Cilt 14 Sayı 2

Bu öğenin dosyaları:

Dosya	Açıklama	Boyut	Biçim
14_2_7.pdf		551.86 kB	Adobe PDF	Göster/Aç

Tüm Öğe Kaydını Göster İstatistikler

Bu öğe kapsamında lisanslı Creative Commons License

Bursa Uludağ Üniversitesi Açık Erişim Sistemi

Bursa Uludağ Üniversitesinin araştırma çıktılarının yer aldığı açık erişim sistemidir.