Hızlısoy S. (Yürütücü), Arslan R. S.
Yükseköğretim Kurumları Destekli Proje, 2023 - 2025
Günümüzde gelişen teknoloji sayesinde ulaşım araçlarının çeşitliliğinin artması ve ulaşım imkanlarının
kolaylaşması ile insanlar diğer ülkelere seyahet edebilmekte ve çok çeşitli ülke vatandaşları ile
karşılaşmaktadırlar. Farklı ülke vatandaşları ile karşılaşıldığında ise iletişim kurabilmek için iki yol vardır.
Bunlar vücut dili iletişim ya da sözlü iletişimdir. Vücut dili kültürden kültüre değişebilir ve farklı anlamlar
içerebilir. Dolayısıyla en güvenli iletişim yolu sözlü iletişim yani konuşmadır. Karşılıklı konuşarak iletişim
kurabilmemiz için öncelikle karşımızdaki insanın söylediklerini anlayabilmemiz, konuştuğu dili bilmemiz
gerekir. Bu sayede onlarla konuşabilmek için çözümler üretebiliriz.
Bu bağlamda, makine öğrenme yöntemlerinin büyük boyutlu verileri işleyerek karmaşık problemlere
çözüm üretebilen yetenekleri sayesinde çok sayıda dili birbirinden ayıracak ve tanıyacak gücü vardır. Bu
çalışma ile, Dünyada en çok konuşulan dillerden yirmi farklı dile ait olmak üzere her bir dilden beş bin adet
konuşma verisi kullanılarak toplam yüzbin veri üzerinden bu dillere özgü öznitelikler (Mel Frekansı
Kepstral Katsayıları (MFCC), Spektrogram vb.) tespit edilecektir. Sınıflandırma aşamasında çeşitli makine
öğrenme algoritmaları (Lojistik Regresyon, Destek Vektör Makineleri, Karar Ağaçları, K En Yakın Komşu
vb.) kullanılarak ve daha başarılı sonuçlar elde etmek için hiper-parametre optimizasyon işlemleri
uygulanarak konuşulan dilin tanımlanması amaçlanmaktadır. Son olarak literatürdeki bu diller ile yapılmış
çalışmalar incelerek sonuçlar karşılaştırılacaktır.