Makine Öğrenme Yöntemleri Kullanılarak Konuşulan Dilin Tanımlanması


Hızlısoy S. (Yürütücü), Arslan R. S.

Yükseköğretim Kurumları Destekli Proje, 2023 - 2025

  • Proje Türü: Yükseköğretim Kurumları Destekli Proje
  • Başlama Tarihi: Aralık 2023
  • Bitiş Tarihi: Aralık 2025

Proje Özeti

Günümüzde gelişen teknoloji sayesinde ulaşım araçlarının çeşitliliğinin artması ve ulaşım imkanlarının

kolaylaşması ile insanlar diğer ülkelere seyahet edebilmekte ve çok çeşitli ülke vatandaşları ile

karşılaşmaktadırlar. Farklı ülke vatandaşları ile karşılaşıldığında ise iletişim kurabilmek için iki yol vardır.

Bunlar vücut dili iletişim ya da sözlü iletişimdir. Vücut dili kültürden kültüre değişebilir ve farklı anlamlar

içerebilir. Dolayısıyla en güvenli iletişim yolu sözlü iletişim yani konuşmadır. Karşılıklı konuşarak iletişim

kurabilmemiz için öncelikle karşımızdaki insanın söylediklerini anlayabilmemiz, konuştuğu dili bilmemiz

gerekir. Bu sayede onlarla konuşabilmek için çözümler üretebiliriz.

Bu bağlamda, makine öğrenme yöntemlerinin büyük boyutlu verileri işleyerek karmaşık problemlere

çözüm üretebilen yetenekleri sayesinde çok sayıda dili birbirinden ayıracak ve tanıyacak gücü vardır. Bu

çalışma ile, Dünyada en çok konuşulan dillerden yirmi farklı dile ait olmak üzere her bir dilden beş bin adet

konuşma verisi kullanılarak toplam yüzbin veri üzerinden bu dillere özgü öznitelikler (Mel Frekansı

Kepstral Katsayıları (MFCC), Spektrogram vb.) tespit edilecektir. Sınıflandırma aşamasında çeşitli makine

öğrenme algoritmaları (Lojistik Regresyon, Destek Vektör Makineleri, Karar Ağaçları, K En Yakın Komşu

vb.) kullanılarak ve daha başarılı sonuçlar elde etmek için hiper-parametre optimizasyon işlemleri

uygulanarak konuşulan dilin tanımlanması amaçlanmaktadır. Son olarak literatürdeki bu diller ile yapılmış

çalışmalar incelerek sonuçlar karşılaştırılacaktır.