CBAM destekli ResNet50 kullanılarak doğru sperm morfolojisi sınıflandırması için derin özellik mühendisliği


Kılıç Ş.

PLOS ONE, sa.e0330914, ss.1-26, 2025 (SCI-Expanded, Scopus) identifier

  • Yayın Türü: Makale / Tam Makale
  • Basım Tarihi: 2025
  • Doi Numarası: 10.1371/journal.pone.0330914
  • Dergi Adı: PLOS ONE
  • Derginin Tarandığı İndeksler: Science Citation Index Expanded (SCI-EXPANDED), Scopus, Academic Search Premier, Agricultural & Environmental Science Database, Animal Behavior Abstracts, Aquatic Science & Fisheries Abstracts (ASFA), BIOSIS, Biotechnology Research Abstracts, Chemical Abstracts Core, Food Science & Technology Abstracts, Index Islamicus, Linguistic Bibliography, MEDLINE, Pollution Abstracts, Psycinfo, zbMATH, Directory of Open Access Journals
  • Sayfa Sayıları: ss.1-26
  • Kayseri Üniversitesi Adresli: Evet

Özet

Erkek fertilitesinin değerlendirilmesinde sperm morfolojisi analizi, üreme sağlığı değerlendirmesinin kritik bir bileşeni olmaya devam etmektedir; zira anormal sperm morfolojisinin, fertilite oranlarındaki düşüşler ve kötü yardımcı üreme teknolojileri sonuçlarıyla güçlü bir korelasyonu bulunmaktadır. Embriyologlar tarafından gerçekleştirilen geleneksel manuel analiz, zaman alıcı, sübjektif ve önemli gözlemciler arası değişkenliğe açıktır; yapılan çalışmalar, uzman değerlendiriciler arasında %40'a varan uyuşmazlıklar rapor etmektedir. Bu araştırma, otomatik ve objektif sperm morfolojisi sınıflandırması için Kıvrımsal Blok Dikkat Modülü (CBAM)'nü ResNet50 mimarisiyle ve gelişmiş derin öznitelik mühendisliği (DFE) teknikleriyle birleştiren yeni bir derin öğrenme çerçevesini sunmaktadır.

ResNet50 omurgasını CBAM dikkat mekanizmaları ile bütünleştiren hibrit bir mimari önermekteyiz. Bu mimari, kapsamlı bir derin öznitelik mühendisliği işlem hattı ile zenginleştirilmiştir. Çerçeve, birden çok öznitelik çıkarma katmanını (CBAM, GAP, GMP, ön-final) Temel Bileşen Analizi (PCA), Ki-kare testi, Rastgele Orman önemi, varyans eşikleme ve bunların kesişimleri dahil olmak üzere 10 farklı öznitelik seçimi yöntemiyle birleştirmektedir. Sınıflandırma, RBF/Doğrusal çekirdekli Destek Vektör Makineleri (SVM) ve k-En Yakın Komşu (k-NN) algoritmaları kullanılarak gerçekleştirilmiştir. Model, iki kıyaslama veri kümesi üzerinde 5 katlı çapraz doğrulama kullanılarak titizlikle değerlendirilmiştir: SMIDS (3000 görüntü, 3-sınıflı) ve HuSHeM (216 görüntü, 4-sınıflı).

Önerilen çerçeve, derin öznitelik mühendisliği kullanılarak SMIDS veri kümesinde %96.08 ± 1.2 ve HuSHeM veri kümesinde %96.77 ± 0.8 test doğrulukları ile olağanüstü bir performans sergilemiştir. Bu sonuçlar, temel CNN performansına kıyasla sırasıyla %8.08 ve %10.41'lik önemli iyileşmeleri temsil etmektedir. McNemar testi istatistiksel anlamlılığı doğrulamıştır. En iyi konfigürasyon (GAP + PCA + SVM RBF), yakın tarihli Vision Transformer ve topluluk yöntemleri dahil olmak üzere mevcut alanında en iyi (state-of-the-art) yaklaşımlara kıyasla üstün performans göstermiştir.

Bu araştırma, dikkat temelli derin öğrenmenin sofistike öznitelik mühendisliği ile birleştirilmesinin sperm morfolojisi analizi için etkinliğini ortaya koymaktadır. Önerilen çerçeve, Grad-CAM dikkat görselleştirmesi aracılığıyla klinik olarak yorumlanabilir sonuçlar sağlarken, alanında en iyi performansı elde etmektedir. Klinik çıkarımlar şunları içermektedir: (1) tanısal değişkenliği azaltan standartlaştırılmış, objektif fertilite değerlendirmesi, (2) embriyologlar için önemli zaman tasarrufu (örnek başına 30–45 dakikadan <1 dakikaya düşüş), (3) laboratuvarlar arası gelişmiş tekrarlanabilirlik ve (4) yardımcı üreme prosedürleri sırasında gerçek zamanlı analiz potansiyeli; tüm bunlar nihayetinde üreme tıbbında hasta bakımını ve tedavi sonuçlarını iyileştirecektir.

Male fertility assessment through sperm morphology analysis remains a critical component of reproductive health evaluation, as abnormal sperm morphology is strongly correlated with reduced fertility rates and poor assisted reproductive technology outcomes. Traditional manual analysis performed by embryologists is time-intensive, subjective, and prone to significant inter-observer variability, with studies reporting up to 40% disagreement between expert evaluators. This research presents a novel deep learning framework combining Convolutional Block Attention Module (CBAM) with ResNet50 architecture and advanced deep feature engineering (DFE) techniques for automated, objective sperm morphology classification.

We propose a hybrid architecture integrating ResNet50 backbone with CBAM attention mechanisms, enhanced by a comprehensive deep feature engineering pipeline. The framework incorporates multiple feature extraction layers (CBAM, GAP, GMP, pre-final) combined with 10 distinct feature selection methods including Principal Component Analysis (PCA), Chi-square test, Random Forest importance, variance thresholding, and their intersections. Classification is performed using Support Vector Machines with RBF/Linear kernels and k-Nearest Neighbors algorithms. The model was rigorously evaluated on two benchmark datasets: SMIDS (3000 images, 3-class) and HuSHeM (216 images, 4-class) using 5-fold cross-validation.

The proposed framework achieved exceptional performance with test accuracies of 96.08 ± 1.2% on SMIDS dataset and 96.77 ± 0.8% on HuSHeM dataset using deep feature engineering, representing significant improvements of 8.08% and 10.41% respectively over baseline CNN performance. McNemar’s test confirmed statistical significance (). The best configuration (GAP + PCA + SVM RBF) demonstrated superior performance compared to existing state-of-the-art approaches, including recent Vision Transformer and ensemble methods.

This research demonstrates the effectiveness of attention-based deep learning combined with sophisticated feature engineering for sperm morphology analysis. The proposed framework achieves state-of-the-art performance while providing clinically interpretable results through Grad-CAM attention visualization. Clinical implications include: (1) standardized, objective fertility assessment reducing diagnostic variability, (2) significant time savings for embryologists (from 30–45 minutes to <1 minute per sample), (3) improved reproducibility across laboratories, and (4) potential for real-time analysis during assisted reproductive procedures, ultimately enhancing patient care and treatment outcomes in reproductive medicine.