Bu öğeden alıntı yapmak, öğeye bağlanmak için bu tanımlayıcıyı kullanınız: http://hdl.handle.net/11513/3533
Başlık: MEDİKAL VERİ SINIFLANDIRMADA SENTETİK VERİ ÜRETİMİNİN ETKİSİ
Yazarlar: ŞEYHANLI, MEHMET
Anahtar kelimeler: SMOTE, Sentetik Veri, Sınıflandırma, Medikal
Yayın Tarihi: 2021
Özet: Veri madenciliği, son yıllarda birçok alanda yaygın olarak kullanılmaktadır. Veri sınıflandırmalarında, örnek sayıların sınıflara göre eşit dağılımı çok önemlidir. Ancak, bazı durumlarda veri setinde yer alan sınıflar eşit dağılıma sahip olmayabilir. Özellikle veri oluşturma aşamasında zorluk yaşanan medikal veri setleri bu probleme verilecek örnekler arasında yer almaktadır. Bu gibi durumlarda, sınıflandırma başarı parametreleri olumsuz yönde etkilenir. Bu soruna bir çözüm olarak, yeni sentetik veri örnekleri üretilerek veri seti dengeli bir hale getirilebilir. Bu çalışmada tıbbi rahatsızlıklara ait nümerik, kategorik ve hem nümerik hem de kategorik olan veri setlerinin sınıflandırılmasında dengesiz veriyi oluşturma yöntemlerinin etkisi tartışılmıştır. Bu veri setlerine ait dengesizlik problemleri iki farklı sentetik örnekleme yaklaşımı yöntemi uygulanarak çözümlenmiştir. Veri setine, sentetik örnekleme yaklaşımı yöntemleri uygulandıktan sonra, Karar Ağacı (KA) ve K- En Yakın Komşuluk (KEYK) sınıflandırma yöntemleri uygulanmıştır. Böylelikle, sentetik veri üretiminin farklı veri türleri üzerindeki etkisi gözlemlenmiştir. Sonuçlar incelendiğinde; sadece kategorik ve hem kategorik hem sayısal veri tipine sahip veri setlerinde en başarılı sonuçların Sentetik Azınlık Aşırı Örnekleme Tekniği (SAAÖT) algoritmasında KA sınıflandırılmasında, sadece numerik veri setinde en başarılı sonucun ise Uyarlamalı Sentetik Örnekleme (USÖ) algoritmasında, k en yakın komşuluk sınıflandırılmasında elde edildiği gözlemlenmiştir.
URI: http://hdl.handle.net/11513/3533
Koleksiyonlarda Görünür:Fen Bilimleri Enstitüsü

Bu öğenin dosyaları:
Dosya Açıklama BoyutBiçim 
666299.pdf906.62 kBAdobe PDFGöster/Aç


DSpace'deki bütün öğeler, aksi belirtilmedikçe, tüm hakları saklı tutulmak şartıyla telif hakkı ile korunmaktadır.