Please use this identifier to cite or link to this item:
http://hdl.handle.net/11513/3533
Title: | MEDİKAL VERİ SINIFLANDIRMADA SENTETİK VERİ ÜRETİMİNİN ETKİSİ |
Authors: | ŞEYHANLI, MEHMET |
Keywords: | SMOTE, Sentetik Veri, Sınıflandırma, Medikal |
Issue Date: | 2021 |
Abstract: | Veri madenciliği, son yıllarda birçok alanda yaygın olarak kullanılmaktadır. Veri sınıflandırmalarında, örnek sayıların sınıflara göre eşit dağılımı çok önemlidir. Ancak, bazı durumlarda veri setinde yer alan sınıflar eşit dağılıma sahip olmayabilir. Özellikle veri oluşturma aşamasında zorluk yaşanan medikal veri setleri bu probleme verilecek örnekler arasında yer almaktadır. Bu gibi durumlarda, sınıflandırma başarı parametreleri olumsuz yönde etkilenir. Bu soruna bir çözüm olarak, yeni sentetik veri örnekleri üretilerek veri seti dengeli bir hale getirilebilir. Bu çalışmada tıbbi rahatsızlıklara ait nümerik, kategorik ve hem nümerik hem de kategorik olan veri setlerinin sınıflandırılmasında dengesiz veriyi oluşturma yöntemlerinin etkisi tartışılmıştır. Bu veri setlerine ait dengesizlik problemleri iki farklı sentetik örnekleme yaklaşımı yöntemi uygulanarak çözümlenmiştir. Veri setine, sentetik örnekleme yaklaşımı yöntemleri uygulandıktan sonra, Karar Ağacı (KA) ve K- En Yakın Komşuluk (KEYK) sınıflandırma yöntemleri uygulanmıştır. Böylelikle, sentetik veri üretiminin farklı veri türleri üzerindeki etkisi gözlemlenmiştir. Sonuçlar incelendiğinde; sadece kategorik ve hem kategorik hem sayısal veri tipine sahip veri setlerinde en başarılı sonuçların Sentetik Azınlık Aşırı Örnekleme Tekniği (SAAÖT) algoritmasında KA sınıflandırılmasında, sadece numerik veri setinde en başarılı sonucun ise Uyarlamalı Sentetik Örnekleme (USÖ) algoritmasında, k en yakın komşuluk sınıflandırılmasında elde edildiği gözlemlenmiştir. |
URI: | http://hdl.handle.net/11513/3533 |
Appears in Collections: | Fen Bilimleri Enstitüsü |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
666299.pdf | 906.62 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.