Please use this identifier to cite or link to this item: http://hdl.handle.net/11513/1814
Title: Metasezgisel algoritmalar ile veri madenciliğinde aykırı değerlerin tespiti uygulamaları / Outliers detection in data mining by metaheuristic algorithms
Authors: GİTMEZ, MERVE
Keywords: Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol = Computer Engineering and Computer Science and Control
Issue Date: 2018
Abstract: Metasezgisel yöntemler, arama uzayında yüksek kalitede çözümleri kapsayan bölgeleri etkin bir şekilde kullanarak optimizasyon problemlerine ait en uygun çözümü bulmayı amaçlayan yöntemlerdir. Bu yöntemler, oldukça az değişiklikle farklı optimizasyon problemlerine uygulanabilmektedirler. Ayrıca veri madenciliğinin de önemli problemlerine uygulanabilmektedirler. Çok değişkenli değişkenler bağlamında aykırı değerlerin tespit edilmesi, veri madenciliği için önemli bir konudur. Bu konuya çözüm getirmek için önerilen yöntemlerin çoğu verilerin dağılım merkezine olan Mahalanobis mesafesine, Öklid mesafesine veya bir iz düşüm takibi yaklaşımına (projection pursuit) dayanmaktadır. Metasezgisel yöntemler, aykırı değerleri tespit etmek amacıyla kullanıldığı uygulamalarda mesafe parametrelerini manuel olarak ayarlamak yerine otomatik olarak optimize etmektedir. Bu çalışmadaki amaç, metasezgisel algoritmaları kullanarak veri madenciliğinin önemli problemi ve konusu olan çok değişkenli değişkenler bağlamında aykırı değerleri tespit etmeye çalışmaktır ve aykırı değerlerin sınıflandırma başarısı üzerindeki etkisini incelemektedir. The aim of metaheuristic methods is to find the most appropriate solution of optimization problems by using the regions covering high quality solutions in search space effectively. These methods can be applied to different optimization problems with very little modification. Also these methods are adapted to the important problems of data mining. Detection of outliers in the context of multivariate data is an important issue for data mining. Most of recommended methods for solving this problem are based on mahalanobis distance, euclidean distance, which is the most common distribution of observations or it is based on projection pursuit approach. Metaheuristic methods, when they are used in the applications in order to detect outliers, are able to optimize the distance parameters automatically rather than adjusting them manually. The purpose of this work is to detect the outlier at the multivariate variable context, which is an important problem and subject of data mining using metaheuristic algorithms and is to examine the impact of the detected outliers on the classification success.
URI: http://hdl.handle.net/11513/1814
Appears in Collections:Fen Bilimleri Enstitüsü

Files in This Item:
File Description SizeFormat 
506166.pdf15.36 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.