Abstract:
Süt, canlıların büyümesi ve gelişmesi için tükettikleri besinlerin başında gelir. Besin değerinin yüksek oluşu, protein, kalsiyum ve vitamin kaynağı olması hasebiyle her yaş grubu için önerilen önemli bir doğal besin kaynağıdır. Ayrıca sütün, beslenme değerinin yüksekliğinin yanında, vücut fonksiyonlarını düzenleyici, vücut gelişimini sağlayıcı, kemik ve diş oluşumunda önemli rolü olan temel bir gıda maddesi olma özelliği de vardır. Bundan dolayı süt ve süt ürünleri toplumun neredeyse tamamı tarafından tüketilmektedir. Toplumun geniş kesimi tarafından tüketilmesinden dolayı bir tağşiş, seyreltme vb. yanıltıcı hilelerle karşılaşmak mümkündür. Söz konusu tehlikelere karşı sütün niteliğinin belirlenmesi büyük önem arz etmektedir. Bu tez çalışmasında, iki farklı veri seti ile çalışılmıştır. Farklı türlerde süt örnekleri (İnek sütü, koyun sütü, keçi sütü, market sütü ve süt tozu) üzerinde FTIR cihazı yardımıyla ölçümler yapılarak elde edilen değerler kullanılarak oluşturulmuş birinci veri setinde sınıflandırma yöntemleri kullanılarak süt türü tahmin edilmeye çalışılmıştır. Kaggle açık kaynak platformunda yayınlanan ikinci veri setinde ise sınıflandırma yöntemleri kullanılarak süt kalitesi tahmin edilmeye çalışılmıştır. Sınıflandırma yöntemi olarak geleneksel makine öğrenme yöntemlerinden KNN ve Karar Ağaçları yöntemleri ile topluluk öğrenme yöntemlerinden Rastgele Orman, Gradyan Artırma, AdaBoost ve Voting yöntemlerinden yararlanılmıştır. Modellerin tahmin performansı doğruluk, duyarlılık, kesinlik ve F-score olmak üzere dört performans ölçütü ile değerlendirilmiştir. Elde edilen sonuçlara bakıldığında birinci veri seti ile süt cinsinin tahmininde KNN, Karar Ağaçları, Rastgele Orman, Gradyan Artırma ve Voting yöntemleri mükemmel (1.00) performans sergilerken, AdaBoost yöntemi daha düşük (0.8) performans göstermiştir. İkinci veri seti ile süt kalitesinin tahmininde ise Voting, Gradyan Artırma, Karar Ağaçları ve Rastgele Orman (0.99) yöntemleri en yüksek performansı göstermiştir. Kullanılan yöntemlerin performansları değerlendirildiğinde genel başarının yüksek olması bu geleneksel makine yöntemleri ile topluluk öğrenme yöntemlerinin bu alandaki çalışmalarda kullanılabileceğini göstermiştir.