Özet:
Tarım sektöründe üretimin artışı; ekilebilen tarım alanlarının genişletilmesi bakımın, sulamanın uygun yöntemlerle zamanında yapılması ve uygun tohum türlerinin secimi gibi parametrelere bağlıdır. Artmakta olan insan nüfusuna sağlıklı ve yeterli gıda üretilebilmesi için tarım alanları yetersiz kalmaktadır. Sağlıklı ve yeterli gıda ihtiyacının karşılanabilmesi için birim alandan sağlıklı ve çok ürün elde etmenin gerektiği anlaşılmıştır. Verimliği artırmanın ön koşulu ise uygun tohum türlerin seçilmesi olduğu görülmüştür. Yapılan bu çalışma iki aşamada gerçekleşmiştir. Birinci aşamada nohut bitkisine ait özelliklerden makine öğrenme yöntemleri ile sınıflandırma işlemi yapılarak nohut tür tahmini yapıldı ikinci aşamada türlere ait verim değerleri regresyon yöntemi ile tahmin edilmiştir. Verilerin test ve eğitim için ayrıştırılmasında çapraz doğrulama 5 ve %50 eğitim %50 test şeklinde gerçekleşmiştir. Makine öğrenmesi sınıflandırma yöntemlerinden karar ağaçları (KA), destek vektör makineleri (DVM) ve k en yakın komşuluk (KNN) yöntemleri uygun görülmüş ve kullanılmıştır. Başarı ölçütü olarak doğruluk kullanılmıştır. Ham veri seti, ham + sentetik veri seti ve sadece sentetik veri setinden oluşan üç sınıfta işlem yapılmıştır. Elde edilen sonuçların başarı oranları karşılaştırıldığında yalnızca ham veriler kullanılarak yapılan sınıflandırmada en yüksek başarı oranı %90.6 doğruluk oranı ile DVM olmuştur. Aynı şekilde ham veriler ile birlikte oluşturulan sentetik verilerin kullanıldığı veri setinin sınıflandırma başarı oranı en yüksek %100 doğruluk oranı ile KA olmuştur. Sadece sentetik verilerden oluşan veri seti kullanıldığında sınıflandırmada en yüksek başarı oranı %95.4 doğruluk oranı ile KNN olmuştur. Başarı performanslarının yüksek olması makine öğrenme yöntemlerinin bu alanda kullanılabileceğini göstermiştir.