Please use this identifier to cite or link to this item:
http://hdl.handle.net/11513/2869
Title: | DERİN ÖĞRENME KULLANARAK EL YAZILARINDAN BİLGİ ÇIKARIMI |
Authors: | Tutar, Mehmet |
Keywords: | MFHD, El Yazısı Karakter Tanıma, Çok özellikli OCR Veri Kümesi, El Yazısı İnsan-Karakter İlişkisi, El Yazısı Fizyolojik İlişkiler |
Issue Date: | 2022 |
Abstract: | İnsanlık tarihi boyunca; iletişim kurma, karşılıklı anlaşabilme ve bunun yanında bilginin aktarımı amacıyla çeşitli alfabeler geliştirilmiştir. Teknolojinin ilerlemesi ile birlikte günümüzde el yazısı tanıma için farklı öğrenme yöntemleri geliştirilmiştir. El yazısı tanıma yöntemleri geliştirilirken el yazısı veri kümelerine ihtiyaç duyulmuş ve bütün alfabeler için mümkün olmasa da sık kullanılan alfabeler için el yazısı metin ve karakter veri kümeleri oluşturulmuştur. Bu çalışmada hem el yazısı tanıma hem de el yazısından bilgi çıkarımı için yeni ve çok nitelikli bir veri kümesi sunulmuştur. Bu veri kümesi; Latin harflerden oluşan Türk alfabesi kullanılarak farklı yaş aralığında, farklı eğitim seviyesine sahip, farklı hobileri olan bay ve bayan toplam 20 000 katılımcı tarafından el yazısıyla yazılan, küçük harf (29 Sınıf), büyük harf (29 Sınıf) ve rakam (10 Sınıf) olmak üzere 3 farklı türden ve toplam 68 sınıftan oluşmaktadır. Aynı zamanda Türkçe el yazısı karakter örneklerinin bu ölçekteki kamuya açık ilk veri kümesidir. Küçük harfler 580 000 adet, büyük harfler 580 000 adet ve rakamlar 200 000 adet olmak üzere toplam 1 360 000 adet el yazısı karakter içermektedir. 4 farklı nitelikte (cinsiyet, yaş, eğitim ve hobi) toplanmış; cinsiyete göre 2 (bay, bayan), yaş aralığına göre 4 (5-11 yaş arası, 12-19 yaş arası, 20-30 yaş arası, 31-65 yaş arası), eğitim durumuna göre 4 (ilkokul, ortaokul, lise, yüksekokul) ve hobilere göre 8 (kitap, TV, internet, oyun, spor, müzik, resim, gezi) farklı niteliğe ayrılmış Türkçe el yazısı karakter örneklerinin işlenmiş ve etiketlenmiş ilk veri kümesidir. Sunduğumuz veri kümesi, sadece bilgisayar bilimleri alanında değil farklı bilimsel alanlarda çalışma yapan araştırmacılara da katkı verecek niteliktedir. Türkiye’de en geniş katılımcı sayısı ile toplanan el yazısı veri kümesinde bulunan küçük harf, büyük harf ve rakamlara, el yazısı karakter tanıma için bilinen sınıflandırma algoritmaları uygulanmış ve bu yöntemlerin performansları incelenmiştir. Bu çalışmada el yazısı bilgisi ile cinsiyet, eğitim düzeyi, hobi ve yaş grubu bilgisi arasında bir ilişki olup olmadığı araştırılmıştır. Veri kümesi ile yapılan deney sonuçları incelendiğinde; performans başarımı sırasıyla cinsiyet, eğitim durumu, yaş grubu ve hobi durumuna göre olmuştur. Buradan hareketle kişinin cinsiyet bilgisinin el yazısına daha fazla yansıdığı gözlemlenmiştir. Sunmuş olduğumuz veri kümesinde bulunan el yazısı rakamlarla yapılan sınıflandırma performansı, kıyaslama veri kümesi olan MNIST ile karşılaştırılmış ve sonuçları tartışılmıştır. |
URI: | http://hdl.handle.net/11513/2869 |
Appears in Collections: | Fen Bilimleri Enstitüsü |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
756108.pdf | 5.42 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.