Please use this identifier to cite or link to this item: http://hdl.handle.net/11513/2885
Title: DUYGU ANALİZİ İÇİN YENİ BİR SÖZLÜK; NAYALex DUYGU SÖZLÜĞÜ
Authors: Atlı, Yakup
Keywords: NAYALex, NRC, Duygu Analizi, Duygu Sözlüğü, Plutchik
Issue Date: 2022
Abstract: İletişimde karşımıza farklı şekillerde (yüz ifadeleri, jestler, konuşma vb.) ortaya çıkan duygularda birçok bilgi gizlidir. Kişiler duygu ve düşüncelerini sosyal medya platformlarında çoğu zaman metinsel ifadeler ile ifade etmektedirler. Sosyal medya paylaşımları incelenerek insanların duygu durumları elde edilebilmektedir. Paylaşımda bulunan kişinin kişilik özelliklerinin ortaya çıkarılması önem kazanmıştır ve buna kaynaklık eden metinlerde gizlenen duyguların sıklığının tespiti ile ilgili birçok çalışma yapılmıştır. Kişilerin paylaşılan mesajlarında gizlenen duyguların ortaya çıkarılması ve tespiti önemlidir. Metinlerde gizlenen duyguların ortaya çıkarılması için kelime-duygu sözlükleri sıklıkla kullanılmaktadır. Kelime-duygu sözlükleri tespit edebildikleri duygu sayısı dikkate alınarak incelendiğinde, olumlu-olumsuz duygu ve 8 farklı duyguyla birlikte en fazla sayıda duygu çıkarımı yapabilen NRC Duygu Sözlüğüdür. Ancak, duygularını metinler aracılığı ile yansıtan sosyal medya kullanıcılarının duygularını kısıtlı sayıdaki duygu ile sınırlandırmak kişilik özelliklerinin ortaya çıkarılmasında yetersiz kalmaktadır. Kişilik özelliklerini ifade eden duyguların, kişiliğin tespitinde daha fazla temsil edilmesini sağlamak için metinlerden daha çok duyguyu ortaya çıkaran bir sözlüğe ihtiyaç olduğu açık bir şekilde görülmektedir. Bu çalışmada, literatürde bu alanda görülen eksikliğin giderilmesine katkı sunacak olan olumlu-olumsuz ile birlikte 38 farklı duyguyu(korku, kaygı, üzüntü, karamsarlık, iyimserlik, öfke, sevgi, umut vb.) ortaya çıkarabilen NAYALex Duygu Sözlüğü önerilmektedir. Plutchik’in Duygu Teorisine ve NRC Duygu Sözlüğüne dayandırılarak oluşturduğumuz NAYALex Duygu Sözlüğü, her bir kelimesi 38 farklı duygunun en az biri ile ilişkili 6469 ingilizce kelimeden oluşan 245.822 duygu-kelime ilişkisi içermektedir. Bu çalışmamızda iki farklı veri üzerinde çalışmalar yapılmıştır. Birinci veri seti, Instagram kullanıcılarının paylaşımlarını içeren 11.880 farklı paylaşım verisini içermektedir. İkinci veri seti, doğrulama için kullanılan ve önerilen sözlükte yer alan 38 farklı duygunun her birini ayrı ayrı ifade edebilen İngilizce cümlelerden oluşmaktadır. Veri setindeki 380 farklı cümle, insan değerlendiricilere okutularak, okuyucuya göre(38 farklı duygu için) ifade ettiği duyguların belirtilmesi istenmiştir. İnsan değerlendiricilerden elde edilen doğrulama veri seti 26.600 cümle-duygu ilişkisi içermekte ve elde edilen veriler doğrultusunda önerilen NAYALex Duygu Sözlüğünün doğrulanması yapılmıştır. Instagram veri seti üzerinde yapılan deneysel çalışma ve analizlerle NAYALex sözlüğünün kişilik analizinde uygulanabilir ve kullanılabilir bir sözlük olduğu ispatlanmıştır. Doğrulama verisi kullanılarak insan değerlendiriciler ile yapılan çalışma sonucunda NAYALex Duygu Sözlüğü için %77 ortalama doğrulama oranı elde edilerek sözlüğün doğrulması sağlanmıştır. Ayrıca NAYALex doğrulaması için kullanılan doğrulama veri setine Naive Bayes, Destek Vektör Makineleri ve KNN(K-Nearest Neighbors) öğrenme algoritmaları uygulanarak performanslar incelenmiştir. Doğrulama veri seti üzerinde uygulanan sınıflandırma algoritmaları arasında %93 doğruluk oranı ile Destek Vektör Makineleri en yüksek değere sahip sınıflandırma algoritması olmuştur. NAYALex Duygu Sözlüğü; bugüne kadar yapılmış (LIWC, EmoSenticNet, NRC, Empath) duygu sözlükleriyle karşılaştırıldığında, Tiffany'nin belirttiği 154 duygu için kendisine en yakın rakibi olan %6.5 kapsam oranına sahip NRC(Emolex)’e göre yaklaşık dört kat daha fazla duygu çıkarımı yaparak %24.7 oranı ile bildiğimiz kadarıyla en kapsamlı duygu sözlüğü olmuştur.
URI: http://hdl.handle.net/11513/2885
Appears in Collections:Fen Bilimleri Enstitüsü

Files in This Item:
File Description SizeFormat 
749883.pdf2.39 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.