Abstract:
Çevrimiçi sosyal ağlar, bilgi yaymak için en çok kullanılan sosyal araçlar arasında birinci sırada yer almaktadır. Sosyal ağlarda takipçi sayısı genellikle bir başarı göstergesi olarak görülmekte ve bu sayı, paylaşılan haberlerin doğruluğu ile ilişkilendirilmektedir. Ancak, sahte hesaplar tarafından sahte takipçiler alınarak takipçi oranının arttırılması ile hesabın gerçek bir hesap gibi görünmesi sağlanabilir ve bu şekilde yanlış bilgileri rahatça paylaşabilirler. Bu nedenle bu hesapların kontrolünü sağlamak için çalışmamızda, bu sahte hesaplar tespit edilerek sosyal ağların daha güvenilir hale gelmesi konusunda katkı sağlanmaya çalışılmıştır. Araştırmamızda Instagram sosyal ağı ele alınmıştır. Doğruluk sonuçlarını elde etmek için Rastgele Orman (Random Forest), Ekstra Ağaçlar (Extra Trees), Gradyan Arttırma (Gradient Boosting), Karar Ağacı (Decision Tree), AdaBoost (Adaptive Boosting) gibi ağaç yapısına dayalı öğrenme algoritmaları kullanılmıştır. Gerekli veri analizleri sonucunda algoritmalarda sırasıyla %94, %93, %90, %88 ve %94 doğruluk oranları elde edildiği gözlemlenmiştir. Diğer çalışmalardan farklı olarak algoritmaların sonuçlarını daha da iyileştirmek için, Topluluk Öğrenme (Ensemble Learning) yöntemlerinden olan VotingClassifier (hard voting) ve StackingClassifier(meta öğrenici) algoritmaları kullanılmıştır. Bu yöntemleri kullanmamızın temel nedeni birden fazla modelin avantajlarını bir araya getirerek, tek bir modelden daha iyi performans sağlamasıdır. Çalışmamızda VotingClassifier ve StackingClassifier modellerinde Rastgele Orman, Ekstra Ağaçlar ve AdaBoost algoritmalarını birleştirilerek sırasıyla %96 ve %95’lik en yüksek doğruluk oranına ulaşılmıştır. Ayrıca çalışmamızı diğer çalışmalardan ayıran diğer bir özellik ise YoloV8 nesne tanıma modeli kullanılarak görüntü işleme teknikleri ile profil fotoğraflarını kategorilere ayırıp analizini gerçekleştirerek profil fotoğraflarının sahte hesaplar üzerindeki etkilerinin ele alınması olmuştur. YoloV8 modelinin kullanma nedenimiz ise daha hızlı ve doğru iyileştirilmeler gerçekleştirerek sonuç vermesidir. Son olarak elde ettiğimiz analiz sonuçlarını Visual Studio platformunda geliştirdiğimiz Windows ara yüzü aracılığıyla, Instagram API'den çekilen güncel verileri kullanarak hesapların sahte hesaba aitlik durumu test edilmiştir. Sonuç olarak görüntü işleme ve veri madenciliği yöntemleri birlikte kullanılarak sonuçların doğruluk değerlerinin artırılması noktasında literatüre katkı sağlanmıştır.