Yalan haber yayılımının duygu analiziyle incelenmesi ve metin sınıflandırmada yapay sinir ağlarının başarımlarının karşılaştırılması
Citation
Er, M.F. (2022). Yalan haber yayılımının duygu analiziyle incelenmesi ve metin sınıflandırmada yapay sinir ağlarının başarımlarının karşılaştırılması. Yayımlanmamış yüksek lisans tezi, Çanakkale Onsekiz Mart Üniversitesi, Çanakkale.Abstract
Sosyal medyanın haber kaynağı olarak kullanılması günümüzde oldukça yaygındır. Ancak karşılaşılan haberlerin doğruluğunun sorgulanmadan ve kontrol edilmeden doğru kabul edilmesi, yalan haberlerin yayılmasının ana nedenlerindendir. Sosyal medya kullanıcıları için, haberin doğruluğu kanıtlardan ziyade fikir ve duyguların kontrolü altında olduğundan, yalan haberlerin yayılmasında hangi duygunun daha etkili olduğu sorusu ortaya çıkmaktadır. Çalışmamız, kullanıcıların yalan haberlere tepkileri ile haberlerin yaygınlığı arasında bir ilişki olup olmadığını araştırmaktadır. Çalışmamızda, Twitter kullanıcılarının 31 Aralık 2019–30 Temmuz 2022 tarihleri arasında yalan haberlere verdikleri tepkiler toplanmış ve 4 ana başlıkta kategorize edilmiştir. Bu tepkiler üzerine duygu analizi yapılmıştır. Yalan haberin yaygınlığıyla habere verilen tepki arasında bir ilişki olduğu ancak yalan haberin türüne ve insanları hangi bağlamda etkilediğine göre değiştiği gözlemlenmiştir. Veri setleri, LSTM yöntemi ve TensorFlow Hub'da önceden eğitilmiş metin gömmelerini kullanan YSA modeliyle eğitilmiştir. Tüm veri setleri için, LSTM'e kıyasla YSA modelinden daha yüksek doğruluk değeri elde edilmiştir. Önceden eğitilmiş metin gömmelerini kullanan YSA modelinin az veriyle bile oldukça iyi sonuç verdiği görülmüş, doğrulama ve test veri seti için sırasıyla 0.9020 ve 0.8998 doğruluk değerleri elde edilmiştir. Modellerin optimum seviyesine ulaşmaları için kullanılan eğitim tur sayıları da farklılık göstermiştir. Bulgular metin sınıflandırma problemi için, önceden eğitimli metin gömmelerinin kullanılmasının performansı arttırdığını ve eğitim süresini kısalttığını göstermektedir. The use of social media as a news source is quite common nowadays. However, the fact that the news encountered is accepted as true without questioning and checking its accuracy is one of the main reasons for the spread of fake news. For social media users, the question arises as to which emotion is more effective in spreading fake news, as the accuracy of the news is under the control of ideas and emotions rather than evidence. From this point of view, our study investigates whether there is a relationship between users' reactions to the news and the prevalence of the news. In our study, the reactions of Twitter users to fake news between 31 December 2019 and 30 July 2022 were collected and categorized under 4 main headings. Sentiment analysis was performed on these reactions. It has been observed that there is a relationship between the prevalence of fake news and the reaction to the news, but it varies according to the type of fake news and the context in which it affects people. The datasets were trained with the LSTM method and the Neural Nets model using pre-trained text embeddings in TensorFlow Hub. For all datasets, higher accuracy value was obtained from the NN model compared to LSTM. It was seen that the NN model using pre-trained text embeddings gave very good results even with little data, and accuracy values of 0.9020 and 0.8998 were obtained for the validation and test dataset, respectively. The number of epochs used to reach the optimum level of the models also differed. The findings show that for the text classification problem, the use of pre-trained text embeddings improves performance and reduces training time.