Yalan haber yayılımın önlenmesine yönelik bir web tarayıcı uzantısı geliştirilmesi
Abstract
Yalan haber, çevrimiçi platformlarda çok hızlı yayılması ve tespit edilmesinin zor olması nedeniyle günümüzün en büyük sorunlarından biridir. Yalan haberler çok hızlı yayılarak kitlelerin yanlış yönlendirilmesi, kışkırtılması, korku salınarak kaos ortamı yaratılması gibi toplumsal ve sosyal çok büyük sorunlara neden olmaktadır. Olumsuz etkilerinden dolayı, yalan haberlerin tespit edilip yayılmasının önlenmesi önemli ve öncelikli bir mesele olmuştur. Çalışmanın amacı, yalan haberlerin tespit edilerek yayılmasının önlenmesidir. Bunun için yalan haber tespiti yapan yeni bir Chrome uzantısı geliştirilmiştir. Doğal dil işleme, veri madenciliği yöntemleri, denetimli öğrenme algoritmaları, çevrimiçi öğrenme algoritması, derin öğrenme algoritması ve Python programlama dili kullanılarak uzantı geliştirilmiştir. İlk olarak veri setine, veri ön işleme için doğal dil işleme yöntemleri uygulanmıştır. Veri seti, %80 eğitim ve %20 test olmak üzere ikiye ayrılmıştır. Kelime vektörlerini oluşturmak için, Terim Frekansı – Ters Doküman Frekansı vektörizasyonu kullanılmıştır. En önemli aşama olan model uygulamada; Pasif agresif, Destek Vektör Makinesi, Rassal Orman, AdaBoost, XGBoost ve Uzun-kısa Süreli Bellek (LSTM) algoritmaları kullanılmıştır. Kullanılan algoritmaların doğruluk oranları ve karmaşıklık matrisleri karşılaştırılmıştır. En yüksek tahmin sonucunu %90.72'lik bir oranla LSTM algoritması vermiştir. Oluşturulan makine öğrenmesi modeli, Python programında Flask ve Rest API kullanılarak çevrimiçi internet ortamında çalışabilir hale getirilmiştir. Son olarak tarayıcı uzantı arayüzü; Javascript, HTML ve CSS kullanılarak oluşturulmuştur. Fake news is one of the biggest problems of today, as it spreads so fast on online platforms and is difficult to detect. Fake news spreads fairly quickly, causing huge social problems such as misdirecting and provoking the masses, creating an atmosphere of chaos by spreading fear. Due to its negative effects, detecting and preventing the spread of fake news has been an important and priority issue. The aim of the study is to detect and prevent the spread of fake news. For the purpose, a new Chrome extension has been developed that detects fake news. The extension was developed using natural language processing, data mining methods, supervised learning algorithms, online learning algorithm and Python programming language. Firstly, natural language processing methods were applied to the data set for data preprocessing. The data set is divided into two as 80% training and 20% testing. Term Frequency – Inverse Document Frequency vectorization was used for feature selection. In the model application, which is the most important stage; Passive Aggressive, Support Vector Machine, Random Forest, AdaBoost, XGBoost and Long-Short-Term Memory (LSTM) algorithms are used. The accuracy rates and confusion matrix of the algorithms used were compared. The LSTM algorithm gave the highest prediction result with a rate of %90.72. The created machine learning model has been made workable in the online internet environment by using Flask and Rest API in the Python program. Finally, the browser extension interface have been built using Javascript, HTML and CSS.
URI
https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=G_oJ1rKE4SgJUkomyAKpR3c-A4cXOiZv0RH6JwPjtLiM6-f9lYI2hpw1v_LVdIRYhttps://hdl.handle.net/20.500.12428/4646