Makine öğrenme temelli konut fiyat tahminlemede meta model uygulaması: Çanakkale ili örneği
Citation
Dumlu, C. (2022). Makine öğrenme temelli konut fiyat tahminlemede meta model uygulaması: Çanakkale ili örneği. Yayımlanmamış yüksek lisans tezi, Çanakkale Onsekiz Mart Üniversitesi, Çanakkale.Abstract
Makine Öğrenmesi yöntemleri günümüzde birçok alanda olduğu gibi emlak fiyatlarının tahmin edilmesi için de yaygın olarak kullanılmaktadır. Gerçekleştirilen çalışmada satılık konut fiyatlarının tahmin edilmesi için bir meta model geliştirilmiştir. RapidMiner aracı kullanılarak gerçekleştirilen meta modelde Karar Ağacı, Rassal Orman, Destek Vektör Makinesi ve Yapay Sinir Ağı yöntemleri kullanılmıştır. Çalışmada Çanakkale iline ait satılık konut verileri kullanılmıştır. Bu veriler web kazıyıcı oluşturularak aktif olarak kullanılan bir emlak sitesi üzerinden elde edilmiştir. Modelin tahmin başarısının arttırılması için elde edilen bu ham veriler belirli veri ön işleme adımlarından geçirilmiştir. Karar Ağacı, Rassal Orman, Destek Vektör Makinesi ve Yapay Sinir Ağı yöntemleri bir meta model altında birleştirilmiş ve nihai sonuç için Çoğunluk Oylaması kullanılmıştır. Hem meta model hem de meta model altındaki tüm alt modellerin eğitimi ve testi için 10 katmanlı çapraz geçerlilik yöntemi kullanılmıştır. Modellerin en iyi performansı verebilmesi için evrişimsel optimizasyon temelli hiper parametre optimizasyonu uygulanmıştır. İlgili optimizasyonun performansa katkısını gösterebilmek adına tüm modeller varsayılan hiper parametre değerleriyle de kurulmuş, optimize edilmiş modeller ile performans karşılaştırması yapılmıştır. Hem alt modeller hem de meta model için optimize edilmiş hiper parametrelerle kurulan modellerin daha yüksek tahmin performansı gösterdiği görülmüştür. Alt modeller içinde en yüksek performansı 0,825 korelasyon sayısı ile Rassal Orman göstermiştir. Kurulan model 0,836'lık korelasyon ile alt modellerin tahmin performansının oldukça üstüne çıkmıştır. Machine Learning methods are widely used for estimating real estate prices as it is used in many other domains. In this study, a meta-model has been developed to predict the prices of houses on sale. Decision Tree (DT), Random Forest (RF), Support Vector Machine (SVM) and Artificial Neural Network (ANN) were used in the meta-model developed by using the RapidMiner tool. The data set consists of the houses on sale in Canakkale province. A web scrapper was developed to retrieve the sale data from an actively used real estate web site. In order to increase the prediction performance a data preprocessing step was conducted. A ten-fold cross validation was used to train and test both the base learners and the meta model. Evolutionary based hyper parameter optimization was used to increase the performance of the models. In order to show the contribution of the optimization to the performance, all models were constructed with the default hyper parameter values, and performance comparisons were made with the optimized models. Base learners and meta model with optimized hyper parameters showed higher predictive performance. Random Forest showed the highest performance with a correlation number of 0,825 among the base learners. The established meta model was well above the prediction performance of the sub-models with a correlation of 0,836.