Derin öğrenme ile yüksek çözünürlüklü ortofotoların sınıflandırma doğruluklarının analizi
Tarih
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Erişim Hakkı
Özet
Derin öğrenme ile görüntü sınıflandırma uygulamalarının popüler mimarisi olan evrişimsel sinir ağı (ESA) kullanılarak yüksek çözünürlüklü ortofotoların arazi örtüsü sınıflandırması amaçlanmaktadır. Çalışmanın amacı doğrultusunda, ResNet isimli ESA ağ yapısını temel alan DeepLabv3 mimarisi kullanılarak eğitimler gerçekleştirilmiştir. Çalışmada kullanılmak üzere Uluslararası Fotogrametri ve Uzaktan Algılama Birliği (ISPRS) tarafından açık veri seti olarak kullanıma sunulan ISPRS-Potsdam tercih edilmiştir. Veri setinde bulunan 6000x6000 boyutlu ortofotolar 400x400 boyutunda dilimlenmiş ve 1408 adet eğitim, 352 adet doğrulama, 352 adet ise test verisi olarak kullanılmıştır. Sinir ağı; RG (kırmızı-yeşil), RB (kırmızı-mavi), GB (yeşil-mavi), RGB (kırmızı-yeşil-mavi) ve IRRG (kızılötesi-kırmızı-yeşil) olmak üzere beş farklı spektral bant kombinasyonları ile eğitilmiştir. Eğitimler tamamlandıktan sonra, test verileri üzerinde sınıflandırma başarıları karşılaştırılmıştır. RG %91, RB %85, GB %91, RGB %92, IRRG %91 eğitim doğruluklarına sahiptir. Test doğrulukları ise sırasıyla %77, %76, %83, %82, %83 olarak elde edilmiştir. Gerçekleştirilen eğitimlerin sonucunda, GB verilerinin eğitiminde geçirimsiz yüzey, bina ve hiçbir sınıfa dâhil olmayanlar, RGB verilerinin eğitiminde düşük bitki örtüsü sınıfı ve IRRG verilerinin eğitiminde ağaç sınıflarının en yüksek doğruluk verdiği gözlemlenmiştir. DeepLabv3 mimarisinin yüksek çözünürlüklü ortofotolardan arazi örtüsü sınıflandırmasında kullanılabileceği ve kızılötesi girdi verisinin eğitime katkı sağladığı sonucuna varılmıştır.
It is aimed to classify high resolution orthophotos using the convolutional neural network (CNN), which is the popular architecture of image classification applications with deep learning. For the purpose of the study, trainings were carried out using the DeepLabv3 architecture based on the CNN network named ResNet. ISPRS-Potsdam, which is presented as an open data set by the International Photogrammetry and Remote Sensing Association (ISPRS), was chosen for the study. 6000x6000 size orthophotos in the data set were sliced to 400x400 size and used as 1408 training, 352 verification and 352 test data. Plexus; It has been trained with five different spectral band combinations: RG (red-green), RB (red-blue), GB (green-blue), RGB (red-green-blue) and IRRG (infrared-red-green). After the trainings were completed, the classification success was compared on the test data. RG 91%, RB 85%, GB 91%, RGB 92%, IRRG 91% training accuracy. Test accuracies were 77%, 76%, 83%, 82%, and 83%, respectively. As a result of the trainings carried out, it was observed that the impermeable surface, building and those not included in any class in the training of GB data, the low vegetation class in the training of the RGB data and the tree classes in the training of IRRG data were observed to give the highest accuracy. It was concluded that DeepLabv3 architecture can be used in land cover classification from high resolution orthophotos and infrared input data contributes to education.











