Korelasyon analizi üzerine değerlendirmeler
Abstract
Bu tez çalışmasında uygulamada yaygın olarak kullanılan istatistik tekniklerden biri olan korelasyon analizinin kapsamlı bir değerlendirmesi yapılmıştır. Bu amaçla hem iki kantitatif değişken hem de iki kalitatif ya da değişkenlerden birisinin kalitatif olduğu durumlarda değişkenler arasındaki ilişkilerin araştırılması amacıyla önerilen korelasyon katsayılarının performansları kapsamlı bir şekilde değerlendirilmiştir. İki kantitatif değişken arasındaki ilişkilerin araştırılmasında kullanılan Pearson, Spearman, Kendall-Tau, Winsorize, Distance, Biweight Midcorrelation, Hoeffding's D, Percentage Bend ve Blomqvist's gibi korelasyon katsayıları kendi aralarında karşılaştırılmıştır. Benzer şekilde Phi, Tetrachoric, Polychoric, Biserial, Point Biserial, Rank Biserial, Polyserial korelasyon katsayıları da kendi aralarında karşılaştırılmıştır. Bu karşılaştırmalar sonucunda hangi deneme koşulu ya da koşullarında hangi korelasyon katsayılarının kullanılmasının daha uygun olacağına yönelik bilgi üretilmiştir. Yapılan kapsamlı Monte Carlo simülasyon denemeleri sonucunda Pearson, Spearman Rank, Winsorize, Biweight Midcorrelation ve Percentage Bend korelasyon katsayıları örneklerin iki değişkenli Cauchy dağılımlarından alınmaları hariç genel olarak en uygun korelasyonlar oldukları görülmüştür. Genel olarak en sapmalı sonuçlar ise Hoeffding ve Blomqvist korelasyon katsayıları kullanıldığında elde edilmiştir. Bu durum özellikle n ? 30 olduğunda daha da belirginleşmiştir. In this thesis, a comprehensive evaluation of correlation analysis has been done. For this purpose, the performances of the proposed correlation coefficients have been comprehensively evaluated for investigating the relationships between the variables in cases where both two quantitative variables and two qualitative or one of the variables are qualitative. Correlation coefficients such as Pearson, Spearman Rank, Kendall-Tau, Winsorize, Distance, Biweight Midcorrelation, Hoeffding's D, Percentage Bend and Blomqvist's, which are used to investigate the relationships between two quantitative variables, were compared among themselves. Similarly, correlation coefficients of Phi, Tetrachoric, Polychoric, Biserial, Point Biserial, Rank Biserial, Polyserial were also compared among themselves. As a result of these comparisons, information was produced about which correlation coefficients would be more appropriate to use in which experimental condition(s). As a result of comprehensive Monte Carlo simulation experiments, Pearson, Spearman Rank, Winsorize, Biweight Midcorrelation and Percentage Bend correlation coefficients were found to be the most appropriate correlations in general, except for the samples taken from bivariate Cauchy distributions. In general, the most deviated results have been observed when the Hoeffding's and Blomqvist correlation coefficients have been used. These deviations are more obvious particularly when n ? 30.
URI
https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=nLNfCsWgUluh5T2iyudShiuM7JQB4MvrrwrqpZT4-q6lr_yu-Otym3rX5Dlm2N0fhttps://hdl.handle.net/20.500.12428/5197