İçindekiler
Pearson Korelasyon Analizi Varsayımları Nelerdir?
Pearson korelasyon analizi yapmak için önce belli varsayımların sağlanıp sağlanmadığını kontrol etmemiz gerekiyor. Eğer bu varsayımların hepsi sağlanmıyorsa, korelasyon analizi sonuçları gerçeği isabetli bir şekilde yansıtmıyor olacaktır. Pearson korelasyon analizi için en önemli 4 varsayım aşağıdaki gibidir:
- İki değişken de devamlı veri tipi şeklinde olmalıdır
- Verimizde uç değer (outlier) olmamalıdır
- Verimiz normal dağılım şeklinde dağılmalıdır
- İki değişken arasındaki ilişki doğrusal şekilde olmalıdır
Gerçeği yansıtan bir Pearson Korelasyon Analizi yapabilmek ve analizden geçerli sonuçlar elde edebilmek için bu varsayımların yerine getirilmiş olup olmadığının incelenmesi önemlidir. Varsayımlar yerine getirilmiyorsa, Pearson korelasyon analizinin sonuçları güvenilir olmayabilir. Bu durumda, Spearman Korelasyon Analizi veya Kendall’s Tau Korelasyon Analizi gibi başka istatistiksel teknikler kullanılması gerekebilir.
SPSS ile Pearson Korelasyon Varsayımları Test Etme
SPSS ile korelasyon analizi yapmak için gerekli varsayımları aşağıdaki gibi test edebiliriz.
Önce Analyze -> Descriptive Statistics -> Expolore butonlarına basıyoruz.

Değişkenlerimizin ikisini birden, soldaki kutudan alıp sağdaki “Dependent List” kutusuna koyuyoruz.

Plots butonuna basıyoruz. Açılan pencerede aşağıdaki gibi, “Normality plots with tests” ve “Histogram” seçeneklerini işaretliyoruz. Continue’ya basıyoruz.

Deminki pencerede bu sefer Plots yerine Statistics butonuna basıyoruz. “Descriptives” ve “Outliers” seçeneklerini işaretliyoruz ve Continue’ya basıyoruz. Sonra OK butonuna basarak varsayımlar için analizimizi başlatıyoruz.

1) Uç Değer Testi
SPSS bize her değişkenimiz için 1 adet boxplot yani kutu grafiği sunacak. Burada bakmamız gereken yer, grafikteki mavi kutunun üst ve altındaki çubukların üzerinde herhangi bir noktanın var olup olmadığı. Eğer bu bölgelerde nokta varsa, bu, o noktaların uç değerlere sahip olan noktalar olduğunu gösterir.
Bu noktalar hangi kişilere aitse, o kişileri korelasyon analizinden çıkartmak, daha isabetli bir korelasyon testi yapmamızı sağlayabilir. Fakat uç değerlere sahip kişileri çıkartmak her zaman doğru olmayabilir, çünkü onlar da gerçek ölçümler ise, elimizdeki verinin bir kısmını seçici olarak yok etmiş oluyoruz. Uç değerlere sahip verilere sahip olmamız durumunda ne yapmamız gerektiği hakkında bir tartışmayı burada okuyabilirsiniz.
Bizim bu örnekteki kutu grafiklerimizin ikisinde de, mavi kutuların dışındaki dikey çizgilerin dışında herhangi bir nokta görünmüyor. Demek ki bizim buradaki veri setimizde hiçbir uç değer yok. Korelasyon testimize güvenle devam edebiliriz.
(Eğer verimizde çok fazla uç değer varsa ve hiçbir uç değeri çıkartmak istemiyorsak, parametrik Pearson korelasyonu yapmak yerine, parametrik olmayan alternatifler Spearman veya Kendall korelasyonu yapabiliriz.)

2) Normal Dağılım Testi
Değişkenlerimizin normal dağılıma sahip olup olmadığına, Kolmogorov-Smirnov veya Shapiro-Wilk testi ile bakıyoruz. Bu testlerin 1 tanesini seçip, tablodaki Sig. sütunu değerleri 0.05’in üstünde mi diye bakacağız.
Bu örnekte bütün Sig. yani p değerleri 0.05’in üstünde. Bu yüzden, normal dağılım var şeklinde yorumlayabiliriz. Bu varsayım da doğrulanmış oldu.
(Eğer normal dağılım olmadığı sonucuna varsaydık, parametrik Pearson korelasyonu yapmak yerine, parametrik olmayan alternatifler Spearman veya Kendall korelasyonu yapmayı tercih etmemiz gerekirdi.)

3) Doğrusal İlişki Testi
Şimdi, iki değişkenimiz arasında doğrusal ilişki var mı diye bakacağız.
SPSS’te Graphs -> Chart Builder butonlarına tıklayıp tablo oluşturucuyu açıyoruz.

Karşınıza böyle bir pencere açılacak.

Önce aşağıdaki “Gallery” bölümünden Scatter/Dot’u seçip sonra noktalardan oluşan kutuyu mouse ile alıp ortadaki büyük boşluğa taşıyoruz. Resimde ok işaretleri ile gösterdim.
Sonra, değişkenlerimizi soldaki “Variables” kutusundan alıp yeni oluşturduğumuz grafikteki yatay ve dikey eksenlere taşıyoruz. Hangisini nereye koyduğumuz fark etmez.
Sonra OK butonuna basıyoruz ve SPSS bize grafiğimizi oluşturuyor.

Aşağıdaki grafiği inceliyoruz. Noktaların dağılımını gözümüz ile incelediğimizde, soldan sağa yaklaşık doğrusal olarak bir artış olduğunu gözlemleyebiliriz. Soldaki noktalar genelde daha aşağıdayken, sağa gittikçe noktalar genel olarak biraz daha yukarı çıkıyor. O zaman, değişkenlerimiz arasında doğrusal bir ilişki var diyebiliriz.
(Eğer değişkenler arasında doğrusal bir ilişki olmadığı sonucuna varsaydık, parametrik Pearson korelasyonu yapmak yerine, parametrik olmayan alternatifler Spearman veya Kendall korelasyonu yapmayı tercih etmemiz gerekirdi.)

DİKKAT: Anscombe’s Quartet !!
Korelasyon analizi yaparken, iki değişken arasında bulduğumuz korelasyon ilişkinin doğrusal olup olmadığına neden grafik oluşturup inceleyerek karar vermeliyiz? Çünkü, SPSS bize bir korelasyon ilişkisi verse bile, değişkenlerin değerlerinin grafik üzerindeki dağılımları aşağıdaki 4 grafikteki gibi olabilir.
Aşağıdaki 4 grafiğin sadece sol üstteki olanı doğrusal olarak kabul edilebilir. Diğer dağılımlar doğrusal değildir. İlk grafik hariç diğer 3 grafikte iki değişken arasındaki ilişki doğrusal olmadığı için, eğer bu grafiklere sahip değişkenler arasında korelasyon var mı diye test etmek istersek, non-parametrik korelasyon testleri olan Spearman veya Kendall’dan birini seçmek, parametrik Pearson korelasyonu yapmaktan daha doğru bir tercih olacak. İlk grafik için ise Pearson korelasyonu yapmak uygun olacak.

ÖNEMLİ NOT! Pearson korelasyon testi yapmak için ancak gerekli olan bütün varsayımları doğruladıktan sonra, analizi yapma aşamasına geçebiliriz.

Bir yanıt bırakın