Bu yazıda, regresyon analizinde modelin açıklama gücü hakkında sıkça kullanılan R Kare ve Düzeltilmiş R Kare değerinden bahsedeceğiz. Bu R Kare çeşitlerinin ne olduğuna, anlamına, SPSS’te nasıl bulunacağına ve nasıl yorumlanacağına değineceğiz.
R Kare Nedir?
Basit doğrusal regresyon analizinde, R-kare (R²), bağımsız değişkenin regresyon modelinde bağımlı değişkendeki değişkenliğin ne kadarını açıkladığını temsil eden bir istatistiksel ölçüdür. SPSS içinde, R-kare genellikle regresyon çıktısının bir parçası olarak R Squared ismiyle rapor edilir.
R-karenin alabileceği değerler 0 ile 1 arasında değişir. 0 değeri, modeldeki bağımsız değişkenin bağımlı değişkenin değişkenliğinin hiçbirini açıklamadığını gösterirken, 1 değeri bağımsız değişkenin bağımlı değişkendeki tüm değişkenliğini açıkladığını gösterir. R-kare değerinin tam 1 olması pratikte imkansızdır diyebiliriz.
Örneğin, 0.75 R-kare değerine sahipseniz, bu, bağımlı değişkenin değişkenliğinin %75’inin bağımsız değişken tarafından açıklanabildiği anlamına gelir. Kalan %25’lik değişkenlik açıklanamamıştır ve modelde yer almayan diğer faktörlere veya rastgele varyasyona bağlı olabilir.
R-kare genellikle bir regresyon modelinin uyum iyiliğinin bir ölçüsü olarak kullanılır. Daha yüksek bir R-kare değeri genellikle modelin verilere daha iyi uyduğunu gösterir, ancak bu değeri, belirli araştırma sorusu ve verinin doğası bağlamında yorumlamak önemlidir. Ayrıca, R-kare tek başına, regresyon katsayılarının istatistiksel olarak anlamlı olup olmadığını veya model varsayımlarının karşılanıp karşılanmadığını göstermez. Bunlara regresyon analizinde ayrıca bakılmalıdır.
SPSS içinde, R-kare değerini regresyon analizinin çıktısında “Model Summary” tablosunda, katsayılar, standart hatalar ve p anlamlılık düzeyleri gibi diğer ilgili istatistiklerle birlikte bulabilirsiniz.
Yukarıdaki örnekte Kalite’nin Memnuniyet’e etkisine baktık. Bu etki istatistiksel olarak anlamlıymış (p < 0.001). R Square değerinin 0.071 olmasından da anlıyoruz ki: Kalite, Memnuniyet’teki artışın %7.1’inden sorumluymuş.
R-kare’yi yorumlarken dikkatli olmak önemlidir, çünkü bu değer, gerçek anlamda anlamlı olmayan bağımsız değişkenler regresyon modeline eklenerek yapay olarak şişirilebilir. Bu yüzden, R-kare, yalnızca basit doğrusal regresyon modelinde incelenmelidir. Çoklu doğrusal regresyon modellerinde, Düzeltilmiş R-Kare isimli diğer değere bakılıp yorum yapılmalıdır.
Düzeltilmiş R Kare (Adjusted R Squared) Nedir?
Düzeltilmiş R-kare (Adjusted R-squared), çoklu doğrusal regresyon analizinde, modeldeki bağımsız değişkenlerin sayısını sonucu bulunan hatalı olabilecek R-kare değerinin düzeltmek için kullanılan, R-kare istatistiğinin değiştirilmiş bir versiyonudur. Regresyon modelinin uyum iyiliğini R-kareden daha doğru bir şekilde ölçmek için kullanılır, özellikle farklı sayıda tahminci içeren modelleri karşılaştırırken.
R Kare (R-squared), bağımsız değişkenlerin bağımlı değişken üzerindeki toplam varyansı açıklama oranını ifade eder. Ancak, R Kare’nin tek başına kullanılması bazen yanıltıcı olabilir, özellikle regresyon modeli bağımsız değişken sayısı arttıkça.
Düzeltilmiş R Kare, R Kare’nin bir düzeltmesini sunar ve modelin bağımsız değişken sayısını dikkate alır. Bu, regresyon modelinin karmaşıklığını kontrol etmek için önemlidir. Bu yüzden çoklu regresyonlarda Düzeltilmiş R Kare değeri, her zaman normal düz R Kare değerinden daha düşük çıkar.
Düzeltilmiş R-kare, model uyumunu önemli ölçüde iyileştirmeyen ek bağımsız değişkenlerin modele dahil edilişini kontrol eder. Modeldeki bağımsız değişkenlerin sayısını dikkate alır ve R-kare değerini buna göre düzenler. Düzeltilmiş R-kare ayrıca veri setinin örneklem büyüklüğünü de düzeltir. Daha fazla bağımsız değişkenin modele eklenmesi genellikle Düzeltilmiş R-kare değerini artırır, ancak model uyumundaki iyileşme sınırlıysa veya örneklem büyüklüğü küçükse, artış R-kare’deki artışa göre daha az olur ve bu kabul edilebilir.
Düzeltilmiş R-kare değerleri de aynı R-kare değerleri gibi 0 ile 1 arasında değişir. Daha yüksek bir Düzeltilmiş R-kare değeri, modelin verilere daha iyi uyduğunu gösterir. Çoklu regresyon modelleri analiz edilirken, Düzeltilmiş R-kare genellikle R-kare’den daha çok tercih edilir çünkü model performansının daha doğru bir değerlendirmesini sağlar ve model karmaşıklığını dikkate alır.
SPSS içinde, Düzeltilmiş R-kare değerini regresyon analizinin çıktısında “Model Summary” tablosunda, katsayılar, standart hatalar ve p anlamlılık düzeyleri gibi diğer ilgili istatistiklerle birlikte bulabilirsiniz.
Yukarıdaki örnekte Servis ve Kalite’nin Memnuniyet’e etkisine baktık. Bu etki istatistiksel olarak anlamlıymış (p = 0.004). Adjusted R Square değerinin 0.059 olmasından da anlıyoruz ki: Servis ve Kalite, ikisi birlikte toplam, Memnuniyet’teki artışın %7.1’inden sorumluymuş.
Düzeltilmiş R Kare Ek Bilgi
Demin Düzeltilmiş R Kare değerine bakarak, Servis ve Kalite’nin Memnuniyet’e olan birlikte etkisine baktık. Peki Servis tek başına ve Kalite tek başına Memnuniyet’i nasıl etkiliyor bunu nereden öğreneceğiz?
Bunu yine çoklu doğrusal regresyon analizimizde önümüze gelecek başka bir tablo olan “Coefficients” başlıklı tabloda, Sig. sütununa bakarak öğreniyoruz. Satırdaki Sig. yani p değeri eğer 0.05’ten küçükse, o değişken, bağımlı değişkeni anlamlı biçimde etkilemiyordur demektir.
Bu örnekte, Kalite’nin Sig. değeri 0.05’ten küçük (p < 0.001), Servis’in Sig. değeri ise 0.05’ten büyük (p = 0.989). Demek ki, Memnuniyet’i sadece Kalite etkiliyor.
Peki, Kalite Memnuniyet’i tek başına ne kadar etkiliyor bunu nasıl öğreneceğiz? Bunu da, aynı tabloda “Part” isimli sütuna bakarak öğreniyoruz. Part değerinin karesi alınarak bulunan değer, o değişkenin tek başına bağımlı değişkeni yüzde kaç etkilediğini gösterecek.
Bizim örneğimizde Servis’in Part değeri neredeyse 0’dır. Bu beklenen bir durumdur çünkü Servis’in p değeri istatistiksel olarak anlamsız çıkmıştı, yani Memnuniyet’i etkilemiyor. Kalite’nin Part değeri ise 0.266 çıktı. Karesini alırsak 0.071 çıkıyor. Dikkat ederseniz, bu değer üstteki “Model Summary” tablosundaki R Squared yani R Kare değeriyle aynı. Bu durum çok normaldir, çünkü çoklu regresyon modelimizde 2 değişken vardı ama sadece 1 tanesi istatistiksel olarak anlamlı çıktı. 1 tanesi anlamlı ilişki gösterdiğine göre onun tek başına bağımlı değişkeni etkileme miktarını gösteren R Kare değeriyle eşit olması da şaşırtıcı değil.
Bir yanıt bırakın