
İçindekiler
Heteroskedastisite ve Homoskedastisite kavramları, doğrusal regresyon analizinde varyansın sabitliği ile ilgili terimlerdir. Basit ve çoklu doğrusal regresyon analizlerinde, homoskedastisite varsayımının doğrulanması, regresyon analizi sonuçlarının tutarlı olması açısından önemlidir. Bu varsayım, Breusch-Pagan Testi ile kontrol edilmektedir. Bu yazıda, homoskedastisite ve heteroskedastisite durumlarının ne anlama geldiğini ve regresyon analizi için homoskedastisite varsayımını SPSS ile Breusch-Pagan Testi yaparak nasıl test edeceğimizi anlatacağım.
Heteroskedastisite ve Homoskedastisite Nedir?
- Heteroskedastisite, regresyonda hata terimlerinin varyansının sabit olmadığı durumu ifade eder. Yani, hata terimleri bağımsız değişkenlerin değerlerine bağlı olarak değişen varyansa sahiptir. (İngilizce kaynaklarda Heteroscedasticity veya Heteroskedasticity olarak geçmektedir)
- Homoskedastisite, regresyon modelinde bağımsız değişkenlerin tüm değerleri için hata terimlerinin (residuals) varyansının yaklaşık olarak sabit olduğunu ifade eder. Yani, modelde tahmin edilen değerlerin doğruluğu, bağımsız değişkenlerin değerlerinden bağımsız olarak aynıdır. (İngilizce kaynaklarda Homoscedasticity veya Homoskedasticity olarak geçmektedir)
Aşağıdaki resimde, 2 değişken arasında Heteroskedastisite ve Homoskedastisite durumları olduğu zaman grafik üzerinde nasıl görünüyor bunu görsel olarak görebilirsiniz.
Heteroskedastisite ve Homoskedastisite Neden Önemlidir?
Homoskedastisite, modelin genel doğruluğunu ve tahminlerin tutarlılığını artırır, çünkü veride heteroskedastisitenin varlığı, standart hata tahminlerinin yanlış olmasına neden olabilir. Bu da regresyon analizi sonucu oluşturulan modeldeki güven aralıklarının ve hipotez testlerinin sonuçlarının isabetsiz olmasına sebep olabilmektedir.
Bu sebeple, doğrusal regresyon analizinin sonuçlarının sağlıklı olabilmesi için, homoskedastisite varsayımının sağlanması gerekmektedir. Homoskedastisite varsayımını test etmenin en sık kullanılan metodu Breusch-Pagan Testi’dir. Ne yazık ki, SPSS’te homoskedastisite durumunu test etmek için herhangi bir fonksiyon bulunmamaktadır.
Buna karşın, birkaç ekstra manuel işlem yaparak, regresyon analizi yapacak olduğumuz veride homoskedastisite olup olmadığını test etmemiz mümkündür.
SPSS ile Heteroskedastisite & Homoskedastisite Tespiti (Breusch-Pagan Testi)
SPSS’te homoskedastisitenin varlığını test etmek için doğrudan Breusch-Pagan Testi uygulamak mümkün olmasa da, homoskedastisite testini aşağıdaki gibi manuel olarak yapıp güvenilir sonuçlara ulaşmak mümkündür.
Bu örnekte gün sayısı ile bir testten alınan puan arasında basit doğrusal regresyon analizi yapacağız. Bu örnekte 1 adet bağımsız değişken var, fakat birden fazla sayıda bağımsız değişken ile çoklu doğrusal regresyon yapacaksanız da bu sayfadakileri aynen takip edebilirsiniz.
Analyze -> Regression -> Linear
Bağımsız ve bağımlı değişkenleri sırasıyla Independents ve Dependent kutularına koyuyoruz. (Birden fazla bağımsız değişken varsa hepsini aynı anda Independents kutusuna atmak gerekli.) Sonra “Save” butonuna basıyoruz. Açılacak olan pencerede Predicted Values bölümünde Unstandardized seçeneğini ve Residuals bölümünde bölümünde Unstandardized seçeneğini seçiyoruz.
Daha sonra, “Plots” butonuna basarak, Y kutusuna ZRESID isimli, X kutusuna ZPRED isimli değişkenleri yerleştiriyoruz.
“Continue” ve “OK” butonlarına bastığımızda, SPSS bizim için analizi yapacak. Burada önemli olan analizin sonucu değil de, analiz çıktısındaki “Scatterplot” grafiği. Burada, gün sayısı küçük iken puanların tutarlı bir şekilde gittiğini, fakat gün sayısı büyük iken puanların saptığını yani varyanslarının değiştiğini görüyoruz. Bu varyans değişimi, istatistiksel olarak anlamlı bir değişim mi diye bakmak için Bruesch-Pagan Testi’ni yapmamız gerekiyor bundan sonra.
SPSS veri setimize tekrar dönersek, değişkenlerimizin yanında PRE_1 ve RES_1 isimli 2 değişken oluşmuş olduğunu göreceğiz. Bunlar sırasıyla tahmin edilen (predicted) ve artık (residual) değişkenler demektir.
Verimizi Bruesch-Pagan Testi’ne uygun hale getirmek için, residual (artık) değerin karesini almamız gerekiyor.
Transform -> Compute Variable
Target Variable kısmına yeni bir değişken ismi yazıyoruz. Sonra resimdeki gibi RES_1 * RES_1 işlemini yazıyoruz ve “OK” butonuna basıyoruz.
Bu şekilde, artık (residual) değerin karesini oluşturmuş olduk.
Şimdi, yine Analyze -> Regression -> Linear butonlarına basalım.
Bağımsız değişken(ler) aynı yerinde kalacak. Dependent kutusuna ise, yeni oluşturduğumuz RES_1_kare değişkenini koyalım ve “OK”a basalım.
SPSS analiz sonuçlarının arasında, yalnızca ANOVA tablosundaki Sig. değerine bakmamız gerekiyor. Bu değer, manuel olarak yaptığımız Bruesch-Pagan Testi’nin sonucundaki p istatistiksel anlamlılık değeridir.
- Bu p değeri eğer 0.05’ten büyükse, veride homoskedastisite olduğunu gösterir. Yani, regresyon analizinde artık değerlerin varyansı, bağımsız değişken(ler)in küçük ya da büyük olmasına göre farklılık göstermemektedir demektir. Bu iyi bir durumdur, bu durumda doğrusal regresyon analizi sonuçlarımızın güvenilir olduğunu söyleyebiliriz.
- Fakat bu p değeri eğer 0.05’ten küçükse, veride heteroskedastisite durumu olduğunu anlarız. Yani, bu örnekteki gibi, bağımsız değişken(ler)in küçük veya büyük olması, artık değerin az veya çok varyans göstermesini etkilemektedir. Bu durum da, istediğimiz bir durum değildir ve bu durumda doğrusal regresyon analizi yapmak güvenilir olmayacaktır.
Bir yanıt bırakın