
İçindekiler
SPSS’te oluşturulan çoklu regresyon analizi modeline bağımsız değişkenlerin hepsinin aynı anda dahil edildiği çoklu regresyon analizi yöntemine “forced-entry” metodu denir. Bu yazımızda, çoklu doğrusal regresyon analizi yaparken tercih edebileceğimiz “Forced-Entry” metodunun ne olduğuna, SPSS ile nasıl yapılacağına, ve sonuç tablolarının nasıl yorumlanması gerektiğine değineceğiz.
Çoklu Regresyon “Forced-Entry” Metodu Nedir?
Çoklu doğrusal regresyon analizinde amaç, birden fazla bağımsız değişkenin bir adet bağımlı değişken üzerindeki etkisini incelemektir. Forced-Entry metodu, çoklu regresyon modeline tüm bağımsız değişkenlerin aynı anda sokulduğu (önem sırasına bakılmaksızın) analiz yöntemini ifade eder.
Değişkenlerin belirli kriterlere göre sırayla analize eklendiği veya çıkarıldığı hiyerarşik ve stepwise regresyon yöntemlerinin aksine, Forced-Entry yönteminde, analizde incelenmek istenen tüm bağımsız değişkenler aynı anda regresyon analizine sokulur. Bu yaklaşım genellikle araştırmacıların, önem miktarlarına bakılmaksızın tüm değişkenlerin eşit önemde değerlendirildiği keşfedici yönde yaptıkları araştırmalarda tercih edilir.
Mesela, “exploratory” yani “keşfedici” deney tasarımlarında, yani hakkında ön bilgi yeterince bulunmayan bağımsız değişkenlerin hangilerinin bağımlı değişkeni etkileyip hangilerinin etkilemediğine bakmayı içeren deney tasarımlarının istatistiksel analizi yapılırken “forced-entry” çoklu regresyon analizi uygulanır.
Forced-Entry Çoklu Regresyon Varsayımları
Linke tıklayarak çoklu doğrusal regresyon varsayımlarını test etme konusunda yazdığım diğer yazıyı okuyabilir ve çoklu regresyon analizinin bütün varsayımlarının nasıl test edileceğini öğrenebilirsiniz.
SPSS’te yapacağımız forced-entry çoklu regresyon analizinde bulduğumuz sonuçlara güvenebilmemiz için, verimizin regresyon analizi öncesinde bazı varsayımları sağlıyor olması gerekir. Önce regresyon analizi varsayımlarının sağlandığından emin olup, regresyon analizini ondan sonra yapmak gerekir. Bu varsayımlar şunlardır:
- Bütün bağımsız ve bağımlı değişkenlerin devamlı veri tipinde olması gerekir.
- Veride çok değişkenli (multivariate) uç değer olmaması gerekir.
- Gözlenen ile beklenen değerlerin farkının yani “artık değerlerin” (Residual’ların) normal dağılım göstermesi gerekir.
- Bağımsız değişkenlerin hiçbiri, bağımlı değişken ile lineer olmayan bir ilişki göstermemelidir. Yani eğrisel ilişki olmamalıdır. (Doğrusal İlişki Varsayımı)
- Bağımsız değişkenlerin herhangi ikisini ele aldığımızda, bu iki değişkenin birbiriyle 0.70’ten fazla korelasyon göstermemesi gerekir. (Çoklu Bağlantısızlık Varsayımı)
- Hata varyansları bağımsız değişkenlerin büyüklüğüne göre değişkenlik göstermemelidir. (Homoskedastisite)
- Otokorelasyon olmamalıdır. (Durbin-Watson testi)
Çoklu doğrusal regresyon analizinin varsayımlarını test etme işi epey uzundur ve analizin kendisinden daha kafa karıştırıcı olabilmektedir. Bu sayfada hem çoklu doğrusal regresyon analizi yapmayı hem de varsayımları test etmeyi anlatırsam çok kafa karıştırıcı olabilir. Bu sebeple, bu sayfada varsayımların nasıl test edileceğinden bahsetmeden, yalnızca forced-entry metoduyla çoklu regresyon analizi yapmayı ve sonuçları yorumlamayı göstereceğim.
Linke tıklayarak çoklu doğrusal regresyon varsayımlarını test etme konusunda yazdığım diğer yazıyı okuyabilir ve çoklu regresyon analizinin bütün varsayımlarının nasıl test edileceğini öğrenebilirsiniz.
SPSS ile Forced-Entry Çoklu Regresyon Nasıl Yapılır?
SPSS’te forced-entry çoklu regresyon yapmak için aşağıdaki adımları takip edebiliriz.
Bu sayfada yapacağımız örnekte, 3 bağımsız ve 1 bağımlı değişkenimiz var. Depresyon, dayanıklılık ve stres faktörlerinin, yorgunluk seviyesi üzerindeki etkilerine bakacağız.
Analyze -> Regression -> Linear
Bağımlı değişkenimizi Dependent kutusuna, bağımsız değişkenlerimizin hepsini tek seferde altındaki Independent(s) kutusuna atıyoruz. Method olarak Enter seçili olmalı.
Daha sonra, “Statistics” butonuna basarak, açılan yeni pencerede, aşağıdaki kutucukları işaretliyoruz. Sonra “Continue”ya basıyoruz.
Son olarak, “OK” butonuna basarak SPSS’te forced-entry çoklu regresyon analizimizi başlatıyoruz.
Forced-Entry Çoklu Regresyon SPSS Tablo Yorumlama
SPSS’te “forced-entry” metoduyla yaptığımız çoklu doğrusal regresyon analizinin sonucunda 3 tane bakmamız gereken tablomuz olacak. Bunlar regresyon modelinin istatistiksel olarak anlamlı olup olmadığı, bağımsız değişkenlerin bağımlı değişkeni açıklama gücü, regresyon katsayıları ve yönü hakkındadır.
1) ANOVA Tablosu
ANOVA tablosundaki Sig. değeri, p değeridir. Bu değer, SPSS’in kurduğu regresyon modelinin, rastgele bir dağılımdan anlamlı şekilde farklı olup olmadığını belirlemeye yarar. Eğer p değeri 0.05’ten küçükse, bağımsız değişkenlerden en az 1 tanesinin bağımlı değişken üzerinde anlamlı bir etkisi var demektir.
Bu tablodaki p değeri bütün bağımsız değişkenlerin birlikte modele sokulmasıyla yapılan regresyon analizinin anlamlılık değeridir. Eğer bu değer 0.05’in altında ise, regresyon modelimiz istatistiksel olarak anlamlı demektir.
Bu örnekte 0.05’in altında bir p değeri bulduk. Yani Stres, Dayanıklılık ve Depresyon değişkenlerinden en az 1 tanesi, Yorgunluk bağımlı değişkeni üzerinde etkiye sahipmiş.
2) Regresyon Model Özeti
“Model Summary” tablosundaki Adjusted R Square değeri (yani düzeltilmiş R-kare değeri), modelin bağımsız değişkenlerinin bağımlı değişken üzerindeki değişimi toplu olarak açıklama gücünü ifade eder.
Bu örnekte Adjusted R Square değeri 0.096 çıkmış, yani “modeldeki değişkenler, Yorgunluk üzerindeki değişimin %9.6’sını açıklayabiliyor” diyebiliriz. Yorgunluk üzerindeki kalan %90.4’lük değişim de, bu modelde olmayan bilinmeyen başka faktörlere bağlıdır.
3) Regresyon Katsayıları
Asıl detaylı bakmak gereken tablo bu aslında.
“Coefficients” tablosundaki Sig. değerleri, her bağımsız değişkenin ayrı ayrı bağımlı değişken üzerindeki etkisinin p istatistiksel anlamlılık değerini gösteriyor. Bu tabloya göre Depresyon, Yorgunluk üzerinde anlamlı bir etkiye sahipmiş (çünkü p değeri 0.006 yani 0.05’ten küçük). Dayanıklılık, Yorgunluk üzerinde anlamlı bir etkiye sahip değilmiş (p = 0.580). Stres de Yorgunluk üzerinde anlamlı bir etkiye sahipmiş (p = 0.012).
- Tablodaki B değerine bakarak “Depresyon seviyesinde 1 birimlik artış, Yorgunluk seviyesinde 0.202 birimlik bir artışı anlamlı şekilde öngörmektedir.” veya “Stres seviyesinde 1 birimlik artış, Yorgunluk seviyesinde 0.372 birimlik bir düşüşü anlamlı şekilde öngörmektedir.” şeklinde yorumlar yapabiliriz.
- Beta değerlerine bakarak da “Depresyon seviyesinde 1 standart sapmalık artış, Yorgunluk seviyesinde 0.220 standart sapmalık bir artışı anlamlı şekilde öngörmektedir.” veya “Stres seviyesinde 1 standart sapmalık artış, Yorgunluk seviyesinde 0.204 standart sapmalık bir düşüşü anlamlı şekilde öngörmektedir.” şeklinde yorumlar yapabiliriz.
- “Dayanıklılık arttıkça yorgunluk artar” gibi bir yorumlama yapamıyoruz çünkü p değerini 0.580 bulmuştuk yani Dayanıklılık’ın Yorgunluk üzerindeki etkisi anlamsızdır. Anlamsız olunca “etkisi var” diyemiyoruz.
Ek Bilgi:
Bu tabloda Correlations bölümündeki Partial, kısmi korelasyonu (yani diğer değişkenlerin etkileri kontrol edildiğinde bir bağımsız değişkenin bağımlı değişken üzerindeki etkisini) göstermektedir.
Part değerinin karesini alırsak ise, o satırdaki bağımsız değişkenin tek başına bağımlı değişkendeki varyansın yüzde kaçını açıklayabiliyor olduğunu buluruz. (Mesela depresyon için hesaplarsak 0.214 * 0.214 = 0.046 yani “depresyon bağımlı değişkendeki varyansın %4.6’sını tek başına açıklayabiliyor” şeklinde yorumlayabiliriz.)Bu tablonun bu bölümü hakkında detay merak ediyorsanız onun hakkında yazdığım diğer yazıyı okuyabilirsiniz.
Tekrar SPSS’te Forced-Entry Regresyon (Sadece Anlamlı Bağımsız Değişkenlerle)
İlk başta test ettiğimiz modelde 3 tane bağımsız değişken vardı: Depresyon, Dayanıklılık, Stres. Yukarıda yaptığımız forced-entry regresyon analizinde bunlardan sadece Depresyon ve Stres’in bağımlı değişken olan Yorgunluk ile ilişkisi olduğunu bulduk. Şimdi, bir forced-entry regresyon daha yapalım, bu sefer sadece anlamlı olan değişkenlerle (yani Depresyon ve Stres). Bu adım öncekilere göre baya kısa sürecek.
Yine Analyze -> Regression -> Linear basıyoruz.
Dayanıklılık değişkenini analiz kutusundan çekip soldaki kutuya geri atıyoruz. Başka hiçbir değişiklik yapmadan “OK”a basıyoruz ve analizi başlatıyoruz.
Tablolardan ANOVA tablosundaki Sig. değeri 0.001’den küçük. Demek ki 2 bağımsız değişkenli yeni regresyon modelimiz hâlâ istatistiksel açıdan anlamlı.
“Model Summary” tablosundaki Adjusted R Square değeri, modelin bağımsız değişkenlerinin bağımlı değişken üzerindeki değişimi açıklama gücünü ifade eder demiştik. Bu yeni regresyon analizi tablosunda 0.101 çıkmış (eskisi 0.096’ydı), yani modeldeki değişkenler, Yorgunluk üzerindeki değişimin %10.1’sını açıklayabiliyor.
Demin 3 değişkenle yaptığımız ilk forced-entry regresyon analizindeki model, Yorgunluk üzerindeki değişimin %9.6’sını açıklıyordu. Yeni yaptığımız 2 değişkenli regresyon modeli, Yorgunluk üzerindeki değişimi daha iyi açıklamış. O zaman “ikisi de anlamlı etkiye sahip 2 değişkenle yaptığımız regresyon analizi, biri anlamsız ikisi anlamlı 3 değişkenle yaptığımız regresyon analizinden daha isabetli sonuçlar vermektedir” diyebiliriz.
En son modelimiz Yorgunluk üzerindeki değişimin %10.1’sını açıklayabiliyor demiştik. Yorgunluk’taki kalan %89.1’lik değişim, bu modelde olmayan bilinmeyen başka faktörlere bağlıdır.
“Coefficients” tablosundaki Sig. değeri yani p değeri, her bağımsız değişkenin, bağımlı değişkendeki değişim üzerinde önemli bir etkisi olup olmadığı bilgisini verir. Eğer p değeri 0.05’ten küçük ise anlamlı demektir. Bu tabloya göre Depresyon ve Stres, bağımlı değişken olan Yorgunluk üzerinde anlamlı bir değişime sebep olmaktadır (çünkü p değerleri sırayla 0.006 ve 0.009).
B değeri, her bağımsız değişkenin ölçüldüğü ölçekteki 1 birimlik değişimin, bağımlı değişken üzerinde kaç birimlik değişime sebep olduğunu söylüyor. Örneğin Depresyon’daki 1 birimlik değişim, Yorgunluk’ta 0.201 miktarda bir artışa sebep oluyor. Stres’teki 1 birimlik değişim, Yorgunluk’ta 0.382 miktarda azalışa sebep oluyor.
Beta ise, farklı değişkenlerin ölçeklerinin standardize edilmesiyle bulunan bir değerdir. Burada, değerlerin kendisi değil de standart sapmaları üzerinden bir yorumlama yapılmaktadır. Beta değerleri şöyle okunur: “Depresyondaki değerde 1 standart sapmalık artış, Yorgunlukta 0.219 standart sapmalık artışa sebep olur; Stresteki 1 standart sapmalık artış, Yorgunlukta 0.209 standart sapmalık azalışa sebep olur”.
Son olarak, modelimizdeki hangi bağımsız değişkenlerin bağımlı değişkene ne kadar etki ettiğini bulmak için Coefficients tablosundaki Part sütununa bakıyoruz.
Part değerinin karesini alıp sonra onu yüzde cinsinden yazarsak, o bağımsız değişkenin, tek başına bağımlı değişkendeki değişimi yüzde kaç açıkladığını öğreniyoruz.
- Bu örnekte Depresyon’un Part değeri 0.214. Karesini alırsak 0.046 ediyor. Yani Depresyon, Yorgunluk’taki değişimin %4.6’sını açıklıyormuş.
- Benzer şekilde Stres’in Part değeri -0.204. Karesini alırsak 0.041 ediyor. Yani Stres, Yorgunluk’taki değişimin %4.1’ini açıklıyormuş.
Yorgunluk seviyesi üzerinde depresyon faktörünün etkisinin stres faktörüne göre daha yüksek olduğunu anlayabiliriz buradan.
Forced-entry metoduyla çoklu doğrusal regresyon yapma adımları bu kadardı. Önce bütün değişkenleri aynı anda modele sokarak regresyon modelini kurup bağımlı değişkene etki etmeyen değişkenleri çıkartıp tekrar regresyon modeli kuruyoruz ve sonunda her bağımsız değişken bağımlı değişkeni nasıl etkiliyor diye bakıyoruz. Artık çoklu regresyon analizimizi yapıp sonuçları öğrendiğimize göre bu analizin raporlamasına geçebiliriz.
Bir yanıt bırakın