
İçindekiler
Çoklu regresyon analizi, sosyal bilimlerden sağlık alanına kadar birçok farklı disiplinde kullanılır. Çoklu regresyon analizinin farklı yöntemleri vardır; bu yazıda değişkenlerin modele dahil edilme sırası otomatik olarak belirlenen “Stepwise Regresyon Analizi” yönteminden bahsedeceğim.
SPSS ile Stepwise Regresyon Analizi yapılırken, SPSS bütün bağımsız değişkenlerin bağımlı değişken üzerindeki etkilerini tamamen matematiksel bir açıdan değerlendirerek, en büyük etkisi olan değişkenleri sırayla modele ekleyerek sonunda yalnızca anlamlı değişkenlerden oluşan bir regresyon modeli kurulmasını sağlar.
Bu yazıda, Stepwise regresyon analizinin SPSS’te nasıl uygulandığını adım adım göstererek anlatacağım.
Çoklu Regresyon “Stepwise” Metodu Nedir?
Çoklu doğrusal regresyon, birden fazla bağımsız değişkenin bir bağımlı değişken üzerindeki etkisini incelemek için kullanılır. Çoklu regresyon analizinin forced-entry, hiyerarşik ve stepwise olmak üzere 3 tane popüler yöntemi vardır. Bu sayfada anlatacağım “stepwise metodu”, hiyerarşik regresyona benzer; fakat hiyerarşik regresyondan farkı, stepwise yönteminde analizin sonunda modelde bulunacak bağımsız değişkenlerin hangileri olacağının belirlenmesine SPSS’in otomatik olarak karar vermesidir.
Stepwise regresyon analizi sürecinde, istatistiksel olarak anlamlı olan bağımsız değişkenler birer birer modele eklenir veya çıkartılır ve her adımda modelin performansı değerlendirilir. Bu değerlendirme sonucunda, modele katılmayacak değişkenler elenir ve en iyi performansı gösteren değişkenler modelde kalır.
Stepwise regresyon modeli, bağımlı değişken üzerinde anlamlı etkisi olup olmadığını incelemek istediğimiz çok fazla sayıda bağımsız değişken varsa, bu değişkenlerden hangilerinin gerçekten anlamlı etkisi olduğunu ayıklama konusunda bize yardımcı olur. Bu yöntem sayesinde, araştırmacılar çok sayıda bağımsız değişken adayı içinden en etkili bağımsız değişkenleri belirleyerek daha sade, anlamlı ve yorumlanabilir modeller oluşturabilirler.
Stepwise regresyon genellikle iki temel türde uygulanır:
- İleri Seçim (Forward Selection): Bu yöntemde, modelin başlangıcında hiç değişken içermez ve ardından her adımda en iyi değişken eklenir. Her adımda, eklenen değişkenin eklenip eklenmemesi, eklenen değişkenlerin modelin performansını artırıp artırmadığına bağlı olarak belirlenir.
- Geri Seçim (Backward Elimination): Bu yöntemde, model başlangıçta tüm değişkenleri içerir ve her adımda en az etkili olan değişken çıkarılır. Bu süreç, çıkarılan değişkenin modelin performansını olumsuz etkileyip etkilemediğine bağlı olarak devam eder.
Avantajları ve Sorunları
Stepwise regresyonun önemli avantajlarından biri, modelin gereksiz karmaşıklaşmasını önleyerek daha yalın ve anlamlı bir yapı sunmasıdır. Ancak bazı önemli sınırlamaları da vardır:
-
Overfitting (aşırı uyum) riski taşıyabilir. Yani model, eldeki veri setine çok iyi uyum sağlarken, farklı veri setlerinde yeterince başarılı sonuçlar veremeyebilir.
-
Seçilen değişkenler farklı veri kümelerinde değişkenlik gösterebilir. Bu da modelin genellenebilirliğini zayıflatabilir.
-
Yalnızca istatistiksel anlamlılık temelinde değişken seçildiği için, teorik temellere dayanmayan modeller ortaya çıkabilir.
Bu nedenlerle, stepwise yöntemi kullanılırken dikkatli olunmalıdır, elde edilen sonuçların sadece matematiksel açıdan değil, kuramsal ve pratik açıdan da değerlendirilmesi önemlidir.
Stepwise regresyon analizinde SPSS modele dahil ettiği ve etmediği bağımsız değişkenleri sadece matematiksel temellere dayanarak belirlediği için teorik temelleri olan araştırmalarda Stepwise yönteminin kullanılmaması önerilmektedir. Stepwise yerine hiyerarşik regresyon (değişkenler sırayla eklenmek isteniyorsa) veya forced entry (değişkenlerin hepsi aynı anda eklenmek isteniyorsa) yöntemlerinin tercih edilmesi önerilmektedir.
SPSS ile Stepwise Çoklu Regresyon Nasıl Yapılır?
Aşağıda, SPSS ile nasıl stepwise regresyon yapılacağını bir örnek üzerinden resimlerle göstereceğim.
Analyze -> Regression -> Linear basıyoruz.
Bu örnekte 3 bağımsız ve 1 bağımlı değişkenimiz olacak.
Bağımlı değişkenimiz olan depresyon’u Dependent kutusuna; stres, dürtüsellik ve yaşam doyumu bağımsız değişkenlerimizi de aşağıdaki kutuya birlikte koyuyoruz.
Önemli olan yer, “Method” menüsünden “Stepwise” seçmeliyiz.
Statistics butonuna basarak “R Squared Change” de işaretlersek modele eklenen her yeni değişkenin modelin açıklama gücüne nasıl bir katkısı olduğunu görebileceğiz.
Stepwise Regresyon Yorumlama
İlk tabloda stepwise regresyon analizi kapsamında birbiri ardına kaç adet model kurulduğu, ve her modelde yeni eklenen değişkenin ne olduğu görülebilir.
Mesela bizim yaptığımız stepwise regresyon analizinde 2 model kurulmuş: Birinci modelde stres eklenmiş, ikinci modelde de yaşam doyumu eklenmiş. (Dürtüsellik modele hiç eklenmemiş SPSS tarafından)
- 1. modelde sadece Stres bağımsız değişken, Depresyon bağımlı değişken
- 2. modelde hem Stres hem Yaşam Doyumu bağımsız değişken, Depresyon bağımlı değişken
“Model Summary” tablosunda oluşturulan regresyon analizi modellerinin açıklama gücü (R Square), her bir yeni modelde bir önceki modele göre modele göre açıklama gücündeki artış (R Square Change) ve açıklama gücündeki artışın istatistiksel olarak anlamlılığı (Sig F Change) bilgilerine erişilebilir.
Aşağıdaki tabloyu yorumlayacak olursak:
- 1. modelde R Square değeri 0.076’dır, yani Stres’in tek bağımsız değişken olduğu durumda Depresyon’daki varyansın %7.6’sı açıklanabilmektedir.
- 2. modelde bağımsız değişken olarak Stres’in yanına Yaşam Doyumu da eklenmiştir ve R Square değeri 0.076’dan 0.119’a çıkmıştır. Yani R Square değeri Yaşam Doyumu’nun gelişiyle 0.043 artmıştır.
Böylece modelin Depresyon’daki varyansın artık %7.6’sını değil, %11.9’unu açıkladığı sonucuna varılabilir.
Açıklanan varyanstaki bu artışın anlamlı bir artış olup olmadığını da en sağdaki Sig F Change sütunundan okuyunca görüyoruz ki p değeri 0.008 (yani 0.05’ten küçük p değeri olduğu için anlamlı bir artış).
ANOVA tablosu aslında çok önemli değil, Stepwise regresyon analizinde ANOVA tablosundaki her modelin p değeri 0.05’ten küçük çıkar her zaman zaten.
Son olarak regresyon analizinde ulaştığımız asıl sonuçları “Coefficients” tablosundan okuyarak görebiliriz. Bunu tablonun aşağısında açıklıyor olacağım.
Önce 1. modele bakalım.
Stres’in tek bağımsız değişken olarak yer aldığı 1. regresyon modelinde stres değişkeninin p değeri 0.001’den küçük bulunmuş, Beta değeri de 0.276 yani “stres arttıkça depresyon da artıyor” denebilir.
Şimdi 2. modele bakalım.
Stres ve Yaşam Doyumu’nun bağımsız değişkenler olarak birlikte yer aldığı 2. regresyon modelinde stres’in p değeri 0.004 bulunmuş ve yaşam doyumu’nun p değeri 0.008 bulunmuş, yani iki değişkenin depresyon üzerindeki etkisi de anlamlı. Beta değerlerine bakacak olursak, Stres’in Beta değeri 0.232 yani stres arttıkça depresyon da artıyormuş; Yaşam Doyumu’nun Beta değeri ise -0.211 yani yaşam doyumu arttıkça depresyon azalıyormuş. Stres’in Beta değerinin 0’a uzaklığı daha büyük olduğu için denebilir ki “Stresteki artış, depresyondaki artışı yaşam doyumundan daha fazla etkiliyor”.
Bir yanıt bırakın