İçindekiler
Bu yazıda, SPSS kullanarak kukla değişkenlerin nasıl kullanıldığını ve regresyon analizindeki önemini adım adım açıklayacağım. Kukla değişkenler, kategorik değişkenlerin regresyon modellerine dahil edilmesinde güçlü bir araç olarak kullanılır. Bu yazıda, adım adım kukla değişkenlerin nasıl oluşturulduklarını ve yorumlandıklarını görsellerle birlikte anlatacağım. Bu yazıyı okuyarak, SPSS kullanarak kukla değişkenlerinizi doğru bir şekilde oluşturabilecek ve regresyon analizlerinize katarak analizlerinizde daha sağlam sonuçlar elde edebileceksiniz.
UYARI: Bu sayfada anlatacağım kukla değişken regresyon örneği, 3 veya daha fazla değere sahip olabilen (mesela Hetero Erkek, Hetero Kadın ve LGBT cinsiyet) kategorik değişkenler hakkındadır. Eğer yalnızca 2 değere sahip olabilen kategorik değişkenler (mesela Erkek ve Kadın) nasıl kukla değişken olarak kodlanıp regresyon analizine dahil ediliyor öğrenmek istiyorsanız, o konuya özel olarak yazdığım diğer yazıyı okumalısınız.
Kukla Değişken Nedir?
Regresyon analizinde, kukla değişken İngilizce’de “dummy variable” teriminin karşılığıdır (ayrıca gösterge değişkeni, ikili değişken veya dikotom değişken olarak da bilinir). Kukla değişken, bir kategorik bağımsız değişkenin regresyon modelindeki kategorilerini temsil etmek için kullanılan bir değişkendir. Kukla değişkenler SPSS’te her zaman ikili (0 veya 1) olarak kodlanır, burada 0 belirli bir kategorinin yokluğunu ve 1 bu kategorinin varlığını temsil eder.
SPSS bağlamında, kukla değişkenler, regresyon analizinde iki veya daha fazla kategorisi olan kategorik değişkenleri temsil etmek için sıklıkla kullanılır. SPSS’te kukla değişkenler şöyle çalışır:
- Kukla Değişkenlerin Oluşturulması: Diyelim ki üç kategorisi olan “Grup” adında bir kategorik bir değişkeniniz var: A, B ve C. Bu değişkeni SPSS’de bir regresyon analizine dahil etmek için, iki kukla değişken oluşturmanız gerekir. Diyelim ki “Grup_B” ve “Grup_C” adında iki kukla değişken oluşturdunuz.
- Kategori B’deki gözlemler için “Grup_B” 1 olacak ve “Grup_C” 0 olacak.
- Kategori C’deki gözlemler için “Grup_B” 0 olacak ve “Grup_C” 1 olacak.
- Kategori A’daki gözlemler için hem “Grup_B” hem de “Grup_C” 0 olacak.
- Kukla Değişkenlerle Regresyon Analizi: Kukla değişkenler oluşturulduktan sonra, SPSS’te diğer bağımsız değişkenlerle birlikte bir regresyon modeline dahil edebilirsiniz. Örneğin, “Skor” gibi bir sürekli veri tipindeki bağımlı değişkenin “Grup” ve diğer bağımsız değişkenlerle ilişkisine bakıyorsanız, SPSS’te bir regresyon analizi yaparsınız ve “Skor” bağımlı değişken olarak, “Grup_B” ve “Grup_C” (diğer bağımsız değişkenlerle birlikte) bağımsız değişkenler olarak yer alır.
- Katsayıların Yorumlanması: SPSS’teki regresyon çıktısında, her kukla değişkenin kendi katsayısı olacaktır. Bu katsayılar, referans kategorisi (genellikle hiçbir kukla değişken tarafından temsil edilmeyen kategori) ile kukla değişken tarafından temsil edilen kategori arasındaki bağımlı değişkenin ortalama değerindeki farkı temsil eder.
- Örneğin, “Grup_B” için katsayı 5 ise, bu, ortalama olarak, bağımlı değişkenin kategori B’deki gözlemler için referans kategorisine göre 5 birim daha yüksek olduğu anlamına gelir.
- “Grup_C” için katsayı -3 ise, bu, ortalama olarak, bağımlı değişkenin kategori C’deki gözlemler için referans kategorisine göre 3 birim daha düşük olduğu anlamına gelir.
SPSS’te 3+ Kategori İçin Kukla Değişken Kodlama
Öncelikle, kategorik bir değişken olan Cinsiyet’i, regresyon analizine dahil edebilmemiz için, bu değişkeni SPSS’te kukla olarak kodlamalıyız (dummy coding). Kukla değişkenin değerleri kesinlikle 0 veya 1 olarak kodlanmalı. Yoksa SPSS analizi düzgün çalıştırmaz.
Bu örnekte, 3 kategorisi olan Cinsiyet değişkeninin, Depresyon seviyesine etkisini analiz edeceğiz. Kategoriler Hetero Erkek, Hetero Kadın, LGBT. Daha okunaklı olması açısından “Hetero Erkek” ve “Hetero Kadın” yerine “Erkek” ve “Kadın” olarak bahsedeceğim.
Transform -> Recode into Different Variables
Veri setimizde 3 farklı cinsiyet olduğu için 3 tane farklı kukla değişkeni kodlamalıyız. Yani 3 kere kukla değişken kodlama işlemi yapacağız.
Önce, Erkek cinsiyeti 1, diğer cinsiyetler 0 olarak kukla kodlama işlemi yapalım.
Cinsiyet’i soldaki kutudan alıp sağdaki kutuya koyuyoruz. Sonra Erkek değerini kukla değişken yapacağımız için Output Variable bölümüne Erkek_kukla gibi, ayırt edici bir isim veriyoruz. Change’e basıyoruz.
Sonra “Old and New Values” butonuna basıyoruz.
Bu veri setinde Kadın = 5; Erkek = 6; LGBT = 7 olarak kodlanmıştı.
Önce Old Value’ya 6 yazıyoruz, New Value’ya 1 yazıyoruz. Add butonuyla sağ alttaki kutuya ekliyoruz.
Sonra “All other values”a basıyoruz. New Value olarak 0 belirliyoruz. Add ile sağ alttaki kutuya ekliyoruz.
Continue ve OK’a basıyoruz.
SPSS veri setimize geri dönüp baktığımızda en sağ sütunda Erkek_kukla isminde yeni bir değişken oluştuğunu göreceğiz.
Şimdi aynı işlemi, Kadın ve LGBT değişkenleri için de yapmamız gerekiyor.
Reset butonuna basıp sıfırlayalım, sonra aynı işlemi Kadın kategorisiyle baştan yapalım.
LGBT kategorisi için baştan yapalım.
En sonunda, SPSS veri setimizde Erkek, Kadın ve LGBT için 3 yeni kukla değişken tanımlanmış halde olacak.
SPSS ile 3+ Kategori İçin Kukla Değişkenli Regresyon Nasıl Yapılır?
Şimdi, kukla değişkenli regresyon analizini daha kolay yorumlayabilmemiz için, kısaca cinsiyetlerin Depresyon skoru puan ortalamalarını karşılaştıracağız. Hangi değişkenlerin değerinin istatistiksel açıdan anlamlı olacağı hakkında önden biraz fikir edinmek için ayrıca bir bağımsız örneklem t testi de yapıp inceleyebilirsiniz.
Analyze -> Compare Means -> Means
Açılan kutuda bağımlı değişkenimiz olan Depresyon’u Dependent List kutucuğuna atıyoruz. Bağımsız değişken olan Cinsiyet’i de (kukla olmayan, orijinal halini) Independent List kutucuğuna atıyoruz. Sonra “OK”a basıp analizi başlatıyoruz.
SPSS bize ufak bir Report tablosu verecek. Bu tabloda Kadın, Erkek ve LGBT’nin ortalamalarını Mean satırında görebiliriz. Farklı cinsiyetlerin farklı Depresyon skoru ortalamaları var. Hangi cinsiyetlerin Depresyon skorlarının istatistiksel açıdan anlamlı olduğunu görebilmek için aşağıda kukla değişken regresyon analizi uygulayacağız.
Ortalama değer analizimiz sonucunda Erkek cinsiyetinin Depresyon ortalamasının en yüksek olduğunu bulduk. Regresyon yaparken bunu referans kategorisi alabiliriz yani.
Şimdi kukla değişkenli regresyon analizimize başlayalım.
Analyze -> Regression -> Linear
Kukla değişkenli regresyon analizinde eğer 2’den fazla, 3 veya daha fazla kategoriye sahip bir kategorik değişken varsa, bu kategorilerden 1 tanesi referans kategorisi olarak alınmalıdır.
Biz demin Erkek cinsiyetinin ortalama Depresyon puanının en yüksek olduğunu bulduğumuz için, Erkek kategorisini referans olarak almaya karar verdik.
Bağımlı değişkeni Dependent kutusuna koyduktan sonra, referans kategorisi olan kategori hariç diğer Cinsiyet kategorilerini (Kadın ve LGBT) Independent(s) kutusuna atıyoruz.
Statistics butonuna basıyoruz. Aşağıdaki resimdeki işaretli seçenekleri işaretliyoruz.
“Continue” ve “OK”a basarak analizi başlatabiliriz.
3+ Kategori Kukla Değişken Regresyon SPSS Tablo Yorumlama
“ANOVA” tablosundaki Sig. değerine bakarsak, regresyon modelimizin anlamlı bir ilişki bulup bulmadığını görebiliriz. Bizim örneğimizde Sig. yani p değeri 0.007 çıkmış, yani Cinsiyet ve Depresyon skoru arasında bir ilişki olduğu yönünde bir sonuç var.
“Model Summary” tablosundaki Adjusted R Square değeri 0.52, yani Cinsiyet’in Depresyon skorundaki değişimi açıklama oranı %5.2 demek oluyor. Depresyon skorundaki diğer %94.8 değişim başka sebeplerden veya şans eseri oluyor demektir bu.
En önemli tablo olan “Coefficients” tablosuna bakalım. Bu tabloyu doğru yorumlamak önemli. Bu örnekteki kukla değişkenli regresyon analizinde referans kategorimizin Erkek olduğunu unutmayalım.
“Coefficients” tablosundaki Sig. değerlerine bakmalıyız önce. Kadın kategorisinin Sig. yani p değeri 0.05’in üzerinde çıkmış (0.361). Demek ki Kadın kategorisinin Depresyon skoru, Erkek kategorisinin Depresyon skorundan anlamlı derecede farklı değil. LGBT kategorisinin p değeri 0.05’in altında çıkmış (0.002). Demek ki LGBT kategorisinin Depresyon skoru, Erkek kategorisinin Depresyon skorundan anlamlı derecede farklıymış.
Yine bu aynı tablodaki B değerine bakarsak, şöyle yorumlayabiliriz: “Erkek’ten LGBT kategorisine geçtiğimiz zaman, Depresyon skorunda 1.330’luk bir düşüş görüyoruz.”
Kukla değişken (dummy variable coding) regresyon analizimiz aslında bu kadardı. Bu regresyon analizinde yalnızca kukla değişkenlerle uğraştığımız için, sadece anlamlı bağımsız değişkenleri analize dahil edip regresyonu yeniden çalıştırma işlemini bu analiz türünde yapmıyoruz.
Ancak, diğer Cinsiyet karşılaştırmalarıyla ilgileniyorsanız (mesela LGBT’nin Kadın’a göre Depresyon skoru farkı), başka bir cinsiyeti referans kategorisi olarak seçerek regresyonu yeniden çalıştırabilirsiniz. Bunun için seçtiğiniz referans cinsiyet dışındaki tüm cinsiyetleri modele girin ve regresyon analizini uygulayın.
Bir yanıt bırakın