SPSS ile Kukla Değişken Regresyon (2 Kategori) — Resimli

spss kukla değişken regresyon

Kukla değişken, doğrusal (lineer) regresyon analizi yaparak bağımlı değişken üzerindeki etkilerini incelemek istediğimiz bağımsız değişkenlerin arasında kategorik yapıda bir bağımsız değişken bulunduğu durumlarda devreye giren bir istatistik uygulamasıdır. Doğrusal regresyon analizine kategorik yapıda bir bağımsız değişken, “0 – 1” kodlama biçimine dönüştürülerek dahil edilebilir. Bu yazıda, “Kukla Değişken” kavramının ne olduğunu anlatarak SPSS ile Kukla Değişkenli Regresyon analizi yapmayı gösteriyorum.

DİKKAT: Bu sayfada anlatacağım Kukla Değişken Regresyon örneği, sadece 2 değere sahip olabilen (mesela Erkek ve Kadın cinsiyet) kategorik bağımsız değişkenleri regresyon analizine dahil etmek hakkındadır. Eğer 3 veya daha fazla değere sahip olabilen kategorik bağımsız değişkenler (mesela mavi – yeşil – kahverengi göz rengi) nasıl kukla değişken olarak kodlanıp regresyon analizine dahil ediliyor öğrenmek istiyorsanız, o konuya özel olarak yazdığım diğer yazıyı okumalısınız.

 

Kukla Değişken Nedir?

“Kukla Değişken” kavramı, Basit veya Çoklu Doğrusal Regresyon analizinde devreye giren bir kavramdır. “Kukla Değişken” ifadesi, İngilizce dilindeki “Dummy Variable” teriminin karşılığıdır (ayrıca “gösterge değişkeni”, “ikili değişken” veya “dikotom değişken” olarak da geçer). Kategorik yapıdaki bir bağımsız değişkeni bir regresyon analizine dahil etmek için o değişkeni “0 ve 1” kodlama biçimine dönüştürüp analize dahil etmemiz gerekmektedir. Bu kodlama biçiminde genellikle “0” olumsuz, “1” ise olumlu anlama gelen kategoriye karşılık gelir.

Peki ya kategorik yapıdaki bağımsız değişken 2’den fazla kategoriye sahipse?

Onu da 3+ kategorili kukla değişkenler hakkında yazdığım ayrı yazıda anlatıyorum.

SPSS’te 2 kategoriye sahip bir bağımsız değişkeni kukla değişken haline getirmek çok basittir:

  1. Kodlama (0–1)
    Eğer değişkeninizin iki kategorisi varsa (örneğin: Kadın / Erkek ya da Evet / Hayır), tek bir değişkeni şöyle kodlarsınız:0 = Referans kategori (örneğin: Kadın)
    1 = Diğer kategori (örneğin: Erkek)Yani ekstra değişken oluşturmaya gerek yoktur, tek değişken yeterlidir.
  2. Regresyona ekleme
    Bu “0–1” olarak kodlanmış değişkeni doğrudan regresyon modeline koyabilirsiniz.
    Örneğin:Bağımlı değişken: Depresyon skoru
    Bağımsız değişken: Cinsiyet (0–1 kodlu)
  3. Katsayının yorumu
    Regresyon çıktısındaki katsayıyı şöyle yorumlarsınız:
    Katsayı, “1” olan grup ile “0” olan grup arasındaki ortalama farkı gösterir.”0″ olan kategori referans gruptur.Örnek:

    Katsayı = +4 → “1” olan grup, “0” olan gruba göre ortalama 4 puan daha yüksek skora sahip
    Katsayı = -2 → “1” olan grup, “0” olan gruba göre ortalama 2 puan daha düşük skora sahip

spss analizi raporlama istatistik

 

SPSS’te Kukla Değişken Kodlama

Bu sayfada anlatacağım örnekte, cinsiyetin, anksiyete düzeyinin ve stres düzeyinin bir kişinin spor yapma miktarı üzerindeki etkisini incelemek istiyoruz. Anksiyete-stres-spor miktarı sayısal değişken olarak bulunmaktadır. Fakat cinsiyet kategorik bir değişkendir (erkek-kadın). Bu yüzden kategorik yapıdaki bir değişken olan Cinsiyet değişkenini, yapacağımız lineer (doğrusal) regresyon analizine dahil edebilmemiz için, bu değişkeni SPSS’te kukla değişken olarak “0 – 1” şeklinde kodlamalıyız (dummy coding).

Kukla değişkenin değerleri kesinlikle 0 veya 1 olarak kodlanmalıdır. Yoksa SPSS analizi düzgün çalıştırmaz.

Transform -> Recode into Different Variables

kukla değişken dummy coding 1

 

Kukla değişken olarak kodlamak istediğimiz değişkeni soldaki kutudan alıp ortadaki geniş kutuya atıyoruz. Output Variable kısmında, yeni oluşturacağımız değişkenin kukla değişken olduğunu belirtecek bir isim veriyoruz ve Change butonuna basıyoruz.

kukla değişken dummy coding 2

 

Daha sonra, aynı penceredeki Old and New Values butonuna basıyoruz. Açılan yeni pencerede, önce Old Value kısmına verimizde bu değişkenin grupları hangi sayıyla ya da hangi yazıyla kodlanmışsa onlardan birini yazıyoruz, sonra New Value kısmına 0 yazıyoruz. Sonra Add butonuna basıyoruz. Daha sonra, diğer değişken için de aynısını yapıyoruz fakat bu sefer New Value kısmına 1 yazıyoruz.

“0” olarak kodladığımız şey referans kategorisi olacak, bu yüzden 0-1 olarak kodlarken buna dikkat ederek kodlamanızı öneririm.

kukla değişken dummy coding 3

 

Bizim bu örnekteki veri setimizde Kadın 5 olarak, Erkek ise 6 olarak kodlanmıştı. Kukla değişken kodlarken biz Kadın’ı 0, Erkek’i de 1 olarak kodladık. Referans kategorisi Kadın olmuş oldu.

kukla değişken dummy coding 0

 

Değişken kodlama işimizi bitirdiğimizde Continue ve OK’a basıyoruz. Veri setimize tekrar baktığımızda, SPSS’in bizim için yeni bir “kukla değişken” sütunu açtığını görebiliriz. Buradaki değerler, demin 0 veya 1 biçiminde kodlamış olduğumuz değerlerdir.

kukla değişken dummy coding 4

spss tez analizi istatistik ödev yaptırma ücretli spss veri analizi danışmanlık

 

SPSS ile Kukla Değişkenli Regresyon Analizi Nasıl Yapılır?

SPSS’te kukla değişkenin dahil olduğu bir Basit Doğrusal Regresyon veya Çoklu Doğrusal Regresyon analizi yapabiliriz artık.

Bu örnekte, anksiyete (sayısal veri), stres (sayısal veri) ve cinsiyetin (kategorik veri) haftada kaç gün spor yapıldığı üzerindeki etkilerini inceleyeceğiz. Detaylı bir örnek olunca bile yorumlamasının kolay olduğunu göstermek için, bu sayfadaki analizi Hiyerarşik Çoklu Doğrusal Regresyon Analizi şeklinde yapıyorum.

Analyze -> Regression -> Linear

kukla değişken dummy coding 5

 

Bağımlı değişkeni Dependent kutusuna koyuyoruz. Kategorik değişkenimizi Independent(s) kutusuna koyuyoruz. Bu kategorik değişken demin yeni oluşturduğumuz kukla değişken olmalı.

kukla değişken dummy coding

 

Daha sonra “Next” butonuna basıyoruz. Diğer bağımsız değişkenlerimizi (sayısal veri tipindeki bağımsız değişkenler) Independent(s) kutusuna taşıyoruz.

kukla değişken dummy coding 7

 

Daha sonra, “Statistics” butonuna basarak, açılan yeni pencerede, aşağıdaki kutucukları işaretliyoruz. Sonra “Continue”ya basıyoruz.

çoklu regresyon 5

 

“OK” butonuna basıp regresyon analizini başlatıyoruz.

kukla değişken dummy coding 8

spss tez analizi istatistik ödev yaptırma ücretli spss veri analizi danışmanlık

 

Kukla Değişkenli Regresyon SPSS Tablo Yorumlama

SPSS bize aynı Çoklu Doğrusal Regresyon analizinde olduğu gibi birtakım tablolar verecek.

ANOVA Tablosu

Öncelikle, ANOVA tablosuna bakıyoruz. Model 1 dediği, sadece Cinsiyet’in spor miktarı ile ilişkisine bakan regresyon modeli. Model 2 dediği ise, bütün değişkenlerin yani Cinsiyet, Anksiyete, Stres hepsi birlikte spor miktarı ile ilişkisine bakan çoklu regresyon modeli.

Model 1’in Sig. sütununda gösterilen p değeri 0.005 yani 0.05’ten küçük. Demek ki, Cinsiyet, tek başına, spor miktarı üzerinde etkisi olan bir değişkenmiş.

Model 2’nin Sig. sütununda gösterilen p değeri ise 0.001, bu da 0.05’ten küçük. Demek ki, Cinsiyet dışındaki diğer iki bağımsız değişkenden en az bir tanesi de (Anksiyete ve Stres) spor miktarını belirliyor olabilir.

kukla değişken dummy coding spss tablo 1

Model Summary

Daha sonra “Model Summary” tablosuna bakacağız. Buradaki Sig. F Change sütununda, ilk satırda sadece kategorik değişkenin olduğu regresyon modelinin istatistiksel anlamlılık p değeri gözüküyor. Bu 0.005’miş yani istatistiksel olarak anlamlı bir model olduğunu gösteriyor. İkinci satırda, devamlı veri tipinde olan diğer iki bağımsız değişkenin de modele dahil edilmesinin sonucunda oluşan yeni regresyon modelinin istatistiksel anlamlılık p değeri gözüküyor. Bu da 0.015 yani Cinsiyet değişkeninin dışında, Anksiyete ve Stres bağımsız değişkenlerinin de modele dahil edilmesi, Spor Miktarı’nın belirlenmesinde istatistiksel olarak anlamlı bir ekstra etkiye sahipmiş.

Adjusted R Square değeri, modele dahil edilen değişkenlerin birlikte ele alındığında bağımlı değişken üzerindeki değişimin yüzde kaçını açıkladığını gösteriyor. Bizim örneğimizde, sadece Cinsiyet değişkeni modele sokulduğunda Cinsiyet, spor miktarındaki değişimin %4.5’ini istatistiksel olarak anlamlı biçimde açıklıyor.

Diğer iki değişken Anksiyete ve Stres de modele sokulduğunda, istatistiksel olarak anlamlı biçimde, spor miktarındaki regresyon modeliyle açıklanabilen değişim istatistiksel olarak anlamlı şekilde 0.40 artarak %8.5’e yükseliyor.

kukla değişken dummy coding spss tablo 2

Coefficients Tablosu

“Coefficients” tablosunda kukla değişkeni yorumlamak kafa karıştırabiliyor. Bunu doğru yorumlamak önemli.

Model 1: Önce, sadece kukla değişkenin dahil edildiği Model 1’in Sig. sütununa yani p değerine bakalım. Bu değer 0.005 yani 0.05’in altında, demek ki Cinsiyet, spor miktarını etkileyen bir faktörmüş. Hangi cinsiyette olmak spor miktarını nasıl etkiliyor şöyle bakıyoruz: Bizim bu örneğimizde Kadın’ı 0, Erkek’i 1 olarak kodlamıştık. B sütunundaki değerleri (Beta değil) okuyarak, “Kadın yerine Erkek olmak, spor yapma miktarında ortalama 0.726 puanlık bir artışa karşılık geliyor.” şeklinde yorumlayabiliriz.

Model 2: Cinsiyet’in p değeri, hâlâ 0.05’in altındadır (p = 0.017). Anksiyete’nin p değeri 0.05’in üstünde (p = 0.640) ve Stres’in p değeri 0.05’in altında (p = 0.006). Buradaki B (Beta değil) ve p değerlerine bakarak şöyle yorumlayabiliriz: “Kadın yerine Erkek olmak, spor yapma miktarında istatistiksel olarak anlamlı şekilde 0.606 puanlık bir artışa karşılık geliyor. Anksiyete düzeyinin spor yapma miktarı üzerinde istatistiksel olarak anlamlı bir etkisi yoktur. Stres düzeyindeki 1 puanlık artış, spor yapma miktarında istatistiksel olarak anlamlı şekilde 0.408 puanlık bir azalışa karşılık geliyor.”

kukla değişken dummy coding spss tablo 3

Burada kukla değişkenin (Cinsiyet) spor yapma miktarı üzerindeki etkisini doğru yorumlamış olduğunuzdan, yani ters yorumlamamış olduğunuzdan, emin olmak için hızlıca bir Bağımsız Örneklem T-Testi yapabilirsiniz. Orda bulduğunuz sonucun yönüyle bu testte bulduğunuz sonucun yönü aynı olmalı. Yani regresyon analizi ve t-testi sonuçları her zaman tutarlı olmalı.


2 kategoriye sahip bir kategorik değişken için kukla değişken kodlama (dummy coding) yapmak ve bu kukla değişken ile çoklu doğrusal regresyon analizi yapmak bu kadardı. Başta dediğim gibi, bu sayfada anlattığım örnek sadece 2 değere sahip olabilen bir kategorik değişkenin kukla değişken olarak kodlanması hakkındaydı. Eğer 3 veya daha fazla değere sahip bir kategorik değişkenin kukla değişken olarak kodlanması nasıl yapılır ve regresyon analizine dahil edilir merak ediyorsanız, o konu hakkında özel olarak yazdığım diğer yazıyı okumanızı öneririm.

spss analizi raporlama istatistik

Deniz Şavkay hakkında 191 makale
Lisans eğitimimi Boğaziçi Üniversitesi Moleküler Biyoloji ve Genetik bölümünde, Yüksek Lisans eğitimimi Polonya'daki SWPS Üniversitesi Psikoloji bölümünde tamamladım. Davranış bilimlerine ilgi duyuyorum ve eğitim hayatımı bunun üzerine şekillendirdim. SPSS ile istatistik analizi yapmayı çok seviyorum. SPSS analizleriyle insan davranışındaki kalıpları keşfetmek ve insan davranışı hakkında iç görü sahibi olmak beni heyecanlandırıyor.

İlk yorum yapan olun

Bir yanıt bırakın

E-posta hesabınız yayımlanmayacak.


*