SPSS ile Kukla Değişken Regresyon (Resimli)

spss kukla değişken regresyon

Bu yazıda, SPSS kullanarak kukla değişkenlerin nasıl kullanıldığını ve regresyon analizindeki önemini adım adım açıklayacağım. Kukla değişkenler, kategorik değişkenlerin regresyon modellerine dahil edilmesinde güçlü bir araç olarak kullanılır. Bu yazıda, adım adım kukla değişkenlerin nasıl oluşturulduklarını ve yorumlandıklarını görsellerle birlikte anlatacağım. Bu yazıyı okuyarak, SPSS kullanarak kukla değişkenlerinizi doğru bir şekilde oluşturabilecek ve regresyon analizlerinize katarak analizlerinizde daha sağlam sonuçlar elde edebileceksiniz.

UYARI: Bu sayfada anlatacağım kukla değişken regresyon örneği, sadece 2 değere sahip olabilen (mesela Erkek ve Kadın cinsiyet) kategorik değişkenler hakkındadır. Eğer 3 veya daha fazla değere sahip olabilen kategorik değişkenler (mesela mavi – yeşil – kahverengi göz rengi) nasıl kukla değişken olarak kodlanıp regresyon analizine dahil ediliyor öğrenmek istiyorsanız, o konuya özel olarak yazdığım diğer yazıyı okumalısınız.

spss analizi ücretli danışmanlık tanışma indirimi veri tablo rapor iletişim

spss tez analizi istatistik ödev yaptırma ücretli spss veri analizi danışmanlık

Kukla Değişken Nedir?

Regresyon analizinde, kukla değişken İngilizce’de “dummy variable” teriminin karşılığıdır (ayrıca gösterge değişkeni, ikili değişken veya dikotom değişken olarak da bilinir). Kukla değişken, bir kategorik bağımsız değişkenin regresyon modelindeki kategorilerini temsil etmek için kullanılan bir değişkendir. Kukla değişkenler SPSS’te her zaman ikili (0 veya 1) olarak kodlanır, burada 0 belirli bir kategorinin yokluğunu ve 1 bu kategorinin varlığını temsil eder.

SPSS bağlamında, kukla değişkenler, regresyon analizinde iki veya daha fazla kategorisi olan kategorik değişkenleri temsil etmek için sıklıkla kullanılır. SPSS’te kukla değişkenler şöyle çalışır:

  1. Kukla Değişkenlerin Oluşturulması: Diyelim ki üç kategorisi olan “Grup” adında bir kategorik bir değişkeniniz var: A, B ve C. Bu değişkeni SPSS’de bir regresyon analizine dahil etmek için, iki kukla değişken oluşturmanız gerekir. Diyelim ki “Grup_B” ve “Grup_C” adında iki kukla değişken oluşturdunuz.
    • Kategori B’deki gözlemler için “Grup_B” 1 olacak ve “Grup_C” 0 olacak.
    • Kategori C’deki gözlemler için “Grup_B” 0 olacak ve “Grup_C” 1 olacak.
    • Kategori A’daki gözlemler için hem “Grup_B” hem de “Grup_C” 0 olacak.
  2. Kukla Değişkenlerle Regresyon Analizi: Kukla değişkenler oluşturulduktan sonra, SPSS’te diğer bağımsız değişkenlerle birlikte bir regresyon modeline dahil edebilirsiniz. Örneğin, “Skor” gibi bir sürekli veri tipindeki bağımlı değişkenin “Grup” ve diğer bağımsız değişkenlerle ilişkisine bakıyorsanız, SPSS’te bir regresyon analizi yaparsınız ve “Skor” bağımlı değişken olarak, “Grup_B” ve “Grup_C” (diğer bağımsız değişkenlerle birlikte) bağımsız değişkenler olarak yer alır.
  3. Katsayıların Yorumlanması: SPSS’teki regresyon çıktısında, her kukla değişkenin kendi katsayısı olacaktır. Bu katsayılar, referans kategorisi (genellikle hiçbir kukla değişken tarafından temsil edilmeyen kategori) ile kukla değişken tarafından temsil edilen kategori arasındaki bağımlı değişkenin ortalama değerindeki farkı temsil eder.
    • Örneğin, “Grup_B” için katsayı 5 ise, bu, ortalama olarak, bağımlı değişkenin kategori B’deki gözlemler için referans kategorisine göre 5 birim daha yüksek olduğu anlamına gelir.
    • “Grup_C” için katsayı -3 ise, bu, ortalama olarak, bağımlı değişkenin kategori C’deki gözlemler için referans kategorisine göre 3 birim daha düşük olduğu anlamına gelir.

spss tez analizi istatistik ödev yaptırma ücretli spss veri analizi danışmanlık

SPSS’te Kukla Değişken Kodlama

Öncelikle, kategorik bir değişken olan Cinsiyet’i, regresyon analizine dahil edebilmemiz için, bu değişkeni SPSS’te kukla olarak kodlamalıyız (dummy coding). Kukla değişkenin değerleri kesinlikle 0 veya 1 olarak kodlanmalı. Yoksa SPSS analizi düzgün çalıştırmaz.

Transform -> Recode into Different Variables

kukla değişken dummy coding 1

 

Kukla değişken olarak kodlamak istediğimiz değişkeni soldaki kutudan alıp ortadaki geniş kutuya atıyoruz. Output Variable kısmında, yeni oluşturacağımız değişkenin kukla değişken olduğunu belirtecek bir isim veriyoruz ve Change butonuna basıyoruz.

kukla değişken dummy coding 2

 

Daha sonra, aynı penceredeki Old and New Values butonuna basıyoruz. Açılan yeni pencerede, önce Old Value kısmına değişkenin alabileceği değerlerden birini yazıyoruz, sonra New Value kısmına 0 yazıyoruz. Sonra Add butonuna basıyoruz. Daha sonra, diğer değişken için de aynısını yapıyoruz fakat bu sefer New Value kısmına 1 yazıyoruz.

kukla değişken dummy coding 3

 

Bizim bu örnekteki veri setimizde Kadın 5 olarak, Erkek ise 6 olarak kodlanmıştı. Kukla değişken kodlarken biz Kadın’ı 0, Erkek’i de 1 olarak kodladık.

kukla değişken dummy coding 0

 

Değişken kodlama işimizi bitirdiğimizde Continue ve OK’a basıyoruz. Veri setimize tekrar baktığımızda, SPSS’in bizim için yeni bir “kukla değişken” sütunu açtığını görebiliriz. Buradaki değerler, demin 0 veya 1 biçiminde kodlamış olduğumuz değerlerdir.

kukla değişken dummy coding 4

 

spss tez analizi istatistik ödev yaptırma ücretli spss veri analizi danışmanlık

SPSS ile Kukla Değişkenli Regresyon Analizi Nasıl Yapılır?

SPSS’te, kukla değişkenin dahil olduğu bir basit doğrusal regresyon veya çoklu doğrusal regresyon analizi yapacaksanız, varsayımların geçerli olduğundan emin olmalısınız. Linkteki yazılara tıklayarak basit ve çoklu regresyondaki varsayımların neler olduğuna ve doğrulandığının nasıl test edildiğine bakabilirsiniz. Bu sayfada sadece varsayımlar sağlandığı durumdan sonra, kukla değişkenli regresyon analizinin nasıl yapıldığını anlatacağım.

Bu örnekte, anksiyete (devamlı veri), stres (devamlı veri) ve cinsiyetin (kategorik veri) haftada kaç gün spor yapıldığıyla olan ilişkisini inceleyeceğiz.

Analyze -> Regression -> Linear

kukla değişken dummy coding 5

 

Bağımlı değişkeni Dependent kutusuna koyuyoruz. Kategorik değişkenimizi Independent(s) kutusuna koyuyoruz. Bu kategorik değişken demin yeni oluşturduğumuz kukla değişken olmalı.

kukla değişken dummy coding

 

Daha sonra “Next” butonuna basıyoruz. Diğer bağımsız değişkenlerimizi (devamlı veri tipindeki bağımsız değişkenler) Independent(s) kutusuna taşıyoruz.

kukla değişken dummy coding 7

 

Daha sonra, “Statistics” butonuna basarak, açılan yeni pencerede, aşağıdaki kutucukları işaretliyoruz. Sonra “Continue”ya basıyoruz.

çoklu regresyon 5

 

“Plots”a basıp, “Produce all partial plots” seçeneğini işaretliyoruz. “Continue”ya basıyoruz.

çoklu regresyon 6

 

“Save” butonuna basıp, açılan yeni pencerede Mahalanobis, Cook’s (bu ikisi sadece uç değer bulmamıza yardımcı olacak) ve Standardized Residuals (bunun üzerinden daha sonra normal dağılımı da test edeceğiz) seçeneklerini işaretliyoruz.

çoklu regresyon 7

 

“OK” butonuna basıp regresyon analizini başlatıyoruz.

kukla değişken dummy coding 8

 

Kukla Değişkenli Regresyon SPSS Tablo Yorumlama

Burada, yazının daha anlaşılır ve kukla değişken konusuna yönelik olması açısından, varsayımların nasıl test edildiği kısmına değinmeyeceğim. Kukla değişken dahil olduğunda varsayımların test edilme şekli çoklu doğrusal regresyon ile aynıdır. İlgili yazıyı okuyup varsayım doğrulama işlemine bakabilirsiniz. Bu sayfada, varsayımlar doğrulanmış gibi farz ederek, kukla değişkenli regresyon analizi sonucu SPSS’te gördüğümüz tablolar nasıl yorumlanır onu anlatacağım.

Öncelikle, ANOVA tablosuna bakıyoruz. Model 1 dediği, sadece Cinsiyet’in spor miktarı ile ilişkisine bakan regresyon modeli. Model 2 dediği ise, bütün değişkenlerin yani Cinsiyet, Anksiyete, Stres hepsi birlikte spor miktarı ile ilişkisine bakan çoklu regresyon modeli.

Model 1’in Sig. değeri 0.005 yani 0.05’ten küçük. Demek ki, Cinsiyet, tek başına, spor miktarı üzerinde etkisi olan bir değişkenmiş.

Model 2’nin Sig. değeri ise 0.001, bu da 0.05’ten küçük. Demek ki, Cinsiyet dışındaki diğer iki bağımsız değişkenden en az bir tanesi (Anksiyete ve Stres) de spor miktarını belirliyor olabilir.

kukla değişken dummy coding spss tablo 1

Daha sonra “Model Summary” tablosuna bakacağız. Buradaki Sig. F Change sütununda, ilk satırda sadece kategorik değişkenin olduğu regresyon modelinin istatistiksel anlamlılık p değeri gözüküyor. Bu 0.005’miş yani istatistiksel olarak anlamlı bir ilişkiyi gösteriyor. İkinci satırda, devamlı veri tipinde olan diğer iki bağımsız değişkenin de modele dahil edilmesinin sonucundaki regresyon modelinin istatistiksel anlamlılık p değeri gözüküyor. Bu da 0.015 yani Cinsiyet değişkeninin dışında, Anksiyete ve Stres bağımsız değişkenlerinin de modele dahil edilmesi, Spor Miktarı’nın belirlenmesinde istatistiksel olarak anlamlı bir etkiye sahipmiş.

Adjusted R Square değeri, modele dahil edilen değişkenlerin birlikte ele alındığında bağımlı değişken üzerindeki değişimin yüzde kaçını açıkladığını gösteriyor. Bizim örneğimizde, sadece Cinsiyet değişkeni modele sokulduğunda Cinsiyet, spor miktarındaki değişimin %4.5’ini istatistiksel olarak anlamlı biçimde açıklıyor.

Diğer iki değişken Anksiyete ve Stres de modele sokulduğunda, istatistiksel olarak anlamlı biçimde, spor miktarındaki regresyon modeliyle açıklanabilen değişim 0.40 artarak %8.5’e yükseliyor.

kukla değişken dummy coding spss tablo 2

 

“Coefficients” tablosunda kukla değişkeni yorumlamak kafa karıştırabiliyor. Bunu doğru yorumlamak önemli. Önce, sadece kukla değişkenin dahil edildiği Model 1’in Sig. değerine bakıyoruz. Bu değer 0.005 yani 0.05’in altında, demek ki Cinsiyet, spor miktarını etkileyen bir faktörmüş. Hangi cinsiyette olmak spor miktarını nasıl etkiliyor şöyle bakıyoruz: Beta değeri, 0.227 çıkmış. Yani pozitif bir değer. Bizim bu örneğimizde Kadın’ı 0, Erkek’i 1 olarak kodlamıştık. Bu pozitif Beta değeri, Erkek olmanın Kadın olmaya göre spor miktarını arttırdığını göstermektedir. (Eğer negatif Beta değeri çıksaydı, 1 yani Erkek olmak, Kadın olmaya göre spor miktarını azaltan bir faktördür diye bir sonuca varacaktık.)

kukla değişken dummy coding spss tablo 3

Daha sonra Model 2’ye bakıyoruz. Cinsiyet’in p değeri, hâlâ 0.05’in altındadır (0.017). Anksiyete’nin p değeri 0.05’in üstünde (0.640) ve Stres’in p değeri 0.05’in altında (0.006). Stres’in Beta değeri negatif, demek ki Stres arttıkça spor yapma miktarı azalıyor. Demek ki Cinsiyet ve Stres, spor yapma miktarını istatistiksel olarak anlamlı biçimde belirliyor. Anksiyete’nin ise böyle bir etkisi yokmuş.

Burada kukla değişkenin (Cinsiyet) spor üzerindeki etkisini doğru yorumlamış olduğunuzdan, ters yorumlamamış olduğunuzdan emin olmak için hızlıca basit bir bağımsız örneklem t testi yapabilirsiniz. Orda bulduğunuz sonucun yönüyle bu testte bulduğunuz sonucun yönü aynı olmalı.

Kukla Değişkenli Çoklu Regresyon – Ek Analiz

Aslında kukla değişkenin kullanımını anlattığım kısım bitti, fakat regresyon analizini tam doğru yapmış olmak için aşağıdaki adımları da uygulayıp sonuçlarını hızlıca yorumlayalım.

Deminki çoklu regresyon analizimizde, Cinsiyet ve Stres’in spor yapma miktarını belirleyen değişkenler olduğunu bulduk, Anksiyete’nin ise böyle bir etkisi olmadığını bulduk. Şimdi, çoklu regresyon analizini sadece anlamlı olan değişkenleri dahil ederek hızlıca tekrar yapalım ve bitirelim.

Analyze -> Regression -> Linear yapıp Anksiyete değişkenini sol kutuya geri koyuyoruz. OK’a basarak regresyon analizini tekrar başlatıyoruz.

kukla değişken dummy coding ek 1

 

Hem Cinsiyet, hem de Cinsiyet & Stres birlikte regresyon modeline dahil edildiğinde, spor yapma miktarına olan etki istatistiksel olarak anlamlı çıkmış. Güzel, devam.

kukla değişken dummy coding ek 2

 

Model Summary tablosunda Adjusted R Square sütununa bakarak, modellerin bağımlı değişkendeki değişimi açıklama miktarlarını öğreniyoruz. Cinsiyet, spor miktarındaki değişimin %4.5’ini açıklayabilirken; Stres, spor miktarındaki değişimin %4.5’ini daha (çünkü 0.45’ten 0.90’a çıkmış) açıklayabilmektedir. Bu iki açıklama miktarı da istatistiksel olarak anlamlı, çünkü tablonun en sağdaki sütunundaki p değerlerinin ikisi de 0.05’in altında.

kukla değişken dummy coding ek 3

 

Kukla değişken kodlama (dummy coding variable) ile çoklu doğrusal regresyon analizi örneğimiz bu kadardı. Başta dediğim gibi, bu sayfada anlattığım örnek sadece 2 değere sahip olabilen bir kategorik değişkenin kukla değişken olarak kodlanması hakkındaydı. Eğer 3 veya daha fazla değere sahip bir kategorik değişkenin kukla kodlanması nasıl yapılır ve regresyon analizine dahil edilir merak ediyorsanız, o konu hakkında özel olarak yazdığım diğer yazıyı okumanızı öneririm.

 

spss tez analizi istatistik ödev yaptırma ücretli spss veri analizi danışmanlık

Deniz Şavkay hakkında 141 makale
Lisans eğitimimi Boğaziçi Üniversitesi Moleküler Biyoloji ve Genetik bölümünde, Yüksek Lisans eğitimimi Polonya'daki SWPS Üniversitesi Psikoloji bölümünde tamamladım. Davranış bilimlerine ilgi duyuyorum ve eğitim hayatımı bunun üzerine şekillendirdim. SPSS ile istatistik analizi yapmayı çok seviyorum. SPSS analizleriyle insan davranışındaki kalıpları keşfetmek ve insan davranışı hakkında iç görü sahibi olmak beni heyecanlandırıyor.

İlk yorum yapan olun

Bir yanıt bırakın

E-posta hesabınız yayımlanmayacak.


*