İçindekiler
Ordinal Regresyon Analizi, bağımlı değişkenin ordinal (sıralı) yapıda olduğu durumda bağımsız değişkenlere dayanarak bağımlı değişkeni tahmin etmek için kullanılabilen regresyon analizi türüdür. Bu yazıda, Ordinal Regresyon Analizi’nin ne olduğunu ve SPSS ile nasıl Ordinal Lojistik Regresyon Analizi nasıl yapıldığını adım adım anlatıyorum.
Ordinal Regresyon Nedir?
Ordinal Regresyon, bağımlı değişken ordinal (sıralı) yapıda bir değişken olduğunda, yani tam olarak sayısal olmadığında ama sıralı kategorilere sahip olduğunda kullanılan bir tür regresyon analizidir. Ordinal Regresyon analizinin amacı, bir veya daha fazla bağımsız değişkene dayanarak bir gözlemin belirli bir kategoriye veya daha yüksek bir kategoriye denk gelme olasılığını tahmin etmektir.
Ordinal Regresyon’da bağımlı değişken aşağıdakiler gibi olabilir:
- Zayıf-orta-şiddetli depresyon
- Fakir-orta-zengin gelir durumu
- İlkokul-ortaokul-lise-üniversite eğitim durumu
Ordinal Regresyon, başka tür regresyon analizleriyle karıştırılmamalıdır. Aşağıda Ordinal Regresyon analizinin diğer tür regresyon analizlerinden farklarını kısaca anlattım.
- Bağımlı değişken sürekli veri olduğunda kullanılan Çoklu Doğrusal Regresyon analizinin aksine (mesela stres ölçeği skoru), Ordinal Regresyon, bağımlı değişkenin sıralı kategorilere sahip olduğu durumlar için uygundur (mesela ilkokul-ortaokul-lise veya düşük-orta-yüksek gelir durumu).
- Bağımlı değişkenin 2 kategoriye sahip bir kategorik değişken (mesela hasta-sağlıklı) olduğu Binary Lojistik Regresyon veya 2’den fazla kategoriye sahip bir kategorik değişken (mesela mavi-yeşil-kırmızı) olduğu Multinominal Lojistik Regresyon analizlerinin aksine, Ordinal Regresyon’da bağımlı değişken sıralı kategorik bir yapıdadır (mesela ilkokul-ortaokul-lise veya düşük-orta-yüksek gelir durumu).
Ordinal Regresyon, bağımlı değişkenin ordinal (sıralı) yapıda olduğu bütün regresyon analizlerinin genel adıdır. SPSS’te Ordinal Regresyon analizi yapıldığında, bu genellikle logit fonksiyonunun kullanıldığı Ordinal Lojistik Regresyon analizi şeklinde yapılmaktadır. Bu yüzden bu sayfanın devamında vereceğim örnekte Ordinal Lojistik Regresyon analizi üzerinden gideceğim.
Ordinal Regresyon İçin Veriler Nasıl Olmalıdır?
- Yalnızca 1 adet bağımlı değişken olmalıdır.
- Bağımlı değişken 3 veya daha fazla kategoriye sahip olmalıdır ve kategorilerin belli bir sırası olmalıdır. (mesela havuç-portakal-muz uygun olmaz, hafif-orta-şiddetli hastalık uygun olur)
- Bağımsız değişkenler 1 veya daha fazla sayıda olabilir.
- Bağımsız değişkenler kategorik yapıda veya sürekli sayısal yapıda olabilirler.
Ordinal Regresyon Varsayımları
Ordinal Regresyon Analizi sonuçlarının yorumlanmasının uygun olabilmesi için öncelikle verinin bazı şartları sağlaması gerekmektedir.
- Proportional Odds (Paralel Doğrular Varsayımı): Bağımsız değişkenlerin etkisi, bağımlı değişkenin tüm kategori eşiklerinde aynı olmalıdır.
Bunu analizi yaparken test ediyoruz, aşağıda gösteriyorum.
SPSS ile Ordinal Lojistik Regresyon Nasıl Yapılır?
Ordinal Regresyon, bağımlı değişkenin ordinal (sıralı) yapıda olduğu bütün regresyon analizlerinin genel adıdır. SPSS’te Ordinal Regresyon analizi yapıldığında, bu genellikle logit fonksiyonunun kullanıldığı Ordinal Lojistik Regresyon analizi şeklinde yapılmaktadır. Bu yüzden bu sayfada SPSS’te Ordinal Lojistik Regresyon analizinin nasıl yapıldığını anlatacağım.
Aşağıdaki adımları izleyerek SPSS’te Ordinal Lojistik Regresyon yapabiliriz.
Bu örnekte, bağımlı değişken bir Memnuniyet soru formu olacak. Katılımcılara, bir üründen memnun olup olmadığını soran 1 adet soru sorulmuş. Sorulara 1’den 7’ye kadar farklı cevaplar veriliyor, aşağıda görebilirsiniz. Bu sorulara verilen cevaplar arasında sıralı bir ilişki var, cevap numarası yükseldikçe memnuniyet artıyor. Fakat iki cevap numarası arasındaki uzaklık tam olarak belli değil. Bu yüzden bu soru formu sürekli veri tipinde değil, sıralı (ordinal) veri tipinde diyebiliriz.

Bağımsız değişkenlerimiz ise şunlardır:
- Ekonomik Durum (Fakir – Orta – Zengin) (Ordinal Veri)
- Cinsiyet (Erkek – Kadın) (Kategorik Veri)
- Anksiyete Seviyesi (1’den 7’ye kadar her puan alınabiliyor) (Bu ölçek, 1-7 arası cevap seçeneği bulunan birden fazla sorunun birleştirilmesiyle oluşturulduğu için, sıralı değil de Sürekli Veri gibi davranılabilir)
SPSS’te Ordinal Lojistik Regresyon analizi yapmaya başlayalım.
Analyze -> Regression -> Ordinal

Bağımlı değişkeni Dependent kutusuna, kategorik veya ordinal yapıdaki bağımsız değişkenleri Factors kutusuna, sürekli veri tipindeki bağımsız değişkenleri de Covariates kutusuna atıyoruz.

“Options”a basıp açılan pencerede Link olarak Logit seçildiğinden emin oluyoruz. (Bu SPSS’in analizi Ordinal Lojistik Regresyon analizi şeklinde gerçekleştirmesini sağlıyor)

“Output”a basıp açılan pencerede resimde görülen seçenekleri işaretliyoruz.

OK’a basarak analizi başlatabiliriz artık.
Ordinal Lojistik Regresyon SPSS Tablo Yorumlama
SPSS, Ordinal Lojistik Regresyon sonucunda bize bir sürü tablo veriyor. Bu tabloların önemli yerlerini göstereceğim şimdi.
Model Fitting Information
“Model Fitting Information” tablosunda Sig. sütunu yani p değerinin 0.05’ten küçük olmasını istiyoruz. Bu tabloya göre modelin anlamlı olması, kurduğumuz regresyon modelinde (hiçbir anlamlı etki olmayan modele göre) model uyumunda önemli bir iyileşme olduğunu gösterir. Bu genellikle demek olur ki gözlemlediğimiz bağımsız değişkenlerden en az 1 tanesi bağımlı değişken üzerinde anlamlı etkiye sahiptir.
Bizde p < 0.001 yani 0.05’ten küçük olduğu için model bağımlı değişkeni istatistiksel olarak anlamlı şekilde tahmin etmeye yarıyor demektir.

Goodness-of-Fit
“Goodness-of-Fit” tablosunda Sig. sütunu yani p değerlerinin ikisinin de 0.05’ten büyük olmasını istiyoruz. Bu tablo, gözlemlenen gerçek verilerin, uyumlu olduğunu düşünerek oluşturduğumuz modeldekilere ne kadar iyi karşılık geldiğinin ölçülmesi anlamına gelir. Burada 0.05’ten büyük bir değer, gözlemlenen veriler ile oluşturulan model arasında önemli bir fark olmadığı anlamına gelir (yani “model veriye uygundur” demektir.
Bizde p değerleri 0.053 ve 0.993 yani uygun diyebiliriz.

Test of Parallel Lines
Ordinal Lojistik Regresyon analizinin en önemli varsayımının test edildiği yer burası.
“Test of Parallel Lines” tablosunda Sig. sütunu yani p değerinin 0.05’ten büyük olmasını istiyoruz. Büyük bir p değeri demek olur ki “bağımsız değişkendeki her kategori için bir katılımcının bağımlı değişkendeki yüksek veya düşük kategoriye düşme oranı, kategoriler arasında yaklaşık aynıdır”. Yani arada etkiyi karıştırıcı başka bir etki olmadığı anlamına gelmektedir. Bu tablodaki p değeri anlamlıysa Ordinal Regresyon yerine analizi Multinominal Lojistik Regresyon yöntemiyle analiz yapılması önerilir.
Bizde bu p değeri 0.381 yani varsayım sağlandı diyebiliriz.

Pseudo R Square
“Pseudo R Square” tablosunda, Ordinal Lojistik Regresyon analizi için en popüler olan değer McFadden değeridir. Bu değer, gerçek R Square yani R Kare değeri gibi “bağımsız değişkenler bağımlı değişkendeki varyasyonun yüzde kaçını açıklıyor” bilgisini vermez, ama onun yerine şöyle bir cümle kurulabilir: “McFadden değeri 0.040 bulunmuştur; bu doğrultuda ordinal regresyon modelinde, hiçbir etkinin olmadığı modele göre, %4.0 oranında bir iyileşme olduğunu söyleyebiliriz.”
Buna ek olarak, Nagelkerke satırını okuyarak da “Nagelkerke R2 değeri (R2 = 0.138), modelin bağımlı değişkendeki varyansın yaklaşık %13.8’ini açıkladığını göstermektedir.” şeklinde bir yorum yapabiliriz.
Cox and Snell değeri fazla okunmaz, Nagelkerke değeri tercih edilir.

Parameter Estimates Tablosu
“Parameter Estimates” tablosunda önce Location bölümünü okumayı gösterip sonra Threshold bölümünü okumayı göstereceğim.
Anksiyete’yi yorumlayalım önce. Sig. sütunu yani p değeri 0.05’ten küçük olduğu için anlamlı bir etki var. Ne yönde anlamlı bir etki var diye bakmak için Estimate sütununda negatif mi pozitif mi bakmamız gerekiyor. Pozitif ise Anksiyete arttıkça Memnuniyet artıyor demektir. Estimate sütunundaki değer, Anksiyete’deki 1 birimlik artışın Memnuniyet’te kaç birimlik artışa karşılık geldiğini söylemez. Bunu daha sonra hesaplayacağız.
Ekonomik durumla ilgili olan 3 satıra bakalım. 1 Fakir, 2 Orta Gelir, 3 Zengin diye kodlamıştık en başta verimizde. SPSS, Ordinal Lojistik Regresyon analizini düzgün yapabilmek için Zengin kategorisini referans kategorisi olarak aldı. Fakir’in Zengin ile karşılaştırmasını en üstteki Ekonomik satırında görebiliriz. Buna göre, “Fakir katılımcılar Zengin’e göre daha düşük Memnuniyet’e sahiplermiş (Estimate sütunu değeri negatif çünkü). Ama bu durum istatistiksel olarak anlamlı değilmiş (çünkü Sig. yani p değeri 0.822).” Aynı şekilde, “Orta gelirli katılımcılar Zengin’e göre daha düşük Memnuniyet’e sahiplermiş (Estimate sütunu değeri negatif çünkü). Ama bu durum istatistiksel olarak anlamlı değilmiş (çünkü Sig. yani p değeri 0.266).”
Cinsiyet bölümünü de aynı şekilde okuyoruz. Verimizde 5 Kadın, 6 Erkek, 7 de Diğer cinsiyet olarak kodlanmıştı. “Diğer” kategorisi cinsiyet için referans kategorisi olarak belirlenmiş. O zaman en üstteki Cinsiyet satırlarına göre, “Kadın bireyler Diğer cinsiyet’e göre istatistiksel olarak anlamlı şekilde daha yüksek Memnuniyet’e sahiplermiş” ve “Erkek bireyler Diğer cinsiyet’e göre istatistiksel olarak anlamlı şekilde daha yüksek Memnuniyet’e sahiplermiş” diye iki cümle kurabiliriz.
Maalesef Fakir ile Orta Gelir’in karşılaştırmasını veya Erkek ve Kadın’ın karşılaştırmasını bu analizde göremiyoruz. Görmek istersek referans kategorisini ya Fakir ya da Orta Gelir (aynı zamanda ya Kadın ya da Erkek) olarak ayarlayıp tekrar böyle bir Ordinal Lojistik Regresyon analizi yapmamız gerekecek.

Maalesef, SPSS otomatik olarak “bağımsız değişkenlerdeki her 1 birimlik artış bağımlı değişkende neye karşılık geliyor” sorusunun cevabını vermemizi sağlayan sayısal değeri bize vermiyor. Bunu kendimiz hesaplamalıyız.
Her satır için, Estimate sütunundaki değeri, Exp() fonksiyonunun içine almamız gerekiyor elimizle. Herhangi bir hesap makinesinde bunu yapabilirsiniz.
Burada, Exp() fonksiyonu sonucunun değeri, Odds Ratio yani “gerçekleşme olasılıklarının oranı” cinsinden bize sunuluyor. Odds Oranı, 0 ile sonsuz arasında değişebilir. 1’den büyük bir Odds Ratio değeri artışı işaret ederken, 1’den küçük bir Odds Ratio değeri azalışı işaret eder.
Ordinal Lojistik Regresyon analizi sonucunda “bağımsız değişkendeki 1 birimlik artış, bağımlı değişkende kaç birimlik bir artışa denk geliyor” şeklinde bir cümle kuramıyoruz. Bunun yerine, “bağımsız değişkendeki 1 birimlik artış, bir katılımcının daha yüksek bir gruba ait olma ihtimalini ne kadar arttırıyor” şeklinde bir cümle kurabiliyoruz.
Bu sayfada incelediğimiz Ordinal Lojistik Regresyon analizi için bu işlemi her satır için sırayla yapacak olursak:
- Anksiyete: Exp(0.304) = 1.35 Odds Ratio değeri. Bu değişkenin türü sürekli veri tipi. Demek ki, “Anksiyete’de 1 birimlik artış, bir kişinin daha yüksek bir Memnuniyet kategorisinde yer alma ihtimalini 1.35 oranında arttırıyormuş (%35 arttırıyormuş).”
- Fakir vs Zengin: Exp(-0.103) = 0.90 Odds Ratio değeri. Bu değişkenin türü kategorik. Referans kategorimiz Zengin’di. Demek ki, “Zengin yerine Fakir olmak, bir kişinin daha yüksek bir Memnuniyet kategorisinde yer alma ihtimali, daha düşük bir Memnuniyet kategorisinde yer alma ihtimalinin yalnızca %90’ı kadardır.”
- Orta vs Zengin: Exp(-0.370) = 0.69 Odds Ratio değeri. Bu değişkenin türü kategorik. Referans kategorimiz Zengin’di. Demek ki, “Orta yerine Fakir olmak, bir kişinin daha yüksek bir Memnuniyet kategorisinde yer alma ihtimali, daha düşük bir Memnuniyet kategorisinde yer alma ihtimalinin yalnızca %69’u kadardır.”
- Kadın vs Diğer: Exp(1.103) = 3.01 Odds Ratio değeri. Bu değişkenin türü kategorik. Referans kategorimiz Diğer’di. Demek ki, “Diğer yerine Kadın cinsiyetinde olan bir kişinin daha yüksek bir Memnuniyet kategorisinde yer alma ihtimali, daha düşük bir Memnuniyet kategorisinde yer alma ihtimalinin 3.01’i kadarmış (%201 arttırıyormuş veya %301 katına çıkarıyormuş).”
- Erkek vs Diğer: Exp(1.091) = 2.98 Odds Ratio değeri. Bu değişkenin türü kategorik. Referans kategorimiz Diğer’di. Demek ki, “Diğer yerine Erkek cinsiyetinde olmak, bir kişinin daha yüksek bir Memnuniyet kategorisinde yer alma ihtimali, daha düşük bir Memnuniyet kategorisinde yer alma ihtimaline göre %198 arttırıyormuş (toplam %298 oluyor diye).”
Bu sayfada örnek olsun diye bütün değişkenler için hesapladım ama gerçekte yalnızca istatistiksel olarak anlamlı çıkan “Anksiyete”, “Erkek vs Diğer”, ve “Kadın vs Diğer”in sonuçları önemlidir, kalan sonuçlar istatistiksel olarak anlamsız olduğu için yorumlanmamalıdır.
Son olarak, Threshold bölümü nasıl yorumlanmalı ondan da bahsedeyim. Deminki tablonun aynısını koydum, aşağıda anlatmaya devam ediyorum.

Threshold kısmında yer alan Estimate değerleri, bağımlı değişkenin belirli kategorilere ayrıldığı kesişim noktalarını (cut points) ifade eder. Bizim analizimizde bağımlı değişken olan “Memnuniyet” 1 ile 7 arasında değer alıyor. Bu yüzden tabloda Memnuniyet = 1 (0.030) ve Memnuniyet = 2 (1.243) … şeklinde eşik değerleri verilmiştir. Bu değerler, lojistik fonksiyonun her kategori için SPSS tarafından hesaplanan sınır noktalarıdır. SPSS, Ordinal Lojistik Regresyon analizinde bağımlı değişkenin kategorilerini belirlerken, bu eşik değerleri kullanarak olasılıkları hesaplar.
Burada bir kategorinin Sig. yani p değeri 0.05’ten büyük ise o zaman demek olur ki “o kategori ile bir sonraki veya önceki kategori arasında anlamlı bir fark bulunmamaktadır”. Mesela bu örnekte Memnuniyet = 1 ile Memnuniyet = 2 arasında anlamlı bir fark yokken, diğer Memnuniyet seviyelerinin aralarında anlamlı fark var denebilir.
SPSS ile Ordinal Regresyon analizi hakkında anlatmak istediğim her şey bu kadardı. Okuduğunuz için teşekkürler.



Bir yanıt bırakın