SPSS ile Normallik Testi (Normal Dağılım Testi)

spss normal dağılım testi

Bu yazımızda, “normal dağılım”ın ne demek olduğunu kısaca açıklayıp, bir değişkenin normal dağılım gösterip göstermediğini SPSS progamını kullanarak nasıl anlayabileceğimize bakacağız. SPSS ile normal dağılım test etmek için 4 farklı yöntem kullanacağız. Bu yöntemlerin hepsini birlikte göz önünde bulundurarak, bir değişkenin normal dağılım gösterip göstermediğine artık güvenle karar verebileceksiniz. SPSS ile normal dağılım testi hakkında ihtiyacınız olan bütün bilgileri bu sayfada bulacağınıza eminim.

spss analizi ücretli danışmanlık tanışma indirimi veri tablo rapor iletişim

spss tez analizi istatistik ödev yaptırma ücretli spss veri analizi danışmanlık

Normal Dağılım Nedir?

Normal dağılım, istatistikte sıkça kullanılan bir skor dağılımı şeklidir. Bir örnek vermek gerekirse, zeka testi skorları normal dağılıma yakın bir dağılım gösterir. Yani çoğu kişinin zeka testi skorları ortalamaya yakın değerlerde bulunurken, çok düşük veya çok yüksek zeka skorlarına sahip olan daha az kişinin bulunduğu anlamına gelir.

Aşağıda, zeka testi skorlarının normal dağılımını ifade eden bir grafik göreceksiniz:

normal dağılım iq

 

Normal Dağılım Özellikleri Nelerdir?

Normal dağılımın temel özellikleri şunlardır:

  1. Ortalama: Normal dağılım gösteren bir değişkenin skorlarının ortalaması, en düşük ve en yüksek skorların tam ortasında bulunur. (Örneğin, ortalama zeka testi skoru 100 olabilir.)
  2. Simetri: Normal dağılım, yukarıdaki resimdeki gibi eğri şeklinde simetrik bir dağılıma sahiptir. Ortalamaya yakın skorlar, eğrinin yüksek olduğu yerdedir ve düşük veya yüksek skorlar eğrinin her iki tarafında daha az sıklıkla bulunur.
  3. Çarpıklık ve Basıklık Değerleri: Normal dağılım gösteren bir değişkenin skorlarının çarpıklık (skewness) ve basıklık (kurtosis) değerleri 0 (sıfır) olur. Çarpıklık ve/veya basıklık değerleri 0’dan fazla uzaklaşırsa, normal dağılım bozulur. Buna aşağıda değineceğiz.

 

normal dağılım grafik

spss tez analizi istatistik ödev yaptırma ücretli spss veri analizi danışmanlık

Normal Dağılım Neden Önemlidir?

Korelasyon, regresyon, ANOVA, t testi gibi testler parametrik testlerdir. SPSS programında bu testleri yapıp güvenilir bir sonuca ulaşmak istiyorsak öncelikle test edeceğimiz değişkenlerin skorlarının dağılımının normal dağılım gösterdiğinden emin olmamız gerekiyor. Eğer analiz edeceğimiz değişkenler arasında normal dağılım göstermeyen en az bir değişken varsa yolumuza farklı, non-parametrik (parametrik olmayan) testlerle devam etmemiz gerekecektir.

SPSS ile Normal Dağılım Test Etme Yöntemleri

Bir değişkenin değerlerinin normal dağılıma sahip olup olmadığını anlamanın çeşitli yolları vardır. Tek bir yoldan bakıp karar vermek yerine, farklı farklı yöntemlerle normal dağılımın olup olmadığına bakmak ve varılan sonuçları birlikte değerlendirerek sonuca varmak en sağlıklı şekilde karar vermemizi sağlar.

SPSS ile yapılan analizlerde, 4 temel yöntemle normal dağılım varlığı test edilir. Bunlar şu şekilde listelenebilir:

  1. Kolmogorov-Smirnov veya Shapiro-Wilk gibi normallik testleri uygulayıp p değerlerine bakmak
  2. Çarplıklık & Basıklık (Skewness & Kurtosis) değerlerine bakmak
  3. Gözümüz ile dağılımın histogram grafiğine bakmak
  4. Q-Q grafiğine bakmak

spss tez analizi istatistik ödev yaptırma ücretli spss veri analizi danışmanlık

1) Kolmogorov-Smirnov ve Shapiro-Wilk Testleri

SPSS’te Kolmogorov-Smirnov ve Shapiro-Wilk testlerinden birini kullanarak bir değişkenin normal dağılım gösterip göstermediğini öğrenmek için, SPSS’te aşağıdaki adımları izlememiz gerekiyor.

 

Adım 1:

İlk önce SPSS’te Analyze -> Descriptive Statistics -> Explore butonlarına basıyoruz.

normallik varsayımı 1

 

Adım 2:

Açılacak olan yeni pencerede, test etmek istediğimiz bütün değişkenleri (1 ya da birden fazla olabilir) sol taraftaki kısımdan alıp sağ taraftaki Dependent List bölümüne koyuyoruz. Sonra Plots butonuna basıyoruz.

normallik varsayımı 5

 

Adım 3:

Aşağıdaki resimde görüldüğü gibi, “Histogram” ve “Normality plots with tests” seçeneklerini işaretliyoruz. Continue’ya basıyoruz. Sonra OK tuşuna basıyoruz.

normallik varsayımı 3

 

Adım 4:

SPSS, bize yeni bir sayfada sonuçları gösterecektir. Sonuçların gösterildiği sayfada Tests Of Normality tablosuna bakmamız gerekiyor. Kolmogorov-Smirnov veya Shapiro-Wilk’ten bir tanesini seçip, Sig. (significance=anlamlılık yani p değeri) değerine bakmamız gerekiyor. Her satır için ayrı ayrı bakmamız gerekiyor. Eğer bir satırdaki değişkenin Sig. değeri 0.05’ten büyükse “o değişken normal dağılıma sahip”, 0.05’ten küçükse “o değişken normal dağılıma sahip değil” diyebiliriz. Kolmogorov-Smirnov veya Shapiro-Wilk testlerinden hangisini seçmemiz gerektiği hakkında emin değilseniz, cevabı aşağıda, resmin altında bulabilirsiniz.

normallik varsayımı 4

 

Kolmogorov-Smirnov Testi vs. Shapiro-Wilk Testi

Normallik analizi yaptığımızda, SPSS bize 2 tane farklı normallik testi sonucu gösteriyor. Testlerin birinin adı Kolmogorov-Smirnov ve diğerinin adı Shapiro-Wilk testi. Bunların arasından birini seçip, tabloda onun olduğu bölümü okumamız gerekiyor. Hangi normallik testini seçmek gerektiği konusunda kesin kurallar yok. Bazı okullarda, katılımcı sayısı 50 kişinin üstünde olduğu zaman Kolmogorov-Smirnov testini seçmek gerektiği öğretilirken, bazı okullarda katılımcı sayısı 100 kişinin altında olduğu zaman Shapiro-Wilk testini yapmak gerektiği öğretiliyor. İnternette hangi kaynaktan okuduğunuza göre hangi testi yapmanız gerektiğiniz hakkında farklı tavsiyeler alabiliyorsunuz. Bu da kafa karışıklığına sebep olabiliyor.

Kolmogorov-Smirnov Testi mi yoksa Shapiro-Wilk Testi mi seçmeliyim?

Dünya çapında birçok üniversitede okutulan Andy Field’ın istatistik kitabında (kaynakçası yazının en sonunda), her durumda Shapiro-Wilk testini tercih etmenin daha güvenilir olduğu yazıyor. Kitapta yazanlara göre, Kolmogorov-Smirnov testi, 0.05’in altında değerler vermeye daha çok yatkın. Bu da, aslında normal dağılıma yakın dağılım gösteren değişkenlerin normal dağılıma sahip değilmiş gibi görünmesine yol açıyor. Bu hatanın önüne geçmek için Shapiro-Wilk testini yapmanın daha isabetli bir yol olduğu yazıyor.

normallik varsayımı 4

Yukarıdaki resimdeki tablonun üçüncü satırında da görebileceğiniz üzere, bu verideki Yaş değişkeninin Sig. (yani p) değeri Kolmogorov-Smirnov testine göre 0.004 iken, Shapiro-Wilk testine göre 0.062 olarak bulunmuş. Yani, Yaş değişkenini Kolmogorov-Smirnov testine göre normal olarak kabul edemiyorken, Shapiro-Wilk testine göre normal olarak kabul edebiliyoruz. Bu örnekte, Andy Field’ın tavsiyesine uyup, Kolmogorov-Smirnov testi yerine Shapiro-Wilk testine bakarsak, “Yaş değişkeni normal dağılım gösteriyor” şeklinde bir sonuca varabiliriz.

 

Not: Eğer hocanız bu testler arasından özellikle kendi dediği teste bakmanızı söylüyorsa itiraz etmeden hocanızın dediğini yaparsanız işiniz daha hızlı çözülür.

spss tez analizi istatistik ödev yaptırma ücretli spss veri analizi danışmanlık

2) Çarpıklık & Basıklık Değerlerine Bakmak

Çarpıklık ve basıklık, bir dağılımın normal dağılım şeklinden ne kadar farklılaşmakta olduğunu gösteren iki ölçüm değeridir. Önce çarpıklık ve basıklık terimlerinin ne anlama geldiğini açıklayıp sonra bu değerlere bakarak normal dağılım olup olmadığına nasıl karar veririz ona bakalım.

Çarpıklık Nedir?

Çarpıklık, bir veri setinin ortalama değerinin grafiğin sağına ya da soluna ne kadar kaydığını gösterir. Aşağıdaki resimde inceleyebilirsiniz.

çarpıklık skewness
Üstteki grafik simetrik bir normal dağılım grafiğidir. Sol alttaki grafikte değerler biraz sağa kaymıştır ve buna “sola doğru (negatif) çarpıklık” denir. Sağ alttaki grafik de yanındaki grafiğin tam tersi yöne çarpıktır.

 

Basıklık Nedir?

Basıklık, bir veri setinin ortalama değerine sahip değerlerin veri setinde ne kadar yoğun olarak geçtiğini gösterir. Aşağıdaki resimde inceleyebilirsiniz.

basıklık kurtosis
Resimde 3 grafik var. Ortadaki yeşil renkli grafik normal dağılımı gösterir. Açık sarı renkli grafikte, veri setinde bulunan değerlerin çoğu ortalama değer civarındadır bu yüzden grafik üzerinde veri setinin ortalama değerine gelindiğinde daha keskin bir yukarı kalkış görünür. Kırmızı grafik de bunun tam tersidir.

 

SPSS’te Çarpıklık & Basıklık Değerine Göre Normal Dağılıma Karar Vermek

SPSS’te yukarıda gösterdiğim işlemleri yaptıktan sonra, SPSS analiz sonucu olarak bize yukarıdaki normallik testi tablolarından başka, çarpıklık & basıklık değerlerinin içinde olduğu “Descriptives” başlıklı bir tablo daha veriyor. Bu tabloda, kırmızı yuvarlak içine aldığım skewness ve kurtosis satırları, çarpıklık ve basıklık değerlerini gösterir.

Pratik bir kısa yol olarak, bu SPSS tablolarındaki çarpıklık ve basıklık değerleri eğer -2 ile +2 arasında ise normal dağılım vardır demeyi tercih edebiliriz.

çarpıklık basıklık 1 çarpıklık basıklık 2 çarpıklık basıklık 3

 

Yukarıdaki tablolara göre, bütün değişkenlerin skewness ve kurtosis skorları -2 ile +2 arasında bulunuyor. Yani çarpıklık ve basıklık değerlerine bakarak normal dağılım var mı diye kısa yoldan karar verecek olursak, “normal dağılım var” diyebiliriz.

 

Çarpıklık & Basıklık Z-Skoru Hesaplama

Genellikle çarpıklık ve basıklık değerleri kaç ise normal dağılım ona göre yorumlanır. Buna ek olarak istatistiksel olarak daha isabetli fakat daha ileri seviye olan bir yöntemi, bu alt başlıkta açıklıyorum. Çok ileri seviye uğraşmayacaksanız burayı geçebilirsiniz.

Ghasemi & Zahediasl’ın 2012’de yayınladıkları makale, çarpıklık ve basıklık değerlerine göre normal dağılım var olup olmadığına karar verme konusunda yüksek kalite standartları belirlemiştir. Makalenin referansını sayfanın en altında Referanslar bölümüne ekledim, bakabilirsiniz.

Çarpıklık z-skoru ve basıklık z-skoru -3 ile +3 aralığındaysa, genelde “normal dağılım var” kabul edilir.

Bu makaleye göre, normal dağılıma karar verirken çarpıklık ve basıklık değerlerini yorumlamak için, bu değerleri standardize etmek gerekmektedir. Yani z-skoru denen standart skor türüne dönüştürülmelidir. Bu oldukça basittir. Aşağıdaki formül ile çarpıklık (skewness) ve basıklık (kurtosis) değerleri z-skoruna dönüştürülebilir.

çarpıklık ve basıklık z skoru formül

 

Bu formül şu anlama gelmektedir: Çarpıklık değerinin, Çarpıklık Standart Hata değerine bölümü, “çarpıklık z-skoru”nu verir. Basıklık değerinin, Basıklık Standart Hata değerine bölümü, “basıklık z-skoru”nu verir.

Örneğin aşağıdaki SPSS tablosunda soldaki sütun Statistic, sağdaki sütun da Standard Error değerini gösteriyor.

Yani skewness satırında soldaki değeri sağdaki değere bölersek, çarpıklık (skewness) değerine ait z-skorunu bulmuş olacağız.

Aynı şekilde kurtosis satırında soldaki değeri sağdaki değere bölersek, basıklık (kurtosis) değerine ait z-skorunu bulmuş olacağız.

çarpıklık basıklık 1

Örneğin bu tabloda “çarpıklık z-skoru = 0.155/0.302=0.513” ve “basıklık z-skoru = -0.004/0.595 = -0.006” şeklinde sonuçlara ulaşabiliriz.

 

Çarpıklık & Basıklık Z-Skoru Değerleri Ne Anlama Geliyor?

Eğer bulduğumuz Çarpıklık ve Basıklık z-skoru değerleri, -1.96 ile +1.96 arasında ise, güvenle normal dağılım var diyebiliriz. Bazı kaynaklar daha esnek bir şekilde -3 ile +3 aralığını normal dağılım saymaktadır.

Ghasemi & Zahediasl’ın (2012) makalesine göre, Çarpıklık & Basıklık z-skoru değeri, eğer ±1.96’dan büyük ise, p<0.05 istatistiksel anlamlılık seviyesinde “normal dağılım yok” diyebiliriz. Daha küçük z-skoru değeri var ise “normal dağılım var” diyebiliriz. 200’den küçük örneklem büyüklüklerinde normal dağılım var mı diye bakarken bu değerlere bakarak güvenle yorum yapabiliriz.

Eğer Çarpıklık & Basıklık z-skoru değeri, ±2.58’den büyük ise, p<0.01 istatistiksel anlamlılık seviyesinde “normal dağılım yok” diyebiliriz. Daha küçük z-skoru değeri var ise “normal dağılım var” diyebiliriz. 200’den büyük bir örneklem büyüklüğüne sahipsek normal dağılım var mı diye bakarken bu yöntemi kullanabiliriz.

Eğer Çarpıklık & Basıklık z-skoru değeri, ±3.29’dan büyük ise, p<0.001 istatistiksel anlamlılık seviyesinde “normal dağılım yok” diyebiliriz. Bu eşik değerini veri seti çok büyükse (1000 kişi veya üzeri) kullanmamız daha sağlıklı olur.

spss tez analizi istatistik ödev yaptırma ücretli spss veri analizi danışmanlık

 

Normallik Testi vs. Çarpıklık Basıklık Değerleri Karşılaştırma

Şimdi aşağıdaki tabloya bakalım. Deminki Kolmogorov-Smirnov ve Shapiro-Wilk testlerindeki p değerlerini hatırlayacak olursak, Permissive ve Authoritarian değişkenlerinin p değerlerinin bu testlerde de 0.05’in üstünde çıktığını yani normal dağılım var yönünde bir sinyal verdiğini görebiliriz. Yeni bulduğumuz Çarpıklık – Basıklık değerleri de bununla tutarlıdır.

Fakat Yaş değişkenine bakacak olursak, normallik testlerindeki p değerlerinin bir tanesi 0.05’ten küçük, bir tanesi de 0.05’ten çok az büyüktür. Bu belirsizliğe sebep olmaktadır. İşte burada ek olarak Çarpıklık – Basıklık değerine de bakmak, normallik konusunda karar vermemize yardımcı oluyor. Yaş değişkeninin Çarpıklık – Basıklık değeri, -2 ile +2 arasında olduğu için, “Yaş değişkeni normal dağılıma sahiptir” şeklinde bir sonuca varabiliriz bu örnek özelinde.

normallik varsayımı 4

 

3) Grafiğe Gözümüz ile Bakmak

Andy Field’ın kitabındaki tavsiyelerinden biri de normal dağılıma karar verirken histogram grafiklerine gözümüzle bakıp sağduyumuzu kullanmaktır. Sadece Shapiro-Wilk testi veya Kolmogorov-Smirnov testi sonucuna ve çarpıklık-basıklık (skewness-kurtosis) değerlerine değil, değişkenlerin histogram grafiğine gözümüzle bakıp normal dağılım sayılıp sayılamayacağını belirleyebiliriz. Normal dağılım gösteren bir histogram grafiği aşağıdaki gibi görünür:

normal dağılım

Bu sayfada yukarıda gösterdiğim SPSS analiz adımlarını takip ettiyseniz SPSS’in bize verdiği sonuçlar arasında grafiklerin de bulunduğunu görebilirsiniz. Buradaki değişkenlerin Histogram grafiklerine bakalım.

Grafiklere bakacak olursak, değişkenin dağılım şekilleri normal dağılıma aşırı benzemese de, her bir değişken için normal dağılıma yakın bir dağılım olduğunu (orta skorlar fazla, çok düşük veya çok yüksek skorlar daha az) gözümüzle görebiliriz.

histogram 1 histogram 2 histogram 3

Yukarıda Yaş değişkeninin Kolmogorov-Smirnov testine göre normal dağılım göstermediğini fakat Shapiro-Wilk testine göre normal dağılım gösterdiğini bulmuştuk. Çarpıklık & basıklık değerleri de normal dağılımı işaret ediyordu. Histogram grafiğine baktığımızda da normal dağılıma benzer bir görüntü görmemizden destek alarak, Yaş değişkeninin normal dağılım gösterdiği sonucuna varabiliriz.

Diğer iki değişkenin zaten normal dağılım gösteriyor olduğu yönünde sonuçlar bulmuştuk, histogram grafiklerinin şekilleri de bununla tutarlı oldu.

 

4) Q-Q Plot İncelemek

Son olarak, derslerde (ve tez-makale çalışmalarında) pek bakılmayan bir yöntem olsa da, deminki analiz işlemlerini yaptığımızda SPSS’in bize verdiği sonuçlar arasında bulunan Q-Q grafiklerini inceleyerek normal dağılıma bakma yöntemini göstereceğim.

Normal dağılım kabul edebilmemiz için, her bir Q-Q grafiğindeki noktaların çapraz düz çizginin üzerinde (veya çok yakın) olması gerekmektedir. Aşağıdaki grafiklerde hafif sapmalar olsa da, genel olarak noktaların çizgi üzerinde bulunduğunu görebiliyoruz. Bu yüzden Q-Q grafiklerine bakınca da her değişken için “normal dağılım var” şeklinde yorum yapabiliriz.

q q grafiği 1 q q grafiği 2 q q grafiği 3

 


Sonuç olarak, incelediğimiz değişkenlerin her birinin normal dağılıma sahip olup olmadığını SPSS üzerinde 4 farklı yoldan kontrol ettik. Önce Kolmogorov-Smirnov veya Shapiro-Wilk normallik testlerine baktık, sonra çarpıklık ve basıklık değerlerini kontrol ettik, sonra histogram grafiği gözümüzle inceledik, en son da Q-Q grafiğine baktık. Tüm adımlarda vardığımız bulguları birleştirerek bir bütün olarak ele alarak, bulgular ışında incelediğimiz değişkenlerin üçünün de normal dağılım gösteriyor olduğu şeklinde bir sonuca vardık.

 

Kaynak:

Bu sayfadaki yazıları yazarken Andy Field’ın istatistik kitabını ve başka çok sık atıfta bulunulan başka bir makaleyi kullandım. Siz de analizinizi yaptıktan sonra referans olarak bu kitabı ve makaleyi gösterebilirsiniz. Kaynakların APA stili referansı şu şekilde:

Field, A. (2018). Discovering statistics using IBM SPSS statistics: North American edition. SAGE.

Ghasemi, A., & Zahediasl, S. (2012). Normality Tests for Statistical Analysis: A Guide for Non-Statisticians. International Journal of Endocrinology and Metabolism, 10(2), 486–489. doi:10.5812/ijem.3505

 

spss tez analizi istatistik ödev yaptırma ücretli spss veri analizi danışmanlık

Deniz Şavkay hakkında 182 makale
Lisans eğitimimi Boğaziçi Üniversitesi Moleküler Biyoloji ve Genetik bölümünde, Yüksek Lisans eğitimimi Polonya'daki SWPS Üniversitesi Psikoloji bölümünde tamamladım. Davranış bilimlerine ilgi duyuyorum ve eğitim hayatımı bunun üzerine şekillendirdim. SPSS ile istatistik analizi yapmayı çok seviyorum. SPSS analizleriyle insan davranışındaki kalıpları keşfetmek ve insan davranışı hakkında iç görü sahibi olmak beni heyecanlandırıyor.

İlk yorum yapan olun

Bir yanıt bırakın

E-posta hesabınız yayımlanmayacak.


*