İçindekiler
Kruskal-Wallis Testi, verilerin normal dağılım göstermediği durumlarda, 3 veya daha fazla grubun skorlarını birbiri arasında karşılaştırmak için kullanılan istatistiksel analiz türüdür. Bu yazıda, Kruskal-Wallis Testi’nin ne olduğunu, SPSS programında nasıl yapıldığını ve sonuçların nasıl yorumlanması gerektiğini detaylarıyla anlatacağım.
Kruskal-Wallis Testi Nedir?
Kruskal-Wallis Testi, 3 veya daha fazla sayıda grubun skorları arasında farklılık olup olmadığını incelemek için yapılan bir istatistiksel testtir.
Eğer 3 veya daha fazla grubun bir test sonucunda aldıkları puanları karşılaştırmak istiyorsak fakat Tek Yönlü ANOVA testinin varsayımlarından olan normal dağılım varsayımı karşılanmıyorsa, grupların skorlarını karşılaştırmak için ANOVA yerine Kruskal-Wallis Testi uygulamak gerekir.
Kruskal-Wallis Testi, parametrik olmayan (non-parametrik) bir testtir; bu sayede veriler normal dağılım göstermese bile Kruskal-Wallis Testi gerçeği yansıtan sonuçlar elde etmeyi sağlar.
Mesela, 4 takım taraftarlarının (GS, FB, BJK, TS) maç sırasında Bağırma miktarlarını karşılaştırmak istiyorsak ve Bağırma skorları normal dağılım göstermiyorsa, o zaman Kruskal-Wallis Testi uygulayarak hangi takımların taraftarları hangi diğer takım taraftarlarından daha çok bağırıyor bunu öğrenebiliriz.
Kruskal-Wallis Testi İçin Veriler Nasıl Olmalıdır?
- Bağımsız değişken 3 veya daha fazla kategoriye sahip olabilir. (mesela ilkokul-lise-üniversite eğitim durumları)
- Bağımlı değişken devamlı sayısal veri ya da ordinal veri tipi şeklinde olabilir. (mesela motivasyon veya memnuniyet skorları)
Veriler normal dağılmadığında, bağımsız değişken 2 kategoriye sahip ise (mesela kadın-erkek) o zaman Mann-Whitney U Testi yapıyorduk. Bağımsız değişken 3+ kategoriye sahip ise de Kruskal-Wallis Testi yapıyoruz…
Hangi durumda hangi testi seçeceğinizden emin değilseniz “Hangi Test?” başlıklı yazımızı okuyarak doğru testi seçmeyi öğrenebilirsiniz.
Kruskal-Wallis Testi Varsayımları
- Kruskal-Wallis Testi, bir non-parametrik test (parametrik olmayan test) olması sebebiyle, sonuçların güvenilir olarak doğru yorumlanabilmesi için verilerin normal dağılım göstermesine ihtiyaç duymaz. Normal dağılım olmasa da isabetli sonuçlar verir.
Eğer 3 grubun skorlarını birbiriyle karşılaştırmak istiyorsak ve skorlar normal dağılım gösteriyorsa Tek Yönlü ANOVA Testi yapmak uygun olur. Skorlar normal dağılım göstermiyorsa da Kruskal-Wallis Testi yapmak uygun olur.
SPSS ile Kruskal-Wallis Testi Nasıl Yapılır?
Bu örnekte 3 tane kedi türünün (sarman, tekir, siyah) bir beceri testi sonucunda aldıkları beceri skorlarını karşılaştırıyoruz. SPSS ile Kruskal-Wallis Testi yaparak acaba bazı kedi türlerinin beceri skorları diğerlerinden anlamlı derecede farklı mı bunu öğreneceğiz.
Aşağıdaki adımları uygulayarak SPSS’te Kruskal-Wallis Testi yapılabilir.
Analyze -> Nonparametric Tests -> Independent Samples

Açılan pencere 3 kısımdan oluşuyor. Objective kısmı bu şekilde görünmeli.

Fields kısmında, bağımlı değişkenimizi Test Fields kutusuna koyuyoruz. Bağımsız değişkenimizi de Groups kısmına koyuyoruz.

Settings kısmında, “Kruskal-Wallis 1-way ANOVA (k samples)” yazan yere ait kutucuğu işaretliyoruz. Aynı zamanda altındaki alan “Multiple comparisons: All pairwise” olarak seçili olmalıdır.
Sonra “Run” butonuna basarak, analizi başlatabiliriz.

SPSS Kruskal-Wallis Testi Sonuç Yorumlama
Kruskal-Wallis Testi, 3+ grubun skorlarını birbiriyle karşılaştırır ama grupların ortalama skorlarını birbiriyle karşılaştırmaz. Bu sebeple SPSS’te Kruskal-Wallis Testi yaptığımızda sonuç tablolarında ortalama ve standart sapma bilgisi gelmez.
Kruskal-Wallis Testi yapınca SPSS bize birtakım tablolarla grafikler veriyor. İlk bakmamız gereken yer, Summary tablosu. Burada kırmızı yuvarlak içine aldığım Sig. değeri Kruskal-Wallis testine dair p anlamlılık değeridir.
Bu örnekte p değeri 0.004 çıkmış, yani 0.05’ten küçük olduğu için, “Kruskal-Wallis testi sonucunda gruplar arasında istatistiksel olarak anlamlı fark bulunmuştur” diyebiliriz. Yani bazı kedi türlerinin Beceri skorları başka kedi türlerinden anlamlı derecede farklıdır demek oluyor.

Kruskal-Wallis Testi sonucundaki p değeri 0.05’ten büyük ise “gruplar arasında anlamlı fark yok” demek oluyor.
Kruskal-Wallis Testi sonucundaki p değeri 0.05’ten küçük ise “gruplar arasında anlamlı fark var” demek oluyor.
Kruskal-Wallis Testi sonucundaki p değerine göre gruplar arasında anlamlı fark olduğunu görebiliyoruz, fakat hangi gruplar arasında anlamlı farklılık olduğunu göremiyoruz. Yani her grubun birbiri arasında anlamlı fark var mı yoksa sadece bazı kedi türlerinin skorları bazılarından mı anlamlı olarak yüksek bunu sadece yukarıdaki p değerine bakarak öğrenemeyiz.
Hangi kedi türlerinin diğer türlerden anlamlı şekilde farklı Beceri skoruna sahip olduğunu bulmak için, bir sonraki Pairwise Comparisons tablosunu incelememiz gerekiyor.

Pairwise Comparisons tablosunda, sırayla her kedi türünün diğer bir kedi türüyle Beceri skoru karşılaştırılıyor ve ikisi arasında anlamlı bir fark var mı diye bulunuyor. Bu örnekte 3 kedi türümüz olduğu için, SPSS 3 farklı karşılaştırma yaptı.
Hangi grupların skorlarının hangilerinden istatistiksel olarak anlamlı şekilde farklılık gösterdiğini bulmak için, düz Sig. yerine en sağ sütundaki Adj. Sig değerine bakmak gerekmektedir. Bu sütun düzeltilmiş p değerini verir. Çünkü aynı ikili karşılaştırma istatistiksel testini 3 kere yapınca, Tip I hata oranı artmaktadır (gerçekte var olmayan bir gruplar arası farkı varmış gibi görme ihtimali). Adj Sig. sütununda bir Bonferroni düzeltmesi yapılarak ona göre her karşılaştırma için yeni p değerleri hesaplanır. Yine Adj. Sig. sütunundaki p değeri 0.05’ten küçük ise anlamlı fark var, 0.05’ten büyük ise de anlamlı fark yok demek olur.
- Bu örneğimizde, Sarman ve Tekir kediler arasında istatistiksel olarak anlamlı bir Beceri farkı görülmemiş (çünkü p değeri 0.822).
- Sarman ve Siyah kediler arasında istatistiksel olarak anlamlı bir Beceri farkı görülmüş (çünkü p değeri 0.004).
- Tekir ve Siyah kediler arasında istatistiksel olarak anlamlı bir Beceri farkı görülmemiş (çünkü p değeri 0.075).
Pairwise Comparisons tablosunu inceledikten sonra, aşağıdaki kutu grafiğinden her kedi türünün ortalama, en küçük ve en büyük Beceri skoru aralıklarını inceleyebiliriz. Mavi kutunun ortasındaki siyah yatay çizgi o kedi türünün medyan yani ortanca değerini veriyor. Kutuların dışına çıkan dikey siyah çizgiler de en düşük ve en yüksek değer aralıklarına karşılık geliyor.
Değer aralıkları yaklaşık aynı olsa da, Siyah kedilerin Beceri skorları, genel olarak diğer kedi türlerinden biraz daha yüksek görünüyor. Bu grafiğe bakarak grupların skor dağılımlarını görebiliyoruz, ama hangi kedi türleri arasındaki farkların istatistiksel olarak anlamlı farklar olduğunu yukarıdaki Pairwise Comparisons tablosuna bakarak anlıyoruz. Bu grafik sadece görsel olarak hangi grubun büyük hangi grubun küçük olduğunu kolay görmemizi sağlıyor, o kadar.

SPSS’te Kruskal-Wallis Testi yapmamız ve tabloları yorumlamamız sonucunda şu sonuca varıyoruz: “Verideki Siyah kediler, Sarman kedilere göre istatistiksel olarak anlamlı biçimde daha yüksek Beceri skoruna sahiptirler. Diğer kedi türleri arasında ise anlamlı bir Beceri seviyesi farkı görülmemiştir.”
Kruskal-Wallis Testi sonucu istatistiksel olarak anlamlı yani 0.05’ten küçük bir p değeri bulduktan sonra hangi gruplar arası anlamlı Beceri seviyesi farkı olduğunu görmek için karşılaştırma yapmaya post hoc karşılaştırma deniyor. Biz bu örnekte, Dunn’s Test kullanarak ikili karşılaştırmalar yaptık. Dunn’s Test en güvenilir olan Kruskal-Wallis post hoc testidir. Pairwise Comparisons tablosundaki Adj. Sig değerleri Dunn’s Test sonucu Bonferroni düzeltmesi uygulanarak gösterilmektedir, ve en güvenilir olan p değerleridir.
Kruskal-Wallis Testi Etki Büyüklüğü Hesaplama
Kruskal-Wallis Testi’nin etki büyüklüğünü bulmak için şu işlemi yapıyoruz: “etakare = (H – k + 1) / (N – k)”. Bu formülde H Test Statistic değeri, k grup sayısı ve N de toplam kişi sayısı oluyor. Bu örnekte değerleri formülde yerine yerleştirdiğimizde etki büyüklüğü olan eta kare değeri (10.860-3+1) / (158-3) = 0.057 çıkıyor.
Eta kare değeri 0.01 ise küçük, 0.06 ise orta, 0.14 veya üzeri ise büyük etki büyüklüğü olarak genel kabul görüyor. Buna göre bu örnekte kedi türünün Beceri puanı üzerinde orta büyüklükte bir etkiye sahip olduğunu söyleyebiliriz.
Bu eta kare değeri, aynı zamanda, modelde bağımlı değişkendeki varyansın bağımsız değişkenler tarafından açıklanan yüzdelik dilimini ifade etmektedir. Bu örnekte eta kare değerini 0.057 bulduk, yani bu, beceri seviyesindeki varyansın %5.7’lik kısmının kedi türü değişkeni tarafından açıklandığını göstermektedir.



Bir yanıt bırakın