SPSS ile Uç Değer Analizi (Resimli)

spss uç değer bulma

Veride uç değerler, istatistiksel veri setlerinde diğer değerlerden anlamlı bir şekilde farklı olan, beklenmeyen değerlerdir. Bu blog yazısında, veride uç değerlerin ne olduğunu ve neden önemli olduklarını ele alacağız. Ayrıca, SPSS programıyla uç değerleri farklı yöntemlerle nasıl bulabileceğimizi ve bu değerleri bulduktan sonra nasıl davranmamız gerektiğini öğreneceğiz.

spss analizi ücretli danışmanlık tanışma indirimi veri tablo rapor iletişim

spss tez analizi istatistik ödev yaptırma ücretli spss veri analizi danışmanlık

Veride Uç Değer (Outlier) Ne Demektir?

Veride uç değer (outlier), genel veri setinden önemli ölçüde farklı olan değerlere denir. Bu değerler, verideki diğer değerlere göre çok daha büyük veya çok daha küçük olabilir.

Mesela 50 kişiden oluşan ve değerlerin genellikle 1-30 aralığında olduğu bir veri setindeki bir kişinin değerinin 99 olması, ortalama değeri diğer verilere göre çok fazla arttıracaktır. Bu, verideki gerçek değer dağılımını yanıltıcı bir şekilde temsil edebilir. Çıkartmak veri hakkında daha gerçekçi fikir edinmemizi sağlayabilir. Doğru bir şekilde uç değerleri tanımlamak ve bunları analizden çıkarmak, istatistiksel sonuçların doğruluğunu ve güvenilirliğini artırabilir.

Mesela aşağıdaki örneğe bakalım. Aşağıdaki resimlerde 67 kişiden oluşan bir grubun, iki farklı ölçek sonucundaki puan dağılımlarının grafikleri var. Bu grafiklerin genelde dengeli dağıldığını görüyoruz, fakat diğer verilerden çok solda (yani küçük) veya çok sağda (yani büyük) bazı veriler var. Acaba bunlar uç değer mi, yoksa normal sorunsuz şans eseri bir varyasyonun sonucu mu diye öğrenmek için SPSS’te uç değer analizi yapmamız gerekiyor.

spss uç değer bulma analizi 1 spss uç değer bulma analizi 2

Uç değerleri göz kararı bulup ayıklamak mümkün değildir! Her şartta istatistiksel bir test uygulanıp onun sonucunda tespit edilmelidirler.

Veri setindeki bu aykırı değerler, genellikle veri analizinde hatalı ölçüm, veri girişi yanlışlığı veya gerçekten anormal bir olaya işaret edebilir. Bu nedenle, uç değerleri tespit etmek ve analiz sonuçlarını kötü etkilemeden veriden çıkartıp çıkartmamaya karar vermek önemlidir. Aşağıda önce SPSS ile uç değer nasıl tespit edilir inceleyip sonunda da bulduğumuz uç değerlerle ne yapacağımıza nasıl karar veriyoruz onu anlatacağım.

spss tez analizi istatistik ödev yaptırma ücretli spss veri analizi danışmanlık

Uç Değer Tespiti Neden Önemlidir?

Uç değerler, verideki gerçek dağılımı yanıltıcı bir şekilde değiştirebildiği için istatistiksel testlerin güvenilirliğini azaltabilir. Ayrıca bazı istatistiksel testler (t-test, ANOVA, korelasyon, regresyon gibi parametrik testler), verideki normal dağılım ve homojen varyans varsayımlarına dayanır. Veride uç değerlerin varlığı bu varsayımları ihlal edebilir ve bu testlerin sonuçlarının güvenilirliğini azaltabilir. Bu tür testlere başlamadan önce her zaman veride uç değer olup olmadığına bakılmalı, varsa ya bu uç değerler veriden çıkartılmalı ya da parametrik testler yerine olmayan alternatif testler kullanılmalıdır.

SPSS ile Uç Değer Tespiti Yöntemleri

Bir değerin uç değer olup olmadığı, her zaman kesin sınırlarla çizilmiş bir ayrım üzerinden yapılmaz. Ayrıca tek bir uç değer tespit yöntemi yoktur. Bu yüzden, farklı uç değer tespiti yöntemlerini birlikte kullanıp sonuçlarını birlikte değerlendirip karar vermek en doğrusudur. SPSS’te en çok kullanılan uç değer tespiti yöntemleri aşağıdakilerdir:

  • Boxplot (kutu grafiği) ile uç değer tespiti
  • Z-skoru üzerinden uç değer tespiti
  • Mahalanobis Uzaklığı ile uç değer tespiti

Bu yöntemlerin hepsini aşağıda kendi başlığı altında anlatacak ve resimlerle SPSS’te nasıl yapıldığını göstereceğim.

1) Boxplot Kutu Grafiği ile SPSS Uç Değer Tespiti

SPSS ile verimizin kutu grafiği çizerek uç değerleri bulmak, mükemmel isabetli bir yöntem olmasa da kolay olması ve aşağı yukarı doğru sonuçlara ulaştırması yüzünden en sık kullanılan yöntemdir.

Boxplot Uç Değer Örnek 1

SPSS -> Descriptive Statistics -> Explore

spss uç değer bulma analizi 3

İncelemek istediğimiz ölçeği “Dependent List” kutusuna atıyoruz. “Statistics” butonuna basıyoruz. Açılacak yeni küçük pencerede “Outliers” ve “Percentiles” seçeneklerini işaretliyoruz. Continue ve OK’a basıyoruz ve analiz başlıyor

Birden fazla ölçeği de Dependent List kutusuna koyup inceleyebiliriz. Bu durumda SPSS, her ölçeği ayrı ayrı kendi içinde analiz eder, ölçekleri birleştirmez.

spss uç değer bulma analizi 4

SPSS çıktılarından kutu grafiğine (boxplot) bakmalıyız.

boxplot spss uç değer bulma analizi 5

Bu grafiği anlamak önemlidir. SPSS verimizdeki değerleri önce en küçükten en büyüğe doğru sıralar. Sonra, verimizin en küçük %25’lik kısmını mavi kutunun altında çizgi olarak gösterir. Verimizin %25’ten büyük, tam orta değerinden küçük kısmını mavi kutunun yatay çizgi ile ayrılmış yerden aşağısında gösterir. Mavi kutunun içindeki yatay çizgi verinin medyan değerini ifade eder, yani 67 değerden oluşan bir veri küçükten büyüğe sıralandığı zaman 34. veri tam ortadadır, bu medyan değeridir. Verinin %50-75 arasındaki kısmı mavi kutunun üst yarısı, verideki değerlerin %75’inden büyük olan değerler de mavi kutunun üstü olarak gösterilir.

Uç değerler bu grafikte mavi kutu ve etrafındaki çizgilerin dışında kalan noktalardır. Ok işaretiyle gösterdim. Uç değeri belirten noktaların yanında yazan sayılar, o değerlerin veri setimizdeki kaç numaralı katılımcıya ait olduğunu belirtir. Verimizi açıp bakalım.

Mesela yukarıda uç değerlerin birinin yanında 1 yazıyordu. Aşağıdaki resimde veri setimizdeki değerlerin listesi görünüyor. En soldaki katılımcı sıra numarasına göre 1 numaralı katılımcının Otoriter skoru 60. Diğer katılımcıların genelde 30-40 civarında. Yani bu ikisi epey farklı. SPSS, uç değer analizi sonucu skorun 60 olmasını bir uç değer olarak almış. 36 numaralı katılımcı için de baksak benzer bir sonuç görecektik.

spss uç değer bulma analizi 6

Medyan yani veriler küçükten büyüğe sıralandığı zaman orta noktada bulunan değer, ortalama değer ile aynı şey değildir!

 

SON NOT: Verimizde hangi değerlerin uç değerler olmaya aday olduğunu bulduktan sonra, o verileri geçici olarak veriden çıkartıp, acaba başka uç değer olabilecek değer var mıdır diye bakmak için yeniden kutu grafiği ile aynı şekilde uç değer analizi yapıp demin görünmeyen yeni uç değer çıktı mı diye kontrol etmeliyiz. Eğer yeni uç değer ortaya çıktıysa, onları da geçici olarak veriden çıkartıp aynı işlemi yeniden yapmalıyız. Merak etmeyin, bu sonsuza kadar sürmez, 1-2 defa maksimum yapmak gerekir.

 

Boxplot Uç Değer Örnek 2

İkinci bir örnek yapalım şimdi. Bu deminki örneğin aynısı değil, okumanızı öneririm.

Örnek 1’deki adımların aynısını yaparak kutu grafiği oluşturuyoruz. Bu sefer değişken olarak Otoriter değil Sorumluluk koyuyoruz tek fark bu.

spss uç değer bulma analizi 7

SPSS’in oluşturduğu kutu grafiğinde yine tam orta değer (medyan), %25’lik aralıklar ve uç değerler gözüküyor. Burada dikkat ederseniz uç değerlerin iki tanesi yuvarlak, bir tanesi de yıldız ile gösterilmiş. Grafiğin hemen altında bunun açıklamasını yapıyorum.

spss uç değer bulma analizi 8

SPSS, boxplot yani kutu grafiği ile uç değer bulma işlemini belirli bir formüle göre yapar. Bu formüle göre, önce verimizdeki değerleri küçükten büyüğe sıralar, örneğin 100 verimiz varsa, 25. veriyi ve 75. veriyi alır, sonra bunların farkını alır ve çeyrekler açıklığı (interquartile range) denen değeri bulur.

Sonra bu değeri 1.5 ile çarpar. Mavi kutunun üstünde bulunan dikey çizginin en altındaki değerden çizgiyi takip ederek yukarı doğru hayali bir çizgi çizerek çıkmaya başlar bu yeni 1.5 ile çarpılmış değer kadar çıkmış olduğu zaman, çıkmayı bitirir. Bitirince eğer hâlâ bu çıkmayı bitirdiği en son üst noktanın üstünde kalan nokta varsa bu noktalara sahip katılımcıları uç değer (outlier) olarak işaretler. Bunu yuvarlak işareti ile gösterir.

SPSS bir de aşırı uç değer (extreme outlier) olarak bazı verileri işaretler. Bunu da yıldız işareti ile gösterir. Mesela üstteki kutu grafiğinde yıldız ile gösterilen 67 numaralı katılımcının verisi aşırı uç bir değerdir. SPSS bunu da şu formülle bulur: Uç değer bulurken çeyrekler açıklığı değerini 1.5 ile çarpıyordu ya. Aşırı uç değer bulurken çeyrekler açıklığı değerini 3 ile çarpar ve onun üzerinden aşırı uç değerleri saptar. Bunları yuvarlak yerine yıldız işareti ile gösterir.

SPSS, yalnızca 1.5 ve 3 sayıları ile çarparak çeyrekler açıklığı üzerinden uç değer tespiti yapabilmektedir. Fakat gerçek dünyada araştırmalarda 1.5 üzerinden uç değerleri belirlemek bazı uç değer olmayan değerlerin uç değermiş gibi görülmesine, 3 üzerinden uç değerleri belirlemek de bazı uç değerlerin uç değer değilmiş gibi görülmesine yol açmaktadır.

Çok atıf alan bu linkteki bilimsel makaleye göre, en iyi uygulama çeyrekler açıklığını 2.2 ile çarparak bulmaktır. Bu da, ancak SPSS dışında hesap makinesi ile yapılabilir.

 

SON NOT: Verimizde hangi değerlerin uç değerler olmaya aday olduğunu bulduktan sonra, o verileri geçici olarak veriden çıkartıp, acaba başka uç değer olabilecek değer var mıdır diye bakmak için yeniden kutu grafiği ile aynı şekilde uç değer analizi yapıp demin görünmeyen yeni uç değer çıktı mı diye kontrol etmeliyiz. Eğer yeni uç değer ortaya çıktıysa, onları da geçici olarak veriden çıkartıp aynı işlemi yeniden yapmalıyız. Merak etmeyin, bu sonsuza kadar sürmez, 1-2 defa maksimum yapmak gerekir.

spss tez analizi istatistik ödev yaptırma ücretli spss veri analizi danışmanlık

2) Z-Skoru ile SPSS Uç Değer Tespiti

SPSS, kutu grafiği ile uç değer analizi yapmadan biraz yetersiz kaldığı için, bir diğer uç değer tespit yöntemi olarak Z-Skoru üzerinden uç değer tespiti yapabiliriz. Bu yöntemde, katılımcıların bir ölçekte cevap verdiği bütün soruların değeri SPSS ile standardize edilip Z-Skoru denen standart değerlere dönüştürülür. Dönüştükten sonra, genellikle -3’ten küçük veya +3’ten büyük olan Z-Skoru’na sahip olan katılımcılar uç değer olarak yorumlanır.

SPSS’te nasıl yapıldığına bakalım. Bu örnekte, sayfanın hemen yukarısında demin Boxplot ile 2. örnekte incelediğim Sorumluluk değişkenine ait veriyi inceleyeceğim. Z-Skoru ile uç değer analizinin Boxplot ile uç değer analizinden farkını görmeniz açısından faydalı olacak.

Analyze -> Descriptive Statistics -> Explore

z skoru spss uç değer bulma analizi 1

 

Açılan Descriptives penceresinde, inceleyeceğimiz ölçeği Variable(s) kutusuna koyuyoruz. Sonra, “Save standardized values as variables” işaretliyoruz. Sonra, OK’a basıyoruz.

Variable(s) kutusuna birden fazla değişken de koyabilirsiniz. SPSS her değişken için birbirinden bağımsız ayrı işlem yapar.

z skoru spss uç değer bulma analizi 2

 

OK’a bastıktan sonra SPSS veri setimize dönüp Data View kısmını açıp inceleyelim. En sağ sütunda, yeni bir sütun açıldığını göreceğiz. Bu, Sorumluluk değişkenlerine ait değerlerin Z-Skorlarının göründüğü sütundur.

Bu sütunda, -3’ten küçük veya +3’ten büyük Z-Skoru’na sahip değerler var mı onu inceleyeceğiz. Bunlar uç değerlerdir.

z skoru spss uç değer bulma analizi 3

 

Sorumluluk değişkenindeki uç değerlere sahip katılımcıları demin Boxplot ile kontrol ettiğimizde, 16, 21 ve 43 numaralı katılımcıların uç değer olarak tespit edildiğini görmüştük. Bunların bir de Z-Skorlarını inceleyelim.

16 no’lu katılımcı Z-Skoru = -1.02324

21 no’lu katılımcı Z-Skoru = 1.18067

Bu değerlerin ikisi de -3’ten küçük veya 3’ten büyük değil. Demek ki, Z-Skoruna göre bu veriyi test ettiğimizde 16 ve 21 no’lu katılımcılar uç değerlere sahip değil gibi görünüyor. Bir testte uç değer çıkınca, diğer testte uç değer değil çıkınca ne yapmak gerektiğini bu sayfanın en sonunda “Ne Yapmalıyız?” alt başlığında detaylıca anlatacağım.

z skoru spss uç değer bulma analizi 4

 

Şimdi bir de deminki Boxplot analizinde “aşırı uç değer” çıkan 43 numaralı katılımcının Z-Skoru verisine bakalım. Bunun Z-Skoru değeri 7.14142 çıkmış. Bu 3’ten büyük olduğu için uç değer olarak kabul edebiliriz.

z skoru spss uç değer bulma analizi 5

 

Gördüğünüz gibi bir uç değer tespit yöntemiyle uç değer çıkan bazı veriler, başka uç değer tespit yöntemiyle uç değer çıkmayabiliyor. Farklı uç değer analizlerine göre farklı sonuç çıktığı durumlarda ne yapılması gerektiğini sayfanın devamında anlatıyor olacağım. Ama öncesinde buraya kadar gösterdiğim iki yöntemde olduğu gibi tek yerine, çok değişkenli uç değer tespit etmek için de bir yöntemden bahsedeceğim.

spss tez analizi istatistik ödev yaptırma ücretli spss veri analizi danışmanlık

3) Mahalanobis Distance ile SPSS Uç Değer Tespiti

UYARI! Bu yöntem sadece çoklu doğrusal regresyon, MANOVA vb. birden fazla bağımsız değişken bulunduran parametrik testlerden önce çok değişkenli uç değer olup olmadığını belirlemek için kullanılmalıdır.

Birden fazla ölçeğe verilen cevapların aynı anda test edildiği çoklu doğrusal regresyon, MANOVA gibi testlerde çok değişkenli uç değer olup olmadığına Mahalanobis Uzaklığı yoluyla bakmak en güçlü uç değer bulma yöntemidir. Çok değişkenli verileri analiz ederken, Mahalanobis uzaklığı bir gözlemin veri kümesindeki diğer gözlemlerden ne kadar olağandışı olduğunu ölçmek için kullanılır.

Büyük Mahalanobis uzaklığına sahip noktalar, potansiyel çok değişkenli aykırı değerler olarak kabul edilir. Mahalanobis uzaklığı ne kadar büyük olunca verinin uç değer sayıldığı veriye ve analize bağlı değişmektedir. Detaylı bir Mahalanobis uzaklığı yorumlama kılavuzu için bu web sitesindeki Mahalanobis uzaklığı hakkında yazdığım yazıya bakabilirsiniz.

Mahalanobis uzaklığı, bir noktanın veri bulutunun merkezinden ne kadar farklı olduğunu değerlendirir ve değişkenler arasındaki korelasyon yapısını dikkate alır. Çok değişkenli veri kümelerinde aykırı değerleri belirlemede değerli bir araçtır ve bir gözlemin geri kalan veriye göre ne kadar olağandışı olduğuna sağlam bir ölçü sunar.

SPSS ile Mahalanobis uzaklığı nasıl bulunuyor hemen bakalım. Mesela bu örnekte Rahatlık, Otoriterlik ve Sorumluluk değişkenlerinin birbirleriyle olan ilişkisini inceleyeceğiz. Regresyon analizini yapmadan önce SPSS’te Mahalanobis uzaklığı hesaplayıp uç değerlere sahip katılımcıları veriden çıkartmalıyız.

Analyze -> Regression -> Linear

spss uç değer mahalanobis 1

 

Mahalanobis uzaklığını açılan Linear Regression penceresi aracılığıyla hesaplayacağız. Bu örnekte Rahat, Otoriter, ve Sorumlu olma bağımsız değişkenlerinin, Agresif olma bağımlı değişkeni ile ilişkisini çoklu doğrusal regresyon analizi ile ölçmeye başlamadan önce Mahalanobis uzaklığı yoluyla uç değerleri bulmak istiyoruz. Rahat, Otoriter ve Sorumluluk değişkenlerinin üçünü birden aynı anda Independent(s) kutusuna atmamız yeterli. Dependent kutusuna da bağımlı değişkenimiz olan Agresif’i atıyoruz.

spss mahalanobis uzaklığı uç değer 1

 

“Save” butonuna basıyoruz. Açılan pencerede Distances bölümünden Mahalanobis seçeneğini işaretliyoruz.

spss uç değer mahalanobis 3

Continue ve OK’a basıyoruz.

SPSS veri setimizin Data View bölümüne tekrar bakarsak, en sağ sütunda yeni bir değişken açıldığını göreceğiz. Bu sütun her katılımcının incelediğimiz verileri üzerinden SPSS’in hesapladığı Mahalanobis uzaklığı değeridir.

spss mahalanobis uzaklığı uç değer 2

 

Şimdi, bu Mahalanobis uzaklıklarının her birinin SPSS’in içindeki özel bir Ki Kare fonksiyonuyla p değerlerini ortaya çıkartmamız gerekiyor.

Transform -> Compute Variable basıyoruz.

spss mahalanobis uzaklığı uç değer 3

 

Yine yeni bir sütun oluşturacağız. Açılan Compute Variable penceresinde, Target Variable bölümüne yeni oluşturacağımız değişkenin ismini yazıyoruz. İsim fark etmez, p değeri bakacağımız için p_value yazdım ben. Sonra,

” 1 – Ki Kare Fonksiyonu ” şeklinde bir ifade yazıyoruz. 1 ve eksi işaretini elle yazabilirsiniz. Ki Kare fonksiyonunu da sağ alt köşedeki Functions and Special Variables bölümünden bulup yukarı taşımak gerekiyor.

spss mahalanobis uzaklığı uç değer 4

 

Dikkat ettiyseniz fonksiyonu taşıdıktan sonra içinde iki tane ” ? ” işareti var. Soldaki soru işareti yerine, demin oluşturmuş olduğumuz yeni Mahalanobis uzaklığı değişkenini taşıyoruz. Sağdaki soru işareti yerine de, Mahalanobis uzaklığı bulurken kaç tane bağımsız değişken üzerinden buluyorsak o sayıyı yazıyoruz. Biz bu örnekte 3 bağımsız değişken ile hesaplama yaptığımız için 3 yazdım.

spss mahalanobis uzaklığı uç değer 5

 

SPSS veri setimizin Data View bölümüne tekrar bakarsak, en sağ sütunda yeni bir değişken açıldığını göreceğiz. Bu sütunda, her Mahalanobis uzaklığına karşılık gelen p değeri bulunmaktadır.

p değeri 0.01’den küçük katılımcılar, uç değer olarak kabul edilir. Bu kişilerin çoklu regresyon veya MANOVA tarzı analizler öncesi veriden çıkartılması uygundur.

spss mahalanobis uzaklığı uç değer 6

 

Aslında şimdi bütün katılımcıların Mahalanobis uzaklığı p değerlerine bakıp, 0.01’den küçük değere sahip olan var mı diye bakmak gerekiyor. Fakat bu örnekte kısa ve faydalı bir karşılaştırma olması açısından sadece demin boxplot kutu grafiği ve z-skoru ile incelediğimiz katılımcılar arasından uç değere sahip gibi görünen 16, 21, ve 43 numaralı katılımcıların Mahalanobis p değerlerini inceleyeceğim.

16 numaralı katılımcının Mahalanobis p değeri 0.3705. Gayet uygun, çok değişkenli uç değer gibi görünmüyor.

21 numaralı katılımcının Mahalanobis p değeri 0.0062. Bu, 0.01 p değeri eşiğinden küçük olduğu için, çok değişkenli uç değer olarak sayılabilir ve diğer uç değer analizlerinden bulduğumuz verilerle birlikte düşünülünce veriden çıkartılabilir.

spss mahalanobis uzaklığı uç değer 7

 

43 numaralı katılımcının Mahalanobis p değeri 0.0000… diye başlayan çok küçük bir sayı. Belli ki 0.01’den küçük. Bu değer, çok değişkenli bir uç değer olarak ele alınmalıdır ve veriden çıkartılması uygundur.

spss mahalanobis uzaklığı uç değer 8

 

Gördüğünüz gibi boxplot kutu grafiği ve z-skoru aracılığıyla tek değişkenli uç değerlere bakmakla Mahalanobis uzaklığı aracılığıyla çok değişkenli uç değerlere bakmak, katılımcıların hangilerinin uç değerlere sahip olabileceği hakkında biraz farklı sonuçlar verdi. Çoklu doğrusal regresyon veya MANOVA gibi birden çok bağımsız değişken içeren testler yapılmadan önce uç değer saptamak için bakılan Mahalanobis uzaklığı, uç değer saptamada diğer iki yöntemden (boxplot, z-score) daha güçlü bir sinyaldir.

spss tez analizi istatistik ödev yaptırma ücretli spss veri analizi danışmanlık

Verimizde Uç Değerleri Bulduktan Sonra Ne Yapmalıyız?

Verimizi analiz etmeden önce verinin içinde uç değerler var mı yok mu diye kutu grafiği veya z-skoru gibi yöntemlerle baktık ve birkaç tane katılımcının uç değere sahip olduğu yönünde bazı bulgular bulduk. Peki bu uç değerleri kesinlikle verimizden çıkartmalı mıyız? Cevap: Hayır.

Bir istatistik analizi öncesinde uç değerlerin veriden çıkartılıp çıkartılmayacağının net kuralları yoktur. Buna doğru karar verebilmek için, analizi yapan kişinin öncelikle analiz ettiği konuya hakim olması gerekir. Böylece hangi değerlerin analiz edilecek veride bulunmaması gereken değerler olduğunu sağduyulu bir şekilde tespit edebilir.

Önce veride uç değerlerin görülmesinin potansiyel sebeplerini anlayıp sonra uç değerleri veriden silip silmeme hakkında en doğru kararı nasıl veririz ona bakalım.

Uç Değerlerin Sebepleri

Bir veride bir değerin uç değer olarak görünmesinin çeşitli sebepleri olabilir. Bunlardan en yaygın olanları;

  • Katılımcının anket sorularını okumadan işaretlemesi,
  • Katılımcının sorulara gerçek cevaplar vermesi fakat bu cevapların diğer insanların cevaplarından aşırı farklı olması,
  • Hatalı veri girişi (mesela SPSS’e veri girişi yapılırken 5 yazacağına 55 yazılmış olabilir yanlışlıkla)

Uç Değerleri Çıkartmak / Çıkartmamak

Ee peki uç değerleri hangi durumlarda veriden çıkartmalıyız?? Mesela bir katılımcı hem kutu grafiğinde hem de z-skoruna göre uç değer olarak çıktı. O zaman uç değer olduğuna yönelik kuvvetli bir kanıt vardır. Bu yine de bu katılımcıyı veriden çıkartmamızı her zaman gerektirmez. Bakmamız gereken diğer noktalar: acaba veri girişi hatalı mı yapıldı yoksa doğru yazılmış gibi mi görünüyor? Eğer doğru gibi görünüyor ise katılımcı acaba incelenen ankette bütün soruları okumadan aynı mı işaretlemiş? Eğer soruları okumuş gibi görünüyor ise, cevaplar verinin ortalama değerlerini önemli şekilde değiştirecek kadar uçlarda mı yoksa sadece biraz mı uçlarda?

Veride gördüğümüz bütün uç değerleri gözümüz kapalı çıkartmamalıyız, çünkü bu uç değerlere sahip katılımcılar da gerçek dünyada toplumun içinde bulunan birer insandır. Eğer bu katılımcıların gerçekten samimi olarak anketimizi cevapladıklarını ve cevaplarının uç değerlere sahip olduğunu bulduysak, bu değerleri verimizde tutmak, yaptığımız analizin gerçek dünyadaki durumu temsil etme miktarını arttıracaktır.

Eğer uç değerleri verimizden çıkartmamaya karar verdiysek, verimizle ANOVA, lineer korelasyon vb parametrik testler yapmak yerine parametrik olmayan Kruskal-Wallis testi, Spearman korelasyon gibi alternatif testleri uygulamayı tercih edebiliriz. Ya da eğer uygulayacağımız test eğer uç değerlerin varlığına dayanıklı bir test ise hem uç değerleri veride tutup hem parametrik test uygulamayı seçebiliriz, sorun olmayabilir.

Bir uç değer analizine göre uç değere sahip olduğunu gözlemlediğimiz bir katılımcının verdiği cevapların sallama mı olduğu yoksa samimi cevaplar verdiğini anlamanın bir yolu da, o katılımcının anketimizdeki diğer ölçeklerin sorularına verdiği cevapların da uç değer çıkıp çıkmayacağıdır. Bu durumda katılımcının bütün ölçekler için ayrı ayrı uç değere sahip olup olmadığına bakılmalıdır. Eğer birçok ölçeğe verdiği cevaplar uç değer ise, bu katılımcı cevapları rastgele işaretlemiş olabilir, gerçek bir kişiyi yansıtmadığı için veriden çıkartmakta fayda vardır.

Çoklu regresyon veya MANOVA gibi multivariate analizler yapıyorsanız, Mahalanobis uzaklığına bakmak en öncelikli uç değer tespit yöntemi olmalıdır. Demin de anlattığım gibi diğer uç değer tespit yöntemleriyle birleştirilerek yorumlanması en doğru kararı vermenize yardımcı olur.

 

SPSS’te uç değer analizi, uç değer tespiti ve yorumlama hakkında yazdığım yazı bu kadardı. En uzun yazılarımdan biri oldu. Bunun sebebi, siyah-beyaz keskin kurallarla belirli bir konu olmaması. Uç değerler bulunduktan sonra onlarla ne yapılacağı hakkındaki karar analiz edilen verinin çeşidi, yapılacak analizin türü, uç değerin diğer değerlere aykırı olma miktarı gibi farklı farklı bir sürü sinyalin bir birleşimi sonucu verilmelidir. Ezbere analiz yapan amatör bir istatistikçiden uzman bir istatistikçiyi ayıran en büyük nokta bu gibi siyah-beyaz olmayan durumları yorumlama becerisidir. Okuduğunuz için teşekkürler.

 

Referanslar:

Field, A. (2018). Discovering statistics using IBM SPSS statistics: North American edition. SAGE.

Hoaglin, D.C., & Iglewicz, B. (1987). Fine-Tuning Some Resistant Rules for Outlier Labeling. Journal of the American Statistical Association, 82, 1147-1149.

 

spss tez analizi istatistik ödev yaptırma ücretli spss veri analizi danışmanlık

Deniz Şavkay hakkında 145 makale
Lisans eğitimimi Boğaziçi Üniversitesi Moleküler Biyoloji ve Genetik bölümünde, Yüksek Lisans eğitimimi Polonya'daki SWPS Üniversitesi Psikoloji bölümünde tamamladım. Davranış bilimlerine ilgi duyuyorum ve eğitim hayatımı bunun üzerine şekillendirdim. SPSS ile istatistik analizi yapmayı çok seviyorum. SPSS analizleriyle insan davranışındaki kalıpları keşfetmek ve insan davranışı hakkında iç görü sahibi olmak beni heyecanlandırıyor.

İlk yorum yapan olun

Bir yanıt bırakın

E-posta hesabınız yayımlanmayacak.


*