İçindekiler
Tanımlayıcı İstatistik Nedir?
Tanımlayıcı istatistikler, verilerin özetlenmesi ve basitçe ifade edilmesi için kullanılır. Bu istatistikler, veri kümesinin genel özelliklerini tanımlamak için kullanılır ve genellikle ham verileri daha anlaşılır hale getirir.
Tanımlayıcı istatistikler, veri analizinin ilk adımı olarak kabul edilir ve genellikle daha karmaşık analitik tekniklere geçmeden önce uygulanır. İş, ekonomi, sağlık bilimleri, sosyal bilimler ve daha birçok alanda temel bir araç olarak kullanılırlar.
Tanımlayıcı istatistiklerin bazı örnekleri şunlardır: Ortalama, medyan, mod, standart sapma, varyans, çarpıklık, basıklık, aralık, çeyrekler arası aralık, minimum ve maksimum değerler…
Tanımlayıcı istatistikler, veri setleri hakkında hızlı ve genel bilgiler sağlamak için kullanılır. Bu ölçüler sayesinde, araştırmacılar veri setinin genel yapısını ve özelliklerini anlar, verilerdeki eğilimleri ve potansiyel aykırı değerleri gözlemler, veri setinin dağılımını değerlendirir ve araştırma veya analizleri için genel bir ön hazırlık yapmış olurlar.
- Merkezi Eğilim Ölçüleri:
- Ortalama (Mean): Verilerin aritmetik ortalamasıdır. Veri setindeki tüm değerlerin toplamının, değer sayısına bölünmesiyle hesaplanır.
- Medyan (Median): Veri seti küçükten büyüğe sıralandığında, orta noktada yer alan değerdir.
- Mod (Mode): Veri setinde en sık rastlanan değerdir.
- Dağılım Ölçüleri:
- Standart Sapma (Standard Deviation): Verilerin ortalamadan ne kadar sapma gösterdiğinin bir ölçüsüdür.
- Varyans (Variance): Standart sapmanın karesidir ve verilerin dağılımını ölçer.
- Aralık (Range): En büyük ve en küçük değerler arasındaki farktır.
- Çeyrekler Açıklığı: Verilerin yüzde 25’lik (Q1) ve yüzde 75’lik (Q3) çeyrekleri arasındaki farktır.
Tanımlayıcı vs. Betimleyici İstatistik Farkı
Tanımlayıcı istatistikler, verilerin özetlenmesi ve basitçe ifade edilmesi için kullanılır. Bu istatistikler, veri kümesinin genel özelliklerini tanımlamak için kullanılır ve genellikle ham verileri daha anlaşılır hale getirme amaçlıdır.
Betimleyici istatistikler, bir örneklemden elde edilen verilerle bir evren hakkında genellemeler yapmayı sağlar. Bu istatistikler, hipotez testleri, regresyon analizleri ve diğer istatistiksel testler gibi yöntemlerle gerçekleştirilir. Betimleyici istatistiklerin bazı örnekleri şunlardır: t-testi, ANOVA, korelasyon, regresyon, ki-kare analizi…
SPSS ile Tanımlayıcı İstatistik Tablosu Oluşturma
SPSS’te, tanımlayıcı istatistik tablosu oluşturmak oldukça kolaydır. Bütün tanımlayıcı istatistikler, tek bir pencereden bulunabilir.
Analyze -> Descriptive Statistics -> Frequencies butonlarına basıyoruz.
Açılan pencerede, tanımlayıcı istatistiklerini görmek istediğimiz değişkeni (veya değişkenleri) Variable(s) kutusuna alıyoruz.
“Statistics” butonuna basıyoruz. Merak ettiğimiz tanımlayıcı istatistiklerin yanlarındaki kutucukları seçip, “Continue”ya basıyoruz. Ben bu örnekte en sık kullanılan tanımlayıcı istatistikleri seçtim.
“OK”a bastıktan sonra, SPSS bize tanımlayıcı istatistikler tablosunu verecektir.
SPSS Tanımlayıcı İstatistik Tablosu Yorumlama
SPSS’in verdiği “Statistics” başlıklı tabloyu okuyarak, tanımlayıcı istatistikleri öğrenebiliriz. Buradaki değerlerin nasıl yorumlanması gerektiğini aşağıda anlatıp yazıyı bitiriyorum.
- Ortalama (Mean): Veri setindeki tüm değerlerin toplamının, veri sayısına bölünmesiyle elde edilen ortalama değerdir.
- Medyan (Median): Veri setindeki değerler küçükten büyüğe sıralandığında ortada bulunan değer medyan değeri olur.
- Mod (Mode): Veri setindeki en sık görülen veri değeridir. En çok katılımcı hangi değere sahipse o değer mod olur.
- Standart Sapma (Std. Deviation): Veri değerlerinin ortalamadan ne kadar saptığını ölçer. Küçük standart sapma değerleri, verilerin birbirine yakın bir aralıkta dağıldığını anlatırken, büyük standart sapma değerleri, verilerin daha geniş bir değer aralığında dağılım gösterdiğini anlatır.
- Varyans (Variance): Veri değerlerinin ortalamadan ne kadar farklılaştığını ölçer, standart sapmanın karesidir.
- Çarpıklık (Skewness): Çarpıklık, bir veri setinin simetrik olup olmadığını belirler. Çarpıklığın pozitif ya da negatif olarak yüksek olması, verinin düşük ya da yüksek değerler üzerine çok yoğunlaştığını gösterir.
- Basıklık (Kurtosis): Basıklık, bir veri setinin tepe noktalarının sivri mi yoksa düze yakın mı olduğunu gösterir. Yüksek basıklık değerleri verilerin orta değerine sahip katılımcı sayısının fazla olduğunu, düşük basıklık değerleri ise yaklaşık her değerde eşit sayıda katılımcının bulunduğunu gösterir.
- Aralık (Range): Veri setindeki en yüksek değer ile en düşük değer arasındaki farktır. Yüksek fark, maksimum ve minimum değerler arasının çok geniş olduğunu gösterir.
- Çeyrekler (Quartiles): Veri setini dört eşit parçaya bölmeye yarar.
- Çeyrekler Arası Aralık (Interquartile Range – IQR): Veri setinin ortanca değerinin etrafındaki yayılımını ölçer ve genellikle veri setindeki ortadaki %50’lik dilimi temsil eder. Bu orta %50’lik dilimin en büyük sayısından en küçük sayısını çıkartınca bulunan değer çeyrekler açıklığı olur. Bu, verinin dağılımını, tüm değerlerin aralığından (range) daha isabetli olarak göstermeye yarar.
- Minimum ve Maksimum Değerler (Minimum and Maximum Values): Veri setindeki en küçük ve en büyük değerlerdir.
SPSS ile tanımlayıcı istatistiklerin analizi ve yorumlanmasının ana hatları bu kadardı. Artık siz de kendi araştırmanızda tanımlayıcı istatistik konusunda sorun yaşamayacaksınız.
Bir yanıt bırakın