
İçindekiler
Geçerlik Nedir?
Geçerlik (validity), istatistiksel analizde bir ölçüm aracının veya testin gerçekten ölçmek istediği şeyi ne kadar doğru ölçtüğünü ifade eden temel bir kavramdır. Bir araştırmada kullanılan ölçek, test veya ölçüm yöntemi, hedeflenen kavramı doğru şekilde ölçmüyorsa elde edilen sonuçlar yanıltıcı olabilir. Geçerlik, farklı türlere ayrılır: iç geçerlik, bir araştırmanın değişkenler arasındaki nedensel ilişkiyi doğru bir şekilde yansıtıp yansıtmadığını değerlendirirken; dış geçerlik, elde edilen sonuçların farklı örneklemler veya durumlar için genellenebilirliğini inceler.
Bunların da alt kategorileri vardır (aşağıda daha uzun bahsediyorum). Örneğin yapı geçerliği, bir ölçeğin ölçmek istediği teorik yapıyı ne kadar iyi ölçtüğünü belirlerken; içerik geçerliği, ölçeğin ilgili kavramın tüm boyutlarını kapsayıp kapsamadığını değerlendirir. Kriter geçerliği ise ölçüm aracının, benzer geçerli bir ölçüt ile ne kadar uyumlu olduğunu gösterir.
Neden Önemlidir?
Geçerlik, bilimsel araştırmalarda elde edilen sonuçların doğruluğu açısından kritik bir öneme sahiptir. Geçerli olmayan bir ölçek veya test kullanıldığında, araştırmanın hipotezlerini test etmenin anlamı olmayabilir çünkü analizlerde gerçeği yansıtmayan sonuçlara ulaşılacaktır. Geçerlik analizi yapılmadan elde edilen bulguların bilimsel olarak güvenilir kabul edilmesi zor olduğundan, her araştırmacının çalışmasında geçerli ve güvenilir ölçüm araçları kullanması büyük önem taşır. Ciddi yapılan bilimsel bir çalışmanın hipotezleri test edilmeden önce, çalışmada kullanılan ölçüm araçlarının geçerlik analizleri yapılmalı ve geçerliğin varlığı uygun yöntemlerle doğrulanmalıdır. SPSS AMOS gibi istatistiksel yazılımlarla faktör analizi gibi yöntemler kullanılarak yapı geçerliği test edilebilir.
Geçerlik Analizi Yapma
SPSS Yardımı İstatistik Merkezi olarak, ölçeğinizin geçerlik ve güvenirlik analizlerini kapsamlı bir şekilde gerçekleştiriyoruz. Analiz sonuçlarını akademik formatta raporluyoruz. Geçerlik analizi sürecinde en sık yaptığımız analizler aşağıdaki gibidir:
✅ Doğrulayıcı Faktör Analizi (DFA) uygulanarak model uyumu test edilir.
✅ Ortalama Açıklanan Varyans (AVE) hesaplanarak yakınsak geçerlik değerlendirilir.
✅ Fornell-Larcker Kriteri ile ayrışım geçerliği analizi yapılır.
✅ Heterotrait-Monotrait Oranı (HTMT) hesaplanarak ölçeğin ayrışım geçerliği doğrulanır.
✅ Maksimum Paylaşılan Varyans (MSV) ve Ortalama Paylaşılan Varyans (ASV) hesaplanarak ayrışım geçerliği değerlendirilir.
✅ Bulgular ayrıntılı bir şekilde raporlanarak, istatistiksel sonuçlar yorumlanır.
Eğer geçerlik değerlerinden bazıları düşük çıktıysa, geçerlik seviyesi arttırma hizmetimiz de mevcuttur. ✅
Araştırmanızda kullandığınız ölçeğinizin faktör yapısını doğrulamak ve geçerlik analizlerini profesyonel bir şekilde yaptırmak istiyorsanız, bizimle iletişime geçebilirsiniz. Bilimsel olarak sağlam veriler elde etmenize yardımcı olmak için buradayız!
Detaylı bilgi ve örnek rapor almak için lütfen bizimle iletişime geçiniz.
Geçerlik Türleri
Aşağıda en sık karşımıza çıkan iç ve dış geçerlik türlerini kısaca listeleyip özetledim.
Yapı Geçerliği (Construct Validity)
Ölçülmek istenen kuramsal yapının gerçekten ölçülüp ölçülmediğini inceler. Yapı geçerliğini test etmek için genellikle Doğrulayıcı Faktör Analizi (DFA) ve ardından yapılan bazı ek analiz yöntemleri kullanılır. Yapı geçerliğinin 2 alt kategorisi vardır. Bunlar birleşim geçerliği ve ayrışım geçerliğidir.
- Birleşim Geçerliği (Convergent Validity):
Aynı yapıyı ölçmesi beklenen farklı ölçme araçları arasındaki yüksek korelasyonu ifade eder. Genellikle Doğrulayıcı Faktör Analizi (DFA) sırasında AVE (Average Variance Extracted) yani Ortalama Açıklanan Varyans hesaplanarak incelenir.
Bu istatistik analizi çalışmalarında çok sık kullanıldığı için aşağıda kendisine ayrı bir bölüm açıp daha uzun anlattım. - Ayrışım Geçerliği (Discriminant Validity):
Bir ölçme aracının, teorik olarak farklı olması beklenen yapılardan gerçekten ayrışıp ayrışmadığını test eder. Yapılar arasında düşük korelasyon beklenir ve Doğrulayıcı Faktör Analizi yapıldıktan sonra Fornell-Larcker kriteri, heterotrait-monotrait ratio (HTMT) ve/veya MSV & ASV değerleri yorumlanarak incelenir.
Bu da istatistik analizi çalışmalarında çok sık kullanıldığı için aşağıda kendisine ayrı bir bölüm açıp daha uzun anlattım.
İçerik Geçerliği (Content Validity)
Bir ölçme aracının tümüyle ölçmek istediği alanı ne kadar kapsadığını ifade eder. Örneğin, bir sınavın tüm konuları yeterince kapsayıp kapsamadığını değerlendirmek için içerik geçerliği göz önünde bulundurulur.
Kriter Geçerliği (Criterion Validity)
Ölçme aracından elde edilen sonuçlarla, harici bir “kriter” veya “altın standart” arasında korelasyon aranır. Örneğin, çalışan performansını ölçen bir testin, çalışanların gerçek performans verileriyle yüksek korelasyon göstermesi beklenir.
Yüzey Geçerliği (Face Validity)
Bir ölçme aracının, ilgili alan uzmanları ve test edilen bireyler tarafından ölçmesi gereken şeyi ölçüyor gibi algılanıp algılanmadığını ifade eder. Bu daha çok subjektif bir değerlendirme olup, genellikle uzman görüşleriyle belirlenir.
Eşzamanlı Geçerlik (Concurrent Validity)
Bir ölçme aracının, aynı zamanda ölçülen başka bir geçerli testle ne kadar uyumlu olduğunu gösterir. Korelasyon analizi ile incelenir.
Çapraz Geçerlik (Cross-Validation)
Ölçme aracının farklı örneklemler üzerinde tekrar test edilerek aynı sonuçları verip vermediğini değerlendirmek için kullanılır. Veri setleri rastgele ikiye bölünerek modelin farklı gruplarda tutarlı olup olmadığı kontrol edilir.
Ekolojik Geçerlik (Ecological Validity)
Bir çalışmanın veya ölçme aracının, gerçek hayattaki durumları ne kadar iyi yansıttığını ifade eder. Deneysel psikoloji ve davranış bilimlerinde sıkça ele alınır.
Kültürel Geçerlik (Cultural Validity)
Bir ölçeğin veya testin farklı kültürlerde aynı anlamı taşıyıp taşımadığını belirler. Kültürler arası araştırmalarda adaptasyon süreçlerinde dikkate alınır.
Yordayıcı Geçerlik (Predictive Validity)
Bir ölçme aracının gelecekteki bir davranışı veya sonucu ne kadar iyi tahmin ettiğini ifade eder. Örneğin, bir üniversite giriş sınavının öğrencilerin akademik başarısını ne ölçüde öngördüğünü belirlemek için regresyon analizi kullanılabilir.
Birleşim Geçerliği (Convergent Validity)
- Aynı yapıyı ölçmesi beklenen farklı ölçme araçları arasında yüksek korelasyon olmasını gerektirir.
- Genellikle Doğrulayıcı Faktör Analizi (DFA) kullanılarak değerlendirilir.
- AVE (Average Variance Extracted) değeri 0.50’nin üzerinde olmalıdır (yapının toplam varyansının en az %50’sinin ortak faktörler tarafından açıklanması beklenir).
Birleşim Geçerliği (Convergent Validity), bir ölçeğin veya testin, ölçmeyi amaçladığı teorik yapı ile gerçekten uyumlu olup olmadığını belirlemek için kullanılan popüler bir geçerlik kriteridir. Ölçeklerdeki aynı kavramı yapıyı ölçmesi beklenen farklı maddeler arasında yüksek korelasyon olması beklenir, çünkü bu durum, ölçeğin maddelerinin aynı kavramsal çerçeve içinde tutarlı bir şekilde çalıştığını gösterir. Örneğin, bir akademik başarı ölçeğinde akademik başarıyı ölçen birden fazla maddenin birbirleriyle yüksek korelasyon göstermesi, ölçeğin her maddesinin aynı yapıyı (akademik başarıyı) ölçtüğünü doğrular. Eğer bu korelasyon düşükse, maddelerden en az 1 tanesi hedeflenen yapıyı yeterince iyi ölçmüyor olabilir. Bu yüzden birleşim geçerliği, özellikle ölçek kullanılan psikometrik çalışmalarda yani anket analizlerinde çok önemlidir.
Birleşim geçerliği, doğrulayıcı faktör analizinden (DFA) elde edilen faktör yükleri ve Ortalama Açıklanan Varyans (AVE = Average Variance Extracted) değeri kullanılarak hesaplanır. İlk olarak, DFA sonuçlarında her faktöre ait madde yükleri incelenir. Her faktöre ait madde yüklerinin kareleri alınarak toplanır ve madde sayısına bölünerek AVE değeri hesaplanır. AVE değeri 0.50’nin üzerinde olduğunda, faktörün toplam varyansının en az %50’sinin ortak faktörler tarafından açıklandığı kabul edilir ve birleşim geçerliğinin yeterli olduğu söylenebilir.
Ayrışım Geçerliği (Discriminant Validity)
- Bir ölçme aracının, teorik olarak farklı yapılardan gerçekten ayrışıp ayrışmadığını test eder.
- Ölçekte yer alan faktörler birbirinden bağımsız mı yoksa fazla örtüşüyor mu bunu değerlendirir.
- Fornell-Larcker kriteri: Bir faktörün AVE’sinin karekökü, diğer faktörlerle olan korelasyonlardan büyük olmalıdır.
- HTMT (Heterotrait-Monotrait Ratio): Kesişim değerinin 0.85 veya 0.90’ın altında olması beklenir.
- MSV & ASV: Maksimum Paylaşılan Varyans (MSV) ve Ortalama Paylaşılan Varyans (ASV) değerleri, AVE değerinden küçük olmalıdır.
Ayrışım Geçerliği (Discriminant Validity), bir ölçüm aracının teorik olarak farklı yapılardan gerçekten ayrışıp ayrışmadığını belirlemek için kullanılan önemli bir geçerlik türüdür. Bir araştırmada kullanılan ölçek veya test, farklı kavramları ölçmeye çalışıyorsa, bu kavramların birbiriyle fazla örtüşmemesi beklenir. Ayrışım geçerliği, özellikle birbirine benzer yapılar arasında net bir ayrım olduğunu kanıtlamak için gereklidir. Örneğin, anksiyete ve depresyon gibi birbirine yakın kavramları ölçen iki farklı ölçek geliştirilmişse, bu ölçeklerin birbirinden bağımsız yapılar olduğunu göstermek için ayrışım geçerliği değerlendirilmelidir.
Bu değerlendirme sırasında kullanılan en yaygın yöntemlerden biri Fornell-Larcker Kriteri’dir. Fornell-Larcker kriterine göre, bir faktörün Ortalama Açıklanan Varyans (AVE) değerinin karekökü, diğer faktörlerle olan korelasyon değerlerinden büyük olmalıdır. Bu durum, ilgili faktörün, diğer faktörlerden daha fazla kendi yapısını yansıttığını gösterir. Eğer AVE’nin karekökü, diğer faktörlerle olan korelasyon değerlerinden küçükse, ölçekteki faktörler arasında fazla örtüşme olduğu düşünülebilir ve ayrışım geçerliğinin zayıf olduğu sonucuna varılır. Bu nedenle, Fornell-Larcker kriteri, faktörlerin birbirinden net bir şekilde ayrıldığını göstermek için kritik bir araçtır.
Bir başka popüler yöntem ise Heterotrait-Monotrait Ratio (HTMT) yöntemidir. HTMT, iki farklı yapıyı ölçen maddeler arasındaki ortalama korelasyonu hesaplar. HTMT değeri, ölçekteki farklı yapılar arasındaki ayrışımı gösterir ve genel kabul gören eşik değerleri 0.85 veya 0.90’dır. Eğer HTMT değeri bu eşik değerlerin altında ise, faktörlerin birbirinden yeterince ayrıştığı ve ölçeğin ayrışım geçerliğinin yüksek olduğu kabul edilir. HTMT değeri eşik değerlerin üzerinde ise, bu durum, faktörler arasında fazla örtüşme olduğuna işaret eder ve ölçeğin ayrışım geçerliğinin zayıf olduğunu gösterir.
Maksimum Paylaşılan Varyans (MSV = Maximum Shared Variance) ve Ortalama Paylaşılan Varyans (ASV = Average Shared Variance) da ayrışım geçerliğini değerlendirmek için kullanılan önemli kriterlerdir. Bunları da ekleyerek ayrışım geçerliği değerlendirmesini daha kapsamlı hale getirebiliriz.
- Maksimum Paylaşılan Varyans (MSV): Bir faktörün herhangi bir başka faktörle olan en yüksek korelasyonunun karesi alınarak hesaplanır. MSV değeri, AVE değerinden küçük olmalıdır. Eğer MSV > AVE ise, ölçeğin farklı faktörleri aşırı derecede örtüşüyor olabilir ve bu da ayrışım geçerliğinin sağlanmadığını gösterir.
- Ortalama Paylaşılan Varyans (ASV): Ölçekte yer alan tüm faktörler arasındaki korelasyonların kareleri alınarak ortalaması hesaplanır. ASV değeri de AVE’den küçük olmalıdır. Eğer ASV > AVE ise, ölçeğin faktörleri arasında yüksek bir örtüşme olduğu düşünülebilir ve ayrışım geçerliğinin sağlanmadığı yorumu yapılır.
Bir yanıt bırakın