Kaplan-Meier Analizi ve Log Rank Testi (SPSS)

Kaplan-Meier Log Rank

Bu yazıda, Kaplan-Meier analizi ve log-rank testi kavramlarını açıklayarak, SPSS’te bu ikisini birleştirerek nasıl sağkalım analizi (survival analysis) yapıldığını anlatacağım. Kaplan-Meier eğrisi, bir zaman diliminde bir olayın gerçekleşme olasılığını tahmin etmek için kullanılırken, log-rank testi, iki farklı grubun kendi Kaplan-Meier eğrileri arasında istatistiksel olarak anlamlı bir fark olup olmadığını belirlemek için kullanılır. Bu yazıda, SPSS’te Kaplan-Meier eğrisi oluşturarak log-rank testinin nasıl yapıldığını adım adım gösterecek ve sonuçların nasıl yorumlanması gerektiğini anlatacağım.

spss analizi ücretli danışmanlık tanışma indirimi veri tablo rapor iletişim

spss tez analizi istatistik ödev yaptırma ücretli spss veri analizi danışmanlık

Kaplan-Meier Analizi Nedir?

“Kaplan-Meier Analizi”, bir “Kaplan-Meier Eğrisi” oluşturarak belirli bir zaman dilimi içinde, bir olayın gerçekleşme olasılığını tahmin etmek için kullanılan bir istatistiksel yöntemdir. Örneğin bir hasta kişilerin beklenen hayatta kalma süresini tahmin etmek için kullanılır. Burada gerçekleşme olasılığı tahmin edilen olay, ölüm’dür. Kaplan-Meier Analizi, genellikle Sağlık alanında analizlerde kullanılmaktadır.

Kaplan-Meier analizi, veri setlerindeki verileri kullanarak zamanla olayların olasılıklarını tahmin etmek için bir hayatta kalma fonksiyonu oluşturur. Örneğin insanların belirli bir süre içinde kansere yakalanma oranlarını tahmin etmek için Kaplan-Meier Analizi yapılabilir.

Kaplan-Meier Analizi sonucu, bir Kaplan-Meier Eğrisi oluşturulur. Bu eğri aşağıdaki gibi görünmektedir.

kaplan meier analizi log rank testi 1

Log Rank Testi Nedir?

Log-Rank Testi, farklı gruplara ait birden fazla Kaplan-Meier eğrisinin arasında istatistiksel olarak anlamlı bir farklılık olup olmadığını bulmak için kullanılan istatistiksel testtir. Bu test, mesela sigara içen ve içmeyen insanların zamana göre kansere yakalanma oranlarını karşılaştırır ve bu gruplar arasında istatistiksel olarak anlamlı bir farklılık olup olmadığını değerlendirir.

Bu test, gruplar arasında, olayların gerçekleşme ihtimallerinin dağılımında istatistiksel olarak anlamlı bir fark olup olmadığını belirlemek için kullanılır. Eğer test sonucunda elde edilen p-değeri 0.05 anlamlılık düzeyinin altındaysa gruplar arasında istatistiksel olarak anlamlı bir fark olduğu sonucuna varılır ve grupların hayatta kalma süreleri arasında bir ilişki olduğu düşünülür.

Log Rank Testi ile 2 tane Kaplan-Meier eğrisi karşılaştırılabilir. 2 tane Kaplan-Meier eğrisinin karşılaştırıldığı bir Log-Rank Testi’nin grafiği aşağıdaki gibi görünür.

kaplan meier analizi log rank testi 2

 

spss tez analizi istatistik ödev yaptırma ücretli spss veri analizi danışmanlık

SPSS’te Kaplan-Meier Analizi ile Log-Rank Testi Nasıl Yapılır?

SPSS’te, iki grup için Kaplan-Meier eğrileri oluşturup bu eğrilerin şekli arasında istatistiksel olarak anlamlı bir fark var mı diye görmek için log rank testi yapmak oldukça kolaydır.

Öncelikle, analize başlamadan önce analiz edeceğimiz veriyi tanıyalım. Bu örnekte, Kadın ve Erkek cinsiyetlerindeki kişilerden oluşan bir grup var. Bu kişilerde farklı Cinsiyet’lerin, 30 Hafta süren bir yarışmada zamana bağlı elenme miktarları arasında istatistiksel olarak anlamlı bir fark var mı diye bakacağız.

SPSS veri setimizin Data View bölümünde her satırda farklı bir katılımcıya ait bilgiler bulunmaktadır. Kaplan-Meier analizi ile Log-Rank testi yapılan verilerde 3 önemli değişken vardır:

  • Zaman (mesela 30 haftalık bir gözlem ise 1’den 30’a kadar sayılar bulunur bu sütunda)
  • Olay (beklenen olayın gerçekleşmesi ve gerçekleşmemesi için 1 ve 2 gibi iki tane farklı sayı kullanılır)
  • Grup (mesela log rank testi ile cinsiyetleri karşılaştıracaksak erkek-kadın olduğu bu sütunda belirtilir)

Hafta sütununda, o yarışmacının en son gözleminin hangi hafta yapıldığını görürüz (elenen bir yarışmacı için elendiği hafta son gözlem yapılan haftadır). Olay sütununda, 1 değeri olayın gerçekleştiğini yani elendiğini, 0 değeri ise olayın gerçekleşmediğini yani elenmediğini göstermektedir. Grup sütununda ise yarışmacının Cinsiyet’ini görürüz.

O zaman verideki satırlar şöyle okunabilir: 1. satırdaki 1 no’lu yarışmacı kadın’dır, 1. haftada elenmiştir. 4 no’lu yarışmacı da kadın’dır, 3. haftada elenmiştir. 19 no’lu yarışmacı kadın’dır, 30. haftanın sonunda elenmemiştir. 30. hafta’nın sonunda yarışma bittiği için son gözlem 30. haftada yapılmıştır. Yarışmacı elenmediği için, Olay gerçekleşmemiş oldu, bu yüzden Olay sütunundaki değer 0’dır.

Genelde Olay sütunundaki değer 0 olunca son gözlem zamanı da deneyin son haftası olur. Ama bazı durumlarda, deneydeki katılımcı herhangi bir sebepten dolayı deneyden ayrılmış vb. olabilir, bu durumda Hafta sütununda mesela 8 yazarken Olay sütununda 0 yazılı olabilir. Bu analize bir engel değildir.

kaplan meier analizi log rank testi 0

 

SPSS ile Log Rank Testi’ne başlamak için,

Analyze -> Survival -> Kaplan-Meier

kaplan meier analizi log rank testi 3

 

Zaman dilimi değişkenimizi Time kutusuna, Olay’ın gerçekleşip gerçekleşmediğini Status kutusuna, hangi değişkenin gruplarını karşılaştırmak istediğimizi de Factor kutusuna atmalıyız.

kaplan meier analizi log rank testi 4

 

Status’a attığımız değişkene tıklayıp, “Define Event” butonuna basarak, beklenen olayın gerçekleşmesi veri setinde hangi sayı ile kodlandıysa, buraya o yazılmalıdır. Bizim verimizde elenme’nin gerçekleşmesini 1 ile kodlamıştık.

kaplan meier analizi log rank testi 5

 

“Options” butonuna basarak açacağımız pencerede Plots başlığı altında Survival’ı işaretlersek, iki cinsiyet için ayrı ayrı oluşturulacak Kaplan-Meier eğrilerini görebiliriz.

kaplan meier analizi log rank testi 6

 

“Compare Factor” butonuna basarak Test Statistics olarak Log Rank’i işaretlersek, iki cinsiyet için ayrı ayrı oluşturulacak olan Kaplan-Meier eğrilerinin arasında istatistiksel olarak anlamlı bir fark var mı diye görmüş olacağız.

Test Statistics bölümündeki testlerin işleyiş şekli arasında fark vardır, bu işleyiş farkı test sonucu elde edeceğimiz p değerlerini önemli ölçüde değiştirebilmektedir.

  • Log Rank, her zaman noktasının önemini eşit olarak sayar.
  • Breslow, önce gerçekleşen olayların önemini daha yüksek olarak sayar.
  • Tarone-Ware de Breslow gibi erken gerçekleşen olayların önemini daha yüksek sayar, ek olarak, erken gerçekleşen olay sayısı az olduğunda Log Rank’ten daha güçlü bir testtir.

Bunlardan en çok kullanılan test istatistiği Log Rank’tir bu yüzden bu örnekte yalnızca bunu kullanacağız, ama siz kendi örneğinize göre testlerin üçünü de işaretleyip aralarındaki farka bakıp araştırdığınız şeydeki hipotezinizi ve analiz sonucu göreceğiniz Kaplan-Meier grafiklerini birlikte düşünerek, bu testlerden hangisini kullanarak p değerini bulmanız gerektiği hakkında karar verebilirsiniz.

kaplan meier analizi log rank testi 7

OK’a basıp analizi başlatabiliriz, her şey hazır.

spss tez analizi istatistik ödev yaptırma ücretli spss veri analizi danışmanlık

Kaplan-Meier Analizi Log-Rank Testi Yorumlama

SPSS’te log rank testi analizini başlattıktan sonra, önümüze gelecek tabloları yorumlaması oldukça kolaydır.

“Case Processing Summary” tablosunda, her cinsiyette kaç kişi olduğunun yanı sıra, kaç kişinin elendiğini “N of Events” sütununda, kaç kişinin 30 hafta boyunca elenmediğini “N” sütununda görüyoruz. Yanında oranlarını da görebiliriz.

Sağkalım Analizi’nde “Censored” kelimesi, bir kişinin deney bitene kadar Olay’ı hiç yaşamamış olması demektir. Mesela bu örnekte, 30 hafta gözlem yapıldı, 30 haftada da elenmeyen yarışmacıların, 30. haftadan sonra kaçıncı hafta eleneceğini bilmemiz mümkün değildir. Buna bu yüzden “sansürlenmiş” anlamında “Censored” denir, yani bu katılımcılar hakkında bir nevi eksik bilgi var sayılır. Aynı şekilde, eğer deney bitmeden, elenmek dışında bir sebepten deneyden ayrılan katılımcı varsa, ona da “Censored” denir.

kaplan meier analizi log rank testi 8

 

“Survival Table” tablosunda, her yarışmacının sırayla kaçıncı haftalarda elendiğini Time sütununda görebiliriz. Estimate sütununda, o haftadan sonra yarışmacıların yüzde kaçının kaldığını görebiliriz. N Of Remaining Cases sütununda ise kaç yarışmacının kaldığını görebiliyoruz.

kaplan meier analizi log rank testi 9

 

İki cinsiyet için de ayrı ayrı oluşturulan Kaplan-Meier eğrileri aşağıda gösteriliyor. Bu tabloya göre, Kadın’lar (mavi), 30 hafta içinde Erkek’lerden daha hızlı şekilde ve daha çok sayıda elenmişler.

kaplan meier analizi log rank testi 10

“Overall Comparisons” tablosunda, Erkek ve Kadın’ların Kaplan-Meier eğrilerinin istatistiksel olarak anlamlı şekilde farklı olup olmadığının bilgisini alıyoruz. Bu tablodaki Sig. p değeri, 0.05’ten küçük ise fark var demektir. Bu örnekte, p değeri 0.112 çıkmış, 0.05’ten büyük olduğu için “iki cinsiyetin zamana bağlı elenme oranları arasında anlamlı bir farklılık yoktur” diye bir sonuca varıyoruz.

kaplan meier analizi log rank testi 11

Aslında istatistiksel olarak anlamlı bir fark bulmadıktan sonra kalan sayılara bakmanın çok anlamı yok, ama bu örnekte öğretmek amacıyla, eğer istatistiksel olarak anlamlı farklılık çıksaydı tabloları nasıl okumaya devam etmek gerekiyordu onu göstereceğim.

“Means and Medians For Survival Time” tablosu, Mean ve Median alanı olarak ikiye bölünmüş. Mean alanında cinsiyetlere göre “ortalama değer”leri görüyoruz, Median alanında ise “o cinsiyetteki yarışmacıların tam yarısı elendiği zaman”ki değerleri görüyoruz. Kaplan-Meier analizi, log rank testi gibi sağkalım analizlerinde, diğer testlerde genelde yapılanın aksine, Median değerlerine Mean değerlerinden daha çok önem verilir.

Mean bölümündeki Estimate sütununda, Kadın’ların ortalama elenme süresinin 13.5 hafta olduğunu görüyoruz. Median bölümündeki Estimate sütununda ise, yarışmaya katılan Kadın’ların yarısı elendiğinde 9. haftada olduğumuzu öğreniyoruz.

Erkekler için bakacak olursak, Mean bölümündeki Estimate sütununda, Erkek’lerin ortalama elenme süresinin 18.9 hafta olduğunu görüyoruz. Median bölümündeki Estimate sütununda ise, yarışmaya katılan Erkek’lerin yarısı elendiğinde 17. haftada olduğumuzu öğreniyoruz.

Süreler arasında bu kadar büyük bir fark olup da p değerinin istatistiksel olarak anlamsız çıkması ilginç ama p değerinin işaret ettiği gibi yorumlamak zorundayız, yapacak bir şey yok.

kaplan meier analizi log rank testi 12

 

Son olarak, son bahsettiğim tablodaki bilgilerle Kaplan-Meier eğrileri grafiğini birleştirmek istiyorum. Bu grafikte dikey sütun, beklenen Olay’ı henüz yaşamamış olan toplam kişi sayısını gösterir. Yatay sütun ise süreyi gösterir yani hafta sayısı. Bu sütunda 0.5 değerinden yatay bir çizgi çekelim. Mavi çizgi, Kadın’a ulaştığında, bu değer hafta olarak 9. haftaya karşılık gelmektedir. Üstteki tablonun Median Estimate bölümünde bulduğumuz değerle aynı. Kırmızı çizgi ile Erkek’in birleşme noktası da 17, Erkek’ler için olan Median Estimate bölümündeki değerle aynı.

kaplan meier analizi log rank testi 13


Yalnızca 2 cinsiyetten oluşan bir gruptaki cinsiyetler arası 30 hafta boyunca yaşanan elenme miktarı üzerinden sağkalım analizi SPSS’te bu şekilde yapılıyor ve sonuçları yorumlanıyor. 2 cinsiyetin Kaplan-Meier eğrilerini karşılaştırdığımız örneğin sonuna geldik.

İkiden Fazla Grup Olduğunda Kaplan-Meier Eğrilerini Karşılaştırma

Eğer 2 cinsiyetten fazla cinsiyet olsaydı bu cinsiyetlerin arasında Kaplan-Meier eğrileri arasında istatistiksel olarak anlamlı olan en az 1 adet farklılık olup olmadığını SPSS ile bulabilirdik. Fakat, ne yazık ki, SPSS’te sağkalım analizi yaptıktan sonra, ANOVA‘dan sonra post hoc yapmak gibi, 2’den fazla grup arasında en az 1 adet anlamlı farklılık bulunduğunu tespit ettikten sonra hangi grupların arasında farklılık olduğunu tespit etmek için özel bir SPSS fonksiyonu mevcut değildir.

Bu yüzden, mesela 3 tane Kaplan-Meier eğrisini Log rank testi ile karşılaştırıp anlamlı bir p değeri bulduktan sonra hangi grupların Kaplan-Meier eğrileri birbirinden anlamlı olarak farklı diye bulmak için, grupları ayrı ayrı Log rank testleri yaparak ikili olarak karşılaştırmak gerekmektedir. Bunu yaparken, Tip I hata ihtimali artmasın diye, kaç adet ek ikili karşılaştırma testi yapacaksak, normalde 0.05 olan p istatistiksel eşik değerimizi yapacağımız o test sayısına bölmeliyiz ve bu aşamadan sonraki yeni p eşik değerimiz o olmalı.

Mesela Erkek-Kadın-Diğer şeklinde 3 cinsiyet grubunun hangisi/hangileri arasında anlamlı bir fark var diye test edecek olursak, Erkek-Kadın & Erkek-Diğer & Kadın-Diğer şeklinde 3 adet ikili karşılaştırma yapıp, 0.05 değerini 3’e bölecek ve sonuç olarak bulacağımız 0.017 değerini de yeni istatistiksel anlamlılık eşik değeri olarak almamız gerekiyor. Yani Log Rank testi p değeri bundan sonra 0.05’ten değil, 0.017’den küçük ise Kaplan-Meier grafikleri arasında istatistiksel olarak anlamlı bir farklılık vardır anlamına geliyor olacak.

 

spss tez analizi istatistik ödev yaptırma ücretli spss veri analizi danışmanlık

Deniz Şavkay hakkında 136 makale
Lisans eğitimimi Boğaziçi Üniversitesi Moleküler Biyoloji ve Genetik bölümünde, Yüksek Lisans eğitimimi Polonya'daki SWPS Üniversitesi Psikoloji bölümünde tamamladım. Davranış bilimlerine ilgi duyuyorum ve eğitim hayatımı bunun üzerine şekillendirdim. SPSS ile istatistik analizi yapmayı çok seviyorum. SPSS analizleriyle insan davranışındaki kalıpları keşfetmek ve insan davranışı hakkında iç görü sahibi olmak beni heyecanlandırıyor.

İlk yorum yapan olun

Bir yanıt bırakın

E-posta hesabınız yayımlanmayacak.


*