İçindekiler
Basit Doğrusal (Lineer) Regresyon, iki adet sayısal değişken arasındaki doğrusal ilişkiyi incelemek ve bağımsız değişkenin aldığı değere bakarak bağımlı değişkenin alabileceği değeri tahmin etmek amacıyla kullanılan istatistiksel analiz türüdür. Başka bir deyişle, 1 adet bağımsız değişkenin 1 adet bağımlı değişken üzerindeki etkisini incelemek için Basit Doğrusal Regresyon Analizi yapılır. Bu yazıda, Basit Doğrusal Regresyon Analizi’nin ne olduğunu ve SPSS ile nasıl yapıldığını detaylı bir şekilde anlatıyorum.
Basit Doğrusal (Lineer) Regresyon Nedir?
“Regresyon analizi” deyince ilk akla gelen yöntem olan basit doğrusal yani lineer regresyon analizi, 1 adet bağımsız değişkenin 1 adet bağımlı değişken üzerindeki etkisini incelemek için kullanılan istatistiksel analiz yöntemidir.
Basit Doğrusal Regresyon Analizi sayesinde, değişkenler arasındaki ilişkinin doğrusal olduğunu varsayarak, bağımlı değişkenin alacağı değerleri, bağımsız değişkenin değerleri aldığı değerlere göre tahmin etmeye çalışırız. Analiz sonucunda elde ettiğimiz regresyon denklemine göre bağımsız değişkenin aldığı herhangi bir değer yazarak, bağımlı değişkenin almasını beklediğimiz değeri buna göre tahmin edebiliriz.
“Basit Doğrusal Regresyon” ifadesi yalnızca 1 adet bağımsız değişkenin 1 adet bağımlı değişkeni etkilediği durumu ifade eder. Eğer bağımlı değişkeni 1’den fazla sayıda bağımsız değişken etkiliyorsa o zaman “Çoklu Doğrusal Regresyon” ifadesi kullanılır.
Doğrusal regresyon analizi yapılabilmesi için, değişkenlerin ikisinin de devamlı (sürekli) veri tipinde olması gerekmektedir.
Regresyon Analizi ile Korelasyon Analizi Arasındaki Fark
Korelasyon analizi iki değişken arasındaki ilişkinin yönünü ve gücünü ölçer. Bu ilişki çift yönlü (↔) olarak düşünülür; yani değişkenlerden biri diğerinin nedeni olarak ele alınmaz. Örneğin stres ile anksiyete arasında pozitif bir korelasyon bulunması, iki değişkenin birlikte arttığını gösterir ancak hangisinin diğerini etkilediğini söylemez.
Regresyon analizi ise değişkenler arasındaki ilişkiyi tek yönlü (→) olarak ele alır. Burada bir bağımsız değişkenin, bağımlı değişken üzerindeki etkisi incelenir ve bağımlı değişkeni tahmin etmeye yönelik bir model kurulur. Örneğin çalışma süresi → sınav başarısı şeklinde bir model kurularak çalışma süresinin başarı üzerindeki etkisi regresyon analiziyle incelenebilir.
Yani korelasyon analizini “iki değişkenin birbiri arasındaki ilişki” olarak düşünürken, regresyon analizini “bir değişkenin diğer değişkene etkisi” olarak düşünebilirsiniz.
Regresyon Denklemi
Basit Doğrusal Regresyon Analizi sonucunda 1 adet regresyon denklemi elde edilir. Bu denklem y = mx + c şeklinde ifade edilir. Bu denklem aynı zamanda bir doğru denklemidir yani değerleri yerine koyunca bir doğru çizgisini ifade eder. Bu denklemde y bağımlı değişkeni, x bağımsız değişkeni, m doğrunun eğimini ve c ise doğrunun kesme noktasını ifade eder (kesme noktası x = 0 iken çizginin y ekseni üzerinde denk geldiği noktaya denir).
Basit Doğrusal Regresyon Analizi, y = mx + c denkleminde yer alan m değeri ve c değerlerini bulmaya yarar. Bu iki değeri bulduktan sonra, bağımsız değişkenin değerini ifade edecek şekilde denklemde x değeri yerine bir sayı koyduğumuz zaman, denklemde bağımlı değişkeni ifade eden y değerini bulmak mümkün hale gelir. Bu sayede Regresyon Analizi bağımsız değişkenin değerine göre bağımlı değişkenin değerini bulmamızı sağlar.
Regresyon denkleminde yer alan eğim (m) bağımsız değişken bir birim arttığında bağımlı değişkende meydana gelen değişimi, kesme noktası (c) ise bağımsız değişkenin değeri sıfır olduğunda bağımlı değişkenin alacağı değeri ifade eder. Bu parametreler belirlendikten sonra, bağımsız değişkenin değeri bilindiğinde bağımlı değişkenin yaklaşık değeri tahmin edilebilir.
Mesela aşağıdaki nokta saçılım grafiğinde her nokta, örneklemde bulunan bir kişinin Öz Saygı ve Duyarlılık skoruna karşılık gelmektedir. Regresyon Analizi sonucunda, bu noktaları en iyi yansıtan bir regresyon doğrusu çizilmiştir (ortadan geçen eğimli siyah çizgi). Bu regresyon çizgisi, bir kişinin Öz Saygı seviyesine göre Duyarlılık seviyesinin hangi değerde olabileceğini en isabetli şekilde tahmin etmeye yarayan çizgidir.

Yukarıdaki y = mx + c formülünün karşılığı y = 0.3*x + 1.78 oluyor bu regresyon grafiğinde. Yani x yerine geçen Öz Saygı skoru 0 iken, y yerine geçen Duyarlılık skoru 1.78 oluyor grafikte gördüğümüz gibi. Bununla birlikte, Öz Saygı seviyesi her 1’er puan arttıkça, Duyarlılık seviyesi de 0.3’er puan artmakta olur. Yani mesela Öz Saygı seviyesi 2 iken, y = 0.3*2 + 1.78 = 2.38 olur yani bu veride bulunan Öz Saygı skoru 2 olan bir kişinin Duyarlılık seviyesi yaklaşık 2.38 oluyor demektir. Basit Doğrusal Regresyon Analizi sonuçlarını yorumlamak işte bu kadar basittir.
Doğrusal Regresyon Analizinin günlük hayatta uygulamasına bir örnek vermek gerekirse: Örneğin, bir pazarlama uzmanı, bir ürün için ne kadar reklam harcaması yaptığında ne kadar ürün satabileceğini, Basit Doğrusal Regresyon Analizi yaparak tahmin edebilir.
Doğrusal regresyon analizi diyorum çünkü doğrusal regresyon dışında farklı regresyon analizi türleri de vardır. Eğer bağımsız ve bağımlı değişkenler arasındaki ilişki doğrusal değil de eğrisel ise o zaman Polinom Regresyon uygulanır. Bağımlı değişken kategorik veri ise o zaman Binary Lojistik veya Multinominal Lojistik Regresyon analizi uygulanır. Bağımsız değişken kategorik veri ise de Kukla Değişken Regresyon uygulanır. Zamana bağlı ilişkileri incelemek için de Cox Regresyon analizi yöntemi uygulanır. Bunlar hakkında bilgileri linklere tıklayarak öğrenebilirsiniz.
Basit Doğrusal Regresyon Varsayımları
Basit doğrusal regresyon analizinin sonuçlarının güvenilir olması için (yani gerçeği yansıttığından emin olabilmemiz için) elimizdeki verilerin belirli ön koşulları sağlaması gerekmektedir. Bunlara regresyon analizinin varsayımları denir. Bu yüzden önce bu varsayımların test edilip, sonra regresyon analizi yapmaya geçmek en sağlıklı yoldur.
Basit doğrusal regresyon analizi varsayımlarını test etmek biraz uzun ve detay bilgiler içerdiğinden dolayı, SPSS’te Basit Doğrusal Regresyon Varsayımları Test Etme başlıklı ayrı bir sayfa açıp orada anlattım. Merak ederseniz orayı okuyabilirsiniz.
Basit doğrusal regresyon analizi yapacağımızda, analiz edeceğimiz iki değişken de sürekli sayısal veri tipinde olmalıdır ve normal dağılım göstermelidirler. Bunun dışında basit doğrusal regresyon analizinin 3 önemli varsayımı daha vardır:
- Doğrusallık Varsayımı
- Homoskedastisite Varsayımı
- Otokorelasyon Olmaması
Konuyu ilk defa öğreniyorsanız varsayımları nasıl test etmek gerektiğini atlayabilirsiniz; direkt olarak bu sayfada aşağıda SPSS ile Regresyon Analizi Yapma Adımları bölümüne geçmeniz daha hızlı öğrenmenizi sağlayacaktır. Regresyon analizinin nasıl yapıldığını ve sonuçları nasıl yorumlamak gerektiğini iyice öğrendikten sonra bu bölüme yani Varsayımlar bölümüne geri dönüp okuyabilirsiniz.
SPSS ile Basit Doğrusal (Lineer) Regresyon Nasıl Yapılır?
Aşağıdaki adımları izleyerek SPSS’te Basit Doğrusal Regresyon Analizi yapabilirsiniz.
Bu örnekte, bir örneklem grubundaki kişilerin yaşlarının o kişilerin mutluluk düzeyleri üzerindeki etkisini incelemek için SPSS programında Basit Doğrusal Regresyon yapıyoruz.
Analyze -> Regression -> Linear

Bağımsız değişkeni “Independent(s)” kutusuna atıp bağımlı değişkeni “Dependent” kutusuna koyuyoruz.

Başka bir işlem yapmamıza gerek yok.
“OK” butonuna basarak analizi başlatıyoruz.
Basit Doğrusal Regresyon SPSS Tablo Yorumlama
Basit Doğrusal Regresyon Analizi’ni başlattıktan sonra, SPSS bize birtakım tablolar verecektir. Bu tablolarda nerelere bakmak gerektiğini ve değerleri nasıl yorumlamak gerektiğini aşağıda anlatıyorum.
ANOVA Tablosu
ANOVA tablosundaki “Sig.” değeri, kurduğumuz regresyon analizi modeline dair p değerini ifade eder. Bu değere bakarak, yaptığımız regresyon analizi sonucunda, bağımsız değişkenin bağımlı değişken üzerindeki etkisinin istatistiksel olarak anlamlı olup olmadığını öğreniriz. Eğer p değeri 0.05’ten küçük çıkarsa, anlamlı bir etkisi vardır demektir.
Burada ANOVA başlıklı bir tablo olması gerçek bir ANOVA Testi yaptığımız anlamına gelmez. Sadece “regresyon analizi modeline göre bağımsız değişkenin bağımlı değişken üzerindeki etkisinin anlamlı olup olmadığını” gösteren regresyon analizi öğesidir bu tablo.
Bizim örneğimizde, ANOVA tablosundaki p değeri 0.028 çıktığı için yaşın mutluluk üzerinde anlamlı bir etkisi olduğu sonucuna varıyoruz.
Bu, aynı zamanda “Yaş değişkeni, mutluluk değişkeninin anlamlı bir miktarını açıklayabilmektedir.” şeklinde de yorumlanabilir.

Coefficients Tablosu
Şimdi de “Coefficients” başlıklı tabloya bakalım.
Öncelikle, bağımsız değişkenin bağımlı değişken üzerinde anlamlı etkisi olduğundan emin olmamız gerekiyor. Yalnızca anlamlı etki varsa (yani p değeri 0.05’ten küçükse) bu tabloya bakarak regresyon denklemi kurup bağımlı değişkeni tahmin etmemiz uygun olur. Eğer anlamlı etki yoksa (yani p değeri 0.05’ten büyükse) o zaman anlamlı etki bulunmadığı anlamına geldiği için regresyon denklemi kurmamız da uygun olmaz, çünkü adı üstünde “etki anlamlı değil” durumundadır.
Basit Regresyon Analizi’nde “Coefficients” tablosundaki Sig. sütunu p değerini ifade eder ve “ANOVA” tablosundaki Sig. değeri ile “Coefficients” tablosundaki Sig. değeri her zaman bire bir aynı olur.
Bu analizde p = 0.028 çıktı, p değeri 0.05’ten küçük olduğu için regresyon denklemi kurup regresyon analizi sonuçlarını detaylıca yorumlayabileceğiz şimdi.

Yukarıdan hatırlarsanız, Basit Doğrusal Regresyon denklemi y = mx + c olarak ifade ediliyordu. “Coefficients” tablosuna bakarak, analiz ettiğimiz verinin regresyon denklemini kuracağız.
Regresyon denkleminde y bağımlı değişkeni, x bağımsız değişkeni, m eğimi ve c ise sabit değeri ifade ediyor. Bunları şimdi yerlerine yerleştirelim.
(Constant) satırındaki B sütunu, sabit değeri (c) ifade eder. Yaş satırındaki B değeri ise eğimi (m) ifade eder. Bu değerler ile kuracağımız regresyon denklemi şöyle oluyor:
Y = 2.810 + (0.012 * X)
Y ve X yerine de değişken isimlerini koyalım:
Mutluluk = 2.810 + (0.012 * Yaş)
Buna göre, 0 (sıfır) yaşındaki birinin mutluluk skoru (mutluluk ölçeğine göre), 2.810 oluyor. Yaştaki her 1 yaş artış, mutluluk skorunun 0.012 artmasına sebep oluyor.
Mesela 20 yaşında birinin mutluluk düzeyini hesaplamak istersek, Mutluluk = 2.810 + (0.012 * 20) = 3.050 şeklinde hesaplayabiliyoruz. Yani regresyon analizi sonucunda yazdığımız regresyon denklemine göre 20 yaşında birinin mutluluk düzeyinin 3.050 olması gerektiğini istatistiksel olarak anlamlı bir şekilde tahmin edebildik.

Yine “Coefficients” tablosundaki Beta değeri, standardize edilmiş regresyon katsayısını ifade eder. B ile gösterilen düz regresyon katsayısı eksi sonsuzdan artı sonsuza kadar her sayı olabilirken, Beta değeri yani standardize edilmiş regresyon katsayısı yalnızca -1 ile +1 arasında değer alabilir. Korelasyon değeri referans değer aralıklarıyla uyumlu olacak şekilde:
- Beta = 0 ise hiç etki yok
- Beta = 0.10 ise zayıf etki var
- Beta = 0.30 ise orta düzeyde etki var
- Beta = 0.50 ya da daha büyük ise güçlü etki var demek oluyor.
Eğer B ve Beta değerleri pozitif ise “bağımsız değişkenin skorları artınca bağımlı değişkenin skorları da artıyor”, eğer B ve Beta değerleri negatif ise “bağımsız değişkenin skorları artınca bağımlı değişkenin skorları azalıyor” şeklinde yorumlanır.
Bu analizde Beta değeri 0.088 çıkmış yani “yaşın mutluluk üzerinde zayıf bir etkisi var” şeklinde yorumlayabiliriz.
Regresyon analizini raporlarken, p değerinin yanı sıra, standardize edilmiş regresyon katsayısını da (Beta), düz regresyon katsayısıyla (B) beraber göstermek gerekir. Mesela bu analiz için “B = 0.012, β = 0.088, p = 0.028” yazabiliriz.
Bu iki değişken arasında Pearson Korelasyon Analizi yaparsak bulacağımız korelasyon katsayısı ile Basit Doğrusal Regresyon Analizi sonucu bulunan bu Beta değeri her zaman bire bir aynı olur. Yani eğer yaş ile mutluluk arasında bir Pearson korelasyon analizi yapsaydık, bulacağımız Pearson’s r korelasyon değeri bu Beta değeri ile aynı olacaktır.
Model Summary Tablosu
Son olarak “Model Summary” tablosunda, regresyon analizi sonuçlarına göre, yaşın mutluluk üzerindeki etkisine dair etki büyüklüğüne bakacağız. Buna “R Square” değerinden bakıyoruz.
R Square değeri, her zaman “Model Summary” tablosundaki R değerinin karesine eşittir. Bu R değeri de, her zaman “Coefficients” tablosundaki Beta değerine eşittir.
Bu örnekte R Square yani R Kare değeri 0.077 çıktı. Bunu yüzdeye çevirirsek, bağımsız değişkenin bağımlı değişken üzerindeki açıklama miktarını ifade edebiliyor olacağız.
Bizim yaptığımız Basit Doğrusal Regresyon Analizi sonucunda R Kare değerinin 0.077 çıkması, bir insanın kaç yaşında olduğunun, o insanın mutluluk seviyesini %7.7 oranında açıkladığını gösteriyor. Mutluluk seviyesindeki geri kalan %92.3 kısım ise yaştan farklı sebeplerle açıklanıyor.
R Kare değeri yorumlama hakkında daha detaylı bilgi öğrenmek için R Kare hakkında özel olarak yazdığım yazıyı okuyabilirsiniz.

SPSS ile Basit Doğrusal (Lineer) Regresyon Analizi hakkında anlatmak istediğim her şey bu kadardı. Okuduğunuz için teşekkürler, çalışmalarınızda kolaylıklar diliyorum.


Bir yanıt bırakın