T-testi veya diğer adıyla öğrenci testi, iki veri seti ortalamaları arasında belirgin bir farklılık olup olmadığını belirlemeye yönelik istatistiksel bir yaklaşımdır.
Bir diğer deyişle t-testi iki veri setinin aynı popülasyondan mı yoksa faklı popülasyondan mı gelir sorusunun cevabını vermektedir. Örneğin, yeni geliştirilen bir ilacın kan basıncına yan etkisi olup olmadığı yönünde bir test yaptığımızı düşünelim. Testi yaparken 40 gönüllü üzerinden çalışıp gurubu ikiye ayırdığımızı ve grubun birine ilaç verdiğimizi söyleyip, içinde ilaç olmayan ancak hastanın ilaç zannettiği placebo adı verilen kapsüllerden diğer gruba da ilacın kendisinden verelim.
Placebo verdiğimiz gruptan aldığımız kan basıncı sonuçlarının ortalaması 11.2 standart sapma ile 120.8, ilacın kendisini alan ikinci grubun değerleri de 13.4 standart sapma ile 130.6 olduğunu düşünelim. Bu sonuçlara göre t-testi uygulandığında elde edilen verilerin tek bir veri seti olarak mı (durum-1) yoksa iki ayrı veri grubu olarak mı (durum-2) değerlendirilebileceği sonucu çıkacaktır.
Durum-1 sıfır hipotezini (1=2) temsil etmektedir. Yani birinci grubun ortalaması ile ikinci grubun ortalaması arasında belirgin bir fark bulunmamakta ve bütün sonuçlar aynı popülasyondan gelmektedir. Bu sonuca göre de üretilen ilacın kan basıncına yan etkisi bulunmamaktadır. Durum-2 ise ilk grubun ortalamasının ikinci grup ortalamasından farklı olduğunu ve verilerin farklı iki popülasyondan geldiğini belirtmektedir. Bu sonuca göre de ilaç kan basıncını arttırıcı yönde etki yapmaktadır.
Yukarıdaki verilen örnekteki gibi ilk bakışta Durum-2’nin daha doğru olabileceği düşünülebilir ki böyle düşünüyorsanız bunun doğru olma ihtimali yüksektir. Fakat Durum-1 doğrudur diye düşünenler kesin olarak haksızdır diyebilir miyiz? İşte tam burada alfa değerinden bahsetmek yerinde olacaktır.
Alfa Değeri
Alfa değeri, sıfır hipotezini kabul etmediğiniz durumda, 100 kez veri topladığınızda bu verilerden kaç tanesinin sizin tahmininiz dışında çıkacağını simgelemektedir. Eğer ki alfa değerini 0.05 olarak seçerseniz, 100 defada 5 defa yanılma payınız var demektir. Dışarıda kalan bu 5 kez durum-I geçerlidir ancak onun dışındaki 95 veri durum-2 için uygun olacaktır. Bir diğer deyişle yapılan her 100 testin içerisinde gerçek ilaç verilen deneklerde kan basıncı artışı görülecektir.
T-testi için hesaplamalar genellikle sıfır hipotezinden yola çıkılarak gerçekleştirilir. T-dağılımı eğrisi, ortalamaların arasındaki farkın sıfıra yakın bir dağılım gösterdiğini sergiler. Ancak eğer ki ortalamalar arasındaki fark sıfırdan çok farklı olacak gibi görünüyorsa alternatif bir hipotez oluşturulur. Yukarıda bahsetmiş olduğumuz alfa düzeyleri sıfır hipotezinin ne zaman terk edilmesi gerektiği konusunda bilgi verir.
Kaynakça:
http://www.socialresearchmethods.net/kb/stat_t.php
http://www.cvgs.k12.va.us:81/DIGSTATS/main/inferant/d_tdist.htm
Yazar:Nihat Keleş