Palyginti dviejų imčių vidurkius yra standartinė užduotis atliekant tyrimus. Sužinokite, kaip ir kada taikyti Stjudento t-testą.
Published
April 22, 2023
Palyginti dviejų imčių vidurkius yra standartinė užduotis atliekant tyrimus, todėl Stjudento t-testas yra vienas dažniausių taikomų statistinių testų. Jeigu atliekate tyrimus, tikėtina, jog susidursite su duomenimis, kur t-testas bus tinkamas. Dėl to svarbu suprasti, kada taikyti testą, kaip jį interpretuoti bei kaip jį pateikti publikacijoje.
Kam skirtas t-testas?
T-testas yra skirtas palyginti dviejų imčių vidurkius. Tai gali būti:
Nepriklausomos imtys: pavyzdžiui, vyrai ir moterys
Priklausomos (porinės) imtys: pavyzdžiui, matavimai prieš ir po gydymo tam pačiam pacientui
Kada rinktis t-testą?
T-testą galima atlikti su tolydžiu kintamuoju, kurį galima padalinti į dvi grupes. Tolydų kintamąjį toliau vadinsime priklausomu kintamuoju, o savo grupių kintamąjį - nepriklausomu kintamuoju.
Pirma, priklausomas kintamasis turi būti tolydus, t.y. jis turi gebėti įgyti daug skirtingų reikšmių. Tinkami priklausomi kintamieji:
Matavimai, kurie gali įgyti be galo didelį kiekį reikšmių: ūgis, svoris, amžius ir pan.
Sudėtiniai skaičiai, pavyzdžiui, ląstelių skaičius matymo lauke, euzinofilų skaičius kraujyje ir pan.
Ranginiai klausimai (iš dalies) - t-testas yra pakankamai atsparus nuokrypiams nuo normalumo.
Antra, priklausomas kintamasis, padalintas į 2 grupes, turi turėti panašią variaciją (t.y. standartinį nuokrypį) ir turi būti pasiskirstęs pagal normalųjį skirstinį.
Patarimas
R naudoja Welch t-testą, kuriam nesvarbi skirtinga variacija. Todėl variacijos testavimas dirbant su R nėra būtinas!
Normalumo tikrinimas
Normalumą galima patikrinti vizualiai su QQ grafiku:
library(ggplot2)ggplot(iris, aes(sample = Sepal.Length)) +stat_qq() +stat_qq_line(color ="red") +facet_wrap(~Species) +labs(title ="3 vilkdalgių rūšių taurėlapių ilgio QQ grafikas", subtitle ="iris duomenų rinkinys; kuo arčiau linijos centre yra taškai, tuo geriau.")
QQ grafikas Excel’e sukuriamas šiek tiek kitaip - reikia naudoti specialų įrankį arba rankiniu būdu skaičiuoti teorines kvantiles.
Welch Two Sample t-test
data: Sepal.Length by Species
t = -10.521, df = 86.538, p-value < 2.2e-16
alternative hypothesis: true difference in means between group setosa and group versicolor is not equal to 0
95 percent confidence interval:
-1.1057074 -0.7542926
sample estimates:
mean in group setosa mean in group versicolor
5.006 5.936
Excel’e t-testą galima atlikti naudojant T.TEST funkciją arba Data Analysis ToolPak.
Kaip interpretuoti t-testą?
T-testo rezultate svarbiausios reikšmės:
t reikšmė - kuo toliau nuo 0, tuo didesnis skirtumas
p reikšmė - jei < 0.05, skirtumas yra statistiškai reikšmingas
“Atlikus nepriklausomų imčių t-testą, nustatyta, kad setosa rūšies taurėlapių ilgis buvo statistiškai reikšmingai mažesnis (M = 5.01, SD = 0.35) nei versicolor rūšies (M = 5.94, SD = 0.52); t(86.54) = -10.52, p < 0.001.”
Jeigu negaliu taikyti t-testo?
Jeigu Stjudento t-testas nėra tinkamas, tokiu atveju reikėtų taikyti Mann-Whitney U testą. Aprašą apie testą galima rasti čia.