P şi intervalul de încredere sunt
rezultatele invariabile ale testelor statistice,
şi drept urmare le găsim în
toate articolele ce descriu o cercetare
originală (încă din abstract). Aşadar,
în finalul unei cercetări, analiza
datelor se încheie prin aplicarea unuia
sau mai multor teste statistice (a
căror alegere se face în funcţie de
tipul datelor = variabilelor), iar rezultatele
acestor teste sunt p şi intervalul
de încredere (CI), care ne arată binecunoscuta
"semnificaţie statistică".
De ce avem nevoie
de statistică?
Pentru că vrem să tragem concluzii
cât mai valide din cantităţi limitate de
date şi diferenţe importante sunt
deseori mascate de variabilitatea biologică
şi/sau imprecizia experimentală.
Pe de altă parte, mintea umană
excelează în găsirea de tipare şi
relaţii şi tinde să generalizeze în
exces.
Se presupune că populaţia este
infinită, iar noi ne facem întotdeauna
cercetările pe un eşantion finit, fie că
este vorba de căteva zeci de subiecţi,
fie că sunt cîteva zeci de mii (ca în
marile studii cardiologice, de ex. ALLHAT).
Statistica (în particular p şi CI)
ne foloseşte tocmai pentru a vedea,
la sfârşit, dacă rezultatele obţinute pe
eşantionul nostru sunt valabile în
general, pe întreaga populaţie şi pot
fi extrapolate la aceasta, sau sunt
rezultatul întîmplării.
Să presupunem că vrem să vedem
dacă fumatul este factor de risc pentru
infarctul de miocard. Pentru aceasta,
alegem un eşantion de n pacienţi
(numărul se calculează în funcţie de 1)
semnificaţia clinică a fumatului =
riscul relativ şi/sau riscul atribuibil
care consider că merită osteneala a fi
evidenţiate, şi de 2) semnificaţia statistică
pe |
 |
care vreau să o obţin). Îi urmăresc şi număr câţi fac infarct dintre
fumători şi câţi dintre nefumători,
şi calculez riscul relativ (RR)=2; în
urma aplicării unui test statistic (în
acest caz tip X2), obţin un p=0,01, iar
calculînd intervalul de încredere al RR,
obţin CI aparţine ş1.3 , 4ţ.
În privinţa p-ului, acest lucru nu
înseamnă altceva decât că, dacă în
realitate (la nivelul populaţiei) riscul
de a face infarct al fumătorilor ar fi
egal cu riscul de a face infarct al
nefumătorilor, probabilitatea ca noi
să fi obţinut un RR >= 2 pe un
eşantion de "n subiecţi" este de 1%.
Cu cât p este mai mic, această probabilitate
(ca rezultatul obţinut de noi
în eşantionul nostru să nu fie cel real)
este mai mică.
Intervalul de încredere (de obicei se
calculează cel 95%) ne dă mai multe
informaţii: în exemplul nostru, ne
spune că în realitate (adică la nivelul
populaţiei), suntem 95% siguri că
riscul relativ este între 1,3 şi 4, adică

în realitate, dacă fumezi ai un risc de
a face infarct miocardic de la de 1,3
până la de 4 ori mai mare decât dacă
nu ai fuma.
A nu se confunda semnificaţia statistică
cu cea clinică! Nu înseamnă că
dacă p ar fi fost 0,0001 în exemplul
de mai sus, fumatul ar fi fost un factor
|
 |
de risc mai mare! Ar fi însemnat
doar că sunt mult mai sigur că RR=2
obţinut în studiul meu e real, iar
intervalul de încredere corespondent
ar fi fost mult mai îngust!
Dacă, de exemplu, vrem să demonstră
m că "medicamentul m" prelungeş
te viaţa în insuficienţa cardiacă,
iar rezultatul este că cei trataţi
cu placebo au trăit în medie 10 ani,
iar cei trataţi cu m au trăit în medie
10 ani şi o zi, p=0,000001 arată doar
că sunt foarte, foarte sigur că acea zi
în plus se datorează medicamentului
m, şi nu este rezultatul întâmplării.
Cu cât p este mai mic, intervalul de
încredere este mai îngust, iar gradul
de certitudine mai mare.
Un anumit nivel al lui p care indică
faptul că o asociere (cum au fost
asocierile dintre fumat şi infarctul
miocardic, sau între medicamentul m
şi supravieţuirea mai lungă, în exemplele
noastre) este semnificativă statistic
este determinată arbitrar; în
cercetarea medicală, acest nivel este
stabilit, prin convenţie, la 0,05.
Aplicând intervalele de încredere,
asocierea (sau diferenţa) nu este
semnificativă statistic atunci când
intervalul de încredere îl cuprinde pe
1, în cazul rapoartelor (de ex. risc relativ,
odds ratio), sau pe 0, în cazul
diferenţelor (de ex. risc atribuibil,
reducerea riscului relativ, reducerea
riscului absolut etc.) (sau în
cazul NNT).
Drept dovadă că p şi intervalele de
încredere ne indică acelaşi lucru
(sunt în acelaşi timp semnificative
sau nu statistic), atunci când p=0,05,
una dintre extremele intervalului de
încredere 95% este 1, în cazul
rapoartelor şi 0, în cazul diferenţelor.
|