Stetoscop Miercuri, 8 septembrie 2010  

Cititi cel mai recent numar al revisteiAici gasiti numerele anterioareAbonamenteCe si unde se intampla in viata medicilorDocumentare medicalaForumRevista in format pdfDespre aceasta revista
Stetoscop


Nr. 26 » MEDICINA BAZATA PE DOVEZI



"P" şi intervale de încredere

P şi intervalul de încredere sunt rezultatele invariabile ale testelor statistice, şi drept urmare le găsim în toate articolele ce descriu o cercetare originală (încă din abstract). Aşadar, în finalul unei cercetări, analiza datelor se încheie prin aplicarea unuia sau mai multor teste statistice (a căror alegere se face în funcţie de tipul datelor = variabilelor), iar rezultatele acestor teste sunt p şi intervalul de încredere (CI), care ne arată binecunoscuta "semnificaţie statistică".

De ce avem nevoie de statistică?

Pentru că vrem să tragem concluzii cât mai valide din cantităţi limitate de date şi diferenţe importante sunt deseori mascate de variabilitatea biologică şi/sau imprecizia experimentală. Pe de altă parte, mintea umană excelează în găsirea de tipare şi relaţii şi tinde să generalizeze în exces.
Se presupune că populaţia este infinită, iar noi ne facem întotdeauna cercetările pe un eşantion finit, fie că este vorba de căteva zeci de subiecţi, fie că sunt cîteva zeci de mii (ca în marile studii cardiologice, de ex. ALLHAT). Statistica (în particular p şi CI) ne foloseşte tocmai pentru a vedea, la sfârşit, dacă rezultatele obţinute pe eşantionul nostru sunt valabile în general, pe întreaga populaţie şi pot fi extrapolate la aceasta, sau sunt rezultatul întîmplării.
Să presupunem că vrem să vedem dacă fumatul este factor de risc pentru infarctul de miocard. Pentru aceasta, alegem un eşantion de n pacienţi (numărul se calculează în funcţie de 1) semnificaţia clinică a fumatului = riscul relativ şi/sau riscul atribuibil care consider că merită osteneala a fi evidenţiate, şi de 2) semnificaţia statistică pe
care vreau să o obţin). Îi urmăresc şi număr câţi fac infarct dintre fumători şi câţi dintre nefumători, şi calculez riscul relativ (RR)=2; în urma aplicării unui test statistic (în acest caz tip X2), obţin un p=0,01, iar calculînd intervalul de încredere al RR, obţin CI aparţine ş1.3 , 4ţ.
În privinţa p-ului, acest lucru nu înseamnă altceva decât că, dacă în realitate (la nivelul populaţiei) riscul de a face infarct al fumătorilor ar fi egal cu riscul de a face infarct al nefumătorilor, probabilitatea ca noi să fi obţinut un RR >= 2 pe un eşantion de "n subiecţi" este de 1%. Cu cât p este mai mic, această probabilitate (ca rezultatul obţinut de noi în eşantionul nostru să nu fie cel real) este mai mică.
Intervalul de încredere (de obicei se calculează cel 95%) ne dă mai multe informaţii: în exemplul nostru, ne spune că în realitate (adică la nivelul populaţiei), suntem 95% siguri că riscul relativ este între 1,3 şi 4, adică



în realitate, dacă fumezi ai un risc de a face infarct miocardic de la de 1,3 până la de 4 ori mai mare decât dacă nu ai fuma.
A nu se confunda semnificaţia statistică cu cea clinică! Nu înseamnă că dacă p ar fi fost 0,0001 în exemplul de mai sus, fumatul ar fi fost un factor
de risc mai mare! Ar fi însemnat doar că sunt mult mai sigur că RR=2 obţinut în studiul meu e real, iar intervalul de încredere corespondent ar fi fost mult mai îngust! Dacă, de exemplu, vrem să demonstră m că "medicamentul m" prelungeş te viaţa în insuficienţa cardiacă, iar rezultatul este că cei trataţi cu placebo au trăit în medie 10 ani, iar cei trataţi cu m au trăit în medie 10 ani şi o zi, p=0,000001 arată doar că sunt foarte, foarte sigur că acea zi în plus se datorează medicamentului m, şi nu este rezultatul întâmplării. Cu cât p este mai mic, intervalul de încredere este mai îngust, iar gradul de certitudine mai mare.
Un anumit nivel al lui p care indică faptul că o asociere (cum au fost asocierile dintre fumat şi infarctul miocardic, sau între medicamentul m şi supravieţuirea mai lungă, în exemplele noastre) este semnificativă statistic este determinată arbitrar; în cercetarea medicală, acest nivel este stabilit, prin convenţie, la 0,05. Aplicând intervalele de încredere, asocierea (sau diferenţa) nu este semnificativă statistic atunci când intervalul de încredere îl cuprinde pe 1, în cazul rapoartelor (de ex. risc relativ, odds ratio), sau pe 0, în cazul diferenţelor (de ex. risc atribuibil, reducerea riscului relativ, reducerea riscului absolut etc.) (sau în cazul NNT).
Drept dovadă că p şi intervalele de încredere ne indică acelaşi lucru (sunt în acelaşi timp semnificative sau nu statistic), atunci când p=0,05, una dintre extremele intervalului de încredere 95% este 1, în cazul rapoartelor şi 0, în cazul diferenţelor.

Cristian Băicuş,
Clinica Medicală II,
Spitalul Colentina
cbaicus@zappmobile.ro