|
De ce avem
nevoie de analiza
statistică?
Fiindcă vrem să tragem concluzii cât mai valide
din cantităţi limitate de date (concluzii despre
populaţie, pornind de la un eşantion) şi pentru a
face acest lucru trebuie să depăşim două obstacole:
Primul este reprezentat de faptul că diferenţe
importante sunt deseori mascate de variabilitatea
biologică şi/sau imprecizia experimentală.
Dacă toţi indivizii fumători ar face cancer pulmonar
şi niciun individ nefumător nu ar face sau
dacă toţi indivizii cu infarct miocardic acut ar muri
dacă nu ar fi trataţi cu clopidogrel, pe când toţi cei
trataţi cu clopidogrel ar trăi, atunci nici n-am mai
avea nevoie de statistică (de altfel, acest ultim
caz, care este din păcate foarte rar întâlnit, nici
nu necesită studiu clinic randomizat pentru dovedirea
eficienţei unui tratament, constituind în
sine un nivel superior al dovezii, 1c, din care
decurge gradul de recomandare A).
În realitate, însă, există indivizi care fumează şi
nu fac infarct miocardic, după cum există indivizi
care nu fumează şi fac infarct - este fumatul
un factor de risc pentru accidentul coronarian
acut? Dacă avem două loturi de pacienţi, unul
sub tratament cu captopril şi celălalt fără tratament,
este posibil să găsim indivizi cu TA de la
110 mmHg la 180 mmHg în ambele loturi şi
atunci ne întrebăm - scade captoprilul TA? Se
ştie că orice test diagnostic are fals pozitivi şi
fals negativi - dacă testul este negativ, este
adevărat că pacientul nu are boala, sau dimpotrivă,
dacă este pozitiv, o are înr-adevăr? Aceste
lucruri trebuie să ne facă să judecăm totul în probabilităţ
i (dintre care probabilitatea de a face o
complicaţie sau de a deceda se numeşte risc):
dacă fumează, un individ are o probabilitate mai
mare să facă infarct miocardic decât dacă nu
fumează (deşi este posibil să nu facă nici un
infarct şi să-şi vadă vecinul, nefumător, făcând |
 |
unul); dacă este tratat cu anticoagulante,
individul cu tromboză
venoasă profundă are o probabilitate
mai mică să facă trombembolism
pulmonar decât dacă nu
se tratează - asta nu înseamnă
că cei trataţi cu anticoagulante
nu mor niciodată de trombembolism
pulmonar, iar cei netrataţi
nu pot scăpa fără să-l facă; în
sfârşit, un test pozitiv doar creşte
probabilitatea unui anumit diagnostic,
după cum unul negativ
doar o scade, iar în practică nu
punem un diagnostic doar atunci
când suntem 100% siguri de el,
pentru că de fapt nu putem fi
niciodată 100% siguri.
Al doilea obstacol este reprezentat
de faptul că mintea umană
excelează în găsirea de tipare şi
relaţii, şi tinde să generalizeze în
exces. Un exemplu luat dintr-o
carte de statistică - o fetiţă i-a
spus colegului ei de joacă: "tu nu
poţi să te faci doctor, numai fetele
pot", pentru că singurii trei medici
pe care îi cunoştea ea, erau femei.
Această tendinţă de generalizare
nu pare să dispară cu vârsta, iar
oamenii de ştiinţă au aceeaşi problemă,
care poate fi prevenită prin
rigoarea statistică.
Calculele statistice extrapolează
de la eşantion la populaţie.
Calculele statistice ne permit să
tragem concluzii generale pornind
de la o cantitate limitată de
date, extrapolând datele de la
eşantion la populaţie. Distincţia
dintre eşantion şi populaţie este
cheia înţelegerii unei bune părţi
din statistică, iar aceşti termeni
sunt folosiţi în diferite contexte,
de exemplu: |
 |
1. Controlul de calitate: din
populaţia de cămăşi sau automobile
fabricate lunar sunt extrase
câteva (un eşantion) care sunt
controlate, iar rezultatele sunt generalizate
asupra întregii populaţ
ii de cămăşi, sau automobile.
2. Sondajele politice: se extrage
la întâmplare un eşantion de
votanţi care sunt chestionaţi, iar
rezultatele sunt folosite pentru a
trage concluzii la nivelul întregii
populaţii de votanţi, putând astfel
să estimăm care va fi rezultatul
alegerilor. Este probabil singurul
loc în care calculele statistice
efectuate pe eşantion sunt verificate
la nivelul populaţiei, în
momentul alegerilor.
3. Studiile clinice: eşantionul
de pacienţi studiaţi este rareori
extras la întâmplare din populaţ
ia generală (populaţia de
pacienţi cu insuficienţă cardiacă
cls. III-IV, de exemplu, dacă studiem
efectul unui tratament la
aceşti pacienţi). Totuşi, pacienţii
incluşi în studiu sunt reprezentativi
pentru toţi pacienţii, şi astfel
se poate face extrapolarea de la
eşantion la populaţie. Care este
populaţia? Toţi pacienţii cu insuficienţă
cardiacă cls. III-IV care se
prezintă la internare la Clinica de
Cardiologie X? Sau toţi pacienţii
din Bucureşti, din România, ori
din lume? Este clar că, în timp ce
populaţia este definită vag,
dorim să folosim datele eşantionului
pe care s-a făcut studiul
pentru a trage concluzii asupra
unui grup mai mare.
În cercetarea biomedicală, de obi- |