 |
|
 |
|



|
Tipurile de variabile
şi testele statistice (II)
|
 |
le transformăm oricānd īn ordinale sau
dihotomice, pe cānd invers nu vom
putea niciodată (de exemplu introducem
īn baza de date anemie DA/NU şi
apoi descoperim că ar fi fost mai bine
să avem chiar valorile hemoglobinei!).
Partea cea mai dificilă este alegerea
īntre testele parametrice şi cele
neparametrice. Alegem clar un test
nonparametric īn trei situaţii:
1. efectul este o variabilă ordinală şi
populaţia este clar non-gaussiană (de
exemplu notele studenţilor, scorul
Apgar, scala vizuală analogică pentru
durere etc.);
2. efectul este o variabilă cantitativă şi
suntem siguri că nu are o distribuţie
gaussiană īn populaţie (īn acest caz o
putem aduce la o distribuţie normală
prin transformare: logaritmul, reciproca,
rădăcina pătrată - din punct de vedere
matematic este corect, mai puţin din
punct de vedere biologic);
3. efectul este o variabilă cantitativă cu
distribuţie gaussiană, dar dispersia
(deviaţia standard) este mult diferită
īntre grupurile de comparat.
Cānd avem cazuri puţine, este greu de
spus dacă distribuţia este gaussiană,
iar testele speciale pentru verificarea
normalităţii (Komogorov-Smirnov) au
putere mică. De fapt, ceea ce contează
este distribuţia la nivelul populaţiei, şi
nu la nivelul eşantionului nostru, iar
informaţii despre distribuţia valorilor
unei variabile īn populaţie trebuie căutate
īn literatură! (este bine de reţinut
că īn natură, distribuţiile non-gaussiene
sunt frecvente, iar acest fapt este valabil
īndeosebi īn cazul valorilor biologice).
Cānd nu ştim dacă distribuţia
este normală, alegerea tipului de test
depinde de mărimea eşantionului: dacă
eşantionul este mare (cel puţin 24/30
de date īn fiecare grup), este mai uşor
de spus dacă eşantionul provine dintr-o
populaţie gaussiană, dar nu are mare
importanţă, putem folosi orice tip de
test, rezultatul va fi acelaşi. Problema
apare dacă eşantionul este mic, cānd
este greu de spus dacă populaţia este
gaussiană. În concluzie, putem afirma
că testele nonparametrice nu sunt
puternice, iar cele parametrice nu sunt
robuste.
dr. Cristian Băicuş |
Pentru variabilele cantitative care nu au
o distribuţie normală şi pentru cele
ordinale se folosesc testele nonparametrice.
De exemplu, dacă vrem să
demonstrăm că pacienţii cu insuficienţă
cardiacă internaţi īn spitalul X
sunt mai gravi decāt cei internaţi īn spitalul
Z, comparând clasa NYHA de insuficienţă
cardiacă īntre cele două
grupuri.
Atunci cānd pacienţii sunt
īmperecheaţi, folosim testele statistice
īmperecheate (paired), parametrice sau
nonparametrice. Singura īmperechere
perfectă se realizează atunci cānd
īmperechem pacientul cu el īnsuşi, īn
comparaţiile īnainte-după. De exemplu,
comparăm TA, sau colesterolul unor
participanţi la un studiu īnainte de a
īncepe tratamentul şi după o lună de
tratament. Variabila (TA, colesterolul)
fiind continuă şi cu o distribuţie probabil
normală, vom folosi un test parametric,
şi anume testul t īmperecheat.
Dacă variabila de comparat nu are o
distribuţie normală (de exemplu valoarea
creatininei la pacienţii cu insuficienţă
renală) sau este o variabilă ordinală
(stadializarea tumorii, sau clasa
NYHA a insuficienţei cardiace, sau
scorul durerii pe o scală analogică
vizuală, īnainte şi după un tratament),
vom folosi un test nonparametric
īmperecheat, care este testul Wilcoxon.
Echivalentul nonparametric al ANOVA
(testul F) este testul Kruskal-Wallis.
Testele nonparametrice nu ţin cont de
valoarea efectivă a variabilei, ci de
ordinea lor (rank tests) - care este valoarea
cea mai mică, care este
următoarea şi aşa mai departe...
Īn cazul variabilelor dihotomice (pentru
compararea proporţiilor) se foloseşte
testul X2 sau variantele sale Yates şi
mai ales testul exact al lui Fisher (atunci
cānd īn tabelul de contingenţă
2x2 avem īntr-una din căsuţe o valoare
aşteptată mai mică de 5). De exemplu,
atunci cānd vrem să comparăm proporţ
ia de pacienţi care a făcut infarct īn |
 |
grupul tratat cu statină cu proporţia de
pacienţi care a făcut infarct īn grupul
tratat cu placebo. De remarcat că īn
studiile terapeutice, atunci cānd avem
de-a face cu efecte surogat studiem
variabile cantitative (TA, transaminaze,
clasa NYHA, fracţia de ejecţie, densitatea
osoasa etc.), pe cānd īn cazul
efectelor serioase avem de-a face cu
variabile dihotomice (pacientul a suferit
sau nu infarctul de miocard, fracura,
decesul etc.).
Cānd vrem să vedem cum (şi dacă)
variază o variabilă cantitativă īn funcţie
de o altă variabilă cantitativă, aşadar
vrem să vedem īn ce măsură două
variabile cantitative se corelează, calculă
m coeficientul de corelaţie al lui
Pearson ( r). De exemplu, putem vedea
dacă vārsta se corelează cu VSH (adică
VSH creşte odată cu vārsta).
Dacă variabilele cantitative nu au o distribuţ
ie normală, sau sunt ordinale (de
exemplu, corelaţia dintre fracţia de
ejecţie şi clasa NYHA a insuficienţei
cardiace stāngi, sau dintre valoarea
transaminazelor şi cea a scorului
necroinflamator găsit la biopsia hepatică)
utilizăm echivalentul nonparametric
al coeficientului Pearson, care este
coeficientul de corelaţie Spearman.
Dacă, īn cazul a două variabile care se
corelează, putem spune care variabilă
o determină pe cealaltă şi/sau vrem să
calculăm valoarea unei variabile ştiindo
pe cealaltă, utilizăm regresia lineară
(de exemplu, ştiind valoarea ALAT,
putem prezice scorul necro-inflamator
de la biopsie, sau ştiind īnălţimea prezicem
valoarea VEMS, sau ştiind doza
de captopril pe care o administrăm
prezicem cu cāt va scădea TA).
Variabilele cantitative pot fi transformate
oricānd īn variabile ordinale sau
dihotomice (de exemplu valorile colesterolului
īn quartile, sau īn colesterol
normal/crescut). Īn baza noastră de
date este indicat să trecem (şi pentru
aceasta să culegem) variabilele noastre
ca atare, pentru că apoi putem să |
 |
 |
|
 |
 |