Ce este analiza multivariabilă?
Analiza multivariabilă (sau multivariată)
este o unealtă statistiă
prin care se determină contribu-
ţia fiecăruia dintre mai mulţi factori
la apariţia unui efect. De
exemplu, există o mulţime de factori
asociaţi cu apariţia bolii coronariene
(fumatul, obezitatea, sedentarismul,
diabetul, hipercolesterolemia,
hipertensiunea) -
numiţi factori de risc, variabile indepenedente,
sau variabile explicative.
Analiza multivariabilă ne
permite să determinăm contribu-
ţia independentă a ficăruia dintre
aceşti factori de risc la apariţia
bolii coronariene (numită efect
sau variabilă dependentă).
De ce avem nevoie de analiza
multivariabilă?
În studiile observaţionale, fiind
mai mulţi factori de risc, nu ştim
care dintre ei este adevărat sau în
ce măsură asocierea aparentă dintre
un factor de risc şi efect nu este
datorată de fapt altora. Să presupunem
că în baza noastră de date
avem toate informaţiile şi variabilele
privind pacienţii, şi vom testa
dacă există o asociere între variabilele
fumat şi boala coronariană,
fără a ţine cont de vreo altă variabilă.
Neexistând randomizare (nu
putem pune pacienţii, prin tragere
la sorţi, să fumeze sau nu), chiar
dacă în analiza univariată (bivariată,
după alţii) găsim o asociere
între fumat şi apariţia coronaropatiei,
aceasta reprezintă o
dovadă prea slabă pentru a o considera |
 |
cauzală. Poate că fumătorii
fac mai degrabă coronaropatie
pentru că sunt mai frecvent bărbaţi
şi/sau sunt săraci şi/sau au mai
degrabă un stil de viaţă nesănătos
în alte privinţe, care sunt adevăraţii
factori de risc. Cu alte cuvinte,
relaţia dintre fumat şi coronaropatie
poate fi confundată de aceste
alte variabile. Confuzia apare atunci
când o asociere aparentă dintre
un factor de risc şi un efect este
afectată de relaţia unei a treia variabile
cu factorul de risc şi cu efectul.
Pentru ca o variabilă să fie un
factor de confuzie, aceasta trebuie
să se asocieze atât cu factorul de
risc, cât şi cu efectul. Sexul masculin
şi sedentarismul pot fi factori
de confuzie, deoarece sunt asociate
atât cu fumatul, cât şi cu boala
coronariană. Prin analiza multivariabilă,
putem demonstra că şi
după ajustarea pentru sexul masculin
şi sedentarism, fumatul are o
relaţie independentă cu boala
coronariană. Să presupunem că în
analiza univariată, boala coronariană
este asociată cu consumul de
cafea (riscul relativ=5, cu semnificaţ
ie statistică). Bănuim, însă, că
există un factor de confuzie, şi anume
fumatul, care este asociat
cu consumul de cafea (cei care
beau cafea, în general fumează) şi
cu efectul (am descoperit asocierea
cafea-coronaropatie). Pentru a
verifica această ipoteză, facem o
analiză multivariată simplă, în
care introducem ca variabile independente
atât cafeaua, cât şi |
 |
fumatul, şi vom vedea efectul fiecăreia dintre ele
asupra apariţiei coronaropatiei. Dacă riscul de a
face boală coronariană se menţine semnificativ
statistic la cei care consumă cafea, înseamnă că
aceasta reprezintă un factor de risc independent
pentru boala coronariană. Dacă însă, în analiza
multivariată, riscul dispare, înseamnă că
într-adevăr, relaţia cafea-coronaropatie a fost confundată
de relaţia adevărată, fumat-coronaropatie.
Bineînţeles că în analiza multivariată vom găsi o
relaţie semnificativă statistic fumat-coronaropatie.
Deşi teoretic se poate face distincţia între
asocierea independentă şi confuzie, o variabilă
poate avea în acelaşi timp un efect independent şi
să fie un factor de confuzie: de exemplu sărăcia
este un factor de confuzie între fumat şi coronaropatie
(cei săraci fumează mai mult şi fac mai
des boala coronariană), dar sărăcia are de asemenea
şi un efect independent asupra apariţiei bolii
coronariene (după ajustarea pentru fumat, colesterolemie
şi alţi factori de risc, aceasta rămâne
totuşi asociată semnificativ cu apariţia bolii).
Înafara analizei multivariabile, pentru eliminarea
confuziei mai poate fi utilizată analiza stratificată,
prin care se cercetează rolul unui factor de risc în
apariţia unui efect, în timp ce se ţine cealaltă variabilă
constantă. Ne putem folosi de stratificare
atunci când există două sau trei variabile
potenţiale factori de confuzie; atunci însă când
acestea sunt mai multe, stratificarea ar crea zeci
de grupuri în care investigatorul ar trebui să determine
relaţia dintre variabile, iar numărul de
pacienţi din fiecare grup ar fi din ce în ce mai mic,
pe măsură ce progresăm cu stratificarea şi s-ar
pierde puterea statistică.
Indiferent dacă folosim startificarea sau analiza
multivariată, nu trebuie să uităm că putem stratifica
sau ajusta doar pentru variabilele pe care le
cunoaştem, ori există mulţi factori de confuzie
necunoscuţi şi deci nemăsuraţi, care ne pândesc
la toate colţurile! |