Dacă în regresia lineară multiplă încercam
să prezicem, din mai multe variabile
independente, o variabilă dependentă
numerică, regresia logistică o folosim
când vrem să prezicem o variabilă nominală
dihotomică.
Regresia logistică poate fi rezultatul unui
studiu etiologic sau terapeutic, ca şi celelalte
tipuri de analiză multivariabilă,
regresia logistică cuantifică asocierea
dintre un factor de risc (sau tratament) şi
o boală (sau orice eveniment), după
ajustarea pentru celelalte variabile,
prognostic sau diagnostic (prin regresia
logistică se ajunge la diverse scoruri sau
reguli de predicţie clinică).
Atunci când un pacient slăbeşte involuntar, ne
întrebăm dacă acesta nu are un cancer, iar
printre cele mai simple elemente pe care le
evaluăm sunt vârsta pacientului, hemoglobina
şi VSH. Variabila dependentă (cancerul ca etiologie
a scăderii ponderale) este nominală dihotomică
(pacientul poate să aibă sau să nu aibă
cancer), în timp ce variabilele independente
sunt în acest caz numerice continue (vârsta,
hemoglobina, VSH). Din experienţă, ştim că este
mai probabil cancerul atunci când pacientul are
o vârstă mai înaitată, un VSH mai mare şi are şi
anemie.
Se efectuează un studiu de cohortă - sunt
incluşi toţi pacienţii cu scădere ponderală involuntară
importantă, se măsoară şi se introduc în
baza de date variabilele independente (vârsta,
VSH, hemoglobina), apoi se caută cauza scăderii
ponderale, rezultatul acestei căutări fiind o variabilă
nominală dihotomică (cancer DA/NU).
Iniţial vom dori să vedem dacă
pacienţii cu cancer diferă de cei
fără cancer în |
 |
privinţa variabilelor independente, în analiză univariată
(se compară, prin teste parametrice=
Student t dacă acestea
au o distribuţie normală sau
neparametrice= Mann-Whitney,
dacă nu au o distribuţie normală
vârsta, VSH şi hemoglobina celor
cu cancer şi a celor fără cancer) şi
vom veda că acestea diferă semnificativ
statistic. În acelaşi timp
ştim că VSH creşte direct
proporţional cu vârsta şi invers
proporţional cu hemoglobina, şi
atunci ne întrebăm dacă VSH crescută
este legată într-adevăr de
cancer, sau este doar un factor de
confuzie, fiind mai mare numai
pentru că pacienţii cu cancer sunt
mai în vârstă şi au mai degrabă
anemie. Una din metodele de a
verifica acest lucru este să efectuă
m o analiză multivariată.
Rezultatul regresiei logistice este
tot o ecuaţie, care prezice cel mai
bine o variabilă efect binară (cancer
da/nu) din una sau mai multe
variabile care pot fi cantitative (în
exemplul nostru vârsta, VSH,
hemoglobina) sau binare. În loc
de a lucra cu probabilităţi (care se
pot afla între 0 şi 1), regresia
logistică lucrează cu logaritmul
natural (ln) al cotei (odds), care
poate lua orice valoare, pozitivă sau negativă. Ecuaţia |
 |
regresiei
logistice poate fi exprimată astfel:
ln(odds Y) = ‚0 + ‚1 X1 + ‚2 X2 +
‚3 X3 + ....‚nXn, adică
ln(odds cancer) = ‚0 + ‚1(vârsta) +
‚2(VSH) + ‚3 (Hb), unde ‚ sunt coeficienţ
ii calculaţi de programul
statistic şi care sunt de fapt logaritmii
naturali ai odds ratio ai
fiecărei variabile, iar ‚0= constanta
= logaritmul natural al odds
cancerului la indivizii la care
toate variabilele au valoarea 0.
Din tabelul 1 vedem că variabilele
luate în calcul sunt asociate cu
etiologia neoplazică independent
una de cealaltă, iar VSH este asociată
cu acesta: după ajustarea
pentru vârstă şi anemie, OR pentru
VSH este rămâne semnificativ
statistic (p=0,016, intervalul de
încredere nu îl conţine pe 1).
Observăm, în acelaşi timp, că OR
pentru toate variabilele sunt foarte
mici, apropiate de 1 şi nesemnificative
clinic: aceasta din cauză că
am folosit variabile numerice, iar
semnificaţia unei OR de 1,044
pentru vârstă este că pacienţii cu o
anumită vârstă au un risc de a
avea cancer de 1,044 de ori mai
mare decât cei cu vârsta imediat
inferioară (pacienţii de 59 de ani
au un risc de cancer de 1,044 de
ori mai mare decât pacienţii de 58
de ani, iar pacienţii de 58 de ani
au un risc de 1,044 de ori mai |