CORSO DI STATISTICA Bruno Mario Cesana
Stefano CalzaNozioni di Calcolo della Probabilità
TERZA PARTE
CORSO DI STATISTICA Bruno Mario Cesana
Stefano Calza
Nozioni di Calcolo della Probabilità
TERZA PARTE
UN TEST DIAGNOSTICO (1)
N
(1000) B + D
(900) A + C
(100) Totale C + D
( 870) D
(850) C
(20) Test –
(Negativo) A + B
( 130) B
( 50) A
(80) Test +
(Positivo) Totale Sano (S) Malato (M) A = VERI POSITIVI, B = FALSI POSITIVI
C = FALSI NEGATIVI, D = VERI NEGATIVI
UN TEST DIAGNOSTICO (2)
Evento: (T+ M) P (T+ M) = A / (A + C) = SENSIBILITA’
Evento: (T - S) P (T - S) = D / (B + D) = SPECIFICITA’
Evento: (T+ S) Falsi Positivi (1 – Specificità)
Evento: (T - M) Falsi Negativi (1 – Sensibilità) Probabilità CONDIZIONATA di ottenere un TEST POSITIVO (T+) DATO CHE IL SOGGETTO E’ MALATO (M): Probabilità CONDIZIONATA di ottenere un TEST POSITIVO (T+) DATO CHE IL SOGGETTO E’ SANO (S):
UN TEST DIAGNOSTICO (3)
Ciò che interessa è la probabilità che IL SOGGETTO SIA MALATO DATO un TEST POSITIVO: Probabilità CONDIZIONATA CHE IL SOGGETTO SIA MALATO (M) DATO un TEST POSITIVO (T+) : Il numeratore è ottenuto dall’Eq.1
Il denominatore [P(T+)] è ottenuto dall’Eq. 1 e dall’Eq 2: P(T+)= (T+ M) + (T+ S).
QUESTA E’ LA FORMULA DEL “TEOREMA DI BAYES” che permette di risolvere il problema dell’INFERENZA INVERSA (dal campione alla popolazione).
UN TEST DIAGNOSTICO (4)
VALORE PREDITTIVO POSITIVO (VP+):
PROBABILITA’ CONDIZIONATA CHE IL SOGGETTO SIA MALATO (M) DATO un TEST POSITIVO (T+): VALORE PREDITTIVO NEGATIVO (VP-):
PROBABILITA’ CONDIZIONATA CHE IL SOGGETTO NON SIA MALATO (S) DATO un TEST NEGATIVO (T-):
TEST DIAGNOSTICO – SCREENING (5)
UN TEST DIAGNOSTICO (6)
n
(1000) B + D
(900) A + C
(100) Totale C + D
( 870) D
(850) C
(20) Test –
(Negativo) A + B
( 130) B
( 50) A
(80) Test +
(Positivo) Totale Sano (S) Malato (M) VP+ = A / (A + B ); VP- = D / (C + D)
N.B.: FORMULE VALIDE SOLO IN CASO DI UN TEST DI SCREENING: n campione casuale dalla popolazione N.
Dalla formula della probabilità condizionata: P(Mi) = Probabilità a priori (non dipendono dall’ esito A)
P(S1 | Mi) = Verosimiglianza (la probabilità di A dato che si è verificato Ei )
P(Mi|S1) = Probabilità a posteriori (verificatosi A, la probabilità con cui Ei si verifica) Ma: Quindi:
Teorema di Bayes
La P(A) sarà data dalla somma delle singole aree di intersezione AEi Considero ora un evento A, sottoinsieme di ovvero: A E1 E2 E3 .......... En Consideriamo l’insieme degli eventi Ei,, i= 1,2..n tra loro incompatibili che costituiscono lo spazio campione
Teorema di Bayes (2)
Proviamo a pensare agli eventi Ei come le cause che determinano l’evento A. Allora, se si è verificato A, con quale probabilità la causa è Ei? In altre parole: P(Ei|A) = ?
In tal caso le osservazioni sperimentali (A) forniscono nuove informazioni alle conoscenze a priori (E) [Da dove vengono quest’ultime? Da altri studi, da esperienze personali, ecc.]
Come noto: P(Ei) = Probabilità a priori (non dipendono dall’ esito A)
P(A| Ei) = Verosimiglianza (la probabilità di A dato che si è verificato Ei )
P(Ei|A) = Probabilità a posteriori (verificatosi A, la probabilità con cui Ei si verifica) Ma: Quindi:
Ulteriore esempio
E’ noto che il 2% delle persone controllate dalla polizia è risultato essere in stato d’ebbrezza.
Un laboratorio ha messo a punto un alcool-test che ha dato esito positivo nel 95% dei casi di reale ebbrezza (sensibilità) ed esito negativo nel 96% delle persone sobrie (specificità).
Quale è la probabilità che una persona sia realmente ebbra, in caso di esito positivo del test (dato che il test è risultato positivo) ?
E = evento “ubriaco”
NE = evento “non ubriaco”
T+ = evento “test positivo”
T- = evento “test negativo”
P(E) = 0.02 P(NE) = 1 - P(E) = 0.98
P(T+ |E) = 0.95 P(B|E) = 1 - P(T+ |E) = 0.05
P(T- |NE) = 0.96 P(T- |NE) = 1 - P(T- |NE) = 0.04
Esempio (2)
Risulterà:
ovvero:
Non molto buono! Se aumentassi la specificità: P(T-|NE) = 0.99?
Decisamente meglio… ma non certo ottimale !
Comments