Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Lez 6
Lez 6
. p.1/21
Entropia condizionata
Def. Date due v.c. X e Y con d.d.p. congiunta p(x, y),
deniamo entropia condizionata la quantit :
H (Y |X ) =
xX
p (x) H (Y |X = x) p (x)
xX y Y
= =
xX y Y
1 p (y |x) lg p (y |x)
=
xX y Y
. p.2/21
1 p (x, y ) lg = p (x, y )
x,y
=
x,y
=
x,y
x,y
=
x y
1 + H (Y |X ) p (x, y ) lg p (x)
=
x
1 p (x) lg + H (Y |X ) = H (X ) + H (Y |X ) p (x)
. p.3/21
. p.4/21
Corollario
H (X, Y |Z ) = H (X |Z ) + H (Y |X, Z )
. p.5/21
Entropia relativa
Def. Date due d.d.p. p(x) e q(x), lentropia relativa (o
distanza Kullback Leibler) D (p||q ) di p(x) e q (x) denita come p (x ) D (p||q ) = p (x) lg q (x)
xX
In generale D (p||q ) = D (q ||p) Propriet: D (p||q ) 0 con luguaglianza sse p = q (si dimostra con la dis. di Jensen)
. p.6/21
Mutua Informazione
Def. Date due v.c. X e Y con probabilit congiunta p(x, y),
la mutua informazione denita come lentropia relativa tra p(x, y ) e p(x)p(y ):
I (X ; Y ) = D (p(x, y )||p(x)p(y )) =
xX y Y
= I (Y ; X )
La mutua informazione rappresenta linformazione che una certa variabile contiene circa unaltra variabile.
. p.7/21
Dim.
I (X ; Y ) = D (p (x, y ) p (x) p (y )) 0.
. p.8/21
Teorema
1. I (X ; Y ) = H (X ) H (X |Y ) = H (Y ) H (Y |X ) = I (Y ; X ) 2. I (X ; Y ) = H (X ) + H (Y ) H (X, Y ) 3. I (X ; Y ) = I (Y ; X ) 4. I (X ; X ) = H (X )
. p.9/21
Dim.
1.
p (X, Y ) p (Y ) p (X |Y ) I (X ; Y ) = E lg = E lg p (X ) p (Y ) p (X ) p (Y ) p (X |Y ) 1 = E lg = E lg p (X |Y ) + lg p (X ) p (X ) 1 1 = E lg E lg p (X ) p (X |Y ) = H (X ) H (X |Y )
2. Per la 1
I (X ; Y ) = H (Y ) H (Y |X )
Quindi
I (X ; Y ) = H (Y ) (H (X, Y ) H (X )) = H (X ) + H (Y ) H (X, Y )
4. Per la 1
I (X ; X ) = H (X ) H (X |X ) = H (X )
. p.11/21
Esercizio
Esercizio Dimostrare H (X |Y ) H (X ) con luguaglianza
sse X e Y sono indipendenti.
. p.12/21
Esempio
Y \X 1 2 3 4 1
1 8 1 16 1 16 1 4
1
1 16 1 8 1 16
3
1 32 1 32 1 16
4
1 32 1 32 1 16
. p.13/21
. p.14/21
H (X |Y ) =
i=1
p (y = i) H (X |Y = i) 1 1 1 1 , , , 2 4 8 8 1 1 1 1 , , , 4 4 4 4 1 + H 4 1 1 1 1 , , , 2 4 8 8
1 = H 4 1 + H 4 1 = 4 1 = 4
1 + H (1, 0, 0, 0) 4
1 1 1 1 1 + 2 + 2 3 2 + lg 4 + 0 2 4 8 4 4 1 7 11 1 1 3 1 1 + + 2+ = + = 2 2 4 2 2 4 2 8
. p.15/21
13 H (Y |X ) = 8 11 27 H (X, Y ) = H (Y ) + H (X |Y ) = 2 + = 8 8 3 7 11 = I (X ; Y ) = H (X ) H (X |Y ) = 4 8 8 3 13 = = H (Y ) H (Y |X ) = 2 8 8
. p.16/21
H (X1 , ..., Xn ) =
i=1
Dim.
H (X1 , X2 ) = H (X1 ) + H (X2 |X1 )
. p.17/21
Iterando
H (X1 , ..., Xn ) = H (Xn |X1 , ..., Xn1 ) + H (X1 , ..., Xn1 ) = ... = H (Xn |Xn1 . . . X1 ) + H (Xn1 |Xn2 . . . X1 ) + . . . + H (X2 |X1 ) + H (X1 )
n
=
i=1
. p.18/21
Teorema
n
H (X1 , , Xn )
i=1
H (Xi ),
Dim.
n n
H (X1 , . . . , Xn ) =
i=1
H (X i )
. p.19/21
Esercizio
Esercizio Dimostrare che, data la funzione f , risulta
H (X ) H (f (X ))
. p.20/21