Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
ÐáíåðéóôçìéáêÝò ðáñáäüóåéò
Ïéêïíïìéêü ÐáíåðéóôÞìéï Áèçíþí
ÔìÞìá ÓôáôéóôéêÞò
Éïýëéïò 2007
Ðåñéå÷üìåíá
1 ÅéóáãùãÞ 1
2 Ï äåéãìáôïëÞðôçò Gibbs 3
2.1 ÄåéãìáôïëÞðôçò Gibbs êáé ÌðåûæéáíÞ ÓôáôéóôéêÞ . . . . . . . . . . . . . . 4
2.2 ÐñïóáõîçìÝíá äåäïìÝíá . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.3 ÄåéãìáôïëÞðôçò Gibbs êáé Óýãêëéóç . . . . . . . . . . . . . . . . . . . . . 6
3 Ï áëãüñéèìïò Metropolis-Hastings 7
3.1 Ðáñáäåßãìáôá áëãüñéèìùí Metropolis-Hastings . . . . . . . . . . . . . . . . 8
3.2 Ï äåéãìáôïëÞðôçò áíåîáñôçóßáò . . . . . . . . . . . . . . . . . . . . . . . . 9
3.3 Óõììåôñéêüò ôõ÷áßïò ðåñßðáôïò Metropolis . . . . . . . . . . . . . . . . . . 9
3.4 Áëãüñéèìïé ðïëëáðëáóéáóôéêïý ôõ÷áßïõ ðåñßðáôïõ . . . . . . . . . . . . . . 10
3.5 Áëãüñéèìïé Langevin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
3.6 Ï äåéãìáôïëÞðôçò ôïõ Gibbs . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3.7 ÌÝèïäïò âïçèçôéêþí ìåôáâëçôþí . . . . . . . . . . . . . . . . . . . . . . . 12
5
6 ÐÅÑÉÅ×ÏÌÅÍÁ
5 ÐñáêôéêÞ åöáñìïãÞ 21
5.1 Äåéãìáôïëçøßá áðü ôéò ðëÞñùò äåóìåõìÝíåò êáôáíïìÝò . . . . . . . . . . . 21
5.2 Ðåñéóóüôåñï ãåíéêïß MCMC áëãüñéèìïé . . . . . . . . . . . . . . . . . . . 21
5.3 ÅöáñìïãÞ êáé áíÜëõóç áðïôåëåóìÜôùí . . . . . . . . . . . . . . . . . . . . 25
5.4 ×ñÞóåéò ôïõ MCMC óôçí êëáóéêÞ óôáôéóôéêÞ êáé áëëïý . . . . . . . . . . . 28
5.5 Ëïãéóìéêü . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
ÅéóáãùãÞ
Ïé MCMC (Markov chain Monte Carlo) áëãüñéèìïé ÷ñçóéìïðïéïýíôáé ôþñá åõñÝùò ïõóéá-
óôéêÜ óå üëåò ôéò ðåñéï÷Ýò ôçò ÓôáôéóôéêÞò. ÅéäéêÜ, åöáñìïãÝò ÷ùñéêÞò ÓôáôéóôéêÞò ðïõ
óõíáíôþíôáé óôçí áñ÷Þ ôçò áíÜðôõîçò ôçò ìåèoäïëïãßáò MCMC (?), ðáñÝ÷ïõí Ýíá áðü ôá
ðéï ðñïêëçôéêÜ ðñïâëÞìáôá óôéò ôå÷íéêÝò ôïõ MCMC. Äåí èá Ýðñåðå íá ìáò åêðëÞóóåé ôï
ãåãïíüò üôé ïé ðåñéóóüôåñåò áðü ôéò ìïíôÝñíåò åéóáãùãÝò ôïõ èÝìáôïò äßíïõí Ýìöáóç óôçí
ðñïóáñìïóôéêüôçôá êáé óôç ãåíéêüôçôá ôïõ MCMC êáé áõôü èá êÜíïõìå êé åìåßò åäþ.
Ôï ðñüâëçìá ôï ïðïßï áíáëýåé ç ìÝèïäïò MCMC åßíáé ãíùóôü ìÝóá áðü ôï åõñý öÜóìá
ôùí åðéóôçìþí óõìðåñéëáìâáíïìÝíùí ôçò ÖõóéêÞò, ôçò ÐëçñïöïñéêÞò êáé ôçò ÓôáôéóôéêÞò.
Ìáò åíäéáöÝñåé íá ðñïóïìïéþóïõìå áðü ìéá ðéèáíüôçôá êáôáíïìÞò, áò ôçí ðïýìå (x).
Ðáñüëï ðïõ ç óõíÜñôçóç (·) ìðïñåß íá ãñáöåß óå óõíåðôõãìÝíç ìïñöÞ (ôïõëÜ÷éóôïí ùò
ðñïò ìéá óôáèåñÜ êáíïíéêïðïßçóçò), áò õðïèÝóïõìå üôé åíäéáöåñüìáóôå ãéá ôéò ñïðÝò ôçò
ðïõ äåí åßíáé õðïëïãßóéìåò áíáëõôéêÜ. ÅðéðëÝïí ç ðñïóïìïßùóç áðåõèåßáò áðü ôçí
ìðïñåß íá åßíáé äýóêïëç Þ áäýíáôç, ßóùò åîáéôßáò ôùí ìåãÜëùí äéáóôÜóåùí ôçò, êáé Ýôóé ï
áðëüò Monte Carlo õðïëïãéóìüò ôùí ñïðþí ôçò åßíáé áäýíáôïò. Ç ìÝèïäïëïãßá MCMC
áíôéìåôùðßæåé ôï ðñüâëçìá ìå ôï íá ðñïóïìïéþíåé áðü ôçí áëõóßäá Marêov ôçò ïðïßáò ç
êáôáíïìÞ éóïññïðßáò åßíáé .
¼ðùò èá äïýìå, õðÜñ÷ïõí ìüíï 2 âáóéêÝò ôå÷íéêÝò ðïõ ÷ñçóéìïðïéïýíôáé óôï MCMC. Ç
ìéá ÷ñçóéìïðïéåß ôç ëïãéêÞ äÝ÷ïìáé/áðïññßðôù ãéá íá \äéïñèþóåé" ìéá áõèáßñåôç áëõóßäá
Markov Ýôóé þóôå íá êÜíåé ôçí óôÜóéìç êáôáíïìÞ. ÁõôÞ ç ìÝèïäïò åßíáé âáóéêÜ ï
áëãüñéèìïò Metropolis-Hastings. Ç Üëëç ìÝèïäïò áðëïðïéåß ôï ðñüâëçìá ôùí ðïëëþí
äéáóôÜóåùí ìå ôï íá ðñïóïìïéþíåé áðü äéáöïñåôéêÝò óõíéóôþóåò ìéêñüôåñùí äéáóôÜóåùí
ôçò X = (X (1) ; : : : X (d) ). ÁõôÞ ç éäÝá åßíáé ç ïõóßá ôïõ ÄåéãìáôïëÞðôç Gibbs (Gibbs
sampler). ÕðÜñ÷ïõí ðïëëïß êáé äéÜöïñïé ôñüðïé íá åöáñìïóôïýí ïé äýï áõôÝò ìÝèïäïé êáé
1
2 ÊÅÖÁËÁÉÏ 1. ÅÉÓÁÃÙÃÇ
Ï äåéãìáôïëÞðôçò Gibbs
Ï ðéï åìöáíÞò ôñüðïò ãéá íá ìåôáôñÝøïõìå Ýíá äýóêïëï ðñüâëçìá ðñïóïìïßùóçò óå ðïëëÝò
äéáóôÜóåéò óå ðéï âïëéêü, åßíáé íá ôï ìåéþóïõìå óå ðïëëÝò ðéï åý÷ñçóôåò êáé ìéêñþí
äéáóôÜóåùí ðñïóïìïéþóåéò. Ðïëëïß MCMC áëãüñéèìïé ôï êÜíïõí áõôü, áëëÜ ç ðéï áðëÞ
ìïñöÞ ôçò óôñáôçãéêÞò áõôÞò åßíáé ï ÄåéãìáôïëÞðôçò Gibbs
ÕðïèÝóôå üôé èÝëïõìå íá ðÜñïõìå äåßãìá áðü ôçí ðïëõìåôáâëçôÞ êáôáíïìÞ (x(1) ; : : : ; x(d) ).
(Ôþñá èá õðïèÝóïõìå üôé áðü åäþ êáé óôç óõíÝ÷åéá ôïõ êåöáëáßïõ ïé êáôáíïìÝò åßíáé
óõíå÷åßò áëëÜ üëá åðåêôåßíïíôáé Üìåóá óôéò äéáêñéôÝò êáôáíïìÝò). Èá ÷ñçóéìïðïéïýìå
ðÜíôá ôéò óõíéóôþóåò óå ðáñÝíèåóç óôïõò åêèÝôåò, Ýôóé þóôå ïé ôõ÷áßåò ìåôáâëçôÝò ðïõ
êáôáíåìÞèçêáí óýìöùíá ìå ôï íá ìðïñïýí íá ãñáöïýí X = (X (1) ; : : : X (d) ), êáé ç
õðïèåôéêÞ êáôáíïìÞ ôçò i-óôçò äåóìåõìÝíçò óõíéóôþóáò äåäïìÝíùí ôùí õðüëïéðùí óýìöù-
íá ìå ôçí èá ãñÜöïíôáé áðëÜ óáí ç äåóìåõìÝíç X (i) |(X (1) ; : : : ; X (i−1) ; X (i+1) ; : : : ; X (d) .
Ïé d äåóìåõìÝíåò êáôáíïìÝò áõôïý ôïõ ôýðïõ ïñßæïíôáé óáí ðëÞñùò äåóìåõìÝíåò êáôáíïìÝò
(full conditional distributions).
Ï äåéãìáôïëÞðôçò Gibbs óåéñéáêÜ êáé óõíå÷üìåíá ðñïóïìïéþíåé áðü ôéò äåóìåõìÝíåò
êáôáíïìÝò ôçò êÜèå óõíéóôþóáò äåäïìÝíùí ôùí Üëëùí óõíéóôùóþí. Ï áëãüñéèìïò áêïëïõ-
èåß ôá ðáñáêÜôù âÞìáôá.
3
4 ÊÅÖÁËÁÉÏ 2. Ï ÄÅÉÃÌÁÔÏËÇÐÔÇÓ GIBBS
ÅðáíáëÜâåôå ôç äéáäéêáóßá.
äåéãìáôïëÞðôçò Gibbs Ý÷åé áðïäåé÷èåß éäéáßôåñá åðéôõ÷Þò óôçí åöáñìïãÞ ôïõ óôçí Ìðåûæé-
áíÞ áíÜëõóç ôùí êáôçãïñéþí ôùí ìïíôÝëùí ðïõ ðåñéÝ÷ïõí äåóìåõìÝíç äïìÞ áíåîáñôçóßáò,
ïðüôå áõôü áðëïðïéåß ðåñáéôÝñù ôç ìïñöÞ ôùí ðëÞñùò äåóìåõìÝíùí ðõêíïôÞôùí ìÝóá
óôïí áëãüñéèìï 1. ÓçìáíôéêÜ ðáñáäåßãìáôá ðåñéëáìâÜíïõí ðïëëÝò êáôçãïñßåò éåñáñ÷éêþí
ìïíôÝëùí, äåßôå ðáñáäåßãìáôïò ÷Üñéí ôï ?, êáé ôá ðñïâëÞìáôá ìå åëëéðÞ óôïé÷åßá. Äåßôå
åðßóçò ôï BUGS (http://www.mrc-bsu.cam.ac.uk/bugs/) ãéá ëïãéóìéêü åéäéêÜ ãéá ôç
äåéãìáôïëçøßá Gibbs óôá éåñáñ÷éêÜ ìïíôÝëá.
1. ¸íá áðü ôá âáóéêÜ ðñïâëÞìáôá ðïõ ðåñéïñßæïõí ôçí õðïëïãéóôéêÞ ÓôáôéóôéêÞ åßíáé
ôï ãåãïíüò üôé ìåñéêÜ áðü ôá äåäïìÝíá ìðïñåß íá ëåßðïõí. ÈåùñçôéêÜ ç êáôáíïìÞ
ôùí ðáñáôçñçèÝíôùí äåäïìÝíùí èá ìðïñïýóå íá êáôáóêåõáóèåß ïëïêëçñþíïíôáò ôá
åëëéðÞ äåäïìÝíá. Ùóôüóï êÜôé ôÝôïéï åßíáé óõ÷íÜ äýóêïëï áí ü÷é áäýíáôï.
2. Óå ëáíèÜíïíôá ìïíôÝëá (latent models) üðùò ôá ìïíôÝëá ìßîçò êáé ôá êñõììÝíá
ìïíôÝëá Markov (Hidden Markov models), ç ðéèáíoöÜíåéá ìðïñåß íá åêöñáóôåß óáí
ìÝóç ôéìÞ Þ Ýíá ïëïêëÞñùìá üóïí áöïñÜ ôç ëáíèÜíïõóá äïìÞ, áëëÜ óõ÷íÜ áõôÞ ç
Ýêöñáóç äåí ìðïñåß íá õðïëïãéóèåß áðïôåëåóìáôéêÜ. Åíôïýôïéò, ëáìâÜíïíôáò õðüøç
ôç ëáíèÜíïõóá äïìÞ, ç äåóìåõìÝíç ðéèáíüôçôá åßíáé óõ÷íÜ ðïëý áðëïýóôåñç. Óå áõôü
ôï ðñüâëçìá åßíáé ÷ñÞóéìï íá åßíáé óå èÝóç êáíåßò íá ìåôá÷åéñéóôåß ôç ëáíèÜíïõóá
äïìÞ óáí ðñïóáõîçìÝíá äåäïìÝíá (augmented data).
¸óôù y obs åßíáé ôá ðáñáôçñçèÝíôá óôïé÷åßá, y mis ôá åëëéðÞ óôïé÷åßá, êáé θ ç Üãíùóôç
ðáñÜìåôñïò ôçò ðéèáíïöÜíåéáò ìå apriori êáôáíïìÞ ôçí 0 (θ). Ôüôå ôá ðáñáðÜíù ðáñáäåß-
ãìáôá äåß÷íïõí ìéá êáôÜóôáóç óôçí ïðïßá ç (y obs ; ymis | θ) åßíáé äéáèÝóéìç åíþ ç
(y obs | θ) äåí åßíáé. Ùò áðïôÝëåóìá áõôïý, èåùñïýìå ôçí y mis óáí Ýíá ðåñáéôÝñù óýíïëï
ðáñáìÝôñùí Ýôóé þóôå
Ýíá äåßãìá áðü ôçí áðü êïéíïý êáôáíïìÞ. Ç ðåñéèþñéá êáôáíïìÞ ôïõ åßíáé åðïìÝíùò ç
aposteriori êáôáíïìÞ ðïõ ìáò åíäéáöÝñåé.
Ï áëãüñéèìïò Metropolis-Hastings
4. ÅðáíáëÜâåôå.
7
8 ÊÅÖÁËÁÉÏ 3. Ï ÁËÃÏÑÉÈÌÏÓ METROPOLIS-HASTINGS
ðåñéï÷Ýò. Áõôü åßíáé óõ÷íÜ ìéá åðáñêÞò ëýóç, áëëÜ üðïõ ðåñáéôÝñù ôïðéêÝò ðëçñïöïñßåò
ãéá ôçí ðõêíüôçôá-óôü÷ï (üðùò ç ðáñÜãùãüò ôïõ) åßíáé äéáèÝóéìåò, áõôÞ ç ðëçñïöïñßá
ìðïñåß óõ÷íÜ íá ÷ñçóéìïðïéçèåß ãéá íá ðáñá÷èïýí ðåñéóóüôåñï áðïôåëåóìáôéêÝò ìÝèïäïé.
Ïé ðéï áðëÝò ôÝôïéåò ìÝèïäïé åßíáé ç êáôçãïñßá ôùí áðïêáëïýìåíùí ìåèüäùí Langevin
(?, ?), ïé ïðïßåò ðñïÝñ÷ïíôáé áðü óõíå÷åßò äéáäéêáóßåò äéÜ÷õóçò ÷ñüíïõ ðïõ Ý÷ïõí óôÜóéìç
êáôáíïìÞ . Ï âáóéêüò Langevin áëãüñéèìïò (Lan-gevin algorithm) óôï Rd (ìåñéêÝò öïñÝò
áðïêáëïýìåíïò MALA (Metropolis-adjusted Lan-gevin algorithm) Þ Langevin-Hastings
áëãüñéèìïò) ÷ñçóéìïðïéåß ìéá ðñïôåéíüìåíç êáôáíïìÞ ðïõ äßíåôáé áðü ôçí
½ ¾
1 −ky − x − 2 ∇ log (x)=2k2
q(x; y) = exp ;
(2 )d=2 2 2
ãéá êÜðïéá êáôÜëëçëç ðáñÜìåôñï . ÁõôÞ åßíáé ç ðñïôåéíüìåíç êßíçóç áðü ôï x êáé
õðïôßèåôáé üôé Ý÷åé êáôáíïìÞ äéÜóôáóçò d ðïõ äßíåôáé áðü ôçí N (x+ 2 ∇ log (x)=2; 2 Id ).
Åäþ ôï ∇ ïñßæåé ôï óõíÞèç ôåëåóôÞ ðáñáãþãïõ. Áíôß íá Ý÷åé êÝíôñï ôçí ôñÝ÷ïõóá ôéìÞ,
ôï ðñïôåéíüìåíï êÝíôñï ñõèìßæåôáé óýìöùíá ìå ôéò ðëçñïöïñßåò ãéá ôï ðïõ ç ðõêíüôçôá-
óôü÷ïò åßíáé ðéèáíü íá åßíáé ìåãáëýôåñç.
ÈåùñçôéêÜ áðïôåëÝóìáôá áðü ôïõò ? ðñïôåßíïõí üôé ïé ìÝèïäïé Langevin óå åöáñìïãÝò ìå
ìåãÜëåò äéáóôÜóåéò åßíáé óçìáíôéêÜ áíþôåñïé áðü ôç ÷ñÞóç ôùí áðëïýóôåñùí åíáëëáêôéêþí
üðùò ï áëãüñéèìïò ôõ÷áßïõ ðåñßðáôïõ Metropolis, êáé áõôÜ ôá áðïôåëÝóìáôá åðéâåâáéþíïíôáé
ìå ôç ÷ñÞóç ôùí ìåèüäùí Langevin, üôáí óå ðïëëÝò ðåñéðôþóåéò åßíáé áäýíáôï íá åðéôåõ÷èåß
åðáñêÞò ìßîç ôçò áëõóßäáò Markov ìå ôïí áëãüñéèìï ôõ÷áßïõ ðåñßðáôïõ Metropolis.
¼ðùò ìå ôïí áëãüñéèìï Metropolis, Ýíá âáóéêü ðñüâëçìá åßíáé íá âñåèåß ìéá ëïãéêÞ ôéìÞ
ãéá ôï 2 . ÅÜí ôï 2 åßíáé ðÜñá ðïëý ìéêñü, ïé êéíÞóåéò ãßíïíôáé ðÜíôá áðïäåêôÝò, êáé ï
áëãüñéèìïò åßíáé áíáðïôåëåóìáôéêüò äåäïìÝíïõ üôé êéíåßôáé óôïí ÷þñï áñãÜ. ÁöåôÝñïõ,
ìåãÜëåò ôéìÝò ôïõ 2 ïäçãïýí ôéò ðéï ðïëëÝò ðñïôåéíüìåíåò êéíÞóåéò óôçí áðüññéøç. ¸íá
ðñáêôéêü ðñüâëçìá åßíáé üôé ç óçìáóßá \ìåãÜëï" êáé \ìéêñü" ìÝóá óå áõôü ôï ðëáßóéï
åîáñôÜôáé áðïöáóéóôéêÜ áðü ôï . ÈåùñçôéêÜ áðïôåëÝóìáôá ðïõ äßíïõí ðñáêôéêÞ êáèï-
äÞãçóç ãéá áõôü ôï ðñüâëçìá ãéá ôïí áëãüñéèìï Langevin- Hastings äßíïíôáé áðü ôïõò ?,
åíþ ãéá ãåíéêüôåñïõò áëãüñéèìïõò äåßôå ôï ?.
ÖõóéêÜ, ôßðïôá äåí Ýñ÷åôáé ÷ùñßò êüóôïò, êáé ôï ðñüâëçìá ìå ôçí åöáñìïãÞ ôïõ Langevin-
Hastings ðñïÝñ÷åôáé áðü ôçí áíÜãêç íá õðïëïãéóôïýí ïé ðáñÜãùãïé ôïõ . Óôç ÷åéñüôåñç
ðåñßðôùóç, ïé ðáñÜãùãïé ôïõ ìðïñåß íá ÷ñåéáóôåß íá õðïëïãéóôïýí ìå áñéèìçôéêÝò
ðñïóåããßóåéò. Åíôïýôïéò, óõ÷íÜ, åéäéêÜ óôéò êáôÜëëçëåò åêèåôéêÝò ïéêïãÝíåéåò, êáé üðïõ ç
êáôÜëëçëç äåóìåõìÝíç äïìÞ áíåîáñôçóßáò õðÜñ÷åé, ìéá áíáëõôéêÞ Ýêöñáóç ãéá ôï ∇ log (x)
12 ÊÅÖÁËÁÉÏ 3. Ï ÁËÃÏÑÉÈÌÏÓ METROPOLIS-HASTINGS
èá Ý÷åé ìßá áðëÞ ìïñöÞ. Óå áõôÞí ôçí ðåñßðôùóç ôï õðïëïãéóôéêü êüóôïò ôçò åöáñìïãÞò
ôïõ Langevin -Hastings åßíáé óõíÞèùò ó÷åôéêÜ ìÝôñéï.
Ðéï ðåñßðëïêåò ìÝèïäïé Langevin Ý÷ïõí áêüìá êáëýôåñç èåùñçôéêÞ õðïóôÞñéîç áðü ôéò
Langevin- Hastings (?), áëëÜ óõ÷íÜ ç õëïðïßçóç áõôþí ôùí ìåèüäùí åßíáé ðïëý ðéü
÷ñïíïâüñá, ðåñéëáìâÜíïíôáò áîéïëüãçóç ôùí ðåñßðëïêùí åêèåôþí ìå ðßíáêåò óå êÜèå
åðáíÜëçøç ãéá ôçí åöáñìïãÞ ôïõò.
üôáí
(x(1) ; : : : x(i−1) ; x(i+1) ; : : : x(d) ) = (y (1) ; : : : y (i−1) ; y (i+1) ; : : : y (d) )
êáé 0 óå Üëëç ðåñßðôùóç. Åýêïëá åëÝã÷åôáé üôé ìå ìéá ôÝôïéá êáôáíïìÞ ðñüôáóçò, ≡ 1
ìÝóá óôï âÞìá 2 ôïõ áëãïñßèìïõ 2.
Áí êáé ðñïöáíþò ðéï ðåñßðëïêç áðü ôçí , ç E ìðïñåß íá åßíáé êáôáëëçëüôåñç ãéá
åîåñåýíçóç ìÝóù MCMC. Ìéá äçìïöéëÞò åöáñìïãÞ ôùí âïçèçôéêþí ìåôáâëçôþí åßíáé
ï äåéãìáôïëÞðôçò öÝôáò (slice sampler), äåßôå ôï ? êáé ?. Ï äåéãìáôïëÞðôçò öÝôáò
÷ñçóéìïðïéåß êáôÜëëçëåò ðáñáãïíôïðïéÞóåéò ôçò ðõêíüôçôáò ãéá íá åéóÜãåé ôéò âïçèçôéêÝò
ìåôáâëçôÝò ãéá íá áðëïðïéÞóåé ôï ðñüâëçìá äåéãìáôïëçøßáò. ÕðïèÝóôå üôé ôï åðéäÝ÷åôáé
ìéá ðáñáãïíôïðïßçóç
l
Y
(x) = f0 (x) fi (x) : (3.7)
i=1
Óõ÷íÜ õðÜñ÷ïõí ðïëý öõóéêÝò ôÝôïéåò ðáñáãïíôïðïéÞóåéò. Ðáñáäåßãìáôïò ÷Üñéí åÜí
åßíáé ç aposteriori ðõêíüôçôá áðü ìéá ÌðåûæéáíÞ áíÜëõóç, f0 èá ìðïñïýóå íá åßíáé ç
apriori êáôáíïìÞ ìå fi íá åßíáé ç óõìâïëÞ óôçí ðéèáíïöÜíåéá áðü ôï iü óçìåßï äåäïìÝíùí,
1 ≤ i ≤ l.
¸óôù S (u) = {x : u(i) ≤ fi (x); 1 ≤ i ≤ l}, ôüôå åýêïëá ìðïñåß íá äåé êáíåßò üôé ç áðü
êïéíïý ðõêíüôçôá ôùí X êáé U äßíåôáé áðü ôçí
üðïõ 1[·] óõìâïëßæåé ôç äåßêôñéá óõíÜñôçóç. Óõ÷íÜ ðáßñíïõìå f0 íá åßíáé óôáèåñá, êáé óå
áõôÞí ôçí ðåñßðôùóç, E åßíáé ç ïìïéüìïñöç ðõêíüôçôá óôï ∩li=1 {x : u(i) ≤ fi (x)}.
Ï äåéãìáôïëÞðôçò öÝôáò ðñáãìáôïðïéåß Ýíá äåéãìáôïëÞðôç Gibbs óôï E . Ç äåóìåõìÝíç
êáôáíïìÞ ôïõ U|X êáèïñßæåôáé áðü ôçí (??) êáé ç áðáßôçóç üôé ôá U (i) s íá åßíáé äåóìåõìÝíá
áíåîÜñôçôá. ÅðïìÝíùò áõôü ôï ìÝñïò ôïõ áëãïñßèìïõ åßíáé Üìåóá åöáñìüóéìï. Ï ðéï
ðñïêëçôéêüò óôü÷ïò åßíáé íá ëÜâïõìå äåßãìá áðü ôç X|U äåäïìÝíïõ üôé ðåñéëáìâÜíåé
ðñïóïìïßùóç áðü ìéá ðõêíüôçôá áíÜëïãç ðñïò ôçí ðåñéêïììÝíç óõíÜñôçóç f0 (x)1[x ∈
S (u)]. Áêüìá êáé üôáí ç f0 åßíáé óôáèåñÜ, áõôÞ ç ðñïóïìïßùóç ìðïñåß íá åßíáé äýóêïëç,
14 ÊÅÖÁËÁÉÏ 3. Ï ÁËÃÏÑÉÈÌÏÓ METROPOLIS-HASTINGS
äåäïìÝíïõ üôé áðáéôåßôáé ðñïóïìïßùóç áðü ôçí ïìïéüìïñöç êáôáíïìÞ óå ìéá åíäå÷ïìÝíùò
õøçëÞò äéÜóôáóçò ðåñßðëïêçò ðåñéï÷Þò, êáé áõôü ðåñéïñßæåé ôç äõíáôüôçôá åöáñìïãÞò ôïõ
äåéãìáôïëÞðôç öÝôáò. Åíôïýôïéò ïé ? êáé ? ðñïóöÝñïõí äéÜöïñåò ðéèáíÝò óôñáôçãéêÝò ãéá
íá åêôåëåóôåß áõôü ôï âÞìá ôçò ðñïóïìïßùóçò.
Ï ? åðéêåíôñþíåôáé óôçí ðåñßðôùóç üðïõ l = 1 êáé ðåñéãñÜöåé ôéò ìåèüäïõò üðïõ ÷ñçóéìïðïéåß
äåéãìáôïëçøßá áðüññéøçò ãéá íá ðÜñåé äåßãìá áðü ôç X|U. Óôï ? âëÝðïõìå üôé óõ÷íÜ
÷ñçóéìïðïéåßôáé ç ðåñßðôùóç l > 1, ìå ôçí åðéëïãÞ ôçò ðáñáãïíôïðïßçóçò íá õðáãïñåýåôáé
áðü ôçí áíÜãêç ôçò áêñéâïýò áíáðáñÜóôáóçò ôïõ S (U) ùò ðåñéïñéóìüò óôéò ðéèáíÝò ôéìÝò
÷þñïõ êáôáóôÜóåùí. Áõôü áðáéôåß ïõóéáóôéêÜ íá åßìáóôå óå èÝóç íá áíáóôñÝøïõìå êÜèå
ìéá áðü ôéò óõíáñôÞóåéò fi ; 1 ≤ i ≤ l.
ÊåöÜëáéï 4
Ãéá íá êáôáëÜâåé êáíåßò ôç èåùñßá MCMC, åßíáé åðéôáêôéêü üôé ðñÝðåé íá êáôáíïÞóåé
êÜðïéåò âáóéêÝò Ýííïéåò ãéá ôéò áëõóßäåò Markov. Óå áõôÞ ôç ðáñÜãñáöï èá äþóïõìå ôç
óõíïðôéêüôåñç ôùí åéóáãùãþí óôéò äéÜöïñåò óçìáíôéêÝò éäÝåò óôç èåùñßá ôùí áëõóßäùí
Markov. Ðñï÷ùñþíôáò ðåñáéôÝñù óôç èåùñßá èá ìáò áðïóðïýóå áðü ôá êýñéá èÝìáôá áõôþí
ôùí óçìåéþóåùí, ïðüôå óå ðïëëÜ óçìåßá èá áñêåóôïýìå óå ïñéóìÝíåò âáóéêÝò áíáöïñÝò.
¼ëåò ïé Ýííïéåò ðïõ åéóÜãïíôáé åäþ, êáé âÝâáéá ðïëëÝò ðåñéóóüôåñåò, èá ðáñïõóéáóôïýí
óôï ?.
ÕðïèÝóôå áñ÷éêÜ üôé ï ÷þñïò êáôáóôÜóåùí, X , åßíáé áñéèìÞóéìïò, êáé Ýóôù Pij = P [Xn =
j | Xn−1 = i], êáé ôï P äçëþíåé ôïí ðßíáêá ìå ôá óôïé÷åßá {Pij }. Ôüôå (P n )ij = P [Xn =
j | X0 = i]. Ìéá áëõóßäá Markov åßíáé
áíÜãùãç áí, ãéá üëá ôá i and j , õðÜñ÷ïõí êÜðïéá n ôÝôïéá þóôå Pijn > 0,
áðåñéïäéêÞ áí, ï ìÝãéóôïò êïéíüò äéáéñÝôçò ôïõ {n : Piin > 0} åßíáé 1 ãéá êÜðïéá i,
15
16 ÊÅÖÁËÁÉÏ 4. Ç ÈÅÙÑÉÁ ÔÏÕ MCMC
Ýììïíç åÜí P [Ç áëõóßäá Markov ãõñßæåé óôï i | îåêßíçóå áðü ôï i] = 1 ãéá üëá ôá i, êáé
èåôéêÜ Ýììïíç áí åßíáé áíÜãùãç, áðåñéïäéêÞ êáé åðáíáëáìâáíüìåíç, êáé {j } åßíáé óõëëïãÞ
ðéèáíïôÞôùí ôÝôïéùí þóôå
lim P n = j (4.1)
n→∞ ij
êáé X
i Pij = j : (4.2)
i
Óçìåéþóôå üôé ãéá ôïí ïñéóìü ôçò áðåñéïäéêüôçôáò, ç åðéëïãÞ ôïõ i äåí åßíáé óçìáíôéêÞ
åöüóïí ç áëõóßäá åßíáé áíÜãùãç. ÁõôÝò ïé Ýííïéåò åßíáé ãíùóôÝò áðü ôç ðñïðôõ÷éáêÞ
ýëç, åíôïýôïéò ãéá ôç èåùñßá ôïõ MCMC èá ðñÝðåé íá åîåôÜóïõìå ðéï ãåíéêïýò ÷þñïõò
êáôáóôÜóåùí áðü ôçí äéáêñéôÞ ðåñßðôùóç. ÕðïèÝóôå ôþñá üôé Ý÷ïõìå êáôáíïìÞ (·) óå Ýíá
÷þñï êáôáóôÜóåùí X . ÁõôÞ ç êáôáíïìÞ ðéèáíüôçôáò åßíáé ðéèáíüí ç aposteriori êáôáíïìÞ,
áëëÜ áõôü ðïõ áîßæåé íá Ý÷ïõìå õðüøç ìáò åßíáé üôé ï X ìðïñåß íá åßíáé ìåãáëýôåñïò áðü
ôï ÷þñï êáôáóôÜóåùí Θ ôùí ðáñáìÝôñùí, ðáñáäåßãìáôïò ÷Üñéí ìðïñåß íá ðåñéëáìâÜíåé ôç
äåßêôñéá ôùí ìïíôÝëùí. Áõôü èá ãßíåé åìöáíÝò óôçí ðáñÜãñáöï ??.
Óõíåðþò, ïé ôå÷íéêÝò ëåðôïìÝñåéåò ôçò ãåíßêåõóçò áðü ôç äéáêñéôÞ óôç óõíå÷Þ ðåñßðôùóç
äåí ðñÝðåé íá ìáò áíçóõ÷ïýí. ÐáñáðÝìðïõìå ôïí åíäéáöåñüìåíï áíáãíþóôç óôá ?, ? Þ
óôï ? ãéá ëåðôïìÝñåéåò.
Óõìâïëßæïõìå ìå P (x; ·) ≡ P (Xt ∈ ·|Xt−1 = x) ôç ðéèáíüôçôá ìåôÜâáóçò (transition
probability) ôçò áëõóßäáò Markov. Ïñßæïõìå ôï ìÝôñï ðéèáíüôçôáò, P ìå
Z
P (A) ≡ (dx)P (x; A) (4.3)
(ãéá ïðïéïäÞðïôå óýíïëï A) ðïõ åßíáé ç êáôáíïìÞ ôçò áëõóßäáò ôïõ Markov ôç ÷ñïíéêÞ
óôéãìÞ t åÜí ç êáôáíïìÞ ìåôÜâáóçò åßíáé P êáé ç êáôáíïìÞ ôç ÷ñïíéêÞ óôéãìÞ t − 1 åßíáé
ãéá Ýíá áõèáßñåôï ìÝôñï ðéèáíüôçôáò . Ìéá áëõóßäá ôïõ Markov Ý÷åé óôÜóéìç êáôáíïìÞ
(stationary (or invariant) distribution) (·) åÜí
ðïõ ðåñéãñÜöåé áêñéâþò ôï ãåíéêü ÷þñï êáôáóôÜóåùí ôçò (??). ¸íáò åðáñêÞò áëëÜ
ü÷é áðáñáßôçôïò, üñïò ãéá íá ðáñáãÜãåé ç êáôáíïìÞ ìåôÜâáóçò áëõóßäåò Markov ìå ôçí
áðáñáßôçôç óôÜóéìç êáôáíïìÞ åßíáé ç áíôéóôñåøéìüôçôá. Ç áíôéóôñåøéìüôçôá óõíåðÜãåôáé
4.1. ÁËÕÓÉÄÅÓ MARKOV ÊÁÉ MCMC 17
üôé ç
(dx)P (x; dy ) = (dy)P (y; dx) (4.5)
êáé éóïññïðåß ôçí ðéèáíüôçôá ôçò ìåôÜâáóçò áðü x óôï y ìå áõôÞí áðü ôï y óôï x. ÁõôÞ
ç åîßóùóç åñìçíåýåôáé ùò éóüôçôá ôùí ìÝôñùí ðéèáíüôçôáò: ç áðü êïéíïý êáôáíïìÞ ôçò
ôñÝ÷ïõóáò êáé ôçò åðüìåíçò êáôÜóôáóçò åßíáé éóïäýíáìç ìå åêåßíç ôçò åðüìåíçò êáé ôçò
ôñÝ÷ïõóáò. ÊáôÜ óõíÝðåéá, ç êáôáíïìÞ ðïõ ðñï÷ùñÜ ðñïò ôá åìðñüò óôï ÷ñüíï åßíáé
éóïäýíáìç ìå áõôÞ ðïõ êéíåßôáé ðñïò ôá ðßóù óôï ÷ñüíï, êáé áõôü åîçãåß ç ÷ñÞóç ôïõ
üñïõ áíôéóôñåøéìüôçôá. Ç áíôéóôñåøéìüôçôá óõíåðÜãåôáé üôé ç åßíáé óôÜóéìç êáôáíïìÞ
åöüóïí Z Z
P (dy) = (dx)P (x; dy ) = (dy)P (y; dx) = (dy): (4.6)
Ç ó÷Ýóç ìåôáîý áëõóßäùí ôïõ Markov êáé ôùí ìåèüäùí MCMC ðñïÝñ÷åôáé áðü ôá áêüëïõèá
óçìáíôéêÜ áðïôåëÝóìáôá. ÕðïèÝóôå üôé ìðïñïýìå íá êáôáóêåõÜóïõìå ìéá áðåñéïäéêÞ êáé
áíÜãùãç áëõóßäá Markov ìå ÷þñï êáôáóôÜóåùí X , ôçò ïðïßáò ç óôÜóéìç êáôáíïìÞ åßíáé
(·). Ôüôå, ç âáóéêÞ èåùñßá áëõóßäùí Markov ìáò ëÝåé üôé ãéá ïðïéïäÞðïôå áñ÷éêÞ ôéìÞ x0 ,
ç ðñáãìáôïðïßçóç ôçò áëõóßäáò X1 ; X2 ; X3 ; : : : ðáñÝ÷åé, ìÝóù ôïõ åñãïäéêïý èåùñÞìáôïò,
ìéá ðñáãìáôïðïßçóç ôçò óôÜóéìçò êáôáíïìÞò åöüóïí
¼ôáí 1 êáé 2 Ý÷ïõí ðõêíüôçôåò üóïí áöïñÜ ôï Lebesgue f1 êáé f2 , êáé ôüôå k1 − 2 k =
R
1
2 X
|f1 (x) − f2 (x)|dx.
Åíôïýôïéò, åßíáé áðáñáßôçôï íá åîåôÜóïõìå ðéï áêñéâåßò óõíèÞêåò óôï r(·; ·) ãéá íá óõãêñß-
íïõìå ôéò äéáöïñåôéêÝò MCMC ìåèüäïõò. ÓõæÞôçóç ãéá ñõèìïýò óýãêëéóçò åßíáé ðÝñá áðü
ôï ðåäßï áõôþí ôùí óçìåéþóåùí, áëëÜ áí åíäéáöÝñåóôå íá ìÜèåôå ðåñéóóüôåñá ãé' áõôü êáé
ôïí ôñüðï ìå ôïí ïðïßï ï ñõèìüò óýãêëéóçò åíüò áëãüñéèìïõ åðçñåÜæåé ôéò ðáñáôçñçèåßóåò
åìðåéñéêÝò éäéüôçôåò ôïõ MCMC, äåßôå ôï ?.
êáôÜ êáôáíïìÞ üóï T → ∞, ãéá êÜðïéï f ∈ (0; ∞), üðïõ f óõìâïëßæåé ôïí ïëïêëçñùìÝíï
áõôïóõó÷åôéóìÝíï ÷ñüíï ãéá ôçí åêôßìçóç ôçò óõíÜñôçóçò f ÷ñçóéìïðïéþíôáò ôçí áëõóßäá
4.3. ÊÅÍÔÑÉÊÏ ÏÑÉÁÊÏ ÈÅÙÑÇÌÁ 19
ÐñáêôéêÞ åöáñìïãÞ
21
22 ÊÅÖÁËÁÉÏ 5. ÐÑÁÊÔÉÊÇ ÅÖÁÑÌÏÃÇ
ÅÜí åßíáé óôÜóéìç ãéá äýï êáôáíïìÝò ìåôÜâáóçò áëõóßäáò Markov, åßíáé åðßóçò óôÜóéìç
åÜí åöáñìüóïõìå ðñþôá ôç ìéá êáé Ýðåéôá ôçí Üëëç, Þ åÜí åðéëÝãïõìå ôõ÷áßá ðïéÜ áðü ôéò
äýï èá åöáñìüæïõìå êÜèå öïñÜ, ê.ë.ð. ÄåäïìÝíïõ üôé áõôü éó÷ýåé åðßóçò åÜí åîåôÜæïõìå
Ýíáí áõèáßñåôï áñéèìü êáôáíïìþí ìåôÜâáóçò, ìáò äßíåôáé Þäç ìéá óõëëïãÞ ôñüðùí íá
ðáñÜîïõìå êáôáíïìÝò ìåôÜâáóçò ìå óôÜóéìç êáôáíïìÞ , ðïõ áí êáé äåí åßíáé áíôéóôñÝøéìåò,
áðïôåëïýíôáé áðü áíôéóôñÝøéìåò óõíéóôþóåò. ¸÷ïõìå äåé Þäç ôï ðáñÜäåéãìá ôïõ äåéãìáôï-
ëÞðôç Gibbs ðïõ êáôáóêåõÜæåôáé ìå ôçí åöáñìïãÞ ìéáò óåéñÜò âçìÜôùí Metropolis-Has-
tings. Åíôïýôïéò, õðÜñ÷ïõí Üëëïé óçìáíôéêïß ôñüðïé ìå ôïõò ïðïßïõò ïé êáôáíïìÝò ìåôÜâá-
óçò óõíäõÜæïíôáé ãéá íá äçìéïõñãÞóïõí ìéá áêüìá ìåãáëýôåñç ãêÜìá äéáèÝóéìùí ôå÷íéêþí
ãéá MCMC.
ÕðÜñ÷ïõí ðïëëïß ôñüðïé íá êáôáóêåõáóôïýí ïé êáôáíïìÝò ìåôÜâáóçò ðïõ åßíáé ôñïðï-
ðïéÞóåéò Þ åðåêôÜóåéò ðåñéóóüôåñùí âáóéêþí MCMC ìåèüäùí. Óõ÷íÜ áõôÝò ïé ôñïðïðïé-
çìÝíåò ìÝèïäïé ìðïñïýí íá åðéôá÷ýíïõí ôéò éäéüôçôåò óýãêëéóçò ôïõ áëãïñßèìïõ. Åíôïýôïéò,
ôÝôïéá âåëôéùìÝíç óýãêëéóç Ýñ÷åôáé ìåñéêÝò öïñÝò ìå ôï êüóôïò ôïõ áõîáíüìåíïõ ÷ñüíïõ
õðïëïãéóìþí, êáé Ýôóé áõôü äåí åßíáé åðáñêÝò ãéá ìéá êáèáñÜ èåùñçôéêÞ óýãêñéóç ôçò
óýãêëéóçò áëõóßäùí Markov ðñïêåéìÝíïõ íá âñïýìå ôïõò ðåñéóóüôåñï áðïôåëåóìáôéêïýò
áëãüñéèìïõò.
Ï äçìïöéëÝóôåñïò áðü áõôïýò åßíáé ï Metropolis-within-Gibbs1 óôïí ïðïßï äåí ìðïñïýìå íá
ðñïóïìïéþóïõìå üëåò ôéò ðëÞñùò äåóìåõìÝíåò êáôáíïìÝò. ¼ðùò ï äåéãìáôïëÞðôçò Gibbs,
ï Metropolis-within- Gibbs áíáíåþíåé ôéò óõíéóôþóåò ðïõ ðåñéãñÜöïõí ôçí ôñÝ÷ïõóá
êáôÜóôáóç. ÕðïèÝóôå üôé ìðïñïýìå íá ãñÜøïõìå x = (x(1) ; : : : ; x(d) ). Óôï i-ïóôü âÞìá, o
äåéãìáôïëÞðôçò Gibbs áíáíåþíåé ôï x(i) óýìöùíá ìå ôçí äåóìåõìÝíç êáôáíïìÞ (x(i) |x(−i) )
üðïõ x(−i) óõìâïëßæåé üëåò ôéò óõíéóôþóåò åêôüò áðü ôï iïóôÞ. Ç ìÝèïäïò Metropolis-
within-Gibbs áíáíåþíåé áêñéâþò ôçí iïóôÞ óõíéóôþóá óýìöùíá ìå Ýíá Metropolis-Hastings
âÞìá ðïõ Ý÷åé ôï (x(i) |x(−i) ) ùò óôÜóéìç êáôáíïìÞ ôïõ.
Õðü êÜðïéá Ýííïéá ï Metropolis-within-Gibbs ìðïñåß íá èåùñçèåß ùò åéäéêÞ ðåñßðôùóç ôïõ
Metropolis-Hastings, áí êáé åßíáé ÷ñÞóéìï íá ôïí äéáêñßíåé êáíåßò áðü áëãïñßèìïõò ðïõ
êÜíïõí áíáíåþóåéò üëùí ôùí äéáóôÜóåùí óå êÜèå âÞìá. Ç ãåíéêüôçôá åßíáé ôï êëåéäß ôçò
óðïõäáéüôçôáò. Åíþ ìïéñÜæåôáé ôï ðëåïíÝêôçìá ôïõ äåéãìáôïëÞðôç Gibbs óôï íá óðÜåé
ìåãÜëåò äéáóôÜóåéò óå Üëëåò ìéêñüôåñåò, äåí ðåñéïñßæåôáé áðü ôçí áíÜãêç íá ðñïóïìïéþíåé
áðü ôéò ðëÞñùò äåóìåõìÝíåò êáôáíïìÝò. ÊáôÜ óõíÝðåéá åßíáé óýíçèåò ãéá Ýíáí áëãüñéèìï
1 Ôï
üíïìá Metropolis-within Gibbs ðñïÝñ÷åôáé áðü ôéò ðñþôåò åöáñìïãÝò üðïõ ïé ðåñéóóüôåñåò
óõíéóôþóåò èá ìðïñïýóáí íá áíáíåùèïýí ÷ñçóéìïðïéþíôáò ôïí äåéãìáôïëÞðôç Gibbs, áëëÜ ãéá Ýíá ìéêñü
áñéèìü ðëÞñùò äåóìåõìÝíùí êáôáíïìþí ïé ñïõôßíåò Metropolis ÷ñçóéìïðïéïýíôáí ãéá íá áíôéêáôáóôÞóïõí
ôá äýóêïëá âÞìáôá áíáíÝùóçò. ¼ðùò ï ßäéïò ï äåéãìáôïëÞðôçò Gibbs, ôï üíïìá åßíáé ìÜëëïí ëÜèïò
äåäïìÝíïõ üôé ìðïñåß åýêïëá íá ðåñéãñáöåß ùò åéäéêÞ ðåñßðôùóç Metropolis- Hastings.
5.2. ÐÅÑÉÓÓÏÔÅÑÏ ÃÅÍÉÊÏÉ MCMC ÁËÃÏÑÉÈÌÏÉ 23
éó÷õñÞ aposteriori åîÜñôçóç ìåôáîý ôùí óõíôåôáãìÝíùí ôçò X ðáñÜãïõí áñãÝò ìßîåéò
MCMC áëãïñßèìùí. Äåßôå, ðáñáäåßãìáôïò ÷Üñéí, ?. Áõôü ôï ðñüâëçìá ìðïñåß íá åßíáé
ðïëý óïâáñü óôá ðñïâëÞìáôá áýîçóçò ðáñáôçñÞóåùí ðïõ ðåñé-ëáìâÜíïõí åëëéðÞ Þ ôá
ëáíèÜíïíôá äåäïìÝíá, üðïõ ç óôáôéóôéêç ðëçñïöïñßá ãéá ôéò Üãíù-óôåò ðáñáìÝôñïõò ðïõ
ðåñéëáìâÜíïíôáé óôá ëáíèÜíïíôá (imputed) äåäïìÝíá åßíáé áñêåôÜ ìåãá-ëýôåñç áðü áõôÞ
ðïõ ðåñéëáìâÜíåôáé ðñáãìáôéêÜ óôá ðáñáôçñçèÝíôá äåäïìÝíá. Áõôü ôï ðñüâëçìá ó÷åôßæåôáé
ðïëý ìå ðáñüìïéåò äõóêïëßåò ðïõ áíôéìåôùðßæïíôáé óôçí åöáñìïãÞ ôïõ áëãïñßèìïõ EM êáé
ôùí ðáñáëëáãþí ôïõ (?).
¸íá äçìïöéëÝò ðáñÜäåéãìá ðïõ êáôáäåéêíýåé ðïëý êáëÜ áõôü ôï ðñüâëçìá åßíáé ï éåñáñ÷éêÜ
êåíôñïðïéçìÝíïò áëãüñéèìïò óôá ÌðåûæéáíÜ ãñáììéêÜ ìïíôÝëá. ÓõãêåêñéìÝíá, õðïèÝóôå
üôé Ý÷ïõìå ôçí áðëÞ äïìÞ
Yi ∼ (i ; e2 ); i = 1; 2 : : : n ;
ìå êáíïíéêÞ apriori êáôáíïìÞ óôá random eects,
i ∼ N (; 2 ); i = 1; 2 : : : n
¸íáò ðñáãìáôéêüò êßíäõíïò ôïõ MCMC åßíáé üôé ìðïñåß íá åöáñìïóôåß óå ïõóéáóôéêÜ
ïðïéïäÞðïôå ìïíôÝëï, åßôå ôï ìïíôÝëï åßíáé åßôå ü÷é óôáôéóôéêÜ ëïãéêü. Ïé áëãüñéèìïé
ìðïñïýí íá ðáñáãÜãïõí ðïëý ëïãéêÜ áðïôåëÝóìáôá, áêüìá êáé üôáí ï áñéèìüò ðáñáìÝôñùí
óôï ìïíôÝëï õðåñâáßíåé êáôÜ ðïëý ôï ìÝãåèïò ôïõ óõíüëïõ óôïé÷åßùí. ¸íá ãåíéêü
ðñüâëçìá åßíáé üôé ïé êáôÜëëçëåò apriori ðõêíüôçôåò ìðïñïýí \íá êñýøïõí" ôá ðñïâëÞìáôá
identiability ôïõ ìïíôÝëïõ áöïý ïé êáôáëçêôéêÝò aposteriori ðõêíüôçôåò åßíáé êáôÜëëçëåò
(proper). ¸íáò ôñüðïò íá áðïöåõ÷èåß áõôü åßíáé íá åêôåëåßôáé ðÜíôá ç áíÜëõóç åõáéóèçóßáò
óôéò apriori õðïèÝóåéò ðïõ ðåñéëáìâÜíåé ôçí áíá-ìïíôåëïðïßçóç ìå ìç-ðëçñïöïñéáêÝò apri-
ori êáôáíïìÝs.
¸íá óçìáíôéêü ðñüâëçìá ó÷åôéêÜ ìå ôçí åöáñìïãÞ MCMC åßíáé íá ìåôñïýìå ðüôå ç
óýãêëéóç Ý÷åé åðéôåõ÷èåß, äçëáäÞ ãéá íá áîéïëïãÞóïõìå óå ðïéï óçìåßï ç êáôáíïìÞ ôçò
áëõóßäáò åßíáé åðáñêþò êïíôÜ óôçí áóõìðôùôéêÞ êáôáíïìÞ ãéá üëïõò ôïõò ðñáêôéêïýò
ëüãïõò. Ï áñéèìüò åðáíáëÞøåùí, B , ðïõ áðáéôåßôáé íá éêáíïðïéÞóåé áõôÞ ôç óõíèÞêç
êáëåßôáé burn-in ðåñßïäïò Þ áñ÷éêÞ ìåôáâáôéêÞ öÜóç.
Åßíáé óõíÞèùò ëïãéêü üôé äåßãìáôá ìÝóá óå áõôÞ ôçí (êáô' åêôßìçóç) áñ÷éêÞ ìåôáâáôéêÞ
öÜóç, B , áðïññßðôïíôáé ãéá ôïõò óêïðïýò ôçò Monte Carlo åêôßìçóçò Ýôóé þóôå ç áìåñïëç-
øßá ðïõ ðñïêáëåßôáé áðü ôï áðïôÝëåóìá ôùí áñ÷éêþí ôéìþí ìåéþíåôáé. ¸íá ó÷åôéêü
ðñüâëçìá ðñïóðáèåß íá áîéïëïãÞóåé ðüóåò åðáíáëÞøåéò ÷ñåéÜæïíôáé Ýôóé þóôå ç
T
X
(T − B ) −1
g(Xt )
t=B +1
íá åêôéìÜ ôçí E [g(X )] ìå åðáñêÞ áêñßâåéá ãéá ïðïéåóäÞðïôå óõíáñôÞóåéò g ðïõ ìáò
åíäéáöÝñïõí.
Éäéáßôåñá ãéá ìåãÜëåò äéáóôÜóåéò, ç áîéïëüãçóç ôçò óýãêëéóçò ôïõ MCMC ìå åìðåéñéêÞ
ðáñáôÞñçóç åßíáé åîáéñåôéêÜ äýóêïëç êáé åßíáé óðáíßùò äõíáôü íá åßìáóôå áðïëýôùò óßãïõ-
ñïé üôé ï áëãüñéèìüò ìáò Ý÷åé óõãêëßíåé. Åíôïýôïéò, ìåãÜëïò áñéèìüò ÷ñÞóéìùí äéáãíùóôéêþí
óýãêëéóçò Ý÷åé ðñïôáèåß óôç âéâëéïãñáößá, ïé ðåñéóóüôåñïé ôùí ïðïßùí ðåñéëáìâÜíïõí
ôïí Ýëåã÷ï ìéáò êáôÜëëçëçò óõíÜñôçóçò ôçò áëõóßäáò Markov ôçò ïðïßáò ç åëåã÷üìåíç
óôáôéóôéêÞ óõíÜñôçóç êáëåßôáé äéáãíùóôéêü óýãêëéóçò. ¸÷åé íüçìá íá ÷ñçóéìïðïéïýíôáé
ðïëëáðëÜ äéáãíùóôéêÜ óýãêëéóçò Ýôóé þóôå íá ìåãéóôïðïéåßôáé ç ðéèáíüôçôá åýñåóçò
ðñïâëçìÜôùí óýãêëéóçò. Äåí èá áíáöåñèïýìå óå áõôÜ ôá äéáãíùóôéêÜ åäþ, ãéá ðåñéóóüôåñï
åêôåíåßò áíáèåùñÞóåéò êáé óõãêñßóåéò äåßôå ôá ?, ? êáé ?. ÖõóéêÜ ðñÝðåé õðïãñáì-
26 ÊÅÖÁËÁÉÏ 5. ÐÑÁÊÔÉÊÇ ÅÖÁÑÌÏÃÇ
åßíáé ãíùóôü üôé õðÜñ÷åé. Ï ? ðñüôåéíå ôç ÷ñÞóç ïñéóìÝíùí ìåèüäùí ðïõ Ý÷ïõí ôçí
ðñïÝëåõóÞ ôïõò óôç âéâëéïãñáößá ÷ñïíïëïãéêþí óåéñþí ãéá íá õðïëïãßóïõí ôï ôõðïðïéçìÝíï
óöÜëìá ôùí åêôéìçôñéþí. Ç áðëïýóôåñç áõôþí ôùí ìåèüäùí åßíáé ç ìÝèïäïò ôùí ïìáäéêþí
ìÝóùí ðïõ áíáëýåôáé ùò áêïëïýèùò. ÄéáéñÝóôå ôç ÷ñïíéêÞ óåéñÜ ìÞêïõò T óå k ðáñôßäåò
B1 ; B2 ; : : : ; Bk ßóùí ìåãåèþí m êáé õðïëïãßóôå ôéò åêôéìÞóåéò ôùí ïìáäéêþí ìÝóùí áðü
P
B̄j = Ê(j ) (f (X)) = m−1 i∈Bj f (Xi ). ÌåôÜ, ìéá åêôßìçóç ôïõ Var (Ê (f (X))) äßíåôáé
P P
áðü ôï k−1 (k − 1)−1 kj=1 (B̄j − B̄ )2 , ìå B̄ = k−1 kj=1 Bj . ÖõóéêÜ, ïé ïìáäéêïß ìÝóïé
áíôéìåôùðßæïíôáé óáí áíåîÜñôçôïé êáé åðïìÝíùò ôï ìÞêïò m êÜèå ðáñôßäáò ðñÝðåé íá åßíáé
üóï ôï äõíáôüí ìåãáëýôåñï, ëáìâÜíïíôáò õðüøç üôé ïé áëõóßäåò ðïõ áíáìéãíýïíôáé áñãÜ
áðáéôïýí ìåãáëýôåñç ìåãÝèç ðáñôßäáò. ¸íáò ôñüðïò íá åîåôáóôåß ç áíåîáñôçóßá ìåôáîý
ôùí ïìáäéêþí ìÝóùí ôùí ðáñôßäùí åßíáé íá áðáéôÞóïõìå ôç óõó÷Ýôéóç ìåôáîý B̄j êáé B̄j +1 ,
j = 1; 2; : : : ; k − 1, íá åßíáé ìåôáîý ±0:1.
Ìéá åíáëëáêôéêÞ ìÝèïäïò ãéá íá õðïëïãßóïõìå ôï ôõðïðïéçìÝíï ëÜèïò åßíáé íá ÷ñçóéìïðïéç-
èåß ç éäÝá ôïõ áðïôåëåóìáôéêïý ìåãÝèïõò äåßãìáôïò ãéá ôçí åêôßìçóç ôçò áíáìåíüìåíçò
ôéìÞò ôçò óõíÜñôçóçò f (X ) ùò áðü , äåßôå, ðáñáäåßãìáôïò ÷Üñéí ôç óõæÞôçóç óôï ?.
Ïñßæåôáé ùò
T
ESS = (5.2)
f
üðïõ T åßíáé ï áñéèìüò ôùí åðáíáëÞøåùí êáé f åßíáé ï ïëïêëçñùìÝíïò ÷ñüíïò áõôïóõó÷Ý-
ôéóçò ðïõ ïñßæåôáé óôçí (??).
P
Áí êáé ç rk åßíáé ìéá óõíåðÞò åêôéìÞôñéá ôïõ k , 1 + 2 Tk=1
−1
rk ãéá üëá ôá k, åßíáé óßãïõñá
ìç óõíåðÞò ãéá ôçí åêôßìçóç ôïõ f , ïðüôå ðñÝðåé íá ðñïóÝîïõìå ôïí õðïëïãéóìü ôçò
f . Ìéá áðëÞ ðñáêôéêÞ ëýóç (ðïõ ìðïñåß íá åöáñìïóôåß üôáí ç ðñïóïìïéùìÝíç áëõóßäá
Markov åßíáé áíôéóôñÝøéìç) ðñïôÜèçêå óôï ?, êáé ðåñéëáìâÜíåé ôïí õðïëïãéóìü f ìå ôï
P
1+2 C f
k=1 rk üðïõ ôï óçìåßï ðåñéêïðÞò C åßíáé åðéëåãìÝíï íá åßíáé ôï ìåãáëýôåñï k Ýôóé
þóôå ç r2fk+1 + r2fk > 0 éó÷ýåé.
ìðïñïýìå íá åêôéìÞóïõìå, êõñßùò óôç ÌðåûæéáíÞ óôáôéóôéêÞ. Ðáñüëá áõôÜ ôï MCMC Ý÷åé
åðßóçò ðïëëÝò óçìáíôéêÝò åöáñìïãÝò óôçí êëáóéêÞ óôáôéóôéêÞ. Èá áíáöÝñïõìå óýíôïìá
ôÝóóåñá ðáñáäåßãìáôá.
1. Áñ÷éêÜ óçìåéþóôå üôé áí ìáò äïèåß ìéá åðßðåäç(
at) apriori êáôáíïìÞ, ç ðéèáíïöÜíåéá
êáé ç aposteriori ðõêíüôçôåò åßíáé ßóåò. ÅðïìÝíùò åßíáé åöéêôü íá õðïëïãéóôåß ç
ìÝãéóôç ðéèáíoöÜíåéá óáí êïñõöÞ ìéáò åêôéìçèåßóáò aposteriori ðõêíüôçôáò, õðïèÝ-
ôïíôáò öõóéêÜ üôé ç ôåëåõôáßá åßíáé ïëïêëçñþóéìç ùò ðñïò ôéò ðáñáìÝôñïõò, êÜôé
ðïõ óõìâáßíåé åÜí ç ðéèáíïöÜíåéá åßíáé êáëÜ ïñéóìÝíç. ÊáôÜ óõíÝðåéá, ðñÝðåé íá
áðïêôÞóïõìå ìéá åêôéìÞôñéá ôçò ðõêíüôçôáò áðü Ýíá äåßãìá åîáñôþìåíùí óçìåßùí
áðü áõôÞ ôçí ðõêíüôçôá. Áõôü ãßíåôáé óõíÞèùò óôá ðëáßóéá ôçò åêôéìÞôñéáò ôçò
kernel ðõêíüôçôáò. Ðáñáäåßãìáôïò ÷Üñéí, äåäïìÝíïõ åíüò äåßãìáôïò xi ; 1 ≤ i ≤ n
èá ìðïñïýóáìå íá õðïëïãßóïõìå ôçí ðõêíüôçôá ùò
n
1X 1
exp{−(x − xi )2 =(2 2 )}: (5.3)
n i=1
(2 2 )1=2
2. Ìéá ìÜëëïí äéáöïñåôéêÞ áí êáé ü÷é áóõíÞèéóôç êáôÜóôáóç åßíáé üôáí ç ðéèáíïöÜíåéá
äåäïìÝíçò ìéáò Üãíùóôçò ðáñáìÝôñïõ åßíáé ãíùóôÞ ìüíï ìÝ÷ñé ìéáò óôáèåñÜò êáíïíé-
êïðïßçóçò. Ç éäÝá ïöåßëåôáé óôïõò ?. ¸óôù
h (x)
L(|x) = (5.4)
c()
üðïõ c() åßíáé Üãíùóôï, áëëÜ ç ôéìÞ ôïõ åßíáé êñßóéìç óôïí êáèïñéóìü ôùí ôéìþí
ôçò ìÝãéóôçò ðéèáíïöÜíåéáò ãéá ôï . Óå áõôÞí ôçí ðåñßðôùóç, åßíáé áðáñáßôçôï
íá åêôéìÞóïõìå ôï c. Ôþñá õðïèÝóôå üôé ôï 0 åßíáé \ç ðñþôç åéêáóßá" ôçò ÅÌÐ.
30 ÊÅÖÁËÁÉÏ 5. ÐÑÁÊÔÉÊÇ ÅÖÁÑÌÏÃÇ
Ìðïñïýìå íá ãñÜøïõìå
L(|x) h (x) c(0 )
= ; (5.5)
L(0 |x) h0 (x) c()
êáé ìðïñïýìå íá åêôéìÞóïõìå ôï c()=c(0 ) ãéá Ýíá áõèáßñåôï áðü Ýíá äåßãìá
(x1 ; : : : xn ) áðü ôçí h0 ÷ñçóéìïðïéþíôáò ôçí åêôéìÞôñéá
n
1 X h (xi )
; (5.6)
n i=1 h0 (xi )
ç ïðïßá åßíáé ìéá áìåñüëçðôç åêôéìÞôñéá ôïõ c()=c(0 ). Áðü áõôÞí ôçí ðñïóïìïßùóç,
åðïìÝíùò, ìðïñïýìå íá õðïëïãßóïõìå ôï L(|x)=L(0 |x) áðü ôçí (??), êáé íá âåëôéþ-
óïõìå ôçí åêôéìÞôñéá ôçò ÅÌÐ. ÁõôÞ ç äéáäéêáóßá åðáíáëáìâÜíåôáé óõíÞèùò ôüóåò
öïñÝò üóåò ÷ñåéÜæïíôáé ãéá íá óôáèåñïðïéçèïýí ïé åêôéìÞôñéåò.
3. Ï Simulated annealing åßíáé Ýíáò óôï÷áóôéêüò áëãüñéèìïò ãéá ôçí ïëéêÞ ìåãéóôïðïß-
çóç óõíáñôÞóåùí. Óõó÷åôßæåôáé ðÜñá ðïëý ìå ôï MCMC. Ç ìüíç äéáöïñÜ åßíáé
üôé ðõêíüôçôá-óôü÷ïò áëëÜæåé üóï ï áëãüñéèìïò ðñï÷ùñÜåé. Ðñþôá ðáñáôçñÞóôå
üôé áí èÝëïõìå íá ìåãéóôïðïéÞóïõìå ìéá ìç áñíçôéêÞ óõíÜñôçóç h(y); y ∈ A, ç
ìåãéóôïðïéçìÝíç ôéìÞ ìåãéóôïðïéåß åðßóçò ôï h(y)1=T ãéá áõèáßñåôï T > 0 ãíùóôï ùò
èåñìïêñáóßá. Åíôïýôïéò, ãéá ìéêñü T , õðïèÝôïíôáò üôé h1=T åßíáé ìéá ïëïêëçñþóéìç
óõíÜñôçóç, ç ðõêíüôçôá áíÜëïãç ôïõ h(y)1=T ðåñéÝ÷åé ôï ìåãáëýôåñï ìÝñïò ôçò ìÜæáò
ðéèáíüôçôÜò ôïõ êïíôÜ óôéò êïñõöÝò ôçò óõíÜñôçóçò. Ç éäÝá ðßóù áðü ôï simulated
annealing åßíáé, óå êÜèå åðáíÜëçøç n, íá ðñáãìáôïðïéåß ôïí MCMC áëãüñéèìï óå
ðõêíüôçôá áíÜëïãç ðñïò ôï h1=Tn , üðïõ {Tn } åßíáé ìéá áêïëïõèßá èåñìïêñáóéþí
ðïõ óõãêëßíåé óôï ìçäÝí. Ï áëãüñéèìïò óõãêëßíåé óôç ìÝãéóôç ôéìÞ h êÜôù áðü
êáôÜëëçëåò óõíèÞêåò êïíïíéêüôçôáò. Åßíáé óçìáíôéêü ç Tn íá ìçí óõãêëßíåé óôï
ìçäÝí ðÜñá ðïëý ãñÞãïñá, äåäïìÝíïõ üôé áðïäåéêíýåôáé üôé áõôü èá ìðïñïýóå íá
êÜíåé ôïí áëãüñéèìï íá êïëÞóåé óå Ýíá ôïðéêü ìÝãéóôï ôçò óõíÜñôçóçò h.
4. Ôï MCMC ÷ñçóéìïðïéåßôáé åðßóçò ãéá íá ðñïóïìïéþóïõìå áðü ìåñéêÜ óôï÷áóôéêÜ
ìïíôÝëá üðùò áíåëßîåéò óçìåßùí (point processes).
5.5 Ëïãéóìéêü
¸íá äçìïöéëÝò ðñüãñáììá ãéá íá åêôåëåóèåß ôï MCMC óå ðïéêßëá ìïíôÝëá åßíáé ôï BUGS.
¸÷åé áíáðôõ÷èåß óôçí ìïíÜäá âéïóôáôéóôéêÞò MRC óôï ðáíåðéóôÞìéï ôïõ Êáßìðñéôæ êáé
ç ðéï ðñüóöáôç ÝêäïóÞ ôïõ êáëåßôáé WinBUGS. ÄéáãíùóôéêÜ óýãêëéóçò óå s-plus ðïõ
5.5. ËÏÃÉÓÌÉÊÏ 31
ìðïñïýí, Þ äåí ìðïñïýí, íá óõíïäåýóïõí ôï BUGS åßíáé ôá CODA êáé BOA. Ãéá ðåñéóóüôåñåò
ëåðôïìÝñåéåò äåßôå ôéò éóôïóåëßäåò http://www.mrc-bsu.cam.ac.uk/bugs/ êáé
http://www.public-health.uiowa.edu/boa/.
32 ÊÅÖÁËÁÉÏ 5. ÐÑÁÊÔÉÊÇ ÅÖÁÑÌÏÃÇ
ÊåöÜëáéï 6
6.1 ÅéóáãùãÞ
Ìéá ÌðåûæéáíÞ ðñïóÝããéóç óôçí åðéëïãÞ ìïíôÝëùí åßíáé ç áêüëïõèç. ÕðïèÝóôå üôé ôá
äåäïìÝíá y èåùñïýíôáé ãéá íá Ý÷ïõí ðáñá÷èåß áðü êÜðïéï ìïíôÝëï m, Ýíá áðü ôá ìïíôÝëá
ðïõ áíÞêïõí óôï óýíïëï M üëùí ôùí áíôáãùíéóôéêþí ìïíôÝëùí. ÊÜèå ìïíôÝëï ïñßæåé
ôçí êáôáíïìÞ ôïõ Y , L(y|m; θm ) åêôüò áðü ìéá Üãíùóôç ðáñÜìåôñï-äéÜíõóìá θm ∈ Θm ,
üðïõ Θm åßíáé ôï óýíïëï üëùí ôùí ðéèáíþí ôéìþí ãéá ôéò ðáñáìÝôñïõò ôïõ ìïíôÝëïõ m.
Áí p(m) åßíáé ç apriori ðéèáíüôçôá ôïõ ìïíôÝëïõ m, ç aposteriori ðéèáíüôçôá äßíåôáé áðü
ôçí
p(m)L(y|m)
(m|y) = P ; m∈M (6.1)
p(m)L(y|m)
m∈M
üðïõ L(y|m) åßíáé ç ðåñéèþñéá ðéèáíïöÜíåéá õðïëïãéóìÝíç ìå ôç ÷ñÞóç ôïõ θm ,
Z
L(y|m) = L(y|m; θm )p(θm |m)dθm
êáé p(θm |m) åßíáé ç äåóìåõìÝíç apriori êáôáíïìÞ ôùí ðáñáìÝôñùí θm ôïõ ìïíôÝëïõ m.
ÕðÜñ÷ïõí äýï óçìáíôéêÜ ðñïâëÞìáôá óôïí õðïëïãéóìü ôùí aposteriori ðéèáíïôÞôùí ôùí
ìïíôÝëùí. Êáô' áñ÷Üò, ï õðïëïãéóìüò ôçò ðåñéèþñéáò ðéèáíïöÜíåéáò óõíáíôÜ ôéò óõíçèéó-
ìÝíåò äõóêïëßåò ïëïêëÞñùóçò ôçò ÌðåûæéáíÞò óôáôéóôéêÞò. Äåýôåñïí, üôáí åîåôÜæïõìå
ðïëëÜ ìïíôÝëá, ï õðïëïãéóìüò ôçò L(y|m) ãéá üëá ôá m ∈ M ãßíåôáé áðáãïñåõôéêÜ
33
34 ÊÅÖÁËÁÉÏ 6. ÐÑÏÓÄÉÏÑÉÓÌÏÓ ÌÏÍÔÅËÏÕ ÌÅ ÔÇ ×ÑÇÓÇ MCMC
ìåãÜëïò. Ïé MCMC ìÝèïäïé ìðïñïýí íá åßíáé ÷ñÞóéìïé êáé óôéò äýï ðåñéðôþóåéò äåäïìÝíïõ
üôé ü÷é ìüíï ðáñÝ÷ïõí ôéò ìåèïäïëïãßåò ãéá ôïí õðïëïãéóìü ôçò ðåñéèþñéáò ðéèáíïöÜíåéáò
áðü ôï MCMC äåßãìá áëëÜ ìðïñïýí åðßóçò íá ðáñÝ÷ïõí åñãáëåßá ãéá íá êáôáóêåõÜóïõìå
áëãïñßèìïõò áíáæÞôçóçò ìïíôÝëùí ðïõ ðáñÜãïõí ðáñáôçñÞóåéò áðü ôçí áðü êïéíïý aposte-
riori êáôáíïìÞ (m; θm |y) ôïõ (m; θm ). Èá åîåôÜóïõìå áõôÝò ôéò äýï ðåñéðôþóåéò ÷ùñéóôÜ
óôéò åðüìåíåò äýï ðáñáãñÜöïõò.
Óçìåéþóôå üôé ç (??) ìðïñåß íá ÷ñçóéìïðïéçèåß ãéá åêôßìçóç ìüíï ôçò L(y|m) åÜí ìéá
ãíùóôÞ ðõêíüôçôá ÷ñçóéìïðïéåßôáé áíôß ôçò (m0 |y ; m0 ) Ýôóé þóôå (m0 |y ; m0 ) = cm0 (θ)
êáé L(y|m0 ) = 1.
ÄéáöïñåôéêÝò åðéëïãÝò ôçò g(θ) ðáñÜãïõí äéáöïñåôéêÝò åêôéìÞôñéåò. Ðáñáäåßãìáôïò ÷Üñéí,
õðïèÝôïíôáò üôé Θm ⊂ Θm0 , g(θ) = c−1 m0 (θ) óõíåðÜãåôáé (??). Áí Θm = Θm0 , g (θ) =
m (θ)cm0 (θ) ðáñÜãåé ìéá ãåíßêåõóç ôïõ áñìïíéêïý êáíüíá ôùí ?:
c−1 −1
© ª
L(y|m) Em0 c−1
m0 (θ)
= : (6.5)
L(y|m ) Em {cm (θ)}
0 −1
Ìéá Üëëç åíäéáöÝñïõóá åðéëïãÞ ôçò g(θ) ðáñÜãåé ìéá ãåíßêåõóç ôçò ìåèïäïëïãßáò ðåñéèþñéáò
ðéèáíïöÜíåéáò ðïõ åéóÞ÷èç áðü ôïí ?, ç ïðïßá óôçñßæåôáé óõãêåêñéìÝíá óôï äåßãìá Metropolis-
Hastings, äåßôå ?.
Ïé ? ìåëÝôçóáí ôç äåéãìáôïëçøßáò ãÝöõñáò ëåðôïìåñþò êáé óçìåßùóáí üôé ç éäÝá ðßóù
áðü áõôÞ åßíáé üôé ôá äåßãìáôá ëáìâÜíïíôáé êáé áðü ôéò äýï aposteriori ðõêíüôçôåò åíþ
ìéá Üëëç ðõêíüôçôá ÷ñçóéìåýåôáé ùò ãÝöõñá ãéá íá óõíäÝóåé ôá äýï äåßãìáôá. Ãéá íá
äåßôå áõôü ðéü êáèáñÜ, õðïèÝóôå üôé ìéá «ãÝöõñá»-ðõêíüôçôá b (θ) âñßóêåôáé \ìåôáîý"
ôùí cm (θ) êáé cm0 (θ). Ôüôå ç g(θ) ìðïñåß íá ãñáöôåß ùò
Ýôóé þóôå
L(y|m) Em0 {b (θ)=cm0 (θ)}
= : (6.7)
L(y|m0 ) Em {b (θ)=cm (θ)}
Ôï ìÞíõìá áðü ôçí ôåëåõôáßá åîßóùóç åßíáé üôé ï ëüãïò ôùí äýï ðåñéèþñéùí ðéèáíïöáíåéþí
åêôéìÜôáé ìå ôç ÷ñçóéìïðïßçóç ôùí äåéãìÜôùí êáé áðü ôéò äýï aposteriori ðõêíüôçôåò áðü
ôá äýï ìïíôÝëá ìå ôçí ðõêíüôçôá b (θ) íá ÷ñçóéìåýåé ùò ìéá \ãÝöõñá" ìåôáîý ôïõò.
ÄåäïìÝíïõ üôé ç éäÝá åßíáé âáóéóìÝíç óôï ãåãïíüò üôé áõôÞ ç ãÝöõñá Ý÷åé ðåäßï ïñéóìïý
36 ÊÅÖÁËÁÉÏ 6. ÐÑÏÓÄÉÏÑÉÓÌÏÓ ÌÏÍÔÅËÏÕ ÌÅ ÔÇ ×ÑÇÓÇ MCMC
T T
ôï Θm Θm0 , óçìåéþóôå üôé áõôÞ ç ìÝèïäïò äåí èá ëåéôïõñãïýóå åÜí Θm Θm0 = ∅ êáé
èá õðïëåéôïõñãïýóå åÜí áõôÞ ç ôïìÞ åßíáé \ìéêñÞ".
1 óôï [0; 1]. Ç ðñïêýðôïõóá åêôéìÞôñéá ãéá äåßãìáôá θ1;zi ; θ2;zi ; : : : ; θn;zi áðü ôçí (θ |
y ; zi ) for i = 1; : : : ; k åßíáé
" #
µ ¶ k−1 n d log (y | θ ; z )
L(y | z = 1) 1 X 1 X
dz t
log = (zi+1 − zi )
L(y | z = 0) 2 i=0 n t=1 p(z ) zi+1
" # !#
d
+ dz log (y | θ t ; z ) :
p(z ) zi
óôç äçìéïõñãßá ìéáò áëõóßäáò Markov ðïõ ìðïñåß \íá ðçäÞóåé" ìåôáîý ôùí ìïíôÝëùí
äéáöïñåôéêþí äéáóôÜóåùí ðáñáìÝôñùí ìe Ýíáí ãåíéêü ôñüðï, äéáôçñþíôáò ôç ëåðôïìåñÞ
éóïññïðßá (detailed balance) ðïõ åîáóöáëßæåé ôç óùóôÞ óôÜóéìç êáôáíïìÞ åÜí ç áëõóßäá
åßíáé Ýììïíç êáé áðåñéïäéêÞ. Åßíáé ìéá ãåíßêåõóç óôçí ÌðåûóéáíÞ óôáôéóôéêÞ êïéíüôçôá
ôùí éäåþí ðïõ ðñþôá åìöáíß-óôçêáí óôç ÷ùñéêÞ óôáôéóôéêÞ ãéá ôéò óçìåéáêÝò áíåëßîåéò
Markov, äåßôå ?, êáé óôçí áíÜëõóç åéêüíáò, äåßôå ?. Ï áëãüñéèìïò åðéôñÝðåé ôïí õðïëïãéóìü
aposteriori ðéèáíïôÞôùí ìïíôÝëùí ìå ðáñáìÝôñïõò ïðïéáóäÞðïôå äéÜóôáóçò. Ôï óçìáíôéêü
ìåéïíÝêôçìÜ ôïõ åßíáé üôé ç áðïôåëåóìáôéêüôçôá ôïõ áëãïñßèìïõ áðáéôåß ðñïóåêôéêÞ åðéëïãÞ
ôùí ðñïôåéíüìåíùí ðõêíïôÞôùí, äåßôå åí ôïýôïéò ôï ? ãéá ôéò ãåíéêÝò ëýóåéò óå áõôü ôï
ðñüâëçìá. Ï áëãüñéèìïò ðåñéãñÜöåôáé ùò åîÞò.
ÕðïèÝóôå üôé ç ôñÝ÷ïõóá êáôÜóôáóç ôçò áëõóßäáò Markov åßíáé (m; θm ), üðïõ ôï θm Ý÷åé
äéÜóôáóç d(θm ). Ìéá åêäï÷Þ ôçò äéáäéêáóßáò åßíáé ç áêüëïõèç:
Áëãüñéèìïò 3
µ ¶
L(y|m0 ; θ0m0 )p(θ0m0 |m0 )p(m0 )j (m0 ; m); q (u0 |θm ; m0 ; m)
= min 1; |J |
L(y|m; θm )p(θm |m)p(m)j (m; m0 )q(u|θm0 ; m; m0 )
üðïõ
@gm;m0 (θm ; u)
J= :
@ (θm ; u)
ÕðÜñ÷ïõí ðïëëÝò ðáñáëëáãÝò Þ áðëïýóôåñåò åêäüóåéò ôïõ reversible jump ðïõ ìðïñïýí íá
åöáñìïóôïýí óå åéäéêÜ ðñïâëÞìáôá ðñïóäéïñéóìïý ìïíôÝëùí. Ðáñáäåßãìáôïò ÷Üñéí, åÜí
üëåò ïé ðáñÜìåôñïé ôïõ ðñïôåéíüìåíïõ ìïíôÝëïõ ðáñÜãïíôáé Üìåóá áðü ôï ðñïôåéíüìåíç
êáôáíïìÞ, ôüôå (θ0m0 ; u0 ) = (u; θm ) ìå d(θm ) = d(u0 ) êáé d(θm0 ) = d(u), êáé ç ÉáêùâéáíÞ
6.3. MCMC ÌÅÈÏÄÏÉ ÅÎÅÑÅÕÍÇÓÇÓ-ÅÐÉËÏÃÇÓ ÌÏÍÔÅËÏÕ 39
óôçí (??) åßíáé Ýíá. Óå áõôÞí ôçí ðåñßðôùóç, Ý÷ïõìå äåéãìáôïëçøßá áíåîáñôçóßáò. ÅðïìÝ-
íùò ç äåéãìáôïëçøßá áíåîáñôçóßáò åßíáé ìéá åéäéêÞ ðåñßðôùóç ôïõ reversible jump. Ìå ôéò
ßäéåò ðñïôåéíüìåíåò êáôáíïìÝò, áëëÜ üôáí ç óõíÜñôçóç (θ0m0 ; u0 ) = gm;m0 (u; θm ) äåí åßíáé
ôáõôïôéêÞ, Ý÷ïõìå Ýíáí ãåíéêüôåñï Metropolis-Hastings áëãüñéèìï üðïõ θ0m0 åðéôñÝðåôáé
íá åîáñôÜôáé áðü ôï θm . ÅÜí m0 = m, ôüôå ç êßíçóç åßíáé Ýíá ôõðéêü âÞìá Metropolis-
Hastings.
Åíôïýôïéò, ç ðñáãìáôéêÞ åõåëéîßá ôïõ reversible jump åßíáé üôé ìáò åðéôñÝðåé íá ÷ñçóéìï-
ðïéïýìå ðñïôåéíüìåíåò êáôáíïìÝò ÷áìçëüôåñçò äéÜóôáóçò áðü d(θ0m0 ). Ðáñáäåßãìáôïò
÷Üñéí, åÜí ôï ìïíôÝëï m åßíáé öùëéáóìÝíï (nested) óto m0 , ôüôå ìðïñåß íá õðÜñîåé
åîáéñåôéêÜ öõóéêÞ ðñïôåéíüìåíç êáôáíïìÞ êáé óõíÜñôçóç ìåôáó÷çìáôéóìïý gm;m0 (ðïõ
ìðïñåß íá åßíáé ç óõíÜñôçóç ôáõôüôçôáò) ôÝôïéá þóôå d(u0 ) = 0 êáé θ0m0 = gm;m0 (θm ; u).
ÅðïìÝíùò, üôáí ðñïôåßíåôáé ç áíôßóôñïöç êßíçóç, ïé ðáñÜìåôñïé ôïõ ìïíôÝëïõ ðñïôåßíïíôáé
íôåôåñìéíéóôéêÜ. ÁõôÞ ç ðñïóÝããéóç åßíáé ðïõ õéïèåôåßôáé, ðáñáäåßãìáôïò ÷Üñéí, óôï ?. Ðéü
åíäéáöÝñïõóá áðü ôçí ðáñáðÜíù ðåñßðôùóç, êáé åñåõíçôéêÞ ðñüêëçóç ôïõ reversible jump,
åßíáé ç êáôáóêåõÞ êéíÞóåùí ìÝóù ôùí êáôÜëëçëùí åðéëïãþí ôïõ gm;m0 . ÌåñéêÝò åöáñìïãÝò
åßíáé ? ãéá ôéò äéáêñéôÝò ìßîåéò, ? ãéá ôá êñõììÝíÜ ìïíôÝëá Markov êáé ? ãéá ãåíéêåõìÝíá
ãñáììéêÜ ìïíôÝëá.
Ìéá Üëëç åíäéáöÝñïõóá êáôÜóôáóç ðñïêýðôåé üôáí, ãéá êÜèå m, ç aposteriori êáôáíïìÞ
ðõêíüôçôá (θm |m; y) åßíáé äéáèÝóéìç êáé ìðïñåß íá ïëïêëçñùèåß ãéá íá äþóåé ôçí ðåñéèþñéá
ðéèáíïöÜíåéá, (y|m). ÅÜí áõôÞ ç êáôáíïìÞ ÷ñçóéìïðïéåßôáé ùò ðñüôáóç óôïí áëãüñéèìï
reversible jump ôüôå ç ðéèáíüôçôá áðïäï÷Þò äßíåôáé áðü
µ ¶
L(y|m0 ; θ0m0 )p(θ0m0 |m0 )p(m0 )j (m0 ; m)(θm |m ; y)
= min 1;
L(y|m; θm )p(θm |m)p(m)j (m; m0 )(θ0m 0 |m 0 ; y)
µ ¶
p(m0 )j (m0 ; m)
= min 1; Bm0 m
p(m)j (m; m0 )
üðïõ Bm0 m åßíáé ï ðáñÜãïíôáò Bayes (Bayes factor) ôïõ ìïíôÝëïõ m0 Ýíáíôé ôïõ ìïíôÝëïõ
m. Óôçí ðñÜîç, äåí ìðïñïýìå óõíÞèùò íá õðïëïãßóïõìå ôï Bm0 m . Óôçí åéäéêÞ ðåñßðôùóç
üðïõ ôá ìïíôÝëá åßíáé ôá áðïóõíèÝóéìá (decomposable) ãñáöéêÜ ìïíôÝëá, ïé ? ÷ñçóéìïðïßçóáí
áêñéâþò áõôÞ ôçí ðñïóÝããéóç, ôçí ïðïßá ïíüìáóáí MC 3 . ÅðéðëÝïí, åÜí ç ðåñéèþñéá
ðéèáíïöÜíåéá ìðïñåß ìå êÜðïéï ôñüðï íá ðñïóåããéóôåß åýêïëá, ðáñáäåßãìáôïò ÷Üñéí áðü
ôéò ðñïóåããßóåéò Laplace üðùò ðåñéãñÜöåôáé óôïõò ?, áõôüò ï áëãüñéèìïò ðáñÝ÷åé ìßá ðïëý
ãñÞãïñç áíáæÞôçóç óôï ÷þñï ôùí ìïíôÝëùí. Óçìåéþóôå üôé äåí õðÜñ÷åé êáìßá áíÜãêç
íá ðáñáîïõìå ôéò ðáñáìÝôñïõò θm ùò ôìÞìá ôçò áëõóßäáò Markov. Áõôïß ìðïñïýí íá
ðáñá÷èïýí ÷ùñéóôÜ áðü ôéò ãíùóôÝò aposteriori êáôáíïìÝò (θm |m; y) áí åßíáé áðáñáßôçôï.
40 ÊÅÖÁËÁÉÏ 6. ÐÑÏÓÄÉÏÑÉÓÌÏÓ ÌÏÍÔÅËÏÕ ÌÅ ÔÇ ×ÑÇÓÇ MCMC
ÕðÜñ÷ïõí äéÜöïñåò ó÷åôéêÝò ðñïóåããßóåéò ãéá ôïõò MCMC áëãüñéèìïõò ìå ÷þñïõò êáôá-
óôÜóåùí äéáöïñåôéêþí äéáóôÜóåùí. Ìéá ðïëý êïìøÞ êáé åõÝëéêôç äéáôýðùóç ãñÜöåé
üëåò ôéò ðõêíüôçôåò ùò ðñïò Ýíá óýíèåôï ìÝôñï äéáäéêáóßáò Poisson, äåßôå ðáñáäåßãìáôïò
÷Üñéí ?, ?. Óå áõôü ôï ðëáßóéï, ïé öõóéêÝò ðñïôåéíüìåíåò êáôáíïìÝò ðáñïõóéÜæïíôáé
óáí ôùí äåéãìáôïëÞðôåò ãÝííçóçò êáé èáíÜôïõ ìåôáôïðßóåùí. Áõôïß ïé áëãüñéèìïé åßíáé
éäéáßôåñá öõóéêïß êáé ÷ñÞóéìïé óôá ðëáßóéá ôùí ìïíôÝëùí ÷ùñéêþí óçìåéáêþí áíåëßîåùí
ðïõ åßíáé óõ÷íÜ åýêïëï íá ÷áñáêôçñéóôïýí áðü ôçí Üðïøç ôçò ðõêíüôçôÜò ôïõò ùò ðñïò
Ýíá êáôÜëëçëï ìÝôñï áíÝëéîçò Poisson.
ÊåöÜëáéï 7
Ç ðáñÜìåôñïò éêáíïðïéåß ôçí éäéüôçôá ôçò äåóìåõìÝíçò óõæõãßáò óå áõôÞí ôçí ðåñßðôùóç,
êáé ç äåóìåõìÝíç êáôáíïìÞ ôçò äåäïìÝíïõ ôïõ ìðïñåß íá ãñáöôåß óáí
µ ¶
25 1
( |; y) ∝ IG + 10−3 ; y T V −1 y + 10−3 : (7.1)
2 2
ÅðïìÝíùò ç äåéãìáôïëçøßá áðü áõôÞí ôçí äåóìåõìÝíç êáôáíïìÞ åßíáé áðëÞ. Ç äåóìåõìÝíç
41
42 ÊÅÖÁËÁÉÏ 7. ¸ÍÁ ÅÐÅÎÇÃÇÌÁÔÉÊÏ ÐÁÑÁÄÅÉÃÌÁ
ç ïðïßá äåí Ý÷åé ìéá ãíùóôÞ ìïñöÞ, êáé Ýôóé ç äåéãìáôïëçøßá áðü áõôÞ åßíáé ðéï ðñïâëçìáôéêÞ.
1
Autocorrelation
0.8
0.6
0.4
0.2
−0.2
0 200 400 600 800 1000 1200
beta
1.2
1
Autocorrelation
0.8
0.6
0.4
0.2
−0.2
0 200 400 600 800 1000 1200
lags
áëãüñéèìïõ åßíáé öôù÷Þ, êáé ç åêôßìçóç âáóéóìÝíç óôï äåßãìá áðü ôçí áëõóßäá Markov
7.2. COLLAPSED ÁËÃÏÑÉÈÌÏÓ 43
èá Þôáí áíáðïôåëåóìáôéêÞ óôçí êáëýôåñç ðåñßðôùóç, ãéá íá ìçí áíáöÝñïõìå üôé èá Þôáí
åíäå÷ïìÝíùò áíáîéüðéóôç.
Ìéá ìáôéÜ óôï ó÷Þìá ?? äåß÷íåé ãéáôß ç óýãêëéóç ôïõ áëãïñßèìïõ åßíáé ôüóï öôù÷Þ.
Ïé ðáñÜìåôñïé óõó÷åôßæïíôáé ðïëý, Ýôóé þóôå ìéá äåéãìáôïëçøßá Gibbs âáóéóìÝíç óôç
óôñáôçãéêÞ ðïõ ÷ñçóéìïðïéåß áõôÞ ôçí ðáñáìåôñïðïßçóçóç èá áíáìéãíýåôáé åîáéñåôéêÜ
áñãÜ. Ðáñáìåôñïðïßçóç ôùí êáé ðñïêåéìÝíïõ íá ìåéùèïýí ïé aposteriori åîáñôÞóåéò
åßíáé ìéá ðéèáíÞ ëýóç. Åíôïýôïéò óå áõôü ôï ðëáßóéï, äåí õðÜñ÷åé êáìßá öõóéêÞ êáôçãïñßá
ðáñáìåôñïðïéÞóåùí áðü ôéò ïðïßåò íá ìðïñïýìå íá åðéëÝîïõìå, áíáãêÜæïíôÜò ìáò íá
ðñïôåßíïõìå åíáëëáêôéêÝò ëýóåéò.
300
250
200
alpha
150
100
50
0
0 20 40 60 80 100
beta
ôçí ( |i ; y). Ãéá ôçí áîéïëüãçóç ôçò óýãêëéóçò ôçò (i ; i ) áêïëïõèßáò, åßíáé åðáñêÝò
íá åîåôÜóïõìå ìüíï ôá i 's, äåäïìÝíïõ üôé ôá i 's Ý÷ïõí ðñïÝëèåé áõôüìáôá áðü ôç óùóôÞ
êáôáíïìÞ áöïý ôï Ý÷åé óõãêëßíåé óôçí ðåñéèþñéá aposteriori êáôáíïìÞ ôïõ, äåßôå ôï ?.
Ìéá áðëÞ åðéëïãÞ ãéá íá åîåñåõíÞóåé ï áëãüñéèìïò ôçí (|y) åßíáé ï óõììåôñéêüò ôõ÷áßïò
ðåñßðáôïò Metropolis ìå êáíïíéêÞ ðñïôåéíüìåíç ðõêíüôçôá. Óôéò ðñïóïìïéþóåéò ìáò óõíôï-
íßóáìå ôçí ðñïôåéíüìåíç äéáóðïñÜ ãéá íá Ý÷ïõìå ðïóïóôü áðïäï÷Þò êáôÜ ðñïóÝããéóç
ðåñßðïõ 0,33. Ç óõíÜñôçóç áõôïóõó÷Ýôéóçò ôïõ ðñïêýðôïíôïò áëãïñßèìïõ áðåéêïíßæåôáé
óôï ÷áìçëüôåñï ôìÞìá ôïõ ó÷Þìáôïò ??.
Independence sampler
0.12
0.1
Autocorrelation
0.08
0.06
0.04
0.02
−0.02
0 20 40 60 80 100 120 140 160
1
Autocorrelation
0.8
0.6
0.4
0.2
−0.2
0 20 40 60 80 100 120 140 160
Lags
Ãéá Üëëç ìéá öïñÜ, ç óõíÜñôçóç áõôïóõó÷Ýôéóçò ìåéþíåôáé áñêåôÜ áñãÜ, êáé óôçí ðñáãìá-
ôéêüôçôá ïé ôõðïðïéçìÝíïé Ýëåã÷ïé óýãêëéóçò (üðùò åßíáé äéáèÝóéìïé óôï ëïãéóìéêü CODA)
äçëþíïõí üôé ç óýãêëéóç äåí Ý÷åé åðéôåõ÷èåß ìåôÜ áðü 600000 åðáíáëÞøåéò, õðï÷ñåþíïíôáò
ìáò íá ÷ñçóéìïðïéÞóïõìå êé Üëëïõò áëãüñéèìïõò Metropolis-Hastings.
óüôåñï ãßíåôáé. Åíôïýôïéò, áöïý ç áêñéâÞò ìßìçóç ôçò êáôáíïìÞò óôü÷ïõ åßíáé áäýíáôç,
åßíáé óçìáíôéêü íá ðñïóðáèÞóåé êáíåßò íá óöÜëåé ðñïôåßíïíôáò ðõêíüôçôåò ðïõ Ý÷ïõí ðéï
ðá÷éÝò ïõñÝò áðü ôçí ðõêíüôçôá óôü÷ï. Áõôü åßíáé óõíÞèùò åöéêôü óå ìïíïäéÜóôáôá
ðáñáäåßãìáôá. Óå áõôü ôï ðáñÜäåéãìá ìéá ðõêíüôçôá(ìßîçò) ôçò ìïñöÞò 0:45G (2:1; 1:5−1 )+
0:25G (1; 10−1 ) + 0:3G (1; 70−1 ), ìå G(a; b) íá óõìâïëßæåé ôçí ó.ð.ð. ÃÜììá, ìïéÜæåé ìå ôçí
(|y) áñêåôÜ êáëÜ áëëÜ Ý÷åé ìéá äåîéÜ ïõñÜ ðïõ åßíáé ìåãáëýôåñç (heavier) áðü ôçí
üðùò åßíáé åðéèõìçôü. Äåßôå ôï Ó÷Þìá ??. Ç ðñïêýðôïõóá äåéãìáôïëçøßá áíåîáñôçóßáò
0 10 20 30 40 50 60 70 80 90 100
alpha
Ó÷Þìá 7.4: Óýãêñéóç ôïõ (|y) êáé ôçò ðñïôåéíüìåíçò ðõêíüôçôáò åðéëåãìÝíçò ãéá ôçí
äåéãìáôïëçøßá áíåîáñôçóßáò. Óõíå÷Þò ãñáììÞ: ìßîç ôçò Gamma. ÄéáêåêïììÝíç ãñáììÞ:
(|y).
ðáñÜãåé ôçí óõíÜñôçóç áõôïóõó÷Ýôéóçò ðïõ öáßíåôáé óôï ?? êáé ðïóïóôü åðéôõ÷ßáò 0:76,
ðïëý õøçëü ãéá áõôüí ôïí áëãüñéèìï.
Ôï ó÷Þìá ?? ðáñïõóéÜæåé ôìÞìáôá áðü ôá äåßãìáôá ôïõ log ãéá ôçí äåéãìáôïëçøßá
áíåîáñôçóßáò êáé ôïí óõììåôñéêü ôõ÷áßï ðåñßðáôï Metropolis ôçò ÐáñáãñÜöïõ 7:2. Åßíáé
óáöÝò üôé ï áëãüñéèìïò Metropolis ôõ÷áßïõ ðåñßðáôïõ ðáñïõóéÜæåé äéáäñïìÝò óôç äåîéÜ
ïõñÜ ôçò ( | y) ïé ïðïßåò åßíáé áðñüâëåðôåò êáé ìç êáíïíéêÝò. Áõôü åßíáé Ýíá êïéíü
öáéíüìåíï ãéá ôïí áëãüñéèìï ôõ÷áßïõ ðåñßðáôïõ óôéò ðõêíüôçôåò ìå ðá÷éÝò ïõñÝò, êáé
ïäçãåß óå ðåñáéôÝñù ðñïâëÞìáôá áíáîéüðéóôùí Monte Carlo åêôéìÞóåùí. Äåßôå, ðáñá-
äåßãìáôïò ÷Üñéí, ôï ?. Ìéá ëýóç åßíáé ç ÷ñÞóç ðñïôåéíüìåíùí ôõ÷áßùí ðåñéðÜôùí ìå
êáôáíïìÝò ìå ðá÷éÝò ïõñÝò, äåßôå ôï (?).
Áðü ôçí Üëëç ìåñéÜ, ç äåéãìáôïëçøßá áíåîáñôçóßáò öáßíåôáé íá Ý÷åé ìéêñÝò áëëÜ óõ÷íÝò
ðåñéçãÞóåéò óôéò ïõñÝò, ðïõ äåß÷íïõí üôé ôï äåßãìá áðü áõôÞ ôç äåéãìáôïëçøßá åßíáé ðéï
áîéüðéóôo.
¸íáò Üëëïò ôñüðïò íá åñåõíçèåß ç óõìðåñéöïñÜ áõôþí ôùí áëãïñßèìùí åßíáé íá ÷ùñßóïõìå
ôï MCMC äåßãìá óå ïìÜäåò óôáèåñïý ìåãÝèïõò, ãéá ðáñÜäåéãìá êÜèå ìßá ìÞêïõò 100
46 ÊÅÖÁËÁÉÏ 7. ¸ÍÁ ÅÐÅÎÇÃÇÌÁÔÉÊÏ ÐÁÑÁÄÅÉÃÌÁ
Independence sampler
8
−2
−4
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
−2
−4
−6
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
Iterations
Ó÷Þìá 7.5: Äåßãìáôá ôïõ log ãéá ôçí äåéãìáôïëçøßáò óðïõäáéüôçôáò êáé ôï óõììåôñéêü
ôõ÷áßï ðåñßðáôï Metropolis.
åðáíáëÞøåùí. Ãéá êÜèå ïìÜäá õðïëïãßæïõìå üôé ôïí ìÝóï ðáñôßäáò, Ýóôù Bi , êáé ôï
ðïóïóôü áðïäï÷Þò ðáñôßäáò, Ýóôù ai . ÔåëéêÜ ðáñÜãïõìå Ýíá ãñÜöçìá óçìåßùí ôùí (Bi ; ai )
ôéìþí, äåßôå ôï ó÷Þìá ??.
ÓõíïëéêÜ, ôï ðïóïóôü áðïäï÷Þò ôçò äåéãìáôïëçøßáò áíåîáñôçóßáò ðñÝðåé íá åßíáé üóï
ôï äõíáôüí õøçëü, åíþ áõôïý ôïõ áëãïñßèìïõ ôõ÷áßïõ ðåñéðÜôïõ ðñÝðåé êáíïíéêÜ íá
åßíáé ìåôáîý 0:2 and 0:5. Åíôïýôïéò ôá ãñáöÞìáôá óôï ó÷Þìá ?? êïéôÜíå ðéï âáèéÜ
ôïí ôñüðï ìå ôïí ïðïßï ôï ðïóïóôü áðïäï÷Þò ðïéêßëëåé óôï ðåäßï ïñéóìïý. Áõôü ìðïñåß
íá åßíáé ÷ñÞóéìï óôï íá åíôïðßóåé êáíåßò ôá ìç ðñïöáíÞ ìå Üëëåò ìåèüäïõò ðñïâëÞìáôá
óýãêëéóçò, êáé åðéðëÝïí ìðïñåß óõ÷íÜ íá ÷ñçóéìïðïéçèåß óôï íá ðñïôåßíåé êáëýôåñïõò
äåéãìáôïëÞðôåò, ðáñáäåßãìáôïò ÷Üñéí äåéãìáôïëÞðôåò ðïõ óõìðåñéöÝñïíôáé äéáöïñåôéêÜ óå
äéáöïñåôéêÜ ôìÞìáôá ôïõ ÷þñïõ. Ôï ó÷Þìá ?? äåß÷íåé üôé ç äåéãìáôïëçøßá áíåîáñôçóßáò
Ý÷åé ÷áìçëÜ ðïóïóôÜ áðïäï÷Þò óôçí áñéóôåñÞ ïõñÜ ôçò ðõêíüôçôáò, ðïõ äåß÷íåé üôé ãéá
áõôÝò ôéìÝò ôïõ êïíôÜ óôï ìçäÝí ç ðñïôåéíüìåíç ðõêíüôçôá êáé ç ðõêíüôçôá-óôü÷ïò äåí
ôáéñéÜæïõí êáëÜ êáé ôá ðïóïóôÜ áðïäï÷Þò åßíáé ðïëý ÷áìçëÜ äçìéïõñãþíôáò «êüëëçìá»
óôï ÷þñï êáôáóôÜóåùí. Áöïý ôï åßíáé ìç öñáãìÝíï ãéá ôï êïíôÜ óôï 0, áõôü ðñÝðåé íá
áíáìÝíåôáé. ÊáôÜ óõíÝðåéá áí êáé ç ãåíéêÞ óõìðåñéöïñÜ ôçò äåéãìáôïëçøßáò öáßíåôáé êáëÞ
ãéá áõôÞí ôçí åéäéêÞ MCMC ðñïóïìïßùóç, ç áíåîÜñôçôç ðñïóïìïßùóç ìðïñåß íá êïëëÞóåé
êïíôÜ óôï 0 ãéá ðïëëÝò åðáíáëÞøåéò, êÜíïíôáò êáôÜ óõíÝðåéá ôçí åêôßìçóç Monte Carlo
ïðïéùíäÞðïôå ðïóïôÞôùí ðïõ ìáò åíäéáöÝñïõí ðïëý áíáêñéâÞ.
7.4. Ï ÐÏËËÁÐËÁÓÉÁÓÔÉÊÏÓ ÁËÃÏÑÉÈÌÏÓ ÔÕ×ÁÉÏÕ ÐÅÑÉÐÁÔÏÕ 47
Independence Sampler Symmetric random walk
800 1200
700
1000
600
800
500
Batch mean
Batch mean
400 600
300
400
200
200
100
0 0
0.45 0.5 0.55 0.6 0.65 0.7 0.75 0.8 0.85 0.9 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
Probability of acceptance Probability of acceptance
Ó÷Þìá 7.6: ÐïóïóôÜ áðïäï÷Þò Ýíáíôé ìÝóùí ïìÜäùí ãéá ìÝãåèïò ïìÜäáò 100.
300
250
250
200
Batch mean
Batch mean
200
150
150
100
100
50
50
0 0
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7
Probability of acceptance Probability of acceptance
Ó÷Þìá 7.7: ÐïóïóôÜ áðïäï÷Þò Ýíáíôé ìÝóùí ïìÜäùí ãéá ìÝãåèïò ïìÜäáò 100.
−10
−20
−30
−40
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
−5
−10
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
Iterations
Ó÷Þìá 7.8: Äåßãìáôá ôïõ log ãéá ðïëëáðëáóéáóôéêïýò êáé ôñïðïðïéçìÝíïõò ðïëëáðëïýò
äåéãìáôïëÞðôåò Metropolis
0.5
Autocorrelation
0.4
0.3
0.2
0.1
−0.1
0 20 40 60 80 100 120 140 160
0.6
Autocorrelation
0.4
0.2
−0.2
0 20 40 60 80 100 120 140 160
Lags
Åõ÷áñéóôßåò
Èá èÝëáìå íá åõ÷áñéóôÞóïõìå ôç Ëïõêßá Ìåëéãïôóßäïõ, ôïí ¼ìçñï Ðáðáóðçëéüðïõëï êáé
ôï ÓôÝöáíï ÔïíåëëÜôï ãéá ÷ñÞóéìá ó÷üëéá êáé óõæçôÞóåéò.
Âéâëéïãñáößá
51
52 ÂÉÂËÉÏÃÑÁÖÉÁ
Dellaportas, P. & Smith, A. F. M. (1993). Bayesian inference for generalised linear and
proportional hazards models via Gibbs sampling, Applied Statistics 42: 443{459.
Devroye, L. (1986). Non-Uniform Random Variate Generation, Springer-Verlag, New
York.
Edwards, R. & Sokal, A. (1988). Generalization of the Fortium-Kasteleyn-Swendsen-
Wang representation and Monte Carlo algorithm, Physical Review Letters D
38: 2009{2012.
Gamerman, D. (1997). Markov Chain Monte Carlo: Stochastic Simulation for Bayesian
Inference, Chapman and Hall, London.
Gelfand, A. E. & Dey, D. K. (1994). Bayesian model choice: Asymptotics and exact
calculations, Journal of the Royal Statistical Society, Series B 56: 501{514.
Gelfand, A. E. & Smith, A. F. M. (1990). Sampling-based approaches to calculating
marginal densities, Journal of the American Statistical Association 85: 398{409.
Gelman, A. & Meng, X. L. (1998). Simulating normalising constants: From importance
sampling to bridge sampling to path sampling, Statistical Science 13: 163{185.
Gelman, A., Roberts, G. O. & Gilks, W. (1996). Ecient Metropolis jumping rules,
Bayesian Statistics V pp. 599{608.
Gelman, A. & Rubin, D. (1992). Inference from iterative simulation using multiple se-
quences, Statistical Science 7: 457{472.
Geman, S. & Geman, D. (1984). Stochastic relaxation, Gibbs distributions and the
Bayesian restoration of images, IEEE Transactions of Pattern Analysis and Machine
Intelligence 6: 721{741.
Geyer, C. (1992). Practical Markov chain Monte Carlo, Statistical Science 7: 473{483.
Geyer, C. J. & Thompson, E. A. (1992). Constrained Monte Carlo maximum likelihood
for dependent data (with discussion), Journal of the Royal Statistical Society, Series
B 38: 657{699.
Geyer, C. & Mller, J. (1994). Simulation procedures and likelihood inference for spatial
point processes, Scandinavian Journal of Statistics 21: 359{373.
Gilks, W. R., Richardson, S. & Spiegelhalter, D. J. (eds) (1996). Markov Chain Monte
Carlo in Practice, Chapman and Hall, London.
ÂÉÂËÉÏÃÑÁÖÉÁ 53
Gilks, W. & Wild, P. (1992). Adaptive rejection sampling for Gibbs sampling, Applied
Statistics 41: 37{348.
Green, P. J. (1995). Reversible jump Markov chain Monte Carlo computation and
Bayesian model determination, Biometrika 82: 711{732.
Green, P. J. (2002). Reversible jump MCMC, in P. J. Green, N. Hjort & S. Richardson
(eds), Highly Structured Stochastic Systems, Oxford University Press, to appear.
Grenander, U. & Miller, M. (1994). Representations of knowledge in complex systems
(with discussion), Journal of the Royal Statistical Society, Series B 56: 549{603.
Gruet, M.-A. & Robert, C. (1997). Comment on `Bayesian analysis of mixtures with an
unknown number of components' by S. Richardson and P.J. Green, Journal of Royal
Statistical Society Series B 59: 777.
Hills, S. E. & Smith, A. F. M. (1992). Parameterization issues in Bayesian inference, in
J. Bernardo, J. Berger, A. Dawid & A. Smith (eds), Bayesian Statistics 4, Oxford,
pp. 227{246.
Jarner, S. & Roberts, G. O. (2002a). Convergence of heavy tailed MCMC algorithms,
submitted for publication, available at http://www.statslab.cam.ac.uk/∼mcmc .
Jarner, S. & Roberts, G. O. (2002b). Polynomial convergence rates of Markov chains,
Annals of Applied Probability .
Jeliazkov, I. & Chib, S. (2001). Marginal likelihood from the Metropolis-Hastings output,
Journal of the American Statistical Association 96: 270{281.
Kass, R. E., Carlin, B. P., Gelman, A. & Neal, R. (1998). Markov chain Monte Carlo in
practice: a roundtable discussion, The American Statistician 52: 93{100.
Kass, R. & Raftery, A. (1995). Bayes factors, Journal of the American Statistical Asso-
ciation 90: 773{795.
Liu, J. (2001). Monte Carlo Strategies in Scientic Computing, Springer-Verlag, New
York.
Madigan, D. & York, J. (1995). Bayesian graphical models for discrete data, International
Statistical Review 63: 215{232.
Meng, X. L. & van Dyk, D. A. (1997). The EM algorithm - an old folk-song to a fast new
tune, Journal of the Royal Statistical Society, Series B 59: 511{567.
54 ÂÉÂËÉÏÃÑÁÖÉÁ
Roberts, G. O. (2002). Linking theory and practice of MCMC, in P. J. Green, N. Hjort &
S. Richardson (eds), Highly Structured Stochastic Systems, Oxford University Press,
to appear.
Roberts, G. O., Gelman, A. & Gilks, W. (1997). Weak convergence and optimal scaling
of random walk Metropolis algorithms, Annals of Applied Probability 7: 110{120.
Roberts, G. O. & Rosenthal, J. S. (1997). Geometric ergodicity and hybrid Markov chains,
Electronic Communications in Probability 2: 2.
Roberts, G. O. & Rosenthal, J. S. (1998). Optimal scaling of discrete approximations to
Langevin diusions, Journal of the Royal Statistical Society, Series B 60: 255{268.
Roberts, G. O. & Sahu, S. K. (1997). Updating schemes, correlation structure, blocking
and parameterisation for the Gibbs sampler, Journal of the Royal Statistical Society,
Series B 59: 291{397.
Roberts, G. O. & Skold, M. (2001). Marginal density es-
timation for the Metropolis-Hastingsalgorithm, available at
http://www.maths.lancs.ac.uk/∼robertgo/RobSko01.ps .
Roberts, G. O. & Smith, A. (1994). Simple conditions for the convergence of the Gibbs
sampler and Metropolis-Hastings algorithms, Stochastic Processes and their Appli-
cations 49: 207{216.
Roberts, G. O. & Tweedie, R. L. (1996). Exponential convergence of Langevin diusions
and their discrete approximations, Bernoulli 2: 341{364.
Roberts, G. O. & Tweedie, R. L. (2002). Understanding MCMC, in preparation.
Roberts, G. & Rosenthal, J. (2001a). Markov chains and de-initializing processes, Scan-
dinavian Journal of Statistics 28: 489{504.
Roberts, G. & Rosenthal, J. (2001b). Optimal scaling of various Metropolis-Hastings
algorithms, Statistical Science 16: 351{367.
Rue, H. (2001). Fast sampling of Gaussian Markov random elds, Journal of the Royal
Statistical Society, Series B 63: 325{338.
Smith, A. F. M. & Roberts, G. O. (1993). Bayesian computation via the Gibbs sampler
and related Markov chain Monte Carlo methods (with discussion), Journal of the
Royal Statistical Society, Series B 55: 3{24.
56 ÂÉÂËÉÏÃÑÁÖÉÁ
57