Distinguere Un Segnale Dal Rumore Di Fondo

Distinguere un segnale da un rumore di fondo.
Prima puntata: lanciare i dadi

Mi sono messo in testa di insegnarvi un po' di statistica. O meglio, di fare finta di insegnarvi un po' di statistica: in realt far solo degli esempietti approssimati, senza darvi nessuna dimostrazione, e senza pretesa di rigore matematico alcuno. L'idea sarebbe quella di tentare di spiegarvi come si isola un segnale da un rumore di fondo, quando lo si pu fare, e perch avere pochi dati pu non permette di esprimersi in modo certo rispetto alla presenza di un nuovo fenomeno, mentre invece aumentarne la quantit migliora questa capacit fino a un livello che pu essere considerato sufficientemente attendibile. Siete pronti? Mi ci vorranno almeno un paio di articoli, se non di pi. E, se mi impegno, magari ce la facciamo entro il 13 dicembre. Useremo uno scenario di fisica delle particelle estremamente semplificato. Stiamo facendo un esperimento per la ricerca del puzzone di Piggs: questa fantomatica particella, nel caso in effetti esista in natura, si manifesterebbe nel nostro sofisticato rivelatore con l'accensione di una lucina rossa. Il nostro collega teorico ci ha informati che la produzione del puzzone di Piggs un evento molto raro: se le previsioni sono corrette si manifester in media una volta ogni 10000 interazioni. Segnatevi sui vostri quadernetti che questo ritmo di produzione e apparizione nel rivelatore un valore medio, soggetto a fluttuazioni statistiche: torneremo su questo punto tra un momento. Il principale problema del nostro esperimento quello del rumore di fondo. La natura, notoriamente burlona, ha previsto l'esistenza di un altro processo, che per l'occasione chiameremo bruglione di Yan, che si manifesta nel nostro rivelatore anch'esso con l'accensione della stessa lucina rossa, in modo assolutamente indistinguibile dalla (possibile) manifestazione del puzzone di Piggs. Il fenomeno del bruglione di Yan stato scoperto parecchi anni fa e da allora misurato in lungo e in largo, e rappresenta uno dei tanti aspetti della natura di cui conosciamo tutti i dettagli. Sappiamo per esempio che un fenomeno raro, ma pi frequente dell'apparizione presunta del puzzone: in 10000 interazioni si manifesta infatti in media 10 volte. Facciamo ora una digressione sulla questione dei valori medi e delle fluttuazioni statistiche. Immaginate di lanciare due dadi a 6 facce, di quelli normali e comuni (per i giocatori di D&D prima o poi faremo un serie dedicata) e di sommare le cifre sulle facce superiori. Il valore pi probabile che potete ottenere 7, perch si tratta della cifra che potete ottenere con il maggior numero di combinazioni (nello specifico: 1+6, 2+5, 3+4, 4+3, 5+2, 6+1). Ottenere 6 o 8 ancora abbastanza probabile, ma meno che ottenere 7 (vi lascio calcolare da soli le combinazioni possibili), mentre ottenere 2 o 12 molto meno probabile (potete ottenerli rispettivamente solo facendo 1+1 o 6+6). Prendete un pezzo di carta, e provate a disegnare un grafico, mettendo sull'asse orizzontale il valore che ottenete lanciando due dadi, e sull'asse verticale il numero di combinazioni che permettono di realizzare quel particolare valore. Otterrete qualcosa del genere:
Adesso fate un passaggio ulteriore, e trasformate i valori sull'asse verticale in percentuali. Per farlo, dovete contare tutte le combinazioni possibili (sono 36), e poi dividere ognuno dei valori che avevate sul grafico precedente per questo valore. Ecco qui:
Complimenti! Avete disegnato la vostra prima distribuzione di probabilit, una funzione che vi indica quanto probabile che un certo fenomeno (il lancio di due dadi, per esempio) produca un certo risultato (un certo valore della somma delle facce superiori). A seconda del fenomeno che state studiando (il lancio di due dadi, la produzione del puzzone di Piggs), questa distribuzione avr forme e caratteristiche diverse che si possono studiare matematicamente. Quando studiate una distribuzione di probabilit, ci sono alcune informazioni (matematiche) che vi aiutano a capirne le propriet. La principale il suo valore medio, che, perlomeno nel caso di distribuzioni simmetriche, vi dice qual il risultato pi probabile che potete ottenere se osservate un certo fenomeno. Immediatamente dopo viene un numerello che si chiama deviazione standard o anche scarto
quadratico medio, che vi da una misura di quanto i possibili risultati del vostro esperimento possono assumere dei valori diversi e lontani dal valore medio. Nel caso del lancio di due dati, il valore medio della distribuzione di probabilit dei valori attesi 7, mentre la deviazione standard circa 2.4 (come si calcola non ve lo spiego, se siete curiosi un'informazione facile da trovare):
La media viene solitamente indicata con il simbolo "mu" ( ), e la deviazione standard con "sigma" ( ). Quello che la media e la sigma di questa distribuzione vi dicono per esempio che, quando lanciate due dadi, in poco meno di 67% dei casi il risultato che otterrete sar compleso tra 7-2.4 e 7+2.4, ovvero tra il valore medio della distribuzione pi o meno una sigma (e vi prego di sorvolare sul fatto che il valore della deviazione standard di una distribuzione che pu assumere solo valori interi possa essere un numero reale, di quelli con la virgola, altrimenti non ne usciamo!). L'intervallo tra la media e pi o meno due sigma, conterr in questo caso pi del 95% delle combinazioni possibili. Questi valori dipendono ovviamente dalla forma della distribuzione di probabilit, ma vi danno un'idea di dove voglio andare a parare: l'intervallo compreso tra la media pi o meno un certo numero di sigma comprende una frazione di risultati possibili che sempre pi grande (e tende al 100%) tanto pi grande il numero di sigma che prendete in conto. Per esempio (ma ci torniamo meglio alla prossima puntata), se considerate la distribuzione di probabilit pi frequente in natura, la distribuzione a campana detta "normale" o di Gauss, un intervallo compreso tra la media pi o meno 3 sigma comprende pi del 99% dei risultati possibili per un fenomeno descritto da quella distribuzione. Conoscere il valore medio e la sigma della distribuzione di probabilit di un certo fenomeno, e la forma della distribuzione di probabilit, permette di stimare quali risultati ci si pu attendere, quanto questi siano probabili quando si esegue un esperimento, e soprattutto di valutare quanto un certo risultato sia compatibile con l'ipotesi di un certo fenomeno. Per esempio, se conoscete la distribuzione di probabilit del risultato del lancio di due dadi, potrete scegliere in modo intelligente dove piazzare i vostri insediamenti quando giocate ai Coloni di Catan, in modo da massimizzare la probabilit di produrre risorse e vincere il gioco. Oppure, lanciando due dadi un certo numero di volte e confrontando la distribuzione dei risultati sperimentali con la distribuzione attesa, potete provare a stabilire se i dadi che state usando sono stati truccati. Nel caso della ricerca del puzzone di Piggs, vista la necessit di distinguere la sua apparizione in mezzo al rumore di fondo generato dal fenomeno del bruglione di Yan, siete in una situazione simile. Se riuscite a farvi un'idea di quale sia la distribuzione di probabilit del manifestarsi dell'uno
e dell'altro fenomeno, potete tentare di valutare quanto il risultato del vostro esperimento supporti l'ipotesi dell'esistenza del puzzone, o piuttosto il solo manifestarsi del gi noto bruglione. Per rendere pi concreto l'esempio, ci servir sapere quali siano le caratteristiche delle distribuzioni di probabilit dei due fenomeni in questione (puzzone e bruglione), cosa che vedremo alla prossima puntata. Compito a casa. Mentre aspettate la prossima puntata, provate a costruire la distribuzione di probabilit della somma della facce di tre dadi. Qual il valore pi probabile? E se invece ne lancio quattro?
Distinguere un segnale da un rumore di fondo. Seconda puntata: il significato di un eccesso

Riprendiamo dal nostro segnale, il puzzone di Piggs, e il suo fastidioso rumore di fondo, il bruglione di Yan, che lo imita in tutto e per tutto, e per di pi avviene pi spesso. In entrambi i casi, come dicevamo, si tratta di fenomeni relativamente rari: il bruglione di Yan si manifesta in media 10 volte ogni 10000 collisioni, il puzzone di Piggs, se esiste, in media soltanto 1 volta. I fenomeni che avvengono raramente, e su questo dovrete credermi sulla parola, seguono nel loro apparire una distribuzione di probabilit detta di Poisson. Questa distribuzione ha diverse propriet matematiche interessanti, che vi lascio andare a scoprire da soli se volete approfondire. Per quello che vogliamo fare qui, ci interessa conoscere soltanto un paio di caratteristiche di base. La prima propriet, come potete immagine se avete letto la puntata precedente, il suo valore medio. Se studiate un fenomeno poissoniano, che ha la propriet di manifestarsi 1 volta ogni N misure (per esempio, ogni N collisioni), nel caso voi facciate M misure potete aspettarvi di osservare in media M/N volte il fenomeno. Se il bruglione di Yan si manifesta in media 1 volta ogni 1000 collisioni, se ne misurate 10000 vi aspettate di osservarlo in media 10 volte. Semplice, vero? La seconda propriet la deviazione standard, la "sigma", della distribuzione, anch'essa incontrata nella puntata precedente. La distribuzione di Poisson particolarmente comoda per i calcoli, perch se il suo valore medio K, la sua sigma la radice quadrata di K. Se in 10000 interazioni vi aspettate di osservare in media 10 volte il bruglione di Yan, la sigma della corrispondete distribuzione di probabilit la radice quadrata di 10, ovvero un po' pi di 3. Come ricorderete, la "sigma" di una distribuzione misura quanto probabile che osserviate un valore diverso da quello medio della distribuzione. Nel caso della distribuzione di Poisson (che in certi regimi non si comporta in modo troppo diverso dalla distribuzione normale), l'intervallo compreso tra il valor medio atteso pi o meno una sigma contiene approssimativamente il 68% delle osservazioni possibili. Se osservate l'apparire del brugliore di Yan in 10000 collisioni, in circa 68% dei casi potete aspettarvi che apparir un numero di volte compreso tra poco meno di 7 e poco pi di 13. L'intervallo compreso tra il valor medio e 3 sigma comprende circa il 99.7% di valori possibile, quello tra il valor medio pi o meno 5 sigma il 99.9999%.
Veniamo dunque alle nostre prime 10000 interazioni. Ci aspettiamo (ce l'ha detto il nostro amico teorico) in media 10 accensioni di lampadina causate dal bruglione di Yan, con una sigma di pi o meno 3 accensioni, e 1 accensione potenzialmente dovuta al puzzone di Piggs, la particella ignota di cui siamo alla ricerca, con una sigma di... 1 accensione! Immaginate dunque di osservare 13 accensioni: state forse vedendo l'apparire di puzzone di Piggs, o state semplicemente visionando il bruglione di Yan, che conoscete bene e che vi interessa poco? Purtroppo per voi, non potete dire (ancora) molto. 13 accensioni sono in effetti pi delle 10 che vi aspettereste in media per il solo bruglione, ma l'eccesso che osservate non (ancora) significativo. Siccome la statistica di Poisson governa la frequenza delle apparizioni di bruglione e puzzone, sapete bene che 13 accensioni dovute al solo bruglione, invece che le 10 medie, sono un'eventualit piuttosto probabile. In effetti, un'eventualit possibile circa un terzo delle volte: se doveste rifare l'acquisizione dei vostri 10000 eventi altre 2 volte, potete stare quasi sicuri che l'eccesso sparir. Mentre il numero eventuale di puzzoni di Piggs (1 in media, ma troppo facilmente anche 2 o nessuno) ancora troppo piccolo per poterlo distinguere. Che fate allora? Aspettate, e continuate a misurare, a raccogliere dati, a collezionare collisioni. Vediamo come la situazione evolve se invece di 10000 collisioni ne abbiamo raccolte 1000000. In un milione di collisioni ci aspettiamo di osservare in media 1000 accensioni di lampadina dovute al brugliore di Yan, con una sigma di circa 31 (la radice quadrata di 1000), mentre le accensioni potenzialmente dovute al puzzone di Piggs sarebbero 100, con una sigma di 10. Se in un milione di collisioni osservate 1103 accensioni, questa volta l'eccesso diventa intrigante. Potrebbe trattarsi ancora di una fluttuazione del rumore di fondo? Certamente, ma questa volta si tratterebbe di un eccesso che supera il valor medio atteso (1000) di pi di 3 volte la sigma della distribuzione (3 per 31 fa 93, e voi avete un eccesso di 103 accensioni). Una simile fluttuazione del bruglione di Yan ha una probabilit di avvenire solo 1 volta ogni 370 esperimenti che raccolgano un milioni di eventi, cosa non impossibile ma molto pi rara. In questo caso, normalmente vi permettereste di parlare di "evidenza" di un fenomeno, e di "osservazione di un eccesso". Molto probabilmente pubblichereste qualcosa, ma ovviamente con molta cautela. Per essere sicuri che il vostro eccesso sia genuino volete che le probabilit di una fluttuazione del rumore di fondo siano veramente minuscole, praticamente trascurabili. Se raccogliete un altro milione di interazioni fino ad averne 2 milioni, vi attendete 2000 accensioni dovute al bruglione, con una sigma di circa 41. Se osservate 2215 accensioni, il vostro eccesso (215 accensioni in pi delle 2000 attese in media) rappresenta pi di 5 volte la sigma del rumore di fondo: in questo caso, si tratterebbe di una fluttuazione del rumore di fondo che ha una probabilit di accadere ogni 1700000! D'altra parte, vi attendereste in media 200 accensioni potenzialmente dovute al puzzone, con una sigma di 14 accensioni: l'eccesso infinitamente pi probabilmente dovuto alla presenza di un secondo fenomeno oltre al bruglione, e certamente compatibile con l'esistenza del puzzone ("infinitamente" un eufemismo: quanto questo secondo scenario sia pi probabile qualcosa che si pu calcolare con precisione, ma in questa sede non ci proveremo nemmeno!). Se ve la sentite, in questo caso potete finalmente parlare di "scoperta", perch l'eccesso che osservate statisticamente significativo.
Tutto a posto? Nella maggio parte dei casi, si. Champagne, applausi, seminario pubblico, magari premio Nobel. A meno che (perch c' sempre un "a meno che")... Tutto il ragionamento fatto sino ad adesso si basa sull'ipotesi che le propriet del rumore di fondo, quello che abbiamo chiamato il bruglione di Yan, siano ben note. Questo spesso vero, ma quando si sperimenta in regimi energetici nuovi (per esempio a LHC!), potrebbe non essere cos certo. Il bruglione di Yan potrebbe essere stato studiato con cura con un acceleratore che ha lavorato a 2 TeV, e le previsioni di come dovrebbe manifestarsi a 7 TeV potrebbero essere state estrapolate sulla base di calcoli teorici. Come fare a fidarsi? Che succederebbe se il bruglione di Yan si presentasse in realt in media 11 volte in 10000 eventi, invece delle 10 inizialmente previste? Il ragionamento fatto prima sarebbe ancora valido? Vediamo un po'. In 2 milioni di eventi mi dovrei aspettare 2200 eventi (e non i 2000 che erroneamente credevo) con una sigma di circa 46. La mia osservazione di 2215 accensioni di lampadina assume immediatamente un significato diverso, non trovate?
Sbagliare a stimare il "rumore di fondo" uno degli errori sistematici pi comuni nella fisica delle alte energie. Per evitarlo, esiste una sola strategia: invece di affidarsi a predizioni teoriche, mettersi in condizione di misurare il ritmo di produzione del rumore di fondo direttamente dai dati. Per farlo, occorre trovare una zona di osservazione dove siate sicuri che si manifesti solo il bruglione di Yan, e misurarne le propriet in questa regione. quello di cui parleremo alla prossima puntata.
Distinguere un segnale da un rumore di fondo. Terza puntata: zone di rumore di fondo controllato
Come dicevamo alla fine della scorsa puntata, se si conoscono alla perfezione le propriet del fenomeno (o dei fenomeni) che imita il manifestarsi dell'oggetto di cui siamo alla ricerca, insomma del nostro rumore di fondo, un'analisi statistica delle nostre osservazioni permetter di capire se un eventuale eccesso osservato sia compatibile con la presenza di un segnale genuino sovrapposto al rumore, oppure al solo rumore. Nel caso invece che le propriet del rumore di fondo non siano note con sufficiente precisione, le probabilit di sbagliare aumentano. Nel caso in cui si sottostimi il rumore di fondo, si penser di vedere un segnale quando invece non ce n' traccia. Per evitare di cadere in questa trappola, i fisici cercano sempre di misurare le propriet dei rumori di fondo dagli stessi dati, per non doversi fidare troppo delle predizioni teoriche. Riprendiamo l'esempio del puzzone di Piggs e del suo fastidioso rumore di fondo, il bruglione di Yan. Quello che sappiamo che entrambi si manifestano nel rivelatore con l'accensione di una lampadina rossa. Se la storia fosse tutta qui, non ci sarebbe molto altro da aggiungere. Ma immaginate invece di essere talmente furbi da riuscire a isolare uno o pi modi di manifestarsi del solo bruglione di Yan: immaginiamo per esempio che abbiate scoperto che il bruglione di Yan si manifesta anche con l'accensione di una lampadina verde e di una lampadina blu, supponendo per semplicit con lo stesso ritmo con cui accende quella rossa. E immaginiamo invece che il fenomeno di cui siete alla ricerca, il puzzone di Piggs, per nessuna ragione possa far accendere n la lampadina verde n quella blu. In questo caso siete a cavallo: invece di fidarvi delle predizioni del vostro amico teorico, che vi ha garantito che il bruglione di Yan si manifesta con 10 accensioni ogni 10000 collisioni, andate direttamente a misurare questo valore con le lampadine verdi e blu. Inizialmente, avendo pochi dati, non avrete una grande precisione. Immaginiamo infatti che la previsione del vostro amico teorico sia corretta, e che in 10000 collisioni le tre lampadine si accendano in media 10 volte a causa del bruglione. Come abbiamo visto la volta scorsa, esiste una probabilit importante che invece di vedere 10 accensioni ne vediate invece 13, oppure 7, oppure 11.
In questo caso, facendo l'ipotesi che il ritmo di accensione sia costante nelle varie lampadine
(non necessariamente il caso, ma facciamola semplice), potete per esempio fare una media delle misure delle due lampadine che sapete non saranno accese dal puzzone di Piggs. Meglio ancora, se masticate di analisi dati, farete una media pesata o una regressione, considerando come errore sulle misure la radice quadrata della misura stessa (in sostanza, facendo l'ipotesi che la vostra misura sia poissoniana, e che la misura stessa sia una buona stima della media stessa: ecco il senso delle barre di errore nel grafico precedente). Nel nostro caso semplificato, il risultato della stima del rumore del fondo usando le due lampadine verdi e blu circa 9 (la linea tratteggiata nera), con una precisione di circa 2 conteggi (la banda gialla): meglio della sola lampadina verde e della sola lampadina blu da sole, come ci si aspetterebbe dalla combinazione di due misure. 9 conteggi in 10000 eventi pi o meno 2 una buona stima dei 10 conteggi teorici, e potete certo usare questo numero per valutare quanto l'eccesso di conteggi della lampadina rossa sia significativo. Purtroppo ancora non molto! 13 meno 9 fa 4, che poco pi di 3, la radice quadrata di 9. Si tratta sempre di un eccesso si poco superiore a una sigma. Continuate dunque a raccogliere dati, e ripetete l'operazione di media delle lampadine di controllo. In un milione di eventi la lampadina verde si sar accesa 981 volte, quella blu 1014, e quella rossa (come gi nella puntata precedente) 1103 volte.
Il rumore di fondo stimato con la lampadina verde e blu di 997 (pi o meno 22 accensioni), un'ottima stima del 1000 teorico. L'eccesso che osservate (1103 - 997 = 106) maggiore di pi di 5 sigma del livello del rumore di fondo misurato dai dati (essendo adesso la sigma da considerare l'errore sul livello medio del fondo, cio 22): avete una bella evidenza sperimentale della presenza di un nuovo fenomeno. E vi prego di notare che, quando avevamo considerato solo la lampadina rossa, lo stesso eccesso corrispondeva solo a 3 sigma: dove abbiamo guadagnato? In questo caso avete due misure del fondo, non una sola (o una sola predizione teorica), e il fatto che siano due ne migliora di molto la precisione, e rende lo stesso eccesso pi significativo. Immaginate dunque che cosa potreste fare se aveste a disposizione 30 lampadine invece di 3, e 29 di queste potessero essere usate per misurare il livello di produzione del bruglione di Yan. Qualcosa del genere:
Come vedete, il livello di precisione sulla misura del rumore di fondo (la banda gialla) migliora notevolmente, e il vostro eccesso (la lampadina rossa ha indice 15). D'altra parte, ingrandendo la regione in cui andate a misurare le propriet del rumore di fondo, aumentate anche le possibilit di osservare una fluttuazione larga a sufficienza da essere confusa con un eccesso. Cosa direste se il quadro fosse piuttosto questo qui sotto?
L'eccesso alla lampadina rossa sempre lo stesso, gli altri punti sono generati esattamente come nel grafico precedente: numeri causali distribuiti poissonianamente con media 1000. Questa volta per c' un punto corrispondente alla seconda lampadina che mostra un eccesso assolutamente casuale, che una fluttuazione del fondo. Se non sapeste che il puzzone di Piggs deve manifestarsi con l'accensione della lampadina rossa, ma soltanto che potrebbe manifestarsi in una delle 30 lampadine, come fate a distinguere quale dei due eccessi sia significativo? In due parole: non potete. Dovete (come sempre!) raccogliere pi dati, e verificare se - aumentando la statistica -
l'eccesso resta tale o si rivela soltanto una fluttuazione. Nell'attesa, dovete anche essere cauti nel dichiarare al mondo quale la significativit statistica del vostro eccesso. Se localmente la lampadina rossa mostra un eccesso di 3 sigma, il fatto che non sapete quale lampadina possa accendersi vi obbliga a correggere questo "3 sigma" per quello che si chiama in gergo il "Look Elsewhere Effect" (Effetto del Guardare Altrove) - per gli amici LEE -ovvero per la probabilit che una tale fluttuazione appaia in un'altra qualsiasi delle tante lampadine che state monitorando. Pi sono le lampadine in cui il puzzone di Piggs potrebbe manifestarsi, maggiore sar la correzioni, minore il valore globale del vostro effetto locale. Per stappare lo champagne dovrete aspettare ancora un po'.
Lo stato della ricerca del bosone di Higgs, dopo il seminario al CERN

14 dicembre 2011 La giornata di ieri stata delirante. Mica tanto per gli annunci sullo stato si salute della ricerca del bosone di Higgs: in buona sostanza, conoscevo gi i risultati, e, sebbene sia vero che potrebbero esserci buone ragioni per eccitarsi forse per la prima volta dalla partenza di LHC, la cautela resta comunque d'obbligo, ed decisamente troppo presto per stappare lo champagne. No, il delirio associato piuttosto al baraccone mediatico che si creato intorno a questo evento, baraccone che secondo me ha persino intaccato la qualit scientifica di una parte del seminario stesso (e ve lo dico senza peli sulla lingua: sto pensando alla presentazione di CMS), probabilmente a danno di una comprensione completa dello stato delle cose. Ma andiamo con ordine, e lasciamo folklore e sociologia per un altro articolo. Come penso di aver scritto probabilmente gi un migliaio di volte, non abbiamo nessuna predizione teorica della la massa del bosone di Higgs, per cui o cerchiamo in un intervallo di massa ampio, tra il limite inferiore messo dalle ricerche dirette di LEP (115 GeV), e un limite superiore di circa 1 TeV oltre il quale ben difficile che questa particella esista, perlomeno nel modo in cui lo predice il Modello Standard. Quello che invece i teorici sono in grado di calcolare, in funzione della massa presunta del bosone di Higgs, quanto spesso verrebbe prodotto nelle collisioni di LHC, e quanto facilmente potrebbe decadere in diversi tipi di particelle. Le modalit di decadimento cambiano a seconda della massa del bosone per ragioni diverse, ma la principale rimane questa: perch il bosone di Higgs possa decadere in una serie di particelle dotate di una certa massa, bisogna che la massa del bosone stesso sia sufficiente a generarle. O quasi, perch poi la meccanica quantistica si mette di mezzo, ed esiste una probabilit di creare una particella in modo virtuale per un tempo sufficientemente breve anche se non c' abbastanza energia, ma in sostanza il quadro questo.
Il grafico qui sopra riporta la probabilit che il bosone di Higgs decada in un certo modo, in funzione del valore della sua massa. Come vedete, a bassa massa, diciamo tra 50 e 150 GeV, il
decadimento preferito in una coppia di quark-antiquark b, mentre appena la massa diventa sufficiente, sopra i 150 GeV, il decadimento in coppie di bosoni W e Z diventa predominante. Per masse molto alte, appena l'energia sufficiente, anche il decadimento in coppie di quark-antiquark t diventa possibile. Queste informazioni guidano le strategie di ricerca di ATLAS e CMS, che di fatto cercano di vedere qualche segno del passaggio del bosone di Higgs negli stessi canali di decadimento. Per piccoli valori di massa del bosone di Higgs, tra i 110 e i 150 GeV, lo si cerca principalmente nel suo decadimento in due fotoni ( ), nonostante la probabilit di questo decadimento sia veramente bassina (circa 2 vollte ogni 1000 decadimenti): gli altri modi di decadimento ( e ), sebbene molto pi probabili, sono veramente difficili da vedere a LHC a causa dei grandissimi rumori di fondo. Sia ATLAS che CMS studiano questi modi, e ieri CMS ha presentato gli ultimi risultati anche su questi canali, ma di fatto la sensibilit ultima completamente dominata dal modo , per cui vi parler solo di questo. Nelle regioni di massa intermedia si usano i decadimenti coppie di bosoni W o Z. Siccome a loro volta i bosoni W e Z hanno diversi modi di decadere, alla fine ci ritroviamo con diversi stati finali possibili, anch'essi con una sensibilit diversa a seconda della massa dell'Higgs: tra 110 e 140 GeV possiamo dire parecchio con il decadimento , dove la sta per leptone, che pu essere un elettrone o un muone; tra 200 e 600 GeV ci dice di pi il decadimento , dove la coppia di quark da origine a due spray di adroni che chiamiamo jet; analogamente, sempre tra 200 e 600 GeV c' parecchio da scoprire guardando i decadimenti e ; il decadimento pi sensibile per la scoperta resta per (in varie combinazioni di leptoni: 4 elettroni, o 2 elettroni e 2 muoni, o 4 muoni), che pu dire molto per masse del bosone di Higgs variabili su tutto il range tra i 110 e i 600 GeV. Le ricerche fatte fino ad oggi hanno gi escluso una buona porzione dei valori di masse possibili, per cui di fatto siamo rimasti con una zone piuttosto ristretta dove andare a cercare, o da escludere definitivamente. Se ricordate, la combinazione dei risultati di ATLAS e CMS presentati quest'estate ha gi escluso la regione di massa tra 141 a 476 GeV, riducendo di fatto la zone interessane in cui andare a scavare tra i 115 GeV del limite superiore di LEP e 141 GeV. In questa finestra di bassa massa i canali di decadimento che possono dare informazioni veramente utili sono , e , che sono quelli che ATLAS ha si fatto solo presentato ieri, e che dominano anche i risultati di CMS. Nel caso della ricerca di , i segnale rappresentato dall'apparizione di due fotoni nei rivelatori, le cui energie e posizioni siano compatibili con il decadimento di una particelle. La collisioni di due protoni per genera a sua volta un mucchio di coppie di fotoni, che rappresentano il rumore di fondo. Siccome in questo caso i fotoni non sono prodotti dal decadimento di una particella, se calcolo a partire dalle loro energie e posizioni la massa della particella dal cui decadimento sarebbero originati, non ottengo un valore univoco, ma uno spettro continuo di valori. Con i fotoni che proverrebbero dal decadimento del bosone di Higgs dovrei invece vedere un accumulo di eventi per un valore di massa definito. La massa invariante delle coppie di fotoni osservate in questo caso la lampadina che mi segnalerebbe l'apparire del bosone di Higgs, e siccome ho un continuo di lampadine dove invece il bosone non si manifesta (il continuo di massa dovuto alle coppie di fotoni generate direttamente nello scontro tra i protoni), posso usarlo per valutare il rumore di fondo. Ecco il risultato di ATLAS (o meglio, una parte):
e l'equivalente per CMS:
Nel caso di ATLAS potete vedere, persino a occhio nudo, un certo eccesso in corrispondenza di 126 GeV. Nel caso di CMS le cose sono meno chiare, c' forse un eccesso pi debole intorno a 124 GeV,
e forse un'altro intorno a 135 GeV. Usando le tecniche statistiche di cui abbiamo discusso nei giorni scorsi, questi eccessi possono essere quantificati: localmente ATLAS vede nel canale un eccesso di 2.8 sigma, che per scende a 1.5 sigma se si tiene in conto il Look Elsewhere Effect (LEE). CMS vede un eccesso locale di 2.3 sigma a 124 GeV, la cui significativit scende a 0.8 sigma se si tiene conto del LEE. la situazione simile: anche qui posso usare le energie e le posizioni Per il canale dei 4 leptoni ($eeee$, $ee\mu\mu$ o $\mu\mu\mu\mu$) per ricostruire quale sarebbe la massa della particella originale da cui i leptoni proverrebbero se fossero i suoi prodotti di decadimenti. Qui le cose con il rumore di fondo sono un dito pi complesse, perch si tratta sia per il segnale che per il fondo di eventi molto rati, e per la misura del livello di fondo devo spesso affidarmi a un'estrapolazione dai dati pi complessa. Ecco cosa vede ATLAS:
e quello che vede CMS:
ATLAS ha un'accumulazione di 3 eventi intorno a 125 GeV, in un posto in cui se ne aspetterebbe praticamente solo 1 dovuto al rumore di fondo. La situazione in CMS pi confusa: globalmente anche CMS ha un eccesso di eventi rispetto al totale atteso, ma meno localizzato che quello di ATLAS, con eccessi sia poco sotto 1 120 GeV che intorno a 126 GeV. Vi prego poi di notare che ATLAS ha anche un eccesso di eventi intorno a 240 GeV, pi o meno altrettanto significativo che quello a 125 GeV, mentre CMS non vede nulla di simile in quella zona. Questo un classivo esempio del motivo per cui bisogna essere cauti in questo tipo di ricerche: forse che ATLAS sta vedendo due bosoni di Higgs, uno a 125GeV e uno a 240? O sono entrambe fluttuazioni? E CMS? Finalmente, il canale .Se possibile, qui le cose sono ancora pi complicate: siccome nello stato finale ci sono dei neutrini, che di fatto ATLAS e CMS non vedono, il giochino di ricostruire la massa della particella da cui gli oggetti finali verrebbero partendo alle loro energie e posizioni non pi possibile, e dunque la ricerca si fa meno precisa. Posso sempre costruire della variabile analoghe, ma la capacit di dire qualcosa di preciso rispetto a una massa precisa sar comunque inferiore. In questo canale sia ATLAS che CMS vedono un accesso globale, che potenzialmente rinforza l'ipotesi di un possibile fenomeno a bassa massa, ma non aiuta a chiarire per quale valore di massa possa stare spuntando fuori qualcosa. Se si mettono insieme tutti i risultati, ovvero i 3 canali che ho discusso per ATLAS, e questi 3 pi tutti gli altri per CMS, si ottengono questi risultai globali
ATLAS oggi in grado di escludere tutto il range di bassa massa possibile per il bosone di Higgs tranne l'intervallo tra 115 e 131 GeV, mentre l'eccesso a 240 GeV impedisce un'esclusione completa della regione delle masse intermedie. CMS ha ha bassa massa un'esclusione analoga, che lascia libero l'intervallo tra il limite di LEP e 127 GeV. ATLAS vede un eccesso apparentante coerente intorno a 126 GeV che, combinando tutti i canali, ha una significanza statistica locale di 3.6 sigma, da ridimensionare a 2.5 sigma tenendo in conto il LEE. CMS ha di fatto due eccessi con significanze simili, uno intorno a 120 e l'altro intorno a 124 GeV, non necessariamente coerenti tra di loro (sopratutto tenendo conto dell'ottima risoluzione del calorimetro di CMS che viene usato per misurare tanto i fotoni che gli elettroni). Globalmente questo fa s che CMS abbia un eccesso sparpagliato su tutta la regione di bassa massa, globalmente non pi significativo di 1.9 sigma. Che cosa possiamo concludere da questo quadro? molto difficile dirlo. Come diceva ieri pomeriggio Fabiola Gianotti alla fine della presentazione di ATLAS, sarebbe molto bello da parte del bosone di Higgs aver scelto di esistere tra 115 e 130 GeV: in questa regioni abbiamo mezzi e capacit per stanarlo, e forse qualche primo indizio della sua presenza. Ma tentare di far dire ai dati di pi di quello che possano dire, che mi sembrato un po' quello che Guido Tonelli abbia tentato di fare alla fine della sua presentazione, tirando un po' troppo per i capelli una coerenza tra i risultati di CMS che non necessariamente presente, certamente eccessivo. Gli eccessi osservati sono intriganti, ma tutti ancora troppo limitati per poter escludere che siano delle fluttuazioni del rumore di fondo. Il fatto poi che, oltre agli "eccessi gradevoli", ce ne siano altri meno apprezzati (pensate all'eccesso a 240 GeV nel canale a 4 leptoni di ATLAS, ma anche al doppio eccesso di CMS) dovrebbe ricordare a tutti che la Natura spesso infida, che la statistica una bestia difficile da domare, e che solo pi dati potranno chiarire uno scenario che resta intrigante e eccitante, ma troppo vago per potersi permettere di pi. E che sia chiaro, prima che me lo chiediate: io spero che il bosone di Higgs esista, e che abbia una massa di 125 GeV, e che, magari gi per l'estate 2012, siamo in grado di poterne annunciare la scoperta, grazie ai nuovi dati, ad analisi migliorate di quelli presi nel 2011, e della combinazione delle analisi di ATLAS e CMS. Ma tra quello che nutre le mie speranze (e quelle di molti), e quello che si pu veramente affermare oggi con i risultati che abbiamo, c' veramente una bella differenza.

Distinguere Un Segnale Dal Rumore Di Fondo

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Distinguere Un Segnale Dal Rumore Di Fondo

Caricato da

Copyright:

Formati disponibili

Distinguere un segnale da un rumore di fondo.

Prima puntata: lanciare i dadi

Distinguere un segnale da un rumore di fondo. Seconda puntata: il significato di un eccesso

Lo stato della ricerca del bosone di Higgs, dopo il seminario al CERN

e l'equivalente per CMS:

e quello che vede CMS:

Potrebbero piacerti anche