Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Disclaimer
Questi appunti si basano sul corso tenuto durante l’A.A. 2016-2017 dalla Professoressa Giuliano Fiorillo, e
sono stato scritti dal sottoscritto con l’aiuto, il confronto e la pazienza di tanti colleghi, che ringrazio sempre
di tutto cuore. Tali materiali sono accessibili da chiunque ne abbia bisogno e la loro diffusione dev’essere
mantenuta sempre libera e gratuita.
Inoltre, essendo frutto del lavoro di uno studente, questi appunti non sono esenti da errori e refusi, la cui
segnalazione è sempre incentivata e ben accetta.
Emanuele Di Maio
1
Parte 4: transistor a effetto campo e rivelatori
Transistor a effetto campo
Introduzione
I transistor a effetto campo (o FET, field effect transistor) sono dispositivi a semiconduttore il cui
funzionamento dipende dall’azione di controllo operata sulla corrente da un campo elettrico. Essi sono
divisi in due principali tipi: i transistor a effetto campo a giunzione (JFET, junction field-effect transistor o
semplicemente FET) e i transistor a effetto di campo metallo-ossido-semiconduttore (MOSFET, metal-oxide
semiconductor field-effect transistor).
I FET si mostrano in gran parte dei casi equivalenti ai transistor BJT descritti nella parte 1 (per questo ci
limiteremo a descriverne le peculiarità tecniche anziché i possibili impieghi), ma presentano alcune
particolarità distintive che rendono il loro utilizzo spesso più vantaggioso.
Il transistor ad effetto di campo differisce infatti da un transistor bipolare a giunzione per numerose
caratteristiche, tra cui citiamo le seguenti:
1) Prima fra tutte, la miniaturizzazione: per come sono progettati fisicamente, i FET presentano
dimensioni molto più ridotte; in pochi millimetri sono contenuti anche miliardi di transistor 1;
2) Sono transistor dalla grande resistenza in ingresso, che li rende particolarmente adatti per gli
amplificatori operazionali;
3) Presentano solo correnti unipolari: presentano perciò o solo correnti di elettroni, o solo correnti di
lacune.
4) Possono “simulare”, nei circuiti integrati, resistori e condensatori;
5) Si mostrano particolarmente adatti sia in analogico che in digitale, in quanto possono fungere da
elemento di memoria;
6) Hanno ampio ambito industriale, in quanto la loro struttura permette di creare chip
particolarmente simili tra loro.
Il funzionamento generale
Il principio di funzionamento alla base di un FET è analogo a quello di un BJT: anch’esso presenta tre
terminali, di cui due vengono utilizzati come entrata ed uscita, mentre un terzo viene utilizzato per
controllare e pilotare i segnali regolando il punto di lavoro, come una valvola regola il flusso d’acqua tra due
capi di un tubo. La nostra “acqua” sarà la corrente del transistor, che, come approfondiremo meglio nei
prossimi paragrafi, è solamente di natura maggioritaria: per questo distingueremo FET a canale 𝑛 (se la
corrente maggioritaria è costituita da elettroni) e FET a canale 𝑝 (se la corrente maggioritaria è costituita da
lacune).
1
I transistor ad effetto campo degli anni ’90 raggiungevano la dimensione del centimetro, mentre i moderni transistor
raggiungono l’ordine del nanometro.
2
Schematizzeremo un FET attraverso le seguenti componenti, che diventeranno via via più chiare al
progredire della nostra trattazione:
- Il source 𝑺, cioè il terminale attraverso cui i portatori di maggioritari entrano nel transistor;
- Il drain 𝑫, cioè il terminale attraverso cui i portatori maggioritari lasciano il trasnsitor;
- Il gate G, cioè il terminale in grado di regolare il flusso di maggioritari attraverso una tensione
esterna.
Nella nostra trattazione ci focalizzeremo prevalentemente sulla struttura del MOSFET, il cui utilizzo
industriale è più esteso. Essi sono divisi in due tipi principali:
- I MOSFET ad arricchimento;
- I MOSFET a svuotamento.
Il MOSFET ad arricchimento
Un MOSFET ad arricchimento presenta la struttura indicata in figura: su un substrato di tipo 𝑝 viene fatto
crescere uno strato di ossido di silicio. All’interno di quest’ultimo vengono aperte delle “finestre” laterali
entro cui vengono diffuse delle impurità di tipo 𝑛, mentre nella parte centrale viene aggiunta una lastra
metallica.
Le due regioni 𝑛 costituiscono il source e il drain del transistor, mentre la zona centrale ne costituisce il
gate. Osserviamo allora come un MOSFET sia strutturalmente ben diverso da un BJT: quest’ultimo
presentava una forte asimmetria in modo da pilotare il passaggio di corrente solo verso una direzione,
3
mentre in un MOSFET source e drain possono essere invertiti in quanto, strutturalmente, del tutto
equivalenti.
Si osservi che il drain e il source presentano un drogaggio maggiore rispetto al substrato su cui viene fatto
crescere l’ossido di silicio: nel nostro esempio avremo dunque correnti maggioritarie di tipo 𝑛; non per
niente, questo tipo di transistor viene detto NMOS 2.
La lastra del gate è conduttrice in quanto metallica, ed il substrato di silicio è un semiconduttore: essi
costituiscono perciò un condensatore a facce piane e parallele, intervallate dal dielettrico costituito
dall’ossido di silicio, che è invece un materiale isolante (non per niente questo tipo di transistor viene anche
detto transistor ad effetto di campo a gate isolato o IGFET): questo giustifica l’alta impedenza in ingresso
del dispositivo, dell’ordine di 10() ÷ 10(+ Ω, e le piccole correnti dell’ordine del 𝑓𝐴. Si osservi che il
substrato, detto anche body 𝐵, sebbene sia la regione di principale movimento di cariche, non è
considerato a conti fatti un terminale del transistor, in quanto esso è generalmente collegato a massa
insieme al source.
Qui di seguito alcune caratteristiche tecniche dell’apparato tecnico descritto sopra:
Questi fattori, come vedremo, saranno determinante nella descrizione del passaggio delle cariche
all’interno del transistor.
2
Si osservi che, equivalentemente, avremmo potuto utilizzare correnti maggioritarie di lacune ponendo al
drain e source un drogaggio di tipo 𝑝 elevato rispetto al substrato di tipo 𝑛, ottenendo in questo caso un
PMOS. Gli NMOS sono generalmente più utilizzati dei PMOS, anche se questi ultimi vengono largamente
impiegati per la realizzazione dei CMOS, che analizzeremo in seguito.
NMOS e PMOS ammettono i seguenti simboli circuitali:
4
Se dunque applicassimo una tensione tra source e drain, non osserveremmo un passaggio di corrente, in
quanto uno dei due diodi risulterebbe polarizzato inversamente. E’ necessario effettuare allora un processo
che denoteremo con il termine di arricchimento, in grado di creare un “canale” che permetta il passaggio di
cariche maggioritarie. Per questo, il MOSFET sarà detto, appunto, ad arricchimento.
Si immagini di porre a massa il body e il source, di stabilire una tensione iniziale 𝑉78 = 0 tra drain e source,
e infine una tensione positiva 𝑉:8 al gate: in questo modo, all’interno del condensatore costituito dal gate e
dal substrato si creerà un campo elettrico che attraversi perpendicolarmente lo strato di ossido, e che attiri
le cariche negative al gate:
La zona 𝑝, per il suo drogaggio, non presenta molti elettroni, dunque le cariche negative accumulatesi al
gate devono provenire dalle zone di drogaggio 𝑛 del source e del drain, che arricchiscono il substrato di
elettroni ed invertono progressivamente il suo drogaggio da 𝑝 ad 𝑛.
In questo modo tra drain e source si crea un canale di cariche negative: applicando allora una tensione
𝑉78 > 0 tra 𝑆 e 𝐷 si può controllare il flusso di elettroni da una parte all’altra, con un’intensità, come
vedremo, proporzionale al “campo pilota” esercitato attraverso la tensione 𝑉:8 (oltre che ovviamente alla
tensione 𝑉78 applicata).
Il valore di 𝑉:8 per cui nella regione di canale si accumula un numero di elettroni liberi sufficiente per
formare il canale di conduzione è chiamato tensione di soglia (threshold) ed è indicato con 𝑉> (da non
confondere con l’equivalente in vold della temperatura 𝑉? ). Per un NMOS ovviamente 𝑉> è positiva e
tipicamente è compresa tra 1 e 3 𝑉: se 𝑉:8 non fosse sufficiente, nella zona centrale potrebbero non
crearsi abbastanza portatori di carica negativa e le correnti di elettroni rimarrebbero minoritarie, non
aprendo dunque il canale. Questo fenomeno è detto di strozzamento.
Si osservi inoltre che la corrente venutasi a creare è, come abbiamo già accennato, di soli maggioritari:
l’arricchimento permette di sviluppare una certa quantità di carica (pilotata da 𝑉@A ) negativa da poter
trasmettere tra drain e source, ma le lacune all’interno della zona di svuotamento sarebbero ancora
soggette alla barriera di potenziale determinata dai due “diodi” posti in direzioni opposte: non sarebbero
dunque in grado di muoversi generando una corrente. Il MOSFET, a differenza di un BJT, è dunque un
dispositivo unipolare.
5
- Osservazione: ovviamente lo stesso processo di arricchimento può essere effettuato con un PMOS:
al gate andrà applicata in questo caso una tensione negativa, in modo da attirare le lacune nella
zona adiacente l’ossido e creare un canale di cariche positive, in grado di transitare tra drain e
source. Si osservi che i PMOS sono generalmente meno utilizzati degli NMOS, in quanto di
dimensioni maggiori.
Valutiamo quantitativamente l’entità di queste correnti maggioritarie. Come osserveremo, oltre che da
parametri strutturali, esse saranno dipendenti dalla tensione pilota 𝑉:8 , la tensione applica tra source e
drain 𝑉78 , e la tensione di soglia 𝑉> .
Indichiamo con 𝐶@C la capacità per unità di superficie del gate: in questo modo, poiché la carica è pari al
prodotto di capacità e differenza di tensione, potremo scrivere:
Una volta che 𝑉@A diventa positivo (e dunque 𝑉:8 supera la tensione si soglia), si apre il canale di
maggioritari, e il transistor non risulta più interdetto. Applicando dunque una tensione 𝑉78 > 0 tra source e
drain si crea una corrente 𝐼7 che, in base a quanto imparato a pagina 2 della parte 1, è pari a…
|𝑄 | |𝑄 | |𝑄| 𝑉78
𝐼7 = 𝑣L = 𝜇M 𝐸78 = 𝜇
𝐿 𝐿 𝐿 M 𝐿
Dove abbiamo indicato con 𝑣L la velocità dei portatori di carica, con 𝜇M la mobilità nel mezzo e con 𝐸78 il
campo elettrico generato dalla tensione 𝑉78 tra drain e source che “tira” gli elettroni del canale; nell’ipotesi
in cui esso è costante, 𝑉78 è (a meno di segno) il semplice integrale in una dimensione di 𝐸78 , perciò 𝑉78 =
𝐿𝐸78 . Sostituendo la carica |𝑄| dall’equazione precedente, si ottiene:
La corrente 𝐼7 è dunque dipendente dal prodotto delle tensioni 𝑉78 𝑉@A e dai parametri costruttivi
𝐶@C , 𝑊, 𝐿: si osservi che quanto più è stretta la lunghezza del canale 𝐿, tanto più sarà grande la corrente.
Osserviamo che l’espressione può essere riassunta nel seguente modo: indichiamo con 𝐾 i parametri
Q3
dettati dalla fisica del transistor, in modo che 𝐾 = 𝜇M 𝐶@C R
e dunque:
𝐼7 = 𝐾𝑉@A 𝑉78
Il termine 𝐾𝑉@A descrive un fattore di proporzionalità tra corrente prodotta e tensione applicata, e descrive
dunque una transconduttanza, indicata nella parte 1 con 𝑔T , perciò:
𝐼7 = 𝑔T 𝑉78
3 Q
Il fattore 𝐾 = 𝜇M 𝐶@C viene generalmente analizzato in base ai due principali fattori le che lo compongono: il
R
rapporto 𝑊/𝐿 è detto rapporto d’aspetto, mentre il prodotto 𝜇M 𝐶@C è detto parametro di transconduttanza.
6
della “valvola”: applicata una differenza di tensione, otteniamo una corrente 𝐼7 il cui fattore di
transconduttanza può essere pilotato attraverso la tensione di gate 𝑉@A .
Perciò, la tensione tra il gate ed un punto del canale 𝑉@A − 𝑉(𝑥) non è costante, ma diminuisce dal valore
𝑉@A al valore 𝑉@A − 𝑉78 man mano che il punto si sposta dal source al drain. Ovviamente questo
abbassamento di tensione provoca una minore attrazione delle cariche negative nella zona di svuotamento:
un andamento più realistico sarà perciò il seguente:
Il canale non presenta dunque una profondità uniforme, ma presenta una “rastremazione” all’avvicinarsi
del drain, tanto più grande quanto è alto 𝑉78 . E’ allora necessario correggere la formula che descriva la
4
Nell’ipotesi di un andamento ohmico supporremo un andamento lineare di 𝑉(𝑥).
7
carica |𝑄| all’interno del canale, che evidentemente diminuirà anch’essa all’avvicinarsi del drain. La carica
infinitesima contenuta in un tratto 𝑑𝑥 sarà pari a…
Osserviamo che l’integrale di sopra coincide con la regione in rosso del grafico di 𝑉 in funzione di 𝑥, ed è
dunque pari all’area del trapezio di base maggiore 𝑉@A , base minore 𝑉@A − 𝑉78 ed altezza 𝐿. Otteniamo
perciò:
1 1
|𝑄| = 𝐶@C 𝑊 𝐿(𝑉@A + 𝑉@A − 𝑉78 ) = 𝐶@C 𝑊 𝐿 (2𝑉@A − 𝑉78 )
2 2
|b| ]c_
Sostituendo nell’espressione 𝐼7 = R
𝜇M R
della corrente, si ottiene:
𝑊1 1 e
𝐼7 = 𝜇M 𝐶@C 𝑉78 (2𝑉@A − 𝑉78 ) = 𝐾 d𝑉@A 𝑉78 − 𝑉78 f
𝐿 2 2
Osserviamo che, nell’ipotesi in cui 𝑉78 ≪ 1, si possono trascurare gli effetti del secondo ordine, e dunque
𝐼7 ∼ 𝐾𝑉@A 𝑉78 come visto in precedenza; nell’ipotesi di alte tensioni, tuttavia, la transcaratteristica perde
l’andamento lineare, acquisendo un andamento parabolico.
Il grafico in figura tuttavia mostra solo parzialmente l’andamento di 𝐼7 . Si immagini infatti di aumentare
progressivamente 𝑉78 : ci muoveremmo sui diversi punti della parabola via via più grandi, fino ad arrivare al
massimo ottenuto per 𝑉78 = 𝑉@A ; in questa condizione la differenza di tensione al drain tra 𝑉@A e 𝑉 (𝑥) =
𝑉78 diventa nulla, causando uno “strozzamento” del canale: in seguito ad un ulteriore aumento di 𝑉78 ,
come si può osservare dal grafico in basso, la differenza 𝑉@A − 𝑉(𝑥) = 𝑉@A − 𝑉78 continua a rimanere nulla
(avviene, al più, un restringimento della profondità 𝐿 del canale di cui ne analizzeremo a breve gli effetti), e
e (
dunque la corrente si mantiene costante al valore 𝐼7 (𝑉@A ) = e 𝐾𝑉@A .
8
Si dirà allora che il MOSFET è entrato in saturazione, poiché, indipendentemente dalla tensione posta tra
entrata ed uscita, esso restituisce sempre la stessa corrente. In questo modo possiamo correggere il grafico
precedente con il seguente:
…dove sono state segnate le due zone di funzionamento del transistor: in azzurro quella di regime
parabolico, detta di triodo, e in rosso quella a regime costante, detta di saturazione.
Nel seguente grafico sono stati disegnati varie curve di 𝐼7 al variare della tensione di gate:
In realtà, sperimentalmente, oltre 𝑉78 = 𝑉@A la corrente non si mantiene perfettamente costante, ma
mostra una certa pendenza come quella in figura:
9
Il fenomeno, analogo all’effetto Early dei BJT, può essere facilmente spiegato in questi termini: una volta
raggiunto il regime di saturazione, un progressivo aumento di 𝑉78 restringe la profondità 𝐿 del canale, e
determina dunque un aumento della corrente 𝐼7 , in base alla formula…
𝑊 1 e
𝐼7 = 𝜇M 𝐶@C d𝑉@A 𝑉78 − 𝑉78 f
𝐿 2
Dunque, una volta raggiunto il regime di saturazione, la corrente 𝐼7 mostra comunque una certa
dipendenza dalla tensione 𝑉78 in quanto dipendente da 𝐿.
In maniera analoga a quanto visto a pagina 26 della parte 1, il problema può essere risolto graficamente
con una piccola correzione alla formula: prolungando le rette del regime di saturazione si arriva ad un
punto −𝑉i (sperimentalmente osservato attorno ai −30 ÷ −50 𝑉), costituente l’intersezione con l’asse
( e
delle tensioni 𝑉78 ; l’espressione costante 𝐼7 = e 𝐾𝑉@A può allora essere corretta attraverso il seguente
fattore lineare:
1 e
𝑉78
𝐼7 = 𝐾𝑉@A d1 + f
2 𝑉i
𝜕𝐼7 1 e
1 𝐼7lmn 1
= 𝐾𝑉@A = =
𝜕𝑉78 2 𝑉i 𝑉i 𝑟78
In un regime ohimico, possiamo perciò immaginare che, arrivati nella regione di saturazione, la corrente
varii al variare della tensione a causa di una resistenza parassita (analoga alla resistenza di Ealry) 𝑟78 . In
questo modo diventa chiaro il perché della presenza della resistenza 𝑟78 aggiunta nella schematizzazione di
pagina 2 anche se in regime di saturazione.
10
MOSFET complementari (CMOS) ed utilizzo nel digitale
Sebbene finora sia stato descritto il funzionamento di un MOSFET che presentasse elettroni come correnti
maggioritarie, un PMOS ne presenta le stesse caratteristiche, con la differenza che la tensione 𝑉:8 in grado
di aprire il canale (stavolta di lacune) e la tensione 𝑉78 in grado di muovere le cariche in una certa direzione
hanno segni invertiti rispetto ad un NMOS.
Frequentemente, su una stessa piastra di silicio, vengono collocati più NMOS e PMOS in serie. Questi
dispositivi vengono detti MOSFET complementari (o CMOS), e vengono realizzati come in figura:
Un importante esempio di CMOS è l’invertitore CMOS, spesso utilizzato nei circuiti digitali. Esso ha la
peculiarità di invertire appunto un ingresso alto in un ingresso basso e viceversa.
Un invertitore CMOS è costituito dal seguente circuito:
Immaginiamo la tensione in entrata 𝑣o possa avere solo due stadi, di “off” 𝑣(0) = 0 𝑉 e di “on”
𝑣 (1) = 𝑉LL . Allora,
- Se 𝑣o = 𝑣(0), la tensione al gate dei due transistor è 0, dunque 𝑄( , che è un NMOS, si ritroverà
interdetto in quanto 𝑉:8p < 𝑉> . Al contrario, poiché il source del secondo transistor è collegato a
𝑉LL , si ha 𝑉8:q = 𝑉LL e dunque 𝑉:8q = −𝑉LL , che, essendo negativa, nell’ipotesi di |𝑉LL | > 𝑉> ,
manda il PMOS in conduzione. In questo modo si ottiene in 𝑄( un circuito aperto, e in 𝑄e un
cortocircuito (a meno delle piccole resistenze interne opposte dal transistor), perciò 𝑣@ = 𝑉LL =
𝑣(1), e la tensione in uscita risulta invertita rispetto a quella in entrata.
- Viceversa, se 𝑣o = 𝑣(1) = 𝑉LL , la tensione al gate dei due transistor è alta: questo interdice il
transistor 𝑄e , che necessiterebbe una tensione negativa per entrare in regime attivo, mentre attiva
il transistor 𝑄( che presenta ora una tensione di gate 𝑉:8 = 𝑉LL > 𝑉> . Mentre dunque 𝑄e si
comporta come un ramo aperto, 𝑄( si comporta come un cortocircuito, che collega 𝑣@ a terra e
rende dunque 𝑣@ = 𝑣(0) = 0, invertendo il segnale in entrata.
11
Il MOSFET come resistore
Come abbiamo più volte sottolineato, i MOSFET vengono utilizzati in gran parte delle funzioni svolte dai
BJT. Ad esempio, un equivalente del common emitter studiato nella parte 1, sfruttando i MOSFET, sarebbe
il seguente:
La struttura si dimostra tuttavia poco efficiente da un punto di vista industriale: uno dei principali pregi dei
MOSFET è la miniaturizzabilità, ma comprendiamo che un dispositivo del genere, che sfrutta
un’ingombrante resistenza 𝑅 necessaria per la polarizzazione e il bilanciamento del circuito, perderebbe
tale peculiarità. Nei moderni circuiti integrati si preferisce perciò sostituire le resistenze con ulteriori
MOSFET, posti in particolari configurazioni che saranno oggetto di questo paragrafo. Immaginiamo infatti di
sostituire la resistenza con un transistor nella seguente struttura:
Indicato con 𝑄e il MOSFET in alto, osserviamo che, essendo drain e gate tra loro collegati, vale 𝑉:8q =
𝑉78 e : in questo modo 𝑄e si trova certamente in regime di saturazione, in quanto 𝑉78q > 𝑉@A = 𝑉:8q − 𝑉> .
La corrente prodotta al drain del MOSFET 𝑄e è quindi uniforme e pari a…
𝐾 e
𝑖7q = Z𝑣78 e − 𝑉> [
2
Quest’ultima è la stessa corrente che arriva poi nel source del MOSFET 𝑄( : abbiamo quindi che 𝑖8p dipende,
quadraticamente, da 𝑣78q . Volendo allora analizzare la dipendenza della corrente in uscita e la differenza di
tensione tra uscita e generatore 𝑉LL , si ha:
𝜕𝑖8p 1
= 𝐾Z𝑣78 e − 𝑉> [ =
𝜕𝑣78q 𝑟R
Il MOSFET 𝑄e si comporta dunque, in questo senso, come una resistenza di carico. Si osservi che, a
differenza dei circuiti utilizzanti BJT, la resistenza 𝑟R in questione è pilotata dalla tensione 𝑉78 . Quello che si
osserva non è perciò una “retta” di carico in grado di determinare il punto di lavoro, ma una curva di carico,
il cui andamento è parabolico.
12
Interazioni radiazione-materia
Introduzione
In questo capitolo ci occuperemo dei processi basilari con cui la radiazioni interagiscono con la materia.
L’analisi di queste interazioni è fondamentale per un fisico: da un lato, infatti, ci permetterà di
comprendere la natura e il funzionamento dei rivelatori, che tratteremo nel prossimo capitolo; dall’altro,
permette di analizzare l’ampio spettro di disturbi sperimentali dovuti alle interazioni dell’apparato
sperimentale con l’ambiente esterno: ad esempio, il rivelamento di una particella può essere compromesso
dal suo assorbimento da parte del mezzo entro cui viaggia, o dalla sua deflessione in seguito ad un urto.
Come sarà già noto al lettore, la materia è costituita da una serie di componenti fondamentali, quali gli
elettroni e i nuclei (a loro volta costituiti da sub-componenti), e la radiazione tende ad interagire, a seconda
delle condizioni sperimentali (l’energia della radiazione, il tipo di materiale), con ognuno di questi
costituenti. Una particella 𝛼 che urta contro una lamina d’oro può ad esempio collidere con un elettrone, o
essere assorbita dal nucleo producendo nuovi tipi di radiazione; ancora, fotoni ed elettroni tenderanno a
subire processi di natura elettromagnetica, mentre i neutroni, che sono particelle neutre, tenderanno a
subire maggiormente interazioni di tipo forte, oltre ad interazioni minori, sempre di tipo elettromagnetico
(o anche interazioni deboli!). La comprensione di come un mezzo risponde agli stimoli esterni permette
dunque di comprendere la natura stessa della materia analizzata, o, viceversa, di evidenziare le proprietà
della radiazione incidente conosciuto il tipo di “bersaglio”.
La sezione d’urto
Classicamente e quantisticamente, l’interazione tra radiazione e materia avviene il più delle volte
attraverso un urto, cioè un’interazione di breve durata che interessi materia ed energia, la cui possibilità di
realizzarsi è descritta da una certa probabilità. Quest’ultima è fortemente dipendente dal tipo di
interazione, dai costituenti che la determinano e dall’apparato sperimentale. Sarà perciò necessario, in
questi paragrafi, determinare preliminarmente i principali parametri utili alla comprensione di un urto, e,
primo fra tutti, il concetto di sezione d’urto: questa, come vedremo, restituirà un importante misura della
probabilità che si verifichi un fenomeno.
Si consideri un fascio di particelle costituito da componenti tutti uguali, incidente su un bersaglio che
schematizzeremo come una lamina di superficie 𝑆 e spessore Δ𝑥 (target). Nelle nostre considerazioni, per
praticità, effettueremo le seguenti ipotesi:
Nelle nostre considerazioni sarà utile sfruttare il flusso incidente 𝜙o del fascio di particelle, cioè il numero di
particelle 𝑁o incidenti sul bersaglio per unità di superficie ed unità di tempo:
1 Δ𝑁o
𝜙o =
𝑆 Δ𝑡
13
Poiché stiamo supponendo la lamina bersaglio sia in realtà costituita da numerosi bersagli elementari, la
“superficie d’impatto” delle particelle proiettile in realtà non è tutta la superficie 𝑆, poiché tra un bersaglio
ed un altro possono essere presenti delle “zone vuote”. Sarà allora utile definire una superficie efficace,
cioè una la possibile superficie d’interazione con cui possa avvenire l’urto. Definito con 𝜎 la superficie di un
bersaglio elementare con cui le particelle incidenti possono interagire, questa superficie efficace 𝑆yzz sarà
ovviamente pari a…
𝑆 = 𝜎𝑁{
𝑁} 𝜎𝑁{
=
𝑁o 𝑆
Generalmente è più utile esprimere il numero di bersagli in funzione della densità volumica 𝑛{ , cioè il
numero di bersagli per unità di volume; poiché il volume complessivo della lamina è 𝑆Δ𝑥, si ha:
𝑁} 𝜎𝑛{ Δ𝑥𝑆
= = 𝜎𝑛{ Δ𝑥
𝑁o 𝑆
𝑁} 1
𝜎=
𝑁o 𝑛{ Δ𝑥
La quantità di sopra, le cui dimensioni sono quelle di una superficie, è definita come sezione d’urto. Così
com’è introdotta ha tuttavia una valenza puramente classica e non tiene conto dei principi della meccanica
quantistica, ma in questo modo il lettore può farsi un’idea qualitativa del suo significato: essa può essere
infatti interpretata come la superficie utile con cui ogni particella incidente può interagire con la particella
bersaglio, proporzionale alla probabilità di avvenimento dell’evento.
Poiché le sezioni d’urto analizzate sono generalmente dell’ordine atomico, esse vengono rappresentate
attraverso l’unità di misura dei barn:
1𝑏 ≡ 10€e• 𝑐𝑚 e
- Esempio: l’interazione tra due protoni, il cui raggio è circa 0.8𝑓𝑚, ha una sezione d’urto che
possiamo stimare, grossolanamente, considerando, come superficie utile, una sfera di raggio 𝑅 +
𝑅 = 2𝑅; in questo modo si ottiene:
𝜎 ∼ 80𝑚𝑏
La sezione d’urto, per questioni sperimentali, non è mai rappresentata in maniera indipendente, ma
sempre in funzione di parametri misurabili sperimentalmente. Ad esempio si può misurare la sezione d’urto
associata ad un determinato range di energia, o, com’è più comune, ad un determinato intervallo nello
14
spazio. Immaginiamo infatti di aver posto, attorno alla lamina, una serie di strumentazioni in grado di
rivelare le particelle incidenti una volta che queste hanno interagito con la lamina. In generale, le particelle
proiettile subiscono una deflessione, che porta la loro traiettoria ad inclinarsi di un angolo 𝜃 rispetto alla
direzione originale: questo processo viene generalmente indicato con il termine di scattering. Se allora
individuiamo un angolo solido 𝑑Ω entro cui sono “riemerse” le particelle che hanno subito lo scattering,
possiamo definire la sezione d’urto in base a quante particelle sono state rivelate nell’angolo solido stesso.
E’ perciò utile definire la seguente quantità, detta sezione d’urto differenziale, descrivente il numero di
particelle deflesse per unità di angolo solido 𝑑Ω:
𝑑𝜎 𝑑𝑁} 1
=
𝑑Ω 𝑑Ω 𝑁o 𝑛{ Δ𝑥
Vediamo adesso come mettere insieme tutte le quantità introdotte. Avevamo osservato che:
1 Δ𝑁o
𝜙o =
𝑆 Δ𝑡
𝑁}
= 𝜎𝑛{ Δ𝑥
𝑁o
Alle due espressioni precedenti ne aggiungiamo una terza: il flusso 𝜙o descrive ovviamente il flusso di
particelle incidenti, ma, in seguito allo scattering, solo una parte di questo “riemergerà” indenne dalla
lamina, cioè la frazione associata a Δ𝑁o − Δ𝑁} . Il flusso 𝜙z in uscita sarà dunque pari a…
1 Δ𝑁o Δ𝑁}
𝜙z = d − f
𝑆 Δ𝑡 Δ𝑡
1 Δ𝑁}
𝜙z − 𝜙o = Δ𝜙 = −
𝑆 Δ𝑡
Δ𝜙
− = 𝜎𝑛{ Δ𝑥
𝜙
1
𝑑𝜙 = 𝜎𝑛{ 𝑑𝑥
𝜙
15
Risolvendo l’equazione differenziale di sopra si ottiene:
…che descrive l’andamento del flusso al variare della profondità della lamina. Il termine 𝜎𝑛{ viene indicato
(
con ˆ, dove 𝜆 è detto coefficiente di attenuazione: esso rappresenta infatti la lunghezza tale che, per 𝑥 = 𝜆,
il flusso si è ridotto (attenuato, appunto) di un fattore 1/𝑒.
𝜙(𝑥)
𝒫=
𝜙 (0)
…rappresenta la probabilità che, ad una distanza 𝑥 dal punto d’impatto con il bersaglio, le particelle
proiettile iniziali siano “sopravvissute”, cioè non abbiamo interferito col mezzo. La probabilità, dunque,
decresce al crescere della profondità del mezzo con andamento esponenziale. Conseguentemente, la
quantità…
Questi fenomeni possono avvenire più volte nel “cammino” della particella proiettile, e possono cumularsi
generando effetti macroscopici, sebbene, in ogni urto, le energie in gioco siano molto piccole. Ad esempio,
la collisione anelastica (che tra i due processi è la maggiore responsabile delle perdite di energia) di un
fascio di protoni ad energia di 10𝑀𝑒𝑉 e a sezione d’urto dell’ordine di 10€(‹ ÷ 10€(Œ 𝑐𝑚 e perde tutta la
propria energia in soli 0.25 𝑚𝑚 di rame!
Le particelle che analizzeremo, oltre che una carica responsabile delle interazioni di natura
elettromagnetica, presentano tuttavia una massa, che determinerà gran parte dei fenomeni dinamici in
questione. E’ bene perciò dividere le particelle che analizzeremo in due principali gruppi:
5
Processi secondari, che non tratteremo o tratteremo con piccoli cenni, sono ad esempio:
1) Emissione della radiazione di Cherenkov;
2) Reazioni nucleari;
3) Radiazioni di frenamento, o bremsstrahlung.
16
- Particelle leggere, come elettroni e positroni;
- Particelle pesanti, come muoni, pioni, protoni, e particelle 𝛼.
Escluderemo tuttavia particelle di massa maggiore delle particelle 𝛼, come ioni nucleari carichi, la cui
interazione con la materia causa effetti che esulano da questa trattazione.
Un ulteriore divisione degli urti la si ha a seconda degli effetti energetici: le collisioni sono dette hard
collisions se l’urto con un elettrone ne causa la ionizzazione, mentre sono dette soft collisions se ne causa la
semplice eccitazione.
Nel prossimo paragrafo analizzeremo il primo dei due effetti macroscopici elencati, cioè le perdite
energetiche, in un modello introdotto per la prima volta da Bohr ed in seguito corretto, attraverso la
meccanica quantistica, da Bethe e Bloch, nell’ipotesi di particelle pesanti.
1) L’elettrone bersaglio può essere considerato come una particella libera e inizialmente a velocità
nulla; quest’ultima supposizione è ovviamente valida se i tempi di interazione sono molto più brevi
dei periodi di spostamento dell’elettrone attorno al nucleo atomico a cui è vincolato.
2) La particella pesante, a causa della sua massa molto più grande di quella dell’elettrone, non subisce
deviazioni considerevoli rispetto al suo cammino originale. In questo modo trascureremo il secondo
effetto descritto a pagina 15, concentrandoci solo sugli effetti di natura energetica.
Siano 𝑝⃗) e 𝑝⃗z l’impulso iniziale e finale rispettivamente posseduti dall’elettrone prima e dopo l’interazione
con la particella pesante. Poiché il bersaglio è inizialmente (approssimativamente!) fermo possiamo porre
𝑝⃗) = •0⃗; d’altra parte ci aspettiamo che il campo elettrico della particella pesante causi una variazione
dell’impulso 𝑝⃗, allontanando o respingendo l’elettrone a seconda della carica. Sfruttando il teorema
dell’impulso, possiamo allora determinare l’impulso finale 𝑝⃗z :
Dove abbiamo indicato con 𝜏 il tempo di interazione. Si osservi che, per ragioni di simmetria, soltanto la
componente 𝐹“ ortogonale alla direzione della particella pesante va tenuta in conto, poiché i contributi
paralleli, all’inizio e alla fine dell’interazione, risultano uguali ed opposti, perciò:
𝑒
𝑝z” = \𝐹“ 𝑑𝑡 = \𝑒𝐸“ 𝑑𝑡 = \ 𝐸“ 𝑑𝑥
‘ ‘ • 𝑣
17
…dove 𝑙 è la distanza percorsa dalla particella pesante durante l’interazione. Per determinare il campo
elettrico sviluppato dall’elettrone possiamo utilizzare il teorema di Gauss 6, integrando sulla superficie
cilindrica di raggio 𝑏 ed altezza 𝑙:
2𝑧𝑒
\𝐸•⃗ ⋅ 𝑑𝑆⃗ = \𝐸“ 2𝜋𝑏𝑑𝑥 = 4𝜋𝑧𝑒 ⇒ \𝐸“ 𝑑𝑥 =
8 • • 𝑏
2𝑧𝑒 e
𝑝z =
𝑏𝑣
𝑧𝑒 e 2𝑏
𝑝z = d f
𝑏e 𝑣
In questo modo l’impulso trasferito è espresso come prodotto di una forza media 𝑧𝑒 e /𝑏e (essendo
𝑏 la distanza media tra particella incidente ed elettrone) e di un termine 2𝑏/𝑣 che
conseguentemente descrive approssimativamente il tempo medio dell’interazione: quest’ultimo è
infatti detto tempo d’urto.
𝑝ze 2𝑧 e 𝑒 •
𝑇y = =
2𝑚 𝑏e 𝑣 e 𝑚
yq
In fisica relativistica è utile riscrivere l’espressione di sopra in funzione della costante Tœ q, detta raggio
classico dell’elettrone, e il parametro 𝛽 = 𝑣/𝑐 : moltiplicando e dividendo per 𝑚𝑐 e otteniamo allora:
2𝑧 e 𝑒 • e
𝑧e e
𝑟y e
𝑇y = 𝑚𝑐 = 2𝑚𝑐 ž Ÿ
e 𝑣e e • 𝛽e 𝑏
𝑏 e𝑚 𝑐
𝑐
Come si può osservare l’energia cinetica dell’elettrone non dipende dalla massa incidente (a causa della
nostra approssimazione 𝑀 ≫ 𝑚), ma dipende direttamente dalla sua carica 𝑧 e ed inversamente da 𝛽e , e
dunque dalla sua velocità.
Analizziamo adesso il contributo macroscopico determinato dal numero ripetuto di urti come quello
appena analizzato. La quantità 𝑇y descrive l’energia guadagnata dagli elettroni, ma, per conservazione
dell’energia, ad essa deve corrispondere un’energia persa da parte della particella proiettile. In ogni
interazione, perciò, elettrone dopo elettrone, la particella incidente perde progressivamente la propria
energia. Detto 𝑛y il numero di elettroni per unità di volume nel mezzo, la perdita complessiva in un
volumetto 𝑑𝑉 (assimilabile al volume d’interazione) sarà allora:
6
Si faccia attenzione che si sta usando il sistema cgs di Gauss, ove 4𝜋𝜀) = 1: il risultato del teorema va allora scritto
nel seguente modo:
18
𝑧e e
𝑟y e e
𝑧 e 𝑑𝑏
−𝑑𝐸 = 𝑇y 𝑛y 𝑑𝑉 = 𝑇y 𝑛y 2𝜋𝑏𝑑𝑏𝑑𝑥 = e
2𝑚𝑐 ž Ÿ 2𝜋𝑏𝑑𝑏𝑑𝑥 = 4𝜋𝑟y d f 𝑚𝑐 e 𝑛y 𝑑𝑥
𝛽 𝑏 𝛽 𝑏
In questo modo, integrando su tutti gli elettroni a tutte le possibili distanze 𝑏 dalla particella proiettile, è
possibile ottenere l’energia persa per unità di lunghezza, al variare della profondità del mezzo:
𝑑𝐸 𝑧 e 𝑑𝑏
− = \ 4𝜋𝑟ye d f 𝑚𝑐 e 𝑛y
𝑑𝑥 𝛽 𝑏
Nasce però immediatamente un problema: su quali estremi di integrazione effettuare l’integrale di sopra?
Certamente il calcolo non si può estendere da un elettrone sull’asse della traiettoria (𝑏 = 0) né ad elettroni
molto lontani (𝑏 → ∞), in quanto nel primo caso l’espressione integranda diverge, mentre nel secondo
analizzeremo il caso in cui l’interazione non può agire in un breve intervallo di tempo, contro le nostre
considerazioni iniziali. L’integrazione deve perciò avvenire tra una minima e una massima distanza che
indicheremo con 𝑏¤¥¦ e 𝑏¤§¨ : questi ultimi mostrano le forti imprecisioni del nostro modello indotte dalle
numerose approssimazioni utilizzate, primo fra tutti l’utilizzo di un approccio classico e non relativistico,
che limita la possibilità di effettuare l’integrazione in tutto lo spazio, e l’analisi di interazioni avventi in
tempi molto ristretti. Scriveremo allora:
{©ª«
𝑑𝐸 𝑧 e 𝑑𝑏 𝑧 e 𝑏¤§¨
− =\ 4𝜋𝑟ye d f 𝑚𝑐 e 𝑛y = 4𝜋𝑟ye d f 𝑚𝑐 e 𝑛y log
𝑑𝑥 {©¬- 𝛽 𝑏 𝛽 𝑏¤¥¦
Iniziamo a determinare il termine 𝑏¤¥¦ : com’è noto dalla meccanica relativistica (similmente alla
meccanica classica), l’energia cinetica acquisita da una particella in seguito ad un urto non può superare un
certo valor massimo descritto da questa espressione, che non dimostreremo:
𝑇y¤§¨ = 2𝛾 e 𝛽e 𝑚𝑐 e
D’altra parte, però, 𝑇y è inversamente proporzionale a 𝑏, perciò ad un’energia cinetica massima deve
corrispondete un parametro d’urto 𝑏 minimo; in base alla formula di pagina 17 scriveremo allora:
𝑧e 𝑟y e 𝑟y 𝑧 𝑒e𝑧
𝑇y¤§¨ = 2𝑚𝑐 e
d f = 2𝛾 e e
𝛽 𝑚𝑐 e
⇒ 𝑏¤¥¦ = =
𝛽e 𝑏¤¥¦ 𝛾𝛽e 𝛾𝑚𝑣 e
Per valutare 𝑏¤§¨ dobbiamo invece riprendere le considerazioni effettuate sui tempi di rotazione
dell’elettrone. Come abbiamo visto, il tempo tipico di interazione è dell’ordine di 𝑏/𝑣, che
relativisticamente, come si può dimostrare, assume la forma 𝑏/𝛾𝑣. Questo intervallo di tempo dev’essere
molto più piccolo del periodo di rotazione 𝜏 dell’elettrone, perciò:
𝑏 1 𝑣𝛾
≪ 𝜏 = ⇒ 𝑏¤§¨ =
𝛾𝑣 𝜈 𝜈̅
Dove abbiamo indicato con 𝜈̅ la frequenza media 7 associata all’elettrone. Conosciuta quest’ultima,
possiamo determinare 𝑏¤§¨ . Sostituendo le due quantità nella formula della perdita d’energia, otteniamo
allora:
7
In generale ad un elettrone sono associate funzioni d’onda che siano combinazioni di più lunghezze d’onda e dunque
più frequenze, per questo abbiamo considerato la frequenza media del pacchetto.
19
𝑑𝐸 𝑧 e 𝛾 e 𝑚𝑣 µ
− = 4𝜋𝑟ye d f 𝑚𝑐 e 𝑛y log
𝑑𝑥 𝛽 𝜈̅ 𝑒 e 𝑧
…detta formula di Bohr. Questa presenta sia fattori legati alla particella proiettile, come come i termini 𝑧, 𝛽
e 𝑣, sia fattori legati al mezzo o alla particella proiettile, come 𝑚, 𝑒 ed 𝑛y .
Osserviamo che, per piccoli valori di 𝛽, la dipendenza di 𝑑𝐸/𝑑𝑥 è dominata dal termine 1/𝛽e: man mano
che 𝛽 (e dunque 𝑣) cresce, inizia a pesare nel fattore 𝛾 e 𝑣 µ , determinando invece una “risalita” della curva,
detta risalita relativistica.
Molto frequentemente l’espressione di sopra è riscritta esplicitando diversamente il termine 𝑛y , cioè la
densità numeri di elettroni per unità di volume. Poiché 𝑛y = 𝑍𝑁/𝑉, dove 𝑁 è il numero di atomi contenuti
nel volume 𝑉, se considerassimo 𝑁 = 𝑁i (il numero di Avogadro) avremmo 𝑉 pari al volume di una mole, la
cui massa sarà indicata con 𝐴; detto allora 𝜌 la densità del mezzo, avremo:
𝑍𝑁i 𝑍𝑁i 𝑍
𝑛y = = = 𝑁i 𝜌
𝑉i 𝐴 𝐴
ž Ÿ
𝜌
1 𝑑𝐸 𝑧 e 𝑍 𝛾 e 𝑚𝑣 µ
− = 4𝜋𝑟ye d f 𝑚𝑐 e 𝑁i log
𝜌 𝑑𝑥 𝛽 𝐴 𝜈̅ 𝑒 e 𝑧
Il termine 4𝜋𝑟ye 𝑚𝑐 e 𝑁i , indicato con 𝑘, viene generalmente indicato come fattore di scala, pari a circa
0.3 𝑀𝑒𝑉𝑐𝑚 e . Con questo possiamo un po’ compattare la nostra espressione, ottenendo infine:
1 𝑑𝐸 𝑍 𝑧 e 𝛾 e 𝑚𝑣 µ
− = 𝑘 d f log
𝜌 𝑑𝑥 𝐴 𝛽 𝜈̅ 𝑒 e 𝑧
- Osservazione: si osservi che è presente un ulteriore limite per 𝑏¤¥¦ : per distanze al di sotto della
lunghezza Compton per l’elettrone, pari a 𝜆 = ℎ/𝛾𝑚𝑣 (ancora una volta preso in valor medio),
iniziano fenomeni di natura quantistica che rendono la formula di sopra inadatta. Si dovrà allora
porre:
ℎ
𝑏¤¥¦ ∼ 𝜆̅ =
𝛾𝑚𝑣
𝑑𝐸 𝑍 𝑧 e 𝑚𝑐 e 𝛾 e 𝛽e
− = 𝑘 d f log
𝑑𝑥 𝐴 𝛽 𝜈̅ ℎ
20
parametrizzata in termini di impulso trasferito anziché parametro di impatto 𝑏: quest’ultimo, a differenza
del primo, non è misurabile sperimentalmente, ma solo ricavabile per via indiretta.
La formula sviluppata da Bethe e Bloch, che ci limiteremo a commentare qualitativamente, è la seguente:
1 𝑑𝐸 𝑍 𝑧 e 1 2𝑚𝑐 e 𝛾 e 𝛽e 𝑊¤§¨
− = 𝑘 d f d f º log − 𝛽e »
𝜌 𝑑𝑥 𝐴 𝛽 2 𝐼 e̅
¼ ½ e
- Entrambe presentano una dipendenza dal termine žiŸ ž¾Ÿ ed il fattore di scala 𝑘;
- Il fattore all’interno del logaritmo è analogo, ma presenta alcune apparenti differenze: innanzitutto
osserviamo il termine 𝐼 e̅ , descrivente l’energia media di eccitazione al quadrato (che nel paragrafo
precedente abbiamo stimato, approssimativamente, con ℎ𝜈̅ ), e il termine 𝑊¤§¨ ; questo secondo
descrive la massima energia trasferita in una singola collisione: nel paragrafo precedente l’abbiamo
posto pari a 2𝛾 e 𝛽e 𝑚𝑐 e , ma il calcolo di Beth e Bloche considera eventuali correzioni dovute ad un
rinculo della particella pesante 𝑀:
2𝑚𝑐 e 𝛽e 𝛾 e
𝑊¤§¨ =
𝑚 𝑚e
1 + 2 ¿1 + 𝛽e 𝛾 e + e
𝑀 𝑀
In prima approssimazione, dunque, il termine logaritmico è lo stesso. L’unico vera differenza sta in
𝐼 ,̅ poiché ℎ𝜈̅ ne costituisce solo una stima rozza: il termine presente nella formula di Bethe e Bloch
è invece dedotto sperimentalmente da fit lineari che mostrano la sua dipendenza da 𝑍.
- Termine del tutto assente dalla formula di Bohr è la quantità 𝛽e sottratta all’espressione:
quest’ultimo, all’aumentare della velocità della particella, diventa sempre più rilevante abbassando
il valore associato ai termini di risalita relativistica.
1 𝑑𝐸 𝑍 𝑧 e 1 2𝑚𝑐 e 𝛾 e 𝛽e 𝑊¤§¨ 𝛿 𝐶
− = 𝑘 d f d f º log ̅
e
− 𝛽e − − »
𝜌 𝑑𝑥 𝐴 𝛽 2 𝐼 2 𝑍
La nuova funzione è dunque analoga alla precedente, a meno della presenza dei fattori 𝛿 e 𝐶, detti
rispettivamente correzione densità e correzione di shell.
21
- La correzione densità è associato al cosiddetto effetto densità; le particelle cariche, all’interno del
mezzo, creano un campo elettrico che, oltre a respingere l’elettrone portando agli effetti descritti
prima, deforma gli atomi del materiale attraversato, polarizzandoli. Ogni atomo deformato inizia
così ad esercitare un proprio campo elettrico, che scherma gli elettroni più lontani dal campo
prodotto dalla particella proiettile. In questo modo, le collisioni avvenute tra particella pesante ed
elettroni distanti dalla sua traiettoria contribuiranno di meno alla perdita di energia complessiva
stimata dalla formula di Bethe e Bloch.
Questo fenomeno, denominato effetto densità, è dipeso prevalentemente da due fattori:
1) il primo, la densità del mezzo (da qui l’origine del termine), poiché maggiore è il numero di
protoni ed elettroni, maggiore sarà l’intensità del campo elettrico schermante;
2) il secondo, indipendente dal mezzo, è invece collegato alla natura della particella proiettile:
sperimentalmente si osserva come, per particelle veloci, l’effetto di schermo sia più intenso;
questo spiega l’ulteriore abbassamento della regione della risalita relativistica ad opera del
termine 𝐶/𝑍.
- La correzione di shell, contrariamente alla correzione densità, che è favorito per alte velocità, è
invece introdotta per particelle molto lente. Le analisi che ci hanno permesso di determinare la
formula di Bohr si sono sempre basate su tempi di interazioni molto più piccoli dei periodi di
rotazione medi degli elettroni, in modo che potessero essere approssimati a particelle ferme.
Qualora le particelle proiettile fossero però troppo lente, sarebbe necessario considerare un fattore
correttivo, determinato proprio dalla correzione di shell 𝐶; questo fattore è determinato attraverso
fit sperimentali, e presenta una complicata dipendenza da 𝛽, 𝛾 ed 𝐼 :̅ generalmente, si mostra
sperimentalmente più piccolo del termine di densità 𝛿, che determina gran parte delle correzioni.
22
Come possiamo osservare, ognuna di queste curve, per piccole velocità (associate ad energie dell’ordine
del 𝑀𝑒𝑉) mostra un andamento dominato dal termine 1/𝛽e : all’aumentare di 𝑣, dell’ordine di circa 𝑣 =
0.96𝑐, il termine logaritmico diventa preponderante iniziando quella che abbiamo definito risalita
relativistica. Le particelle che si trovano al minimo della curva, le cui velocità sono dunque pari a circa
0.96𝑐, sono dette particelle al minimo di ionizzazione (MIP, cioè minimum ionizing particles). In genere, in
corrispondenza di questi valori, per 𝑧 = 1, si ha che 𝑑𝐸/𝑑𝑥 è pari circa a…
1 𝑑𝐸 𝑀𝑒𝑉
d f ∼1÷2
𝜌 𝑑𝑥 ¤¥¦ 𝑔/𝑐𝑚 e
Un’importante dettaglio sta nella differenziazione delle curve. Ovviamente, muoni, pioni, protoni etc.
detengono masse diverse e cariche diverse, dunque diversi saranno i fattori moltiplicativi che appaiono
nella formula di Bethe e Bloch: pioni e muoni ad esempio hanno la stessa carica (−𝑒), ma masse di poco
differenti (rispettivamente, 139,6 𝑀𝑒𝑉/𝑐 e e 105,7 𝑀𝑒𝑉/𝑐 e ) quindi appaiono come due curve quasi
coincidenti; se però consideriamo protoni e muoni, o protoni e particelle 𝛼, la cui carica e massa varia
considerevolmente, osserviamo una netta differenziazione dei grafici. In questo senso, i rivelatori energetici
possono essere utilizzati come rivelatori di identità: analizzando l’energia persa in un mezzo, è possibile
risalire al tipo di particella attraversante il mezzo distinguendo la sua curva caratteristica 𝑑𝐸/𝑑𝑥 rispetto
alle altre. Ovviamente un trattamento simile può essere effettuato analizzando non l’energia persa al
variare della particella, ma al variare del mezzo per analizzarne le caratteristiche: dalla formula di Bethe e
Bloch, osserviamo, a causa dei termini 𝐴 e 𝑍 a fattore, una variazione dell’altezza delle curve di
assorbimento: il valore di 𝛽 associato alle MIP non varierà, ma le energie per 𝛽 = 𝛽̅ saranno più tanto più
basse quanto più è alto il numero di massa 𝐴 dell’elemento.
23
fortemente con gli elettroni atomici, tanto da catturarli separandoli dal loro atomo di origine. Questo
ovviamente cambia la 𝑧 della particella proiettile e la 𝑍 del mezzo, contribuendo a trasformare in maniera
imprevedibile la formula di Bethe e Block. Il problema si presenta anche per particelle neutre, le cui basse
velocità aumentano la probabilità di assorbimento da parte degli atomi bersaglio: la descrizione di questo
fenomeno tuttavia esula dagli scopi di questo corso.
Per descrivere la zona associata a 0.01 ≤ 𝛽 ≤ 0.05 si ricorre perciò a fit polinomiali determinati
sperimentalmente. La regione invece associata 𝛽 ≤ 0.01 è invece stata modellizzata secondo un modello
detto teoria di Lindhard, che non tratteremo.
24
Leggi di scala
Le diverse curve di Bethe e Bloch analizzate a pagina 21, se associate allo stesso mezzo, possono facilmente
essere determinate l’una rispetto all’altra attraverso semplici passaggi algebrici, che costituiscono le
cosiddette leggi di scala.
Immaginiamo di analizzare l’assorbimento dell’energia di particelle a diverse velocità all’interno di uno
stesso mezzo; in questo modo, tutti i fattori all’interno della formula di Bethe e Bloch, ad eccezione della
velocità e della carica della particella, sono fissati, e la formula può essere riassunta nella seguente forma:
𝑑𝐸
− = 𝑧 e 𝑓 (𝛽)
𝑑𝑥
Poiché, com’è noto dalla relatività, l’energia cinetica della particella può essere scritta come…
𝑇 = 𝛾𝑀𝑐 e − 𝑀𝑐 e = (𝛾 − 1)𝑀𝑐 e
…possiamo invertire la relazione ed esprimere la velocità della particella in funzione del rapporto 𝑇/𝑀:
𝑇
𝛽 = ℎd f
𝑀
? ?
Detta allora 𝑔 = 𝑓 dℎ žÅŸf = 𝑔 žÅŸ, possiamo esprimere la perdita energetica al variare dell’energia
cinetica della particella:
𝑑𝐸 𝑇
− (𝑇) = 𝑧 e 𝑔 d f
𝑑𝑥 𝑀
Immaginiamo allora di avere due particelle a diversa energia cinetica, diversa massa e diversa carica, che
indicheremo con 𝑇( , 𝑀( , 𝑧( e 𝑇e , 𝑀e , 𝑧e : in base a quanto visto potremo scrivere…
𝑑𝐸( 𝑇
− (𝑇( ) = 𝑧(e 𝑔 d ( f
𝑑𝑥 𝑀(
𝑑𝐸e 𝑇
− (𝑇e ) = 𝑧ee 𝑔 d e f
𝑑𝑥 𝑀e
Supponendo 𝑑𝐸( /𝑑𝑥 sia stato misurato e dunque sia noto, effettuiamo il seguente cambio di variabile alla
seconda equazione:
25
𝑀e
𝑇e = 𝑇(
𝑀(
𝑑𝐸e 𝑀e 𝑇e 𝑇( 𝑇(
− d𝑇e = 𝑇( f = 𝑧ee 𝑔 d = f = 𝑧ee 𝑔 d f
𝑑𝑥 𝑀( 𝑀e 𝑀( 𝑀(
𝑑𝐸( 𝑇 𝑇 1 𝑑𝐸
− (𝑇( ) = 𝑧(e 𝑔 d ( f ⇒ 𝑔 d ( f = − e ( (𝑇( )
𝑑𝑥 𝑀( 𝑀( 𝑧( 𝑑𝑥
Che costituisce, appunto, una legge di scala per poter determinare 𝑑𝐸e /𝑑𝑥 conosciuto 𝑑𝐸( /𝑑𝑥.
- Esempio: Qual è la legge di scala che lega che lega, all’interno di uno stesso mezzo, l’energia persa
da un protone ed una particella 𝛼? Poiché 𝑀Æ = 4𝑀Ç e 𝑍Æ = 2𝑍Ç , otteniamo:
𝑑𝐸Æ 𝑑𝐸Ç 𝑇Æ
(𝑇Æ ) = 4 d f
𝑑𝑥 𝑑𝑥 4
Dunque la perdita di energia per una particella 𝛼 è pari a quattro volte la perdita di energia di un
protone di energia cinetica quattro volte più piccola;
26
Quella di sopra è nota come curva di Bragg: come si può osservare, quando la particella ha raggiunto una
certa velocità ad una certa distanza 𝑥, ha un rilascio massimo di energia, per poi uscire dal regime di Bethe
e Bloch.
Il fenomeno di crescita dell’energia trasmessa in funzione della profondità è particolarmente utilizzata in
ambito medico per il trattamento di tumori maligni. In generale, si prepara la particella proiettile con
energie tali da rendere la relativa curva di Bragg molto piccata per una particolare profondità del mezzo 𝑥,
in corrispondenza della posizione del tumore, come in una situazione del genere:
In questo modo, l’energia assorbita dai tessuti sani è bassa, e gran parte dell’energia si concentra nella zona
dov’è necessario uccidere il tumore.
8
In realtà, come discusso in questo paragrafo, l’assunzione di range uguali per particelle uguali è poco ragionevole, a
causa della natura casuale dei processi di assorbimento.
27
Come si può osservare, per piccole distanze, la quasi totalità delle particelle riesce ad attraversare il mezzo;
ad un certo spessore 𝑥 la curva inizia tuttavia a decrescere in maniera dolce, contrariamente all’ipotesi
iniziale: se il fascio di particelle è costituito da corpuscoli tutti identici e dunque caratterizzati da un unico
range 𝑅, ci saremmo aspettati una variazione repentina a 0 del rapporto 𝑇𝑟/𝐼𝑛 non appena fosse stata
raggiunta la lunghezza 𝑥 = 𝑅; la qual cosa tuttavia non avviene, poiché particelle uguali non hanno range
uguali, visto che il processo di assorbimento è sempre determinato da un regime probabilistico e statistico:
ipoteticamente, una particella potrebbe avere la “fortuna” di attraversare un mezzo perdendo solo parte
della propria energia, contrariamente ad una sua gemella meno fortunata completamente assorbita dal
mezzo.
Il fenomeno appena descritto, indicato con il termine di range straggling, rende impossibile definire in
maniera assoluta il range per tutte le particelle. Qualitativamente, allora, si introduce il concetto di range
medio.
Il range medio può essere valutato in più modi. I primi sono di natura qualitativa: ad esempio, si può
considerare come range medio il valore 𝑥 = 𝑅 per cui il fascio ha dimezzato il numero dei propri
costituenti, cioè quel valore per cui 𝑇𝑟/𝐼𝑛 = 1/2. Questo tipo di stima tuttavia non descrive realmente il
range di una particella, in quanto, sebbene il fascio si sia dimezzato, l’altro 50% delle particelle comunque è
riuscita ad attraversare il mezzo. E’ allora più utile considerare, come range medio, quel valore di 𝑥 = 𝑅 per
cui il fascio trasmesso è sensibilmente vicino allo zero: una stima del genere può, ad esempio, essere
ottenuta considerando il punto di intersezione con l’asse delle 𝑥 della retta tangente al grafico nel punto
per cui 𝑇𝑟/𝐼𝑛 = 1/2: quest’ultimo valore è detto, più propriamente, range pratico, come si può osservare
nella figura precedente.
Ovviamente un altro approccio, teoricamente più rigoroso, sarebbe l’approccio analitico: attraverso la
formula di Bethe e Bloch conosciamo l’andamento medio di 𝑑𝐸/𝑑𝑥, perciò potremmo determinare la 𝑥
corrispondente ad una determinata energia 𝐸z semplicemente invertendo la relazione ed effettuando la
seguente integrazione:
ÈÉ
𝑑𝐸 €(
𝑥=\ d− f 𝑑𝐸
ÈÊ 𝑑𝑥
Perciò, poiché il range è quel valore di 𝑅 per cui 𝐸z = 0, possiamo equivalentemente scrivere:
)
𝑑𝐸 €(
𝑅 = \ d− f 𝑑𝐸
ÈÊ 𝑑𝑥
28
Si osservi che il calcolo di sopra è molto approssimativo: per basse energie, come abbiamo imparato a
pagina 22, la particella esce fuori dal regime di Bethe e Bloch, dunque la formula di 𝑑𝐸/𝑑𝑥 risulterebbe
diversa da quella modellizzata; inoltre, in generale, il percorso della particella non è continuo a causa dei
processi di scattering con il mezzo (che, seppur trascurabile nell’ipotesi 𝑀 ≫ 𝑚, è comunque presente),
che creano un percorso “a zig-zag” di spezzate su cui andrebbe effettuata l’integrazione volta per volta.
Quest’ultimo effetto è tuttavia piccolo, per questo, in genere, si preferisce usare un’espressione
semiempirica che tenga solo conto dell’uscita dal regime BB per piccole velocità, nella forma…
)
𝑑𝐸 €(
𝑅 = 𝑅¤¥¦ + \ d− f 𝑑𝐸
ÈÊ 𝑑𝑥
Dove 𝑅¤¥¦ , cioè il range all’energia cinetica minima per cui sia ancora valido il regime di Bethe e Bloch, va
determinato empiricamente.
Effettuiamo una stima approssimativa dell’integrale di sopra per farci un’idea di quale sia l’andamento di 𝑅:
poiché, com’è noto dalla relatività, l’energia totale della particella è nella forma…
𝑀𝑐 e
𝐸 = 𝛾𝑀𝑐 e =
¿1 − 𝛽e
…otteniamo, differenziando,
𝑀𝑐 e
𝑑𝐸 = µ
(𝛽𝑑𝛽) = 𝑀𝑐𝛾 µ 𝛽𝑑𝛽
(1 − 𝛽e )e
LÈ
Inoltre, supponendo il mezzo fissato, abbiamo, per la formula di Bethe e Bloch, che − LC = 𝑧 e 𝑓 (𝛽), perciò,
sostituendo nell’integrale, otteniamo:
)
𝑑𝐸 €( )
𝑀𝑐 e 𝛾 µ 𝛽 𝑀
𝑅 = \ d− f 𝑑𝐸 = \ e 𝑑𝛽 = e 𝐹 (𝛽) )
ÈÊ 𝑑𝑥 ¾Ê 𝑧 𝑓 (𝛽 ) 𝑧
Per particelle non troppo veloci, come sappiamo, la formula di Bethe e Bloch descrive un andamento di
𝑓 (𝛽) nella forma 1/𝛽e; 𝐹 (𝛽) ), risultato dell’integrazione di una quantità del tipo 𝛽µ , restituirà un fattore
𝛽• , cioè dell’ordine dell’energia di 𝑇 e . Approssimativamente, dunque, per energie non troppo alte, il range
medio di una particella va come il quadrato dell’energia cinetica della particella incidente.
Sperimentalmente infatti si osservano, per diverse particelle, i seguenti andamenti grafici:
29
Cioè delle curve il cui andamento è, più propriamente, nella forma 𝑇(.‹+ , dunque molto vicino alla nostra
stima.
Si osservi inoltre come sia possibile osservare delle leggi di scala anche per i range delle particelle:
ripetendo un ragionamento analogo a quello di pagina 24, possiamo mettere in relazione i range di due
particelle e poter scrivere:
𝑧(e 𝑀e 𝑀(
𝑅e (𝑇e ) = e 𝑀 𝑅( d𝑇( = 𝑇e 𝑀 f
𝑧e ( e
𝑀Æ 𝑧Çe 𝑀Ç 𝑇
𝑅Æ (𝑇) = e 𝑅Ç d𝑇 f = 𝑅Ç d f
𝑀Ç 𝑧Æ 𝑀Æ 4
Oggi i range delle particelle, associati a diversi valori energetici, sono tabulati in base ai dati sperimentali, in
modo che possa essere facilmente conosciuto, per ogni energia, il relativo range 𝑅 (𝐸 ). Si osservi come, in
base a queste relazioni, si possa determinare la variazione di energia di una particella una volta attraversato
un mezzo di spessore Δ𝑥 non necessariamente coincidente con il range.
Si immagini ad esempio un fascio di particelle ad energia 𝐸( conosciuta, attraversante un mezzo di spessore
Δ𝑥, ed emergente ad una nuova energia 𝐸e incognita. Poiché 𝐸e ≠ 0, in generale le particelle non avranno
perso tutta la loro energia iniziale, perciò sarebbe necessario un altro spessore, pari proprio ad Δ𝑥 Ì =
𝑅 (𝐸e ), in grado di annullare totalmente l’energia 𝐸(; in altre parole,
30
Come abbiamo detto range ed energie sono tabulati, dunque, conosciuto 𝐸(, può essere conosciuto
immediatamente 𝑅 (𝐸( ); dalla relazione precedente si può allora conoscere 𝑅 (𝐸e ), e dunque, sempre
grazie ai dati tabulati, il valore di 𝐸e: in questo modo, soltanto conoscendo l’energia iniziale delle particelle
del fascio si può determinare, attraverso il range, l’energia finale.
𝑑𝐸 𝑑𝐸 𝑑𝐸
=d f +d f
𝑑𝑥 𝑑𝑥 œ@•• 𝑑𝑥 oÍÍ
Si osservi che l’irraggiamento e la collisione in generale non sono fenomeni equiprobabili, dunque possono
avvenire situazioni fisiche dove una perdita energetica è più favorita rispetto all’altra. L’energia della
particella per la quale le due perdite energetiche sono invece equivalenti è invece detta di energia critica
𝐸œ , per cui dunque vale:
𝑑𝐸 𝑑𝐸
d f = d f 𝑝𝑒𝑟 𝐸 = 𝐸œ
𝑑𝑥 œ@•• 𝑑𝑥 oÍÍ
Calcolare l’energia critica 𝐸œ per cui i due contributi siano comparabili si mostra molto difficile dal punto di
vista teorico, ed è generalmente determinato via fit sperimentali. Un modo per ottenerne una buona stima
è attraverso la formula semiempirica di Bethe e Heitler, continuamente aggiornata in base a dati
sperimentali sempre più precisi, secondo cui:
9
Gli elettroni proiettile potrebbero causare la ionizzazione degli elettroni del mezzo, causandone dunque il distacco
dal mezzo bersaglio; posto un rivelatore al di là dell’oggetto bombardato, tuttavia, non vi sarebbe modo di distinguere
elettroni proiettile da elettroni bersaglio, essendo questi particelle identiche.
31
1600𝑚y 𝑐 e 800
𝐸œ = ∼ 𝑀𝑒𝑉
𝑍 𝑍
L’energia critica è generalmente dell’ordine della decina di 𝑀𝑒𝑉; nel piombo è ad esempio pari a 9.5 𝑀𝑒𝑉,
nel ferro a 27.4 𝑀𝑒𝑉 e nell’aria è pari a 102 𝑀𝑒𝑉.
Analizziamo dunque nel dettaglio separatamente il contributo energetico dovuto alle collisioni e quello
dovuto ai processi di irraggiamento.
La formula di sopra presenta alcune piccole differenze rispetto la formula classica: in primis, un
fattore 2 al denominatore dell’argomento del logaritmo, e in secondo luogo una funzione 𝐹 (𝛾)
responsabile delle correzioni prima descritta, la cui dipendenza dal termine 𝛾 è, come si può
dimostrare, diversa per positroni ed elettroni. Si può inoltre mostrare come la funzione 𝐹(𝛾) abbia
un andamento molto simile a quello di −𝛽e , dunque complessivamente il termine di collisione per
particelle leggere non è “troppo” diverso da quello determinato per particelle pesanti.
10
Si osservi che in linea di principio anche le particelle più pesanti sono soggette allo scattering, in quanto la loro
massa non è ma infinita e dunque, seppur piccola, subiscono comunque una deflessione e dunque un’accelerazione
che determina il loro irraggiamento. Si può però dimostrare che la sezione d’urto, legata dunque alla probabilità di
avvenimento dell’evento, sia proporzionale ad 𝑟 e, il raggio classico della particella di massa 𝑚:
e
e
𝑒e
𝜎 ∝ 𝑟 = Ï eÐ
𝑚𝑐
La sezione d’urto è dunque sensibilmente non nulla solo per piccole masse, come avviene per elettroni e positroni. Già
nel caso di un muone, dove 𝑚Ñ = 106 𝑀𝑒𝑉, avremmo una sezione d’urto quarantimila volte più piccola di quella
dell’elettrone!
32
1 𝑑𝐸 𝑍e 183
− d f = 4𝛼𝑁i 𝑟ye 𝐸 log (
𝜌 𝑑𝑥 oÍÍ 𝐴
𝑍µ
𝑑𝐸 𝐸
d f =
𝑑𝑥 oÍÍ 𝑋)
𝐴 1
𝑋) =
183 𝜌
4𝛼𝑁i 𝑍 e 𝑟ye log Ï ( Ð
𝑍µ
Esempi di lunghezza di radiazione sono quelli dl piombo, dove 𝑋) = 0.56, dell’alluminio, con 𝑋) =
8.9, e l’aria, con 𝑋) = 300.
Dalla risoluzione dell’equazione differenziale di sopra si ottiene:
C
€
𝐸 (𝑥) = 𝐸) 𝑒 ÓÊ
In questo senso, dunque, la lunghezza di radiazione può essere intesa come la distanza per cui
l’energia della particella nel mezzo si è ridotta di un fattore 1/𝑒.
Un ultimo calcolo interessante riguarda la deflessione degli elettroni 𝜃 rispetto all’orizzontale,
dovuta allo scattering con i nuclei. Si può dimostrare il valor medio di 𝜃 rispetti la seguente
relazione:
21𝑀𝑒𝑉 𝑥
𝜃̅ = ¿< 𝜃 e >= Ô
𝑐𝑝𝛽 𝑋)
11
La formula è riferita ad uno scattering tra elettrone proiettile e nucleo carico; si può mostrare che, nel caso si
volessero considerare anche gli elettroni del mezzo, andrebbe semplicemente corretto il fattore 𝑍 e in 𝑍(𝑍 + 1).
33
determinava una perdita di energia 𝑑𝐸, che si propagava urto dopo urto; il fotone, invece, possiede
un’energia quantizzata e ben definita, pari ad ℎ𝜈, e non può perdere la propria energia parzialmente: esso
o viene assorbito dalla materia bersaglio o “sopravvive” attraversando il mezzo. Al più, dunque, un fascio di
fotoni (cioè una radiazione elettromagnetica) incidente su un mezzo può diminuire la propria intensità, in
quanto può diminuire il numero di fotoni proiettile, ma non può diminuire l’energia di ogni singolo fotone.
Si può dimostrare che la diminuzione in intensità del fascio ha il seguente andamento esponenziale:
𝐼 = 𝐼) 𝑒 €ÑC
…dove 𝜇 è un termine di assorbimento dipendente dal mezzo, proporzionale alla sezione d’urto del mezzo
attraverso la densità atomica 𝑛:
𝑁i
𝜇 = 𝑛𝜎 = 𝜌 𝜎
𝐴
Questa perdita in intensità può avvenire principalmente secondo tre diversi fenomeni, che ci proponiamo
di analizzare per sommi capi:
1) L’effetto fotoelettrico;
2) Lo scattering Compton;
3) La produzione di coppie di antiparticelle.
Ognuno di questi fenomeni avrà una propria sezione d’urto descrivente dunque la probabilità di
avvenimento di ciascuno di questi eventi: la sezione d’urto complessiva sarà dunque pari alla somma delle
singole sezioni d’urto, nella forma:
𝜎>@> = 𝜎ÕÈ + 𝜎Ö + 𝜎ÕÕ
𝐸 = ℎ𝜈 − 𝐵È
Questa energia viene in gran parte convertita in energia cinetica dell’elettrone ionizzato: una piccola
frazione è in realtà scambiata con il nucleo atomico, ma, essendo questo molto più pesante dell’elettrone e
del fotone incidente, si può supporre il suo rinculo trascurabile.
L’andamento grafico associato alla sezione d’urto dell’effetto fotoelettrico è il seguente:
34
La sezione d’urto 𝜎ÕÈ , e dunque la probabilità che l’assorbimento possa avvenire, descrive dei picchi in
corrispondenza delle energie degli orbitali atomici (𝑛 = 1, 𝑛 = 2, etc.) per poi decrescere rapidamente:
com’è noto dalla meccanica quantistica, infatti, la probabilità di assorbimento di un fotone da parte di un
elettrone è non nulla soltanto in particolari condizioni di risonanza, che corrispondono ad energie discrete e
ben definite della particella proiettile.
Il calcolo della sezione d’urto è tuttavia non banale, a causa della complessità delle funzioni d’onda,
soluzione dell’equazione di Dirac, in grado di descrivere il moto degli elettroni atomici. Si preferisce allora
sfruttare formula di natura semiempirica, dipendente dalla sezione d’urto complessiva (cioè a cui
contribuiscono anche scattering Compton e produzione di coppie):
‹
e e
( 𝑚𝑐
𝜎ÕÈ = 4𝛼𝜎>@> d2• f 𝑍 + Ï Ð
ℎ𝜈
In base alla dipendenza con 𝑍 + , osserviamo come materiali con 𝑍 molto grande sono i più favoriti per
l’effetto fotoelettrico.
Il coefficiente di assorbimento, in base alla definizione di pagina 32, sarà:
𝑁i
𝜇ÕÈ = 𝑛𝜎ÕÈ = 𝜌𝜎ÕÈ
𝐴
35
Il fotone, di energia ℎ𝜈, incide con l’elettrone, che assorbe parte dell’energia che converte in energia
cinetica; l’energia rimasta viene espulsa sotto forma di radiazione elettromagnetica, cioè con un altro
fotone, ovviamente di minore energia ℎ𝜈 Ì : quest’ultima è connessa all’energia di partenza ℎ𝜈 attraverso la
seguente relazione, nota dalla meccanica relativistica:
ℎ𝜈
ℎ𝜈 Ì =
ℎ𝜈
1+
𝑚𝑐 e (1 − cos 𝜃)
…dove 𝜃 è l’angolo di deflessione del fotone. Una formula alternativa sfrutta le lunghezze d’onda anziché le
frequenze:
𝜆Ì − 𝜆 = 𝜆œ (1 − cos 𝜃)
ℎ
𝜆Ö =
𝑚𝑐
ℎ𝜈
ℎ𝜈 ž Ÿ
𝑇y = 𝑚𝑐 e (1 − cos 𝜃)
ℎ𝜈
1+ (1 − cos 𝜃 )
𝑚𝑐 e
Ovviamente il coseno di 𝜃 può al più valere 1 e -1, perciò abbiamo dei valori di massimo e di minimo:
(ℎ𝜈)e
𝑇y ¤§¨ =
𝑚𝑐 e
2 + ℎ𝜈
ℎ𝜈 𝜃
cotan 𝜑 = d1 + e
f tan
𝑚𝑐 2
Questa formula è sfruttata dal telescopio Compton, un particolare tipo di rivelatore posizionato all’angolo 𝜃
previsto della deflessione dei fotoni. Quando un elettrone viene rivelato, si può conoscere
immediatamente la sua energia e dunque l’energia dell’elettrone in base alla dipendenza da 𝜃 vista in
precedenza. In questo modo, il telescopio Compton può essere regolato per registrare diversi parametri
energetici semplicemente conoscendo la sua posizione.
36
Ovviamente, una volta determinata l’energia ℎ𝜈 Ì del fotone che ha subito lo scattering, è possibile
determinare l’energia cinetica dell’elettrone per differenza. Si mostra allora utile, in ambito sperimentale,
rappresentare graficamente la sezione d’urto differenziale per unità di energia cinetica dell’elettrone, cioè
la quantità 𝑑𝜎/𝑑𝑇y legata alla probabilità che l’elettrone rinculi con una certa energia 𝑇y . L’analisi di questa
sezione d’urto restituisce, per diversi fotoni incidenti di energia ℎ𝜈, il seguente andamento in funzione di
𝑇y :
Come si può osservare, vi sono energie preferenziali per cui la probabilità di scattering ad una determinata
energia tocca degli alti picchi di probabilità, detti spalla Compton.
Infine, descriviamo la sezione d’urto totale: essa, in base a formule semiempiriche, è espressa dalla
seguente relazione:
𝑚𝑐 e 1 2𝑚𝑐 e
𝜎Ö = 𝜋𝑟ye Ï + log Ð
ℎ𝜈 2 ℎ𝜈
Si osservi che la sezione d’urto Compton è in realtà determinata da due contributi: il primo associata ad una
(i)
sezione d’urto di assorbimento 𝜎Ö , determinata dall’elettrone che subisce l’urto, e il secondo associato
(8)
alla sezione d’urto di scattering 𝜎Ö , determinato invece dal fotone di energia ℎ𝜈 Ì emergente dall’urto. Il
(8) (i)
grafico complessivo di 𝜎Ö = 𝜎Ö + 𝜎Ö è allora il seguente:
37
Si osservi come nella sezione d’urto non appaia la dipendenza da 𝑍: la qual cosa è naturale, in quanto si
stanno trascurando tutti gli effetti di interazione tra elettrone e materia. Il coefficiente di assorbimento
deve però considerare l’urto con 𝑍 possibili elettroni di ciascun atomo, perciò:
𝜇Ö = 𝑛y 𝜎Ö 𝑍
𝑚y
𝐸Ý > 2𝑚y 𝑐 e d1 + f
𝑚Þ
Dove si è indicato con 𝑚Þ la massa del nucleo “canalizzatore”; nell’ipotesi in cui il rapporto 𝑚y /𝑚Þ sia
trascurabile, l’energia del fotone dev’essere dunque pari ad almeno 1,022 𝑀𝑒𝑉.
Nel processo di produzione della coppia elettrone-positrone l’elettrone cede tutta la propria energia nelle
due particelle, sottraendo dunque fotoni al fascio originale; si può mostrare che la sezione d’urto associata
al fenomeno è pari a…
7 183
𝜎ÕÕ = 4𝑍 e 𝛼𝑟ye ß log ( à
9
𝑍µ
Osserviamo numerosi termini in comune all’espressione analizzata, a pagina 31, in riferimento all’energia
persa per irraggiamento dell’elettrone. E’ allora conveniente esprimere l’espressione di sopra in funzione
della lunghezza di radiazione 𝑋) , che, sostituita, restituisce:
𝐴 7
𝜎ÕÕ =
𝜌𝑁i 𝑋) 9
12
Per energie dell’ordine del 𝐺𝑒𝑉 sono state osservate sperimentalmente anche la produzione di coppie protone-
antiprotone e neutrone-antineutrone!
38
…che è, appunto, favorita per alte energie.
Considerato infine il termine di smorzamento 𝜇, si ottiene:
𝑁i 𝐴 7 7
𝜇ÕÕ = 𝑛𝜎ÕÕ = 𝜌 =
𝐴 𝜌𝑁i 𝑋) 9 9𝑋)
Mettendo insieme gli andamenti grafici delle sezioni d’urto 𝜎ÕÈ , 𝜎Ö e 𝜎ÕÕ , associate rispettivamente
all’effetto fotoelettrico, allo scattering Compton e alla produzione di coppie elettrone-positrone, otteniamo
allora:
Sciame elettromagnetico
Un interessante fenomeno che unisce gli effetti della produzione di coppie elettrone-positrone e gli effetti
del bremsstrahlung, cioè l’irraggiamento dovuto all’accelerazione di particelle cariche leggere, è lo sciame
elettromagnetico, anche detto electron-photon showers.
Si consideri infatti un fotone ad alta energia (almeno 1.022 𝑀𝑒𝑉) interagente col mezzo; in base a quanto
appreso nel paragrafo precedente, esso avrà una discreta probabilità di decadere in una coppia elettrone-
positrone; poiché queste ultime sono particelle cariche, dotate di un’energia cinetica pari,
approssimativamente, alla metà del fotone originale, potranno subire uno scattering con i nuclei, che le
devierà dalla loro direzione di partenza portando al fenomeno dell’irraggiamento, e dunque alla
“produzione” di fotoni. Questi fotoni, se posseggono un’energia sufficientemente alta, possono però
decadere nuovamente in coppie elettrone-positrone, facendo ripartire il ciclo fino alla produzione di coppie
non sufficientemente energetiche da rendere, probabilisticamente parlando, l’effetto del bremsstrahlung
39
“conveniente”. Come conseguenza del fenomeno, si creano “cascate” di elettroni, fotoni e positroni che
possono estendersi anche per ampie distanze.
Cerchiamo di valutare, in maniera qualitativa, quale debba essere il range medio di uno sciame
elettromagnetico: iniziamo con l’indicare con 𝐸) l’energia di partenza di un fotone incidente in un mezzo.
Poiché la sezione d’urto del processo di produzione di una coppia è dipendente dalla lunghezza di
radiazione, ci aspettiamo che, una volta percorsa una distanza paragonabile con quest’ultima, ci siano
buone probabilità che il fotone decada in una coppia elettrone-positrone, ciascuno di energia 𝐸) /2. Se
quest’ultima è sufficientemente alta, elettrone e positrone potrebbero irraggiare: in base a quanto visto a
pagina 31, la probabilità di irraggiamento è dominata da 𝑋) , quindi ci aspettiamo che, dopo aver percorso
nuovamente la lunghezza di radiazione, l’elettrone (o il positrone) “produca” un fotone che, per questioni
schematiche, possiamo immaginare di energia pari alla propria metà. In questo modo abbiamo ottenuto
due fotoni, un elettrone e un positrone di energia pari a 𝐸) /4 ciascuno. A questo punto i due fotoni
possono generare due coppie elettrone-positrone, e l’elettrone e il positrone della “generazione”
precedente possono subire nuovamente lo scattering in modo da “produrre” nuovamente elettroni,
positroni e fotoni.
In particolar modo, per ogni spessore (adimensionale) 𝜉 = 𝑥/𝑋) abbiamo 𝑁 particelle ad energia 𝐸/𝑁, che
possiamo schematizzare nella seguente tabella:
𝝃 = 𝒙/𝑿𝟎 𝑵 𝑬/𝑵
0 1 𝐸)
𝐸)
1 2
2
𝐸)
2 4
4
𝐸)
3 8
8
⋮ ⋮ ⋮
𝐸)
𝝃 2ð
2ð
Come abbiamo detto, lo sciame continua a moltiplicarsi finché l’energia degli elettroni (o dei protoni) non è
tale da rendere sensibilmente diversa da zero la probabilità che avvenga l’irraggiamento. Ricordiamo infatti
che parallelamente alla perdita di energia per bremsstrahlung, l’elettrone perde comunque energia per
40
effetto delle collisioni con gli elettroni già presenti nel mezzo, che diventa un fenomeno concorrente
soprattutto per basse energie (come ricordiamo dalle formule di Bethe e Bloch). Dal momento in cui
elettroni e positroni iniziano ad avere perdite di energia per irraggiamento comparabili con quelle dovute
alle collisioni, si inizia a non osservare con minore probabilità l’effetto di bremsstrahlung, e dunque lo
sciame inizia a “morire”.
LÈ LÈ
Come ricordiamo, l’energia per cui ž LC Ÿ ∼ ž LC Ÿ è stata indicata con energia critica. Poiché è dunque
œ@•• oÍÍ
in corrispondenza di essa che lo sciame inizia a svilupparsi con minore probabilità, potremo dire che la
massima energia della cascata si sviluppa in corrispondenza di uno spessore (adimensionale) 𝜉¤§¨ tale che:
𝐸)
𝐸(𝜉¤§¨ ) = 𝐸œ = ð
2 ©ª«
Da cui:
𝐸) 𝐸) 1 𝐸)
𝑁¤§¨ = 2𩪫 = ⇒ 𝜉¤§¨ = log e = log
𝐸œ 𝐸œ log 2 𝐸œ
In questo modo, possiamo suppore che, approssimativamente, la lunghezza media dello sciame sia pari a…
𝑋) 𝐸)
𝑅= log
log 2 𝐸œ
Si osservi che la “profondità” con cui si estende lo sciame non è l’unico fattore necessario da conoscere in
ambito sperimentale. Anzi, spesso si mostra più importante conoscere quanto lo sciame si estende
traversalmente, poiché, in seguito ai ripetuti processi di scattering, esso tende a divaricarsi comprendo
porzioni di spazio sempre più ampie. Una stima di questa ampiezza è data dal raggio di Moliére, che
descrive il raggio del cilindro che contiene il 90% dell’energia prodotta dallo sciame:
21𝑋) 7𝐴
𝑅Å = ∼
𝐸œ 𝑍
La stima precedente è in realtà molto rozza, poiché l’andamento sperimentale osservato descrive un
andamento per 𝑑𝐸/𝑑𝑥 di natura esponenziale, caratterizzato da un massimo oltre cui decresce fino ad
andare a zero. Questi risultati sono molto difficili da determinare in laboratorio, ed infatti si ricorre a
simulazioni numeriche del tipo Monte Carlo. Il nostro calcolo, tuttavia, ci dà una stima qualitativa degli
ordini di grandezza in gioco.
Rivelatori
Caratteristiche dei rivelatori
Un rivelatore è un dispositivo in grado di convertire un’informazione associata ad una particella (energia,
velocità, massa, spin, etc.) in una forma accessibile alla percezione umana. La natura di questa “forma
accessibile” varia da rivelatore in rivelatore, in base alla forma, al funzionamento, al materiale, alla
sensibilità e a numerosi altri fattori che, in quest’ultima sezione di questi appunti, ci proponiamo di
analizzare. Generalmente, un rivelatore non è in grado di apprezzare qualsiasi segnale a causa dei limiti
sperimentali con cui è stato realizzato: per questo la scienza moderna si avvale di un gran numero di
rivelatori, ognuno “specializzato” in un determinato ambito. Ad esempio, i rivelatori a gas sfruttano la
ionizzazione degli elettroni atomici per quantificare l’entità della radiazione che ha causato il distacco
41
elettronico; gli scintillatori, invece, sfruttano le radiazioni emesse in seguito all’eccitazione degli elettroni
atomici, che, seppur in un livello eccitato, non sono ionizzati.
Oggi i moderni rivelatori presentano un’architettura di natura digitale ed elettronica, in quanto
l’informazione acquisita viene subito trasformata tramite impulsi elettrici. In questo modo, i dati acquisiti
possono essere facilmente analizzati da un computer in modo da fornire una rapidità di calcolo e di
elaborazione incredibilmente rapida. Un rivelatore, dunque, non è costituito esclusivamente da un
bersaglio sensibile ai fenomeni analizzati, ma anche da un articolato apparato elettronico.
In generale, allora, distingueremo schematicamente le seguenti parti:
1) Un bersaglio (target in inglese) in interazione con le quantità da rivelare, su cui vengono posti dei
sensori in base alla geometria e la natura del fenomeno in questione;
2) Un convertitore, detto di front end electronics, in grado di trasformare l’informazione acquisita in
un segnale elettrico;
3) Un ADC, cioè un convertitore analogico-digitale, che trasformi il segnale elettrico (analogico) in un
segnale digitale, in modo che possa essere elaborato da un calcolatore.
4) Un sistema DAQ, (data acquisition), cioè un’architettura o un software in grado di ordinare,
interpretare ed elaborare i dati acquisiti.
5) Un event system, cioè un sistema fisico in grado di comunicare, in forma umanamente
interpretabile, il segnale rivelato (un monitor, un display, etc.) ed elaborato nei passaggi
precedenti.
Descritti dunque gli elementi fondamentali che costituiscono un rivelatore, analizziamone i parametri che lo
caratterizzano.
𝑅 (𝐸 ) = 𝑎𝐸 + 𝑏
La determinazione dei termini di proporzionalità tra risposta e segnale in entrata, che ne definiscono
dunque la relazione, è detta calibrazione del rivelatore.
In questo modo si riesce ad avere una risposta biunivoca e non distorta del segnale in entrata. Ovviamente
la risposta non deve essere per forza lineare: basta che sia conosciuta la relazione che intercorre tra 𝑅 ed 𝐸
e che sia univocamente determinata; in generale, tuttavia, una risposta lineare è la più semplice ed
immediata da realizzare. Si osservi che una linearità tra segnale in entrata e risposta non può essere sempre
garantita, poiché un rivelatore può essere sensibile solo a certi range energetici (tendendo a distorcere, ad
esempio, segnali al di fuori di questi) o può avere una risposta lineare solo per alcuni tipi di radiazione,
come vedremo per gli scintillatori.
Alternativamente, anziché definire la risposta del rivelatore in base alla carica “convertita”, è possibile
determinarla in base al concetto di pulse height: l’evento da rivelare, ovviamente, è limitato nel tempo, per
questo ci aspettiamo che la carica determinata dalla traduzione del segnale cresca nel tempo all’arrivo
42
dell’informazione, per poi decrescere nuovamente al termine di quest’ultima. Si crea dunque una curva a
campana, il cui massimo, detto appunto pulse height, è ovviamente direttamente legato all’intensità
dell’evento: poiché si può supporre questa curva non cambi da un evento all’altro, si può definire risposta
come la relazione tra il segnale in ingresso 𝐸 e il pulse height del segnale in output osservato.
Sensibilità ed efficienza
La sensibilità di un rivelatore descrive la sua capacità di produrre un segnale per un dato tipo di
informazione in entrata. Nessun rivelatore può essere sensibile a tutti i tipi di energie o radiazioni: come già
detto precedentemente, i rivelatori si specializzano in base ai range energetici in grado di poter apprezzare.
Sono diversi i fattori che concorrono a determinare la sensibilità di un rivelatore, tra cui:
- La sezione d’urto delle particelle nel mezzo del rivelatore, in quanto, più essa è grande, più è alta la
probabilità che l’evento da rivelare possa avvenire;
- La massa del rivelatore, che come abbiamo visto nei capitoli precedenti è spesso presente (sotto
forma di massa molare) nell’espressione determinate la perdita energetica;
- Rumori di fondo del rivelatore e perturbazioni parassite, che ledono il minimo segnale in grado di
essere percepito dal rivelatore. Segnali a bassa intensità, come radiazioni a scarso numero di fotoni,
infatti, tendono a confondersi con radiazioni di fondo presenti intrinsecamente nel rivelatore,
impedendone il rivelamento;
- Il materiale circondante la zona attiva del rivelatore: spesso infatti la zona in grado di rivelare un
segnale è circondata da apparecchiature sperimentali in grado di perturbare il segnale in entrata,
ad esempio assorbendo parte della radiazione da rivelare. Una semplice finestra di entrata al
volume del rivelatore si può mostrare un grande elemento di disturbo.
Altra caratteristica importante di un rivelatore è l’efficienza: essa descrive la capacità del rivelatore di non
perdere l’informazione in entrata, ed è definita nel seguente modo:
eventi registrati
𝜀=
eventi emessi dalla sorgente
Risoluzione in energia
Per i rivelatori realizzati al fine di misurare l’energia di una radiazione incidente, uno dei fattori più
importanti è sicuramente la risoluzione. Essa descrive la capacità del rivelatore di distinguere due impulsi di
energia molto vicina.
Si immagini infatti di irraggiare un mezzo con due radiazioni di energie distinte, seppur molto vicine, che il
mezzo è in grado di assorbire e riemettere. Idealmente, analizzando lo spettro di emissione del rivelatore, ci
aspetteremmo due linee ben definite associate all’energia 𝐸( della prima radiazione e all’energia 𝐸e della
seconda radiazione. La qual cosa, come il lettore già saprà, non si verifica mai sperimentalmente, poiché
non è possibile ottenere un fascio di fotoni ad un’energia fissata: nemmeno strumenti ad alta coerenza
come i laser riescono a produrre tutti fotoni alla stessa frequenza e dunque alla stessa energia. Al più, si
riesce a produrre una radiazione che varii in un certo range di energie centrato su un valore centrale 𝐸, la
cui forma può essere, preliminarmente, immaginata di tipo gaussiano.
Ciò che si osserva dunque in seguito al bombardamento di un rivelatore con radiazioni di energie vicine (e
cioè, più propriamente, di valori medi vicini) e un andamento del genere:
43
…cioè due forme gaussiane, la cui sovrapposizione crea una struttura “biforcuta”. Come si osserva, se le
gaussiane sono troppo vicine vi è il rischio che i picchi diventino tra loro indistinguibili, dunque il rivelatore
non riuscirebbe a percepire la differenza tra le due energie.
Urge quindi un metodo qualitativo per valutare la bontà della risoluzione di un rivelatore. In genere, si
considera il cosiddetto full width at half maximum (𝐹𝑊𝐻𝑀), cioè la larghezza a mezza altezza della
distribuzione delle energie. Dal calcolo diretto, si può determinare 𝐹𝑊𝐻𝑀 = 𝜎2¿2 log 2 ∼ 2.35𝜎, dove 𝜎
è la varianza della gaussiana.
Se la differenza energetica 𝐸( − 𝐸e = Δ𝐸 è più piccola del 𝐹𝑊𝐻𝑀, le energie sono generalmente
considerate indistinguibili, in quanto si verifica una sovrapposizione delle metà superiori delle loro
distribuzioni.
Quantitativamente parlando, la risoluzione 𝑅y è definita come la minima differenza in energia Δ𝐸 che il
rivelatore è in grado di risolvere divisa per l’energia media 𝐸, ed è espressa generalmente in percentuale. In
base a quanto detto finora, perciò, potremo scrivere:
Δ𝐸 𝐹𝑊𝐻𝑀
𝑅y = =
𝐸 𝐸
Dunque, più 𝑅y è piccolo, più è piccola la risoluzione che il rivelatore è in grado di apprezzare.
Si osservi che però l’assunzione di un andamento gaussiano non sempre si mostra adeguato: in generale,
sebbene il numero di particelle eccitate sia molto alto, la probabilità che esse decadano emettendo una
radiazione in grado di generare un punto della distribuzione precedente è in realtà è spesso abbastanza
bassa. Sarà allora più proprio supporre la distribuzione sia di tipo poissoniano 13.
In una poissoniana, l’ampiezza della distribuzione è proporzionale alla radice del valor medio:
𝜎 = ¿𝜇
13
Una curva di Poisson descrive la probabilità che si realizzino 𝑟 eventi, ciascuno di singola probabilità 𝑝, su 𝑁 casi
osservati, nel limite in cui il numero di campioni è molto alto (𝑁 → ∞) ma la probabilità di osservazione dell’evento 𝑟
è molto piccola (𝑟 → 0). Essa ha il seguente andamento discreto:
𝜇Í 𝑒 €Ñ
𝑃(𝑟) =
𝑟!
Dove 𝜇 descrive il numero medio di eventi. La poissoniana si mostra molto più adatta alle nostre considerazioni, in
quanto, in genere, il numero di particelle emettenti è enorme, ma le probabilità di decadimento è generalmente
bassa.
44
Ora, come sappiamo, i processi di eccitazione atomici richiedono ben precise energie di eccitazione, che
indichiamo con 𝑊; se diamo al sistema un’energia media 𝐸, ci aspettiamo un numero di eventi medio pari
a…
𝐸
𝜇=
𝑊
Poiché ci aspettiamo che, mediamente, ogni atomo del sistema strappi ad 𝐸 l’energia 𝑊. Questo implica
che:
𝐸 2.35√𝜇
𝜎 = ¿𝜇 = Ô ⇒ Δ𝐸 = 𝑊Δ𝜇 = 2.35𝜎 ⇒ Δ𝜇 =
𝑊 𝑊
Δ𝐸 Δ𝜇 2.35 𝑊
𝑅= = = = 2.35 Ô
𝐸 𝜇 √𝜇 𝐸
𝜎 e = 𝐹𝜇
In questo modo,
𝐹𝑊
𝑅 = 2.35Ô
𝐸
Si osservi che il fattore di Fano stringe l’ampiezza della distribuzione di valori osservati: piccoli fattori di
Fano determinano dunque dati sperimentali con basse fluttuazioni, e dunque molto precisi.
1) Tempi morti non estensibili – I rivelatori con tempi morti non estensibili sono del tutto insensibili ai
segnali esterni per tutta la durata del tempo morto. Detto 𝜏 quest’ultimo, supponiamo l’arrivo di
due segnali in rapida successione distanziati da un intervallo di tempo Δ𝑡 tale che Δ𝑡 < 𝜏: in altre
45
parole, il secondo segnale arriva quando il dispositivo è ancora “morto”. Il rivelatore, in questo
caso, reagisce solo al primo evento ed elabora un tempo morto indipendente dal secondo evento.
Per comprendere l’entità dell’informazione persa durante il tempo morto, effettuiamo semplici
considerazioni algebriche: indichiamo con 𝑚 la frequenza di eventi effettivi, e con 𝑘 il numero di
eventi che il rivelatore è stato in grado di percepire o apprezzare in un tempo 𝑇. Poiché per ogni
evento 𝑘 il rivelatore attiva un tempo morto 𝜏, avremo un tempo morto totale pari a 𝑘𝜏 all’interno
del periodo 𝑇, durante il quale verranno irrimediabilmente persi 𝑚𝑘𝜏 eventi. Poiché il numero di
eventi totali è 𝑚𝑇, esso deve corrispondere alla somma tra il numero di eventi misurati 𝑘 e il
numero di eventi persi 𝑚𝑘𝜏, perciò:
𝑘
𝑚𝑇 = 𝑘 + 𝑚𝑘𝜏 ⇒ 𝑚 =
𝑇 − 𝑘𝜏
In questo modo, conoscendo il conteggio 𝑘, il tempo trascorso 𝑇 e il tempo morto 𝜏 del rivelatore,
è possibile conoscere la frequenza degli eventi e dunque il numero di eventi persi 𝑚𝑘𝜏.
2) Tempi morto estensibili – I rivelatori con tempi morti estensibili cumulano la durata del loro tempo
morto all’arrivo di ogni nuovo segnale. Detto 𝜏 il tempo morto, all’arrivo di due segnali distanziati
da un intervallo di tempo Δ𝑡 tale che Δ𝑡 < 𝜏, il rivelatore risponderà generando due tempi morti in
successione, uno per ogni evento.
L’analisi dei tempi estensibili si mostra più complicata della precedente, poiché la misurazione del
tempo morto totale 𝜏 = 𝜏( + 𝜏e + ⋯ non è in grado di descriverci quanti eventi siano stati perduti
nel frattempo.
Per riuscire a fare qualche considerazione qualitativa, sfruttiamo le proprietà della distribuzione di
Poisson. Iniziamo a ricordare che la probabilità di avvenimento di un evento è…
𝜇Í 𝑒 €Ñ
𝑃(𝑟) =
𝑟!
Da qui sarà fondamentale chiederci: quanto è probabile osservare un evento? Quanto è probabile
non osservarne affatto? Il tutto dipenderà se questi eventi sono distanziati da un intervallo di
tempo Δ𝑡 maggiore o minore di 𝜏: nel primo caso, il secondo evento riesce ad essere rivelato
(poiché intanto il tempo morto è terminato), ma nel secondo, l’arrivo dell’ultimo evento aumenta il
46
tempo morto, che ne rende impossibile la rivelazione.
Iniziamo allora a calcolare la probabilità che non si osservino eventi: in base alla formula
precedente, otteniamo:
𝑃(0) = 𝑒 €Ñ
𝜇 descrive il numero medio di eventi, che possiamo supporre, nell’ipotesi lineare, nella forma 𝑚𝑡,
perciò:
𝑃(0) = 𝑒 €T>
𝑃(1) = 1 − 𝑒 €T>
𝑑𝑃
(1) = 𝑚𝑒 €T>
𝑑𝑡
Vediamo ora come esse sono legate al tempo morto: la formula di sopra descrive la probabilità, per
unità di tempo, che si osservi almeno un evento all’istante di tempo 𝑡 e 𝑡 + Δ𝑡. Come abbiamo
visto, l’evento viene osservato solo se Δ𝑡 > 𝜏, poiché in caso contrario viene “divorato” dal tempo
morto. La densità di probabilità di sopra coincide quindi con la probabilità che l’intervallo di tempo
tra due eventi consecutivi sia maggiore di 𝜏:
𝑑𝑃 𝑑𝑃
(1) = (Δ𝑡 > 𝜏)
𝑑𝑡 𝑑𝑡
La probabilità complessiva di osservare almeno un evento tra tutti i possibili intervalli di tempo Δ𝑡 è
quindi pari a…
þ þ
𝑑𝑃
𝑃 (Δ𝑡 > 𝜏) = \ (Δ𝑡 > 𝜏)𝑑𝑡 = \ 𝑚𝑒 €T> 𝑑𝑡 = 𝑒 €T‘
‘ 𝑑𝑡 ‘
Indichiamo ora con 𝑇 il tempo di osservazione. Il numero effettivo di eventi (seppur non tutti
osservati) durante 𝑇 è mediamente 𝑚𝑇; d’altra parte, con l’ultima equazione, abbiamo
determinato che la probabilità di osservare almeno un evento è pari a 𝑒 €T‘ , perciò, la frazione di
eventi osservati tra gli 𝑚𝑇 eventi avvenuti è 𝑚𝑇𝑒 €T‘ . Avremo allora:
𝑘 = 𝑚𝑇𝑒 €T‘
Da cui sarebbe in linea teorica possibile determinare 𝑚, ma si osservi che l’equazione non ammette
soluzione analitica. Inoltre, graficando 𝑘 in funzione di 𝑚, si ottiene una curva che, per un fissato 𝑘,
ammette due possibili valori di 𝑚:
47
Per determinare univocamente 𝑚 è perciò necessario infittire i dati nell’intervallo di valori in cui la
curva ammette un massimo.
Gli scintillatori
Caratteristiche generali
Gli scintillatori o rivelatori a scintillazione sono basati sulla peculiarità che mostrano alcuni materiali di
manifestare fenomeni luminosi quando colpiti da particelle o radiazioni: in questo modo, in base alla
luminosità prodotta, si può analizzare la natura dell’energia delle particelle incidenti.
Lo scintillatore è in realtà parte di un dispositivo più ampio atto alla rivelazione di fotoni, schematizzabile
attraverso la seguente figura:
La prima parte, a diretto contatto con la radiazione incidente, è costituito dallo scintillatore, che produce
fenomeni luminosi a causa all’eccitazione e alla successiva diseccitazione delle particelle che lo
costituiscono; collegato ad esso vi è un fotomoltiplicare, cioè un dispositivo in grado di convertire i fotoni
prodotti dallo scintillatore in una corrente elettrica che, come abbiamo imparato, è più semplice da
analizzare e manipolare. Quest’ultimo componente sarà analizzato nel prossimo capitolo.
In generale, uno scintillatore deve possedere le seguenti peculiarità:
1) Deve possedere una risposta molto rapida, dell’ordine del nanoscendo, in modo da poter
accogliere un gran numero di radiazioni senza perdere informazione a causa dei tempi morti;
2) Deve essere sensibile solo a determinati range energetici: uno scintillatore, eccitato dalla
radiazione incidente, produce a sua volta una propria radiazione a causa della diseccitazione delle
molecole che lo costituiscono. Questa radiazione prodotta rischia tuttavia di essere riassorbita dal
rivelatore, falsando dunque l’informazione in entrata: uno scintillatore dev’essere dunque
trasparente alla propria radiazione, e sensibile esclusivamente alle radiazioni esterne da analizzare.
3) La radiazione prodotta deve anche essere compresa in un range spettrale a cui il fotomoltiplicatore
sia sensibile.
4) Deve detenere una buona pulse shape discrimination, cioè deve essere in grado di avere una
risoluzione sufficiente a discriminare forme d’onda associate a particelle ad energia vicina.
48
I tempi di risposta di uno scintillatore, oltre agli effetti di natura meccanica causati dal fotomoltiplicatore,
sono dovuti ai tempi necessari affinché possa avvenire il decadimento delle molecole che costituiscono la
parte attiva, una volta eccitate dalla radiazione incidente. La diseccitazione provoca la riemissione di una
radiazione detta radiazione di scintillazione, che ne causa i fenomeni luminosi detti di luminescenza, che
avvengono con un certo tempo caratteristico.
Quando l’emissione della radiazione di scintillazione avviene dopo un intervallo di tempo di circa 10€ÿ
secondi, il processo è detto di fluorescenza; se il ritardo è maggiore in quanto lo stato eccitato presenta
maggiore stabilità, il processo è detto di fosforescenza. In generale, tra fluorescenza e fosforescenza si
hanno ritardi nell’emissione che vanno da nanosecondo al microsecondo.
Il numero di fotoni emessi dal materiale può essere facilmente conosciuto attraverso la legge di
decadimento radioattivo, che descrive il decrescere del numero di particelle eccitate nel tempo e dunque il
numero di fotoni prodotti da queste ultime:
>
𝑁 = 𝐴𝑒 €‘
…dove 𝜏 è il tempo caratteristico del mezzo. Ciò che si osserva di interessante sperimentalmente, tuttavia,
è che uno scintillatore, a causa dei numerosi processi concorrenti che determinano il decadimento (che
vedremo in dettaglio nei seguenti paragrafi), non decade mai con un’unica costante di tempo. Una
trattazione più accurata infatti ne prevede almeno due componenti:
> >
€ €
‘É
𝑁 = 𝐴𝑒 + 𝐵𝑒 ‘l
Le costanti di tempo 𝜏z e 𝜏} sono detti tempi di decadimento fast e slow, in quanto alla prima è associato
un decadimento più rapido (𝑛𝑠), mentre alla seconda un decadimento lento (𝜇𝑠).
Le quantità 𝐴 e 𝐵 variano da materiale a materiale, e, come vedremo, saranno responsabili della pulse
shape discrimination.
14
Composti nella forma 𝑀𝑋, dove 𝑀 è un metallo alcalino ed 𝑋 è un alogeno.
49
maggiore luce emanata, etc.
Il processo alla base della produzione di fenomeni luminosi da parte di uno scintillatore inorganico si fonda
sull’eccitazione e la successiva diseccitazione degli elettroni del reticolo cristallino, che, come ricordiamo,
hanno la possibilità di trovarsi nella banda di valenza o nella banda di conduzione.
Quando la radiazione incidente colpisce uno degli atomi del cristallo, esso può essere ionizzato passando
nella banda di conduzione, o può essere eccitato passando in una banda energetica a minore energia, detta
banda degli eccitoni, posta subito sotto la banda di conduzione: in entrambi i casi, si forma una lacuna nella
banda di valenza accoppiata all’elettrone eccitato.
Come si è detto, il cristallo presenta diverse impurità, disposte in modo da creare nuovi livelli energetici
nella zona tra le due bande del solido cristallino. Se un elettrone di queste impurità, dal suo livello
energetico cade nella lacuna della banda di valenza lasciata dall’elettrone precedente, lascia a sua volta una
lacuna nell’impurità. Quest’ultima, molto vicina (energeticamente parlando) alla banda degli eccitoni, può
accogliere un elettrone eccitato, che, nel passaggio nella lacuna dell’impurità, emette una radiazione di
scintillazione ad energia inferiore rispetto all’energia che l’ha eccitato (dell’ordine del gap energetico tra
banda di valenza e banda di conduzione), in modo che essa non possa essere “confusa” con la radiazione
incidente.
Uno scintillatore a cristalli inorganici ha la peculiarità di produrre un gran numero di fotoni a causa dei
“piccoli” gap energetici tra banda di eccitoni e livelli energetici delle impurità; inoltre, essendo un cristallo,
esso può essere costruito in maniera anisotropa in modo da rendere preferenziale l’assorbimento di
energia ed incanalare dunque l’assorbimento dei fotoni: a questo fenomeno si dà il nome di channeling.
D’altra parte presenta tempi caratteristici relativamente lunghi, dell’ordine del centinaio di 𝑛𝑠; inoltre,
alcune transizioni nelle impurità sono non radiative, cioè non emettono radiazione e comportano una
perdita dell’informazione. In questo caso, si dice che le impurità costituito delle trappole energetiche.
50
Gli scintillatori a gas sono ampiamente utilizzati nella fisica sperimentale a causa dei loro rapidi tempi di
risposta; inoltre, essi vengono posti in condizioni di alta pressione (dell’ordine di 200 𝑎𝑡𝑚), in modo da
essere molto densi e massimizzare la probabilità di urto con la radiazione incidente, ed aumentare dunque
l’efficienza. Un forte difetto associato a questi scintillatori sta tuttavia nel tipo di luce emessa: in genere,
l’energia riemessa dalle molecole biatomiche formatesi ha una frequenza nell’ultravioletto, regione nel
quale gran parte dei fotomoltiplicatori sono inefficienti, in quanto la superficie che li separa dallo
scintillatore è di vetro, che assorbe l’ultravioletto. E’ perciò necessario un wavelenght shifter (traslatore di
lunghezza d’onda), come il difenilstilbene, cioè materiali in grado di assorbire la luce ultravioletta e
riemetterla a frequenze più basse, o alternativamente utilizzare materiali trasparenti all’ultravioletto, come
il quarzo.
Essi, dai tempi di decadimento dell’ordine del nanosecondo, sono materiali molto duttili, dunque possono
essere facilmente modellati a seconda dello scintillatore.
A differenza dei cristalli inorganici, ove i legami erano tra atomi o al più tra molecole biatomiche, nel caso
delle strutture organiche le catene idrocarburiche possono raggiungere anche grandi dimensioni. Com’è
noto dalla fisica molecolare, gli elettroni di valenza di queste molecole sono delocalizzate, cioè non
associate ad un particolare atomo, ed occupano degli orbitali molecolari detti orbitali 𝜋. Un ulteriore
caratteristica di queste molecole è la presenza di stati di singoletto e di tripletto, dipendenti, com’è noto
dalla meccanica quantistica, dallo stato di spin del corpuscolo.
Stati di singoletto e tripletto ammettono una serie di livelli eccitati raggruppati in bande (caratterizzati da
diversi stati vibrazionali della molecola), che indicheremo con 𝑆 ∗ e con 𝑇 ∗ nel caso del singoletto e del
tripletto rispettivamente: in genere, tra una banda e l’altra vi è un gap energetico dell’ordine dell’𝑒𝑉,
mentre tra un livello e l’altro della stessa banda decimi dell’𝑒𝑉.
51
All’arrivo di una radiazione incidente sullo scintillatore sufficientemente energetica, gli elettroni allo stato
fondamentale del singoletto tendono ad essere eccitati, dai loro sottolivelli vibrazionali, al secondo livello
eccitato 𝑆 ∗∗ ; la peculiarità di questi composti organici è che presentano uno stato di singoletto eccitato
fortemente instabile, dunque gli elettroni decadono nello stato 𝑆 ∗ in tempi molto brevi, dell’ordine del 𝑝𝑠,
in maniera non radiativa. Il tempo di decadimento da 𝑆 ∗ allo stato fondamentale è invece più lento
(dell’ordine del 𝑛𝑠), ed è durante questo tempo che lo scintillatore mostra i propri fenomeni di
fluorescenza: poiché l’energia emessa nella transizione 𝑆 ∗ → 𝑆) è sicuramente più piccola dell’energia della
transizione 𝑆) → 𝑆 ∗∗ a cui lo scintillatore è sensibile, si riesce ad emettere una radiazione a cui lo
scintillatore stesso è trasparente.
Lo stesso fenomeno può essere osservato nel tripletto, a cui sono tuttavia associate transizioni non
radiative. Si osservi che possono avvenire anche transizioni radiative tra stati di singoletto e stati di
tripletto, ma, com’è noto dalla meccanica quantistica, queste sono fortemente sfavorite da opportune
regole di selezione. Ciò nonostante, delle transizioni tra stati di tripletto a stati di singoletto si osservano,
ma non per decadimento energetico, ma per collisioni. E’ possibile infatti che una molecola, nello stato di
tripletto, urti un’altra molecola di tripletto: una delle due perde energia trasmettendola all’altra, passando
quindi nello stato a minore energia 𝑆) di singoletto; la molecola che invece acquisisce energia passa nello
stato eccitato di singoletto 𝑆 ∗ . Si osservi che parte dell’energia viene dissipata nell’urto sotto forma di
fononi:
𝑇) + 𝑇) → 𝑆 ∗ + 𝑆 + 𝑓𝑜𝑛𝑜𝑛𝑖
A questo punto lo stato 𝑆 ∗ può decadere nello stato 𝑆, emettendo una radiazione analoga a quella trattata
in precedenza. Quest’ultimo processo è tuttavia molto più lento in quanto determinato dall’urto casuale
delle molecole, e infatti presenta un tempo caratteristico 𝜏} molto più grande rispetto a quello che
caratterizza il decadimento degli stati di singoletto 𝜏z : 𝜏} è infatti dell’ordine del 𝜇𝑠. Quello degli scintillatori
organici costituisce dunque un esempio alla nostra trattazione di pagina 47 sui diversi tempi di
decadimento.
52
Esempi di soluti utilizzati frequentemente negli scintillatori organici liquidi sono il POPOP (𝐶e• 𝐻(Œ 𝑁e 𝑂e ), il
PBD (𝐶e) 𝐻(• 𝑁e 𝑂) e il PPO (𝐶(+ 𝐻(( 𝑁𝑂), mentre come solventi vengono spesso utilizzati composti come lo
xylene, il toluene e il benzene.
La peculiarità degli scintillatori organici di poter essere combinati in modo da poter produrre radiazioni a
catena di scintillazione li rende degli ottimi wavelenght shifter: come abbiamo già evidenziato negli
scintillatori a gas, spesso le radiazioni prodotte dalla scintillazione non presentano una lunghezza d’onda
adatta ai fotomoltiplicatori; poiché, però, soluti e solventi degli scintillatori organici possono essere scelti in
modo da trasmettersi radiazioni a lunghezza d’onda ogni volta diversa, si può “regolare” l’ultima emissione
di scintillazione in modo che possa essere meglio registrata dalle altre apparecchiature sperimentali, come,
appunto, i fotomoltiplicatori.
La terza colonna descrive gli 𝑒𝑉 necessari per poter generare, mediamente, un fotone di scintillazione: a
questa quantità si dà il termine di light output, e descrive l’efficienza con cui il rivelatore converte l’energia
incidente in fotoni.
𝐿∝𝐸
Questa relazione, spesso verificata sperimentalmente, può però mostrarsi non valida in alcuni scintillatori.
Questa perdita di linearità si osserva, in generale, negli scintillatori bombardati non da radiazioni, ma da
particelle pesanti a bassa energia, che, come imparato dalla formula di Bethe e Bloch, determinano una
maggiore dissipazione energetica. Il primo modello semiempirico che descrivesse questo curioso
comportamento fu sviluppato da Birks nel 1951: secondo lo scienziato, le molecole eccitate in seguito al
passaggio delle particelle incidenti, che dovevano essere anch’esse molto lente, iniziavano a sviluppare una
53
qualche forma di interazione in grado di sottrarre energia che sarebbe stata altrimenti emessa sotto forma
di luminescenza. Birks inoltre modellizzò la relazione tra luce emessa ed energia incidente attraverso la
seguente formula semiempirica:
𝑑𝐸
𝑑𝐿 𝐿) 𝑑𝑥
=
𝑑𝑥 1 + 𝑘 𝑑𝐸
𝑑𝑥
𝑑𝐿 𝑑𝐸
∼ 𝐿) ⇒ 𝐸 ∝ 𝐿
𝑑𝑥 𝑑𝑥
LÈ
Dunque il regime di linearità è rispettato per basse dissipazioni; tuttavia, nell’ipotesi in cui LC ≫ 1, si ha:
𝑑𝐿
∼ 𝐿)
𝑑𝑥
…dunque la luminosità, per alte dissipazioni, tende a saturare, a causa delle interazioni intermolecolari
descritte prima.
Fotomoltiplicatori
Come già introdotto in precedenza, un fotomoltiplicatore è un dispositivo in grado di convertire un segnale
luminoso in un segnale elettrico: si mostra quindi fondamentale nei rivelatori a scintillazione, ove la luce
prodotta dallo scintillatore dev’essere trasformata in corrente per poter essere elaborata. Nei prossimi
paragrafi analizzeremo come questo processo sia reso possibile attraversi l’effetto fotoelettrico.
Le guide di luce
Innanzitutto, prima di poter essere elaborata, la luce, che viene emessa generalmente in maniera isotropica
in tutte le direzioni, va “incanalata” verso il fotomoltiplicatore, attraverso quelle che vengono indicate con il
termine di guide di luce.
Le guide possono essere realizzate in più modi, ma si basano di fondo sullo stesso fenomeno fisico: la luce,
emessa in tutte le direzioni dallo scintillatore, subisce numerosi fenomeni di riflessione interna lungo le
pareti della guida, fino ad arrivare al fotomoltiplicatore.
54
Si osservi tuttavia che, com’è noto dall’ottica geometrica, esiste un particolare angolo, indicato con il
termine di angolo di Brewster, oltre il quale la luce viene riflessa solo parzialmente (in particolare, la
componente del campo elettrico parallela al piano di incidenza del raggio riflesso si estingue
completamente) causando dunque una perdita dell’informazione. E’ perciò necessario realizzare una guida
di luce che minimizzi le perdite energetiche.
Un esempio è la seguente struttura “a paletta”, che incanali man mano i fotoni all’interno del
fotomoltiplicatore,
Quest’ultima configurazione favorisce maggiormente la riflessione, ma non tiene conto di un limite fisico
dovuto al teorema di Liouville: come ricordiamo, secondo quest’ultimo, il volume dello spazio delle fasi deve
mantenersi costante. Immaginiamo allora di voler incanalare i fotoni da una superficie di dimensioni 𝑙Δ𝑥(
(altezza e lunghezza dello scintillatore) ad una superficie di dimensioni 𝑙Δ𝑥e (altezza e lunghezza del
fotomoltiplicatore), tale che Δ𝑥( > Δ𝑥e , come nella figura precedente. Un fotone ha, in entrata nella guida
di luce, una posizione caratterizzata da un punto di Δ𝑥( e un certo impulso Δ𝑝( , e, all’arrivo nel
fotomoltiplicatore, una posizione descritta da un punto di Δ𝑥e e un certo impulso Δ𝑝e . Se però il volume
dello spazio delle fasi deve rimanere costante, deve verificarsi:
Ma essendo Δ𝑥( > Δ𝑥e , si ha necessariamente Δ𝑝e < Δ𝑝( : l’impulso, e dunque l’energia dei fotoni,
dev’essere minore dell’impulso con cui sono partiti.
Si causa dunque una perdita di energia in entrata che si vuole evitare: un modo per riuscirvi è attraverso la
seguente struttura “a spina di pesce”, ove non è presente una sola guida ma numerose guide, che si
torcono fino al fotomoltiplicatore:
Torcendosi, la superficie di ciascuna delle guide non si riduce, non causando dunque la perdita energetica
dovuta alla conservazione del volume dello spazio delle fasi.
Un ulteriore guida di luce viene realizzata attraverso le fibre ottiche: esse vengono generalmente poste
all’interno di scanalature create sulla superficie dello stesso scintillatore.
Si osservi che un altro possibile fattore di perdita in termini di fotoni è costituito dalla superficie di
separazione tra lo scintillatore e il fotomoltiplicatore: poiché l’indice di rifrazione deve cambiare
55
necessariamente nel passaggio dall’uno all’altro, si verificano fenomeni di riflessione lungo la loro superficie
di separazione, che fanno “rimbalzare” indietro i fotoni allontanandoli dal fotomoltiplicatore. Per questo,
tra i due dispositivi, è posto un grasso siliconico (detto grasso ottico) il cui indice di rifrazione è intermedio
tra quello del fotomoltiplicatore e dello scintillatore, in modo che i fotoni “percepiscano” un indice di
rifrazione quanto più costante possibile, non subendo dunque eccessivi fenomeni di riflessione.
La prima parte del fotomoltiplicatore è costituito da un fotocatodo, cioè uno schermo trasparente verso
l’esterno (in modo da raccogliere i fotoni dallo scintillatore) ma non trasparente verso l’interno:
quest’ultima parte è costituita da un materiale fotosensibile. Quando essa viene urtato da un fotone, si
ionizza per effetto fotoelettrico, provocando il distacco di elettroni.
All’interno del fotomoltiplicatore è presente un campo elettrico ad alta intensità, che attira gli elettroni
verso un anodo posto sul fondo del dispositivo. Tra anodo e fotocatodo sono presenti numerosi elettrodi
metallici (generalmente metalli alcalini, che presentano bassa energia di ionizzazione), indicati con il nome
di dinodi: gli elettroni strappati dal fotocatodo, attirati dall’anodo, urtano con il primo dinodo, trasferendo
parte della loro energia agli elettroni del dinodo stesso. Questi ultimi, eccitati, vengono ionizzati
arricchendo il fascio di elettroni attirati dall’anodo: in questo modo, urto dopo urto con ciascuno dei dinodi,
il fascio acquisisce un numero considerevole di elettroni, infine registrati da un circuito posto oltre l’anodo.
Il fotocatodo
Il fotocatodo costituisce uno degli elementi più importanti del fotomoltiplicatore. Da esso si distaccano
infatti i primi elettroni che verranno via via moltiplicati attraverso l’urto dei dinodi, dunque la perdita di
questi elettroni iniziali si ripercuote per tutto il processo di arricchimento elettronico.
Ovviamente, per poter essere distaccati, gli elettroni devono essere colpiti da fotoni di energia ℎ𝜈 pari o
superiore alla relativa energia di ionizzazione. Si osservi che tuttavia, anche con energie sufficienti, la
probabilità di distacco è ben più piccola di uno, come abbiamo imparato analizzando la sezione d’urto dei
fotoni sulla materia. Irrimediabilmente, perciò, non si potrà mai avere un rapporto uno ad uno tra fotoni
incidenti ed elettroni rilasciati; per poter quantificare questa perdita, è utile introdurre il concetto di
efficienza quantica, definita come:
56
In figura è descritta l’efficienza quantica al variare della lunghezza d’onda associata ai fotoni incidenti per
diversi tipi di fotocatodo:
Come si può osservare, i fotomoltiplicatori mostrano un’alta efficienza solo per determinate lunghezze
d’onda, rendendo alcuni dispositivi più adatti per determinate radiazioni rispetto ad altri. In generale,
dunque, i fotomoltiplicatori tendono a “specializzarsi” in base al tipo di fotoni da convertire.
La geometria del fotocatodo è sviluppata in modo da accogliere i fotoni sfavorendo il più possibile la
riflessione, ed è caratterizzata da una tipica forma convessa. Questa struttura determina però una zona
intermedia tra fotocatodo e dinodi piuttosto ampia, entro cui i fotoni devono essere incanalati: anche in
questo caso, l’incanalazione determina la perdita di alcuni elettroni, ed un’efficienza, detta efficienza di
raccolta, generalmente minore di 1. Si osservi che la forma convessa, oltre a migliorare l’efficienza di
raccolta, permette agli elettroni ionizzati di arrivare verso la zona di incanalazione del fotomoltiplicatore
impiegando gli stessi intervalli di tempo, e in questo modo si minimizza il cosiddetto transit time (tempo di
percorrenza) di ritardo tra un elettrone e l’altro.
𝛿 = 𝑘𝑉}
𝐺 = 𝛿 M = (𝑘𝑉} )M
Per far sì che questo guadagno sia lo stesso in ogni iterazione, si sviluppa una particolare rete di resistenze
in grado di generare un partitore di tensione che mantenga, ad ogni dinodo, la stessa tensione 𝑉. Questa
rete ha anche lo scopo di rifornire i dinodi di elettroni persi in seguito all’urto con il fascio elettronico. Si
57
osservi che è importante mantenere la corrente dei partitori sempre molto più grande della corrente
generata dal fascio tra i dinodi: quest’ultima potrebbe generare un campo elettrico sui dinodi e dunque una
tensione così intensa da superare quella sviluppata dal partitore di tensione, perturbando dunque il
guadagno descritto in precedenza.
Come si può osservare dalla figura, gli ultimi stadi presentano dei condensatori in parallelo alle resistenze.
Può infatti avvenire che, negli ultimi stadi, il numero di elettroni ionizzati sia così alto che il generatore di
tensione non sia in grado di “sostituirli” prontamente. I condensatori, se ad alta capacità, possono fungere
da “riserve” di cariche in grado di sopperire alla mancanza elettronica sui dinodi.
58
3) Gli elettroni tendono ad essere deviati da fattori esterni al fotomoltiplicatore come campi
magnetici. L’effetto non è particolarmente rilevante in piccoli fotomoltiplicatori, ma la curvatura
degli elettroni può diventare anche abbastanza grande per rivelatori di grandi dimensioni. Per
ovviare a questo problema, i grandi fotomoltiplicatori sono posti all’interno di materiali schermati
magneticamente, o, alternativamente, sfruttano un articolato sistema di microcanali, cioè piastre
forate con sottili cavità all’interno del quale gli elettroni, urtando con le pareti, innescano il
processo di elettromoltiplicazione.
𝑄 = 𝑁Ý 𝑒𝐺𝜀𝜂
Dove:
Ovviamente questa carica non è costante in quanto non è costante il numero di fotoni incidenti 𝑁Ý :
quest’ultimi sono determinati dal decadimento delle particelle dello scintillatore, a cui possiamo attribuire,
come al solito, un andamento esponenziale decrescente:
>
€
𝑁Ý = 𝑁) 𝑒 ‘l
…dove con 𝜏} abbiamo indicato il tempo caratteristico di decadimento (per semplicità di calcolo, solo quello
più rapido). La corrente prodotta sull’anodo durante questo tempo caratteristico sarà perciò:
59
Schematizzeremo questa corrente prodotta come generata da un generatore di corrente, collegata ad un
anodo che modellizzeremo attraverso una resistenza e un condensatore posti in parallelo:
La corrente del generatore si dirama nella resistenza 𝑅 (con una corrente 𝑣/𝑅) e nella capacità 𝐶 (con una
corrente 𝐶 𝑑𝑣/𝑑𝑡), perciò:
€
> 𝑣(𝑡) 𝑑𝑣
𝑖 (𝑡) = 𝐼) 𝑒 ‘l = +𝐶
𝑅 𝑑𝑡
…dove abbiamo posto 𝜏 = 𝑅𝐶. L’espressione ammette il seguente andamento grafico per diversi valori di
𝑅𝐶:
La tensione sviluppata all’anodo, misurabile nel tempo attraverso un oscilloscopio, presenta dunque un
contributo associato al tempo caratteristico dello scintillatore, ed un contributo associato al tempo
caratteristico del circuito 𝑅𝐶 che costituisce l’anodo stesso. Si osservi che:
- Per 𝜏 ≪ 𝜏} , cioè dell’ordine del 𝑛𝑠 o più piccolo, la tensione misurata all’anodo è descritta da una
pulse shape di piccola dimensione, e i tempi caratteristici della misura sono dominati dai tempi di
risposta del fotomoltiplicatore;
60
- Per 𝜏 ≫ 𝜏} , la pulse shape diventa molto larga e viene caratterizzata da ampi tempi di risposta,
stavolta dominati dai tempi di decadimento dello scintillatore.
Rivelatori a semiconduttori
Un breve ripasso
Riprendiamo brevemente le caratteristiche dei semiconduttori analizzati nella parte 1: queste ultime, come
vedremo, si dimostreranno incredibilmente utili nella realizzazione di rivelatori.
Tensioni esterne troppo basse (forte polarizzazione inversa) o tensioni troppo alte (forte
polarizzazione diretta) causano una rottura di questo regime esponenziale, detto di breakdown,
fortemente non lineare rispetto alla tensione in ingresso. In generale, il regime di breakdown viene
raggiunto per campi elettri esterni dell’ordine di 3 ⋅ 10+ 𝑉/𝑚.
61
elettrone della zona di svuotamento: quest’ultimo è, in generale, ottenuto dalla ricombinazione degli
elettroni liberi nella zona 𝑛 verso la zona 𝑝, ed è dunque nella banda di valenza. L’eccitazione da parte della
particella incidente può però promuoverlo in una banda di conduzione: in questo modo diventa un
elettrone libero nella zona di svuotamento, e sarà perciò soggetto al campo elettrico di quest’ultima.
L’elettrone viene così attratto dall’eccesso di carica positiva nella zona 𝑛, verso cui inizierà a spostarsi. Un
discorso analogo può essere ripetuto per la lacuna 𝑝 che si genera parallelamente alla promozione
dell’elettrone nella banda di conduzione, che tenderà invece a spostarsi “attratta” (virtualmente parlando)
dall’eccesso di carica negativa creatasi nella zona 𝑝. Lo sviluppo di queste cariche libere all’interno del
semiconduttore determina, per induzione elettromagnetica, variazioni di carica e dunque di tensione ai
morsetti metallici collegati alla giunzione: misurando queste ultime, è possibile determinare la presenza e
l’entità di una radiazione (o una particella) che è stata in grado di determinare la produzione di coppia
elettrone-lacuna.
Sperimentalmente parlando, un diodo rivelatore è drogato e polarizzato in modo da avere un’ampia zona di
svuotamento, estesa quasi ai morsetti metallici con cui è collegato alla tensione di polarizzazione: in questo
modo, elettroni e lacune, una volta avvenuto l’urto con la particella incidente, tendono a depositarsi sui
morsetti metallici su cui possono essere rivelati.
Si osservi che, a differenza dei rivelatori a scintillazione che sfruttano fotomoltiplicatori basati sull’effetto
molto elettrico, la probabilità di eccitazione degli elettroni è molto più alta: bastano solo pochi 𝑒𝑉 per
promuovere un elettrone nella banda di conduzione!
In realtà, la struttura del disegno precedente è poco utilizzata in ambito sperimentale. La diretta
applicazione del semiconduttore ai morsetti metallici, come già abbiamo accennato nella parte 1, tende ad
effettuare processi di ricombinazione tra gli elettroni del metallo e lacune libere del semiconduttore:
potenzialmente, la zona di svuotamento metallo-semiconduttore può essere molto profonda a causa
dell’enorme numero di elettroni liberi del metallo. Per scongiurare questa possibilità, si realizza una
struttura a due giunzioni, caratterizzata da una parte centrale scarsamente drogata (e dunque
caratterizzata da un’ampia zona di svuotamento), e da due sottili semiconduttori fortemente drogati:
62
Essendo i sottili strati 𝑝å ed 𝑛å fortemente drogati (il “+” sta proprio ad indicare “maggiore drogaggio”)
presentano una zona di svuotamento incredibilmente sottile, che argina l’ampia zona che si formerebbe
con il contatto metallico. In questo modo, al di fuori della zona di svuotamento (centrale) non vi sono
ulteriori barriere di potenziale, e i contatti si comportano in maniera ohmica. Nella nostra trattazione,
tuttavia, supporremo questi effetti parassiti siano trascurabili, in modo da semplificare il calcolo.
𝑒𝑁i
𝐸=− 𝑥
𝜀
L’espressione può essere riscritta in funzione della conducibilità: essa, come ricordiamo, è definita nella
seguente maniera:
𝜎 = 𝑒Z𝑁7 𝜇M + 𝑁i 𝜇Ç [
63
Otteniamo allora:
𝑥 𝜎 𝑥
𝐸=− ≡−
𝜀 𝜇Ç 𝜏𝜇Ç
𝑥𝜇M 𝑑𝑥
𝑣7 = 𝜇M 𝐸 = =
𝜏𝜇Ç 𝑑𝑡
L’equazione di sopra descrive un’equazione differenziale in grado di determinare la posizione degli elettroni
all’interno del diodo. Dalla risoluzione, si ottiene:
Ñ8 >
𝑥 = 𝑥) 𝑒 Ñ9 >
…dove 𝑥) descrive la posizione al momento della formazione dell’elettrone. Si osservi che 𝑥 non può essere
più grande di 𝑑, cioè la posizione dell’elettrodo, oltre il quale l’elettrone viene assorbito dal rivelatore. In
questo modo possiamo conoscere il tempo di vita massimo 𝑡¤§¨ dell’elettrone:
𝜇Ç 𝑑
𝑡¤§¨ = 𝜏 log
𝜇y 𝑥)
Fatte queste considerazioni sul moto dell’elettrone, qual è la carica che si induce, al variare della posizione
𝑥, sui morsetti metallici? Iniziamo a ricordare che l’energia associata ad una carica in moto è 𝑊 = 𝑞𝑉, dove
𝑉 è la tensione agente nel punto 𝑥 della carica. Ciò significa che, per poter spostare un elettrone all’interno
della giunzione dalla sua posizione 𝑥 ad una posizione 𝑥 + 𝑑𝑥 è necessaria un’energia…
𝑑𝑊 = −𝑒𝑑𝑉
𝑑𝑉
𝑑𝑊 = −𝑒 𝑑𝑥 = 𝑒𝐸𝑑𝑥
𝑑𝑥
D’altra parte, possiamo immaginare i morsetti metallici collegati al diodo come le piastre di un
condensatore: com’è noto dall’elettromagnetismo, il campo elettrico sviluppato in un condensatore a facce
piane e parallele è 𝐸 = −𝑉7 /𝑑, dove 𝑉7 è la tensione che sta mantenendo la polarizzazione inversa nella
giunzione. Avremo allora:
𝑉7
𝑑𝑊 = −𝑒 𝑑𝑥
𝑑
Questa energia dev’essere ovviamente fornita dal generatore 𝑉7 che sta mantenendo la polarizzazione del
diodo, per conservazione dell’energia. Ricordiamo che l’energia associata ad un condensatore a facce piane
e parallele è nella forma 𝑊 = 𝑄𝑉7 , dove 𝑄 è la carica depositata sulle piastre. Ovviamente, la variazione di
energia 𝑑𝑊 necessaria per spostare l’elettrone dovrà essere “prelevata” dal condensatore, e perciò:
𝑉7 𝑒
𝑑𝑊 = 𝑑𝑄y 𝑉7 = −𝑒 𝑑𝑥 ⇒ 𝑑𝑄y = 𝑑𝑥
𝑑 𝑑
64
In questo modo possiamo conoscere la variazione di carica 𝑑𝑄y ottenuta sui morsetti per induzione:
moltiplicando e dividendo per 𝑑𝑡, infatti,
𝑒 𝑑𝑥
𝑑𝑄y = − 𝑑𝑡
𝑑 𝑑𝑡
L’andamento della carica è qui descritto da un regime esponenziale. Osserviamo però carica massima,
ottenuta all’istante di tempo 𝑡 = 𝑡¤§¨ quando ormai l’elettrone ha urtato il morsetto metallico:
𝑒 𝑑
𝑄y (𝑡¤§¨ ) = 𝑥) d1 − f
𝑑 𝑥)
Riguardo il moto delle lacune possiamo effettuare un calcolo analogo, facendo attenzione al fatto che esse
hanno una diversa mobilità nel mezzo:
𝑥 𝑥
𝑣7 = 𝜇Õ 𝐸 = −𝜇Õ =−
𝜇Ç 𝜏 𝜏
𝑒 >
𝑄Ç = − 𝑥) d1 − 𝑒 €‘ f
𝑑
A questo punto la carica associata ad un singolo elettrone andrebbe integrata su tutti gli elettroni
“liberatisi” dalla banda di valenza in seguito all’urto con la radiazione esterna. Il calcolo si mostra tuttavia
molto laborioso, e non verrà trattato.
Il modello qui descritto non tiene in conto di numerose problematiche sperimentali, come traiettorie non
perfettamente perpendicolari alle facce del diodo, mobilità 𝜇Ç e 𝜇M non indipendenti dalla posizione,
possibili perdite di cariche dovute all’eventuale ricombinazione tra elettroni e lacune, etc. Tuttavia,
65
permette di farsi un’idea approssimativa degli ordini di grandezza in gioco: in particolar modo, possiamo
conoscere il tempo caratteristico 𝜏 impiegato dalle cariche per muoversi nel mezzo, dell’ordine del 𝑛𝑠. A
questo proposito, si osservi che, sebbene gli elettroni, più leggeri, determinino una costruzione del segnale
più veloce, sono le lacune a determinare il segnale indotto. Queste ultime, essendo più lente, richiedono
infatti un maggior tempo per riuscire a ricostruire il segnale nella sua interezza: conseguentemente, l’intero
sistema deve “aspettare” le lacune per poter determinare una pulse shape fedele al segnale in entrata. In
generale, poiché, come si può osservare dall’espressione precedente, i tempi necessari alla ricostruzione
della pulse shape sono dominati dal tempo caratteristico 𝜏, si pone, in parallelo al diodo, un circuito 𝑅𝐶, in
modo che i tempi di carica e scarica regolati da 𝜏} = 𝑅𝐶 “dominino” sui tempi di passaggio delle cariche, in
maniera del tutto analoga alla trattazione dei fotomoltiplicatori di pagina 59.
La giunzione 𝒑𝒊𝒏
In generale, si tende a cercare di ridurre le complicazioni sperimentali descritte sopra attraverso oculate
scelte di lavorazione del mezzo semiconduttore. La perdita di carica dovuta alla ricombinazione, ad
esempio, viene “arginata” attraverso particolari strutture a semiconduttore detta 𝑝𝑖𝑛.
Si immagini una giunzione costituita da un gruppo di tre semiconduttori, caratterizzati da una zona 𝑝 ed
una zona 𝑛 fortemente drogate, e una zona centrale 𝑝 meno drogata, in modo che la zona di svuotamento
si estenda quasi del tutto in quest’ultima, analogamente a quanto analizzato a pagina 60 in merito agli
effetti di ricombinazione parassita ai morsetti metallici. La zona centrale costituisce il vero mezzo attivo
entro cui avviene la rivelazione degli elettroni ionizzati, e deve interferirvi il meno possibile: comprendiamo
però che, tuttavia, essendo la zona drogata di tipo 𝑝, è alta la probabilità che una lacuna “intrappoli” un
elettrone liberato poco prima. D’altra parte questa zona 𝑝 non può nemmeno essere sostituita da un
semiconduttore intrinseco, in quanto questi ultimi, come ricordiamo, esercitano una forte resistenza.
Ciò che si effettua sperimentalmente è allora una compensazione della zona 𝑝, attraverso un drogaggio in
litio. La zona 𝑝, già drogata con degli accettori (generalmente boro) viene infatti ulteriormente drogata con
delle impurità di litio (che funge da accettore), in modo che il numero di donori e accettori si compensi,
come in un semiconduttore intrinseco. In questo modo si ottiene una giunzione 𝑝𝑖𝑛 (cioè zona 𝑝-zona
intrinseca-zona 𝑛), che non presenta un gran numero di lacune che causerebbero altrimenti la
ricombinazione, ma mostra una resistenza pari alla metà di quella di un semiconduttore intrinseco.
Oggi, i principali semiconduttori 𝑝𝑖𝑛 sono basati su silicio e germanio, e vengono indicati con i termini
“silly” (𝑆𝑖𝐿𝑖) e “gelly” (𝐺𝑒𝐿𝑖) rispettivamente.
𝐸
𝑄=𝑒
𝑊
66
Ovviamente non possiamo avere una coppia per ogni fotone incidente, a causa dei fattori di perdita; detta
𝜂 l’efficienza di raccolta, l’espressione più corretta è dunque la seguente
𝐸
𝑄 = 𝜂𝑒
𝑊
𝑄 𝐸
𝑉= = 𝜂𝑒
𝐶 𝑊𝐶
Per quanto riguarda la risoluzione, sperimentalmente si osserva un fattore di Fano dell’ordine di 0.12: la
qual cosa determina gaussiane sperimentali fortemente piccate e dal ristretto FWHM. I rivelatori a
semiconduttori presentano dunque la peculiarità di riuscire ad apprezzare piccolissime risoluzioni, come si
può osservare dal seguente confronto tra rivelatore a germanio e a 𝑁𝑎𝐼:
Se infatti uno scintillatore 𝑁𝑎𝐼(𝑇𝑙 ) ha una risoluzione del 5%, un semiconduttore presenza una risoluzione
del 0.15%: può dunque rivelare a risoluzioni incredibilmente più piccole!
67
All’arrivo di una particella ionizzante, gli elettroni della zona 𝑛 centrale tenderanno a creare coppie
elettroni-lacune che si dirigeranno poi al morsetto più vicino. Rivelando la presenza degli elettroni liberati,
si può conoscere la zona entro cui si è mossa la particella incidente analizzando dove si è distribuita
maggiormente la carica.
Si osservi che, tuttavia, questo tipo di struttura permette di individuare la posizione della particella solo
lungo un asse perpendicolare alle strisce. Per avere una risoluzione bidimensionale, si costruiscono
rivelatori micro-strip a due facce di strisce, sfruttando uno strato di strip di tipo 𝑛 su una faccia, e un altro
strato di strip di tipo 𝑝 sull’altra, disposte ortogonalmente rispetto alle prime, come nel disegno:
In questo modo, se le prime strisce rivelano la posizione su un’asse 𝑥, le seconde possono rivelare la
posizione su un’asse ortogonale 𝑦, in modo da avere una risoluzione bidimensionale della posizione della
particella. In genere, si tende a schermare con altri elettrodi di tipo 𝑝 le strisce di tipo 𝑛 dalle strisce di tipo
𝑝, in modo da evitare passaggi di cariche tra i due che rivelerebbero cariche “fasulle”, cioè non determinate
dall’urto di una particella incidente.
Oggi, anziché una struttura a strisce come quella appena descritta, è spesso utilizzata una struttura a pixel,
68
cioè caratterizzata da tanti rivelatori a semiconduttori dalla forma quadrata, in modo da riuscire ad averne
in maggior numero a parità di superficie. In questo modo si crea una “griglia” di rivelatori, di dimensioni
micrometriche, ognuno in grado di rivelare una particella incidente e restituire la posizione semplicemente
conoscendo il “pixel” su cui ha inciso la particella.
I rivelatori micro-strip e a pixel sono frequentemente utilizzati nei moderni acceleratori di particelle. Essi
sono generalmente posti nelle immediate vicinanze del fascio di particelle che subiscono l’urto, in modo da
poter rivelare la posizione di esse rapidamente prima che esse possano interferire con l’ambiente
circostante.
Ogni elemento della griglia è in realtà costituito da ulteriori sottocelle , indicate con il termine di single
photon avalanche diode o SPAD, di dimensioni dell’ordine della decina di micron. Gli SPAD vengono
realizzati in gran numero sullo stesso “wafer” di silicio, fino a costruire griglie di superficie fino a 6𝑥6𝑐𝑚 e.
Ciascuno degli SPAD costituisce un rivelatore caratterizzato da una doppia giunzione 𝑝𝑛, costituita da due
semiconduttori laterali altamente drogati e due semiconduttori centrali a basso drogaggio, disposti come in
figura
Dove abbiamo indicato con “𝜋” una giunzione drogata di tipo 𝑝 a bassissimo drogaggio. Ai capi della
giunzione è posta una differenza di potenziale molto intensa (fino al centinaio di volt), in modo da spingerlo
fortemente in interdizione ed ottenere un’ampia zona di svuotamento.
69
L’imposizione di un campo elettrico così forte all’interno della giunzione ha un’importante conseguenza,
nota come effetto avalanche (“valanga”): si immagini infatti di osservare un fotone incidente sul dispositivo
ad energia sufficiente da causare la formazione di una coppia elettrone-lacuna; il campo elettrico è così
intenso da causare una forte accelerazione dell’elettrone, che urterà gli elettroni vicini (ancora intrappolati
nella zona di svuotamento) ad una velocità così elevata da causarne il distacco dalla banda di valenza. In
questo modo, da una coppia elettrone-lacuna libera, si sono ottenute due coppie elettrone-lacuna: il
processo si propaga in modo da creare una vera e propria “valanga” di elettroni, da cui il nome
“avalanche”. Il fenomeno viene spesso indicato con il termine di seconda ionizzazione e, in base a quanto
descritto, avviene solo in regimi di campi elettrici particolarmente intensi, indicati con il termine di regione
Geiger: poiché essa è una zona di forte non linearità vicina al punto di breakdown, non vi è una relazione
lineare tra fotone incidente e numero di elettroni creatisi in seguito alla formazione della valanga. Gli SPAD
attivi in regione Geiger sono per questo detti anche Geiger Avalanche Photodiod (o G-APD).
La valanga elettronica che si viene a creare è in grado di crescere autonomamente in seguito all’urto di
nuovi elettroni di valenza, e va ovviamente controllata per evitare di creare correnti eccessivamente grandi.
Si sfrutta perciò una resistenza, detta resistenza di quenching (“smorzamento”).
Per comprendere il funzionamento di quest’ultima, schematizziamo la giunzione come un condensatore 𝐶7 ,
collegato in serie con la resistenza di quenching 𝑅b e, infine, al generatore 𝑉7 in grado di creare il forte
campo elettrico interno che generi la valanga. Quest’ultima, poiché costituisce una corrente del tutto non
lineare ed approssimabile come indipendente dal fotone incidente, verrà modellizzata da un generatore di
forza elettromotrice aggiuntivo 𝑉77 , inizialmente scollegato, come in figura:
70
Il motivo di una struttura così ramificata sta nel principio che determina la valanga elettronica: essendo
questa generata in un regime totalmente non lineare, se vi fosse un unico G-APD non vi sarebbe modo di
sapere se essa sia stata generata da uno o più fotoni, in quanto la risposta è approssimativamente la stessa
ogni volta. In una struttura a griglia ben ramificata, invece, è bassa la probabilità che due fotoni incidano,
durante un breve intervallo di tempo, sullo stesso G-APD: in questo modo, vi è circa una corrispondenza
uno ad uno tra il numero di valanghe generate (la cui intensità è sempre la stessa) e il numero di fotoni
incidenti. Sommando allora tutte le cariche generate dalla valanga, quest’ultima sarà proporzionale al
numero di fotoni incidenti, come si vuole per un fotomoltiplicatore. La struttura a griglia dei SiPM è inoltre
intrinsecamente digitale, in quanto ciascuno dei G-APD può o non può ricevere il segnale generando la
valanga, restituendo dunque un segnale alto o basso a seconda se è stato colpito da un fotone o meno.
Analizziamo infine alcuni parametri sperimentali. L’efficienza quantica di un SiPM è generalmente molto
alta, dell’ordine del 70% grazie alla quasi corrispondenza uno ad uno tra fotoni incidenti e valanghe
generate. Vanno però considerati diversi fattori di perdita dovuta alla geometria del dispositivo: le singole
celle di un fotomoltiplicatore a semiconduttore sono divise da “aree morte” necessarie per la realizzazione
dei circuiti descritti prima ed in grado di evitare il sovrapporsi di valanghe associate a diversi G-APD;
ovviamente i fotoni incidenti contro queste ultime non verranno rivelati. Vanno poi aggiunti fattori di
natura statistica: lo SPAD ha una certa sezione d’urto associata alla probabilità che il fotone “liberi”
l’elettrone dalla sua banda di valenza e un’ulteriore sezione d’urto associata alla probabilità che si inneschi
la valanga (in quanto l’elettrone potrebbe finire in una trappola prima di poterla generare). E’ allora utile
definire il photo-detection efficiency, un parametro che descriva l’efficienza del SiPM, nel seguente modo:
Dove 𝑄È descrive la probabilità di generazione di una coppia elettrone-lacuna, 𝑃 la probabilità che venga
generata una valanga, e 𝜀 è un fattore di efficienza geometrica.
71
Rivelatori a ionizzazione
In quest’ultimo capitolo analizzeremo un’ultima famiglia di rivelatori, cioè i rivelatori a ionizzazione, il cui
meccanismo di base è per certi versi molto simile a quanto analizzato nel caso dei rivelatori a
semiconduttori. Storicamente parlando, i rivelatori a ionizzazione sono stati i primi ad essere utilizzati per la
rivelazione delle particelle: essi descrivono un’ampia classe di dispostivi (generalmente a gas, ma talvolta
liquidi) utilizzati prevalentemente come rivelatori di posizione.
Com’è noto dall’elettromagnetismo classico, un filo carico a tensione 𝑉) esercita nella zona circostante, a
meno di effetti di bordo, un campo elettrico nella forma…
1 𝑉)
𝐸•⃗ = 𝑟̂
𝑟 log 𝑏
𝑎
72
Come si può osservare, sono presenti diversi regimi di funzionamento.
1) Nella prima zona, più vicina a 0 𝑉, la tensione applicata tra catodo ed anodo è troppo bassa, e le
coppie ione-elettrone, anziché essere attirate alle pareti o al filo assiale, tendono a ricombinarsi
con le particelle del gas; conseguentemente, non si osservano correnti.
2) Nella seconda zona si osserva un andamento costante nel numero di cariche in funzione della
tensione: in questa condizione, infatti, la tensione è abbastanza alta da permettere l’attrazione
della quasi totalità di particelle cariche prodotte. E’ in questo regime che funzionano le camere a
ionizzazione. Si osservi che in genere la corrente misurata è molto bassa, in quanto, considerando
fattore d’urto e fattori di perdita, è in genere piccola la percentuale di ioni ed elettroni prodotti in
seguito alla ionizzazione: questo genere di camere è perciò utilizzata per la rivelazioni di raggi 𝛾 ad
alto flusso di particelle.
3) Nella terza zona si ha una netta “impennata” nel numero di particelle cariche osservate
all’aumentare della tensione. In questa regione, infatti, la tensione accelera particolarmente
elettroni e ioni, tanto che, il loro urto con gli atomi del gas, genera nuovi fenomeni di ionizzazione
che si propagano in una reazione a catena. In altre parole, avviene lo stesso processo di
moltiplicazione a valanga già descritto nel caso dei rivelatori a semiconduttori. Si osservi che,
poiché il campo elettrico va come 1/𝑟, esso è maggiormente intenso in prossimità del filo, dove si
generano dunque gran parte delle valanghe, mentre tende a scemare all’allontanarsi dall’asse. In
questo modo non si creano i processi di valanghe incontrollate osservate per i rivelatori a
semiconduttori, e la corrente in uscita misurata, moltiplicata grazie alle valanghe, è proporzionale
al numero di elettroni prodotti e dunque all’energia (o il numero di fotoni) della radiazione
incidente. Questo regime di funzionamento è sfruttato dalle camere proporzionali.
4) Dalla quarta zona in poi la tensione è particolarmente elevata, tanto da creare valanghe così
intense e numerose da distorcere il campo elettrico tra anodo e catodo, facendo perdere il regime
di proporzionalità. Inoltre, poiché nell’urto ad alta velocità gli atomi del gas subiscono una forte
eccitazione, essi tendono ad emettere, nella diseccitazione, fotoni ad alta energia in grado di creare
nuove ionizzazioni e dunque nuove valanghe. Si instaurano dunque dei processi di valanghe
73
secondarie lungo tutta la lunghezza dell’anodo dove, come ricordiamo, il campo elettrico è più
intenso, e, come nei semiconduttori, la valanga è ora in grado di autoalimentarsi. In altre parole, ci
troviamo in quello che abbiamo descritto in precedenza come regime Geiger, ed è necessario un
quenching in grado di “frenare” la cascata elettronica (e ionica!) di particelle. Stavolta,
l’attenuazione della valanga è esercitata da un gas di quenching disciolto nel gas rivelatore, in
grado di assorbire i fotoni prodotti dalla diseccitazione secondaria in modo da evitare
l’autoalimentarsi della valanga. Come ricordiamo, nel regime Geiger si perde ogni proporzionalità, e
la corrente misurata varia poco rispetto alle variazioni di radiazione in entrata: è a questo regime
che operano i rivelatori Geiger-Muller.
5) Le ultime zone corrispondono a regimi di tensioni così alte da causare il breakdown del mezzo
gassoso: questo provoca diversi malfunzionamenti del dispositivo e va dunque ovviamente evitato.
Analisi delle correnti ione-elettrone
A seconda del regime considerato, possiamo distinguere moti di carica di diversa natura.
1) Nella prima zona, in assenza di campo elettrico o per campi elettrici in ogni caso trascurabili, il
moto delle cariche formate in seguito all’interazione con la radiazione è prevalentemente di
diffusione, e dettato puramente dall’agitazione termica. Si può dimostrare che la sezione d’urto
associata a questa diffusione è pari a 𝜎 = √2𝐷𝑡, dove 𝐷 è il coefficiente di diffusione. Si osservi
che il fenomeno di diffusione è presente anche una volta aggiunto il campo elettrico interno, perciò
è talvolta necessario “incanalare” il flusso di cariche con campi elettrici che verifichino una
geometria adatta allo scopo, come vedremo nelle camere a drift.
2) Nella seconda zona, elettroni e ioni vengono accelerati dal campo elettrico, che, essendo diretto
radialmente, li spinge dall’anodo verso il catodo o viceversa. In realtà, l’accelerazione avviene solo
per un breve intervallo di tempo 𝜏, poiché elettroni e ioni tendono ad urtare con gli altri atomi del
gas, perdendo la propria energia cinetica e ripartendo a velocità approssimativamente nulla. Detto
𝜏 l’intervallo di tempo trascorso tra un urto e un altro, avremo che la velocità di drift sarà allora…
𝑣⃗7 = 𝑎⃗𝜏
𝑞
𝐹⃗ = 𝑚𝑎⃗ = 𝑞𝐸•⃗ ⇒ 𝑎⃗ = 𝐸•⃗
𝑚
𝑣⃗7 = 𝜇𝐸•⃗
…dove 𝜇 è, al solito, la mobilità nel gas, diversa ovviamente per ioni ed elettroni: gli ioni, essendo
più pesanti, saranno infatti più lenti.
In generale, 𝜇, per campi elettrici non particolarmente intensi, si mostra indipendente da 𝐸•⃗; la qual
cosa, a causa di numerosi effetti parassiti concorrenti, inizia a non diventare più vera per campi
elettrici a maggiore intensità. L’andamento sperimentale della velocità in funzione di 𝐸•⃗ ha infatti,
nell’argon con diverse misture gassose, il seguente andamento grafico:
74
In generale, gli ioni toccano velocità dell’ordine del centimetro per millisecondo, mentre gli
elettroni del centimetro per microsecondo: in entrambi i casi non sono velocità particolarmente
elevate.
Comprendiamo inoltre la velocità vari da gas a gas a seconda della densità di quest’ultimo. Alte
densità determinano un maggior numero di atomi, dunque un maggior numero di urti e
consequenzialmente un minor tempo 𝜏 tra un urto e un altro, che si riflette sul coefficiente di
mobilità 𝜇.
3) Nella terza zona inizia il processo di generazione di valanghe elettroniche e ioniche. Si osservi che,
tuttavia, la generazione di valanghe nel caso degli elettroni ha velocità diversa rispetto al caso degli
ioni, più pesanti e dunque più lenti. La valanga assume perciò una forma “a goccia”, con gli
elettroni, più rapidi, in testa, e gli ioni, più lenti, in coda, come in figura:
Gli elettroni della valanga, prodotti dalla seconda ionizzazione, tendono a loro volta ad urtare gli
atomi del gas. Anch’essi detengono dunque un particolare intervallo di tempo 𝜏 tra un urto e un
altro e un libero cammino medio 𝜆. Si definisce coefficiente di Townsend la seguente quantità:
1
𝛼=
𝜆
75
In questo senso, detta 𝑥 la distanza percorsa da un elettrone, il rapporto 𝑟/𝜆 descrive,
classicamente, la probabilità che avvenga un urto in grado di generare una seconda ionizzazione.
In questo modo, se 𝑛 è il numero di atomi in un’unità di lunghezza 𝑑𝑥, ci aspettiamo un aumento
𝑑𝑛 di elettroni e ioni nella seguente forma.
𝑑𝑛 = 𝑛𝛼𝑑𝑥
𝑛 = 𝑛) 𝑒 ÆC
…dove 𝑛) è il numero di elettroni di partenza prima dell’innesco della valanga. Questo tipo di
trattazione è ovviamente molto intuitiva, in quanto, rigorosamente parlando 𝛼 dipende dalla
posizione (in quanto la probabilità di ionizzazione è maggiore in prossimità del filo assiale), ma ci dà
una buona approssimazione dell’andamento medio del numero di elettroni all’aumentare dalla
distanza dal filo: in genere 𝛼𝑟 è dell’ordine della decina, perciò si hanno moltiplicazioni elettroniche
anche dell’ordine di 10ÿ .
4) La quarta zona è descritta dal regime Geiger, e, come ricordiamo, l’andamento della carica
prodotta è quasi del tutto indipendente dalla radiazione incidente. La trattazione è dunque analoga
a quella già effettuata nel caso dei rivelatori a semiconduttore.
Indicato con 𝑁€ e con 𝑁å il numero di elettroni e ioni rispettivamente formatisi in seguito alla ionizzazione,
ad essi sarà associata una variazione di energia infinitesima pari a −𝑒𝑁€ 𝑑𝑉 e 𝑒𝑁å 𝑑𝑉, che possiamo
scrivere equivalentemente come:
𝑑𝑊 = −𝑒𝑁€ 𝑑𝑉 + 𝑒𝑁å 𝑑𝑉 = 𝑒𝑁€ 𝐸𝑑𝑥€ − 𝑒𝑁å 𝐸𝑑𝑥å = 𝑒𝑁€ 𝐸𝑣€ 𝑑𝑡 + 𝑒𝑁å 𝐸𝑣å 𝑑𝑡
Dove 𝑣å ha segno negativo, in quanto rivolta in senso opposto all’asse 𝑥 del nostro sistema di riferimento.
Poiché elettroni e ioni vengono formati in un numero pari di coppie, abbiamo 𝑁€ = 𝑁å ≡ 𝑁 e dunque:
76
𝑊 = 𝑒𝐸𝑁𝑑𝑡(𝑣å + 𝑣€ )
D’altra parte il campo elettrico sviluppato all’interno di un condensatore è pari a 𝐸 = 𝑉/𝑑, perciò,
𝑒𝑉𝑁(𝑣å + 𝑣€ )
𝑊= 𝑑𝑡
𝑑
Ovviamente l’energia “donata” a ioni ed elettroni deve provenire dallo stesso generatore 𝑉) : poiché
l’energia infinitesima immagazzinata in un condensatore è pari a 𝐶𝑉𝑑𝑉, otteniamo:
𝑒𝑉𝑁(𝑣å + 𝑣€ ) 𝑒𝑁(𝑣å + 𝑣€ )
𝐶𝑉𝑑𝑉 = 𝑑𝑡 ⇒ 𝑑𝑉 = 𝑑𝑡
𝑑 𝐶𝑑
Da cui otteniamo la tensione osservata a causa della presenza di elettroni e ioni nel condensatore:
𝑒𝑁(𝑣å + 𝑣€ ) 𝑒𝑁
𝑉= 𝑡= (𝑣 𝑡 + 𝑣€ 𝑡)
𝐶𝑑 𝐶𝑑 å
𝑒𝑁
𝑉= (𝑥 + 𝑥€ )
𝐶𝑑 å
La tensione, per induzione, varia dunque al variare della posizione della particella: osserviamo che
raggiunge un valore massimo quando 𝑥å = 0 e 𝑥€ = 𝑑, oltre il quale elettroni e ioni non possono muoversi
in quanto “urtati” contro le piastre del condensatore. Avremo allora:
𝑒𝑁 𝑒𝑁
𝑉¤§¨ = 𝑑=
𝐶𝑑 𝐶
Si voglia sottolineare che, come nei rivelatori a semiconduttori, l’intero processo è dominato dalle particelle
più lente, cioè gli ioni: è necessario infatti aspettare i tempi di percorrenza di questi ultimi al fine di
costruire il segnale in entrata nella sua interezza.
Si osservi infine che il nostro è stato un caso altamente semplicistico, in quanto si è supposto la radiazione
ionizzante avesse direzione parallela alle facce del condensatore; qualora si avesse un certo angolo di
emissione rispetto all’orizzontale, avremmo, data la forte dipendenza dalla 𝑥, una carica indotta sugli
elettrodi diversa punto per punto. Uno stratagemma per superare questo problema consiste nell’utilizzo di
una griglia di Frisch: essa costituisce un reticolo di strisce metalliche parallele alle facce del condensatore,
che lo schermano dalla presenza degli elettroni e non permettono l’induzione:
77
In questo modo, finché gli elettroni non superano la griglia di Frisch, l’anodo ne risulta schermato: non
appena essi emergono da quest’ultima, tuttavia, iniziano a provocare l’induzione sul condensatore, che
vedrà ora le cariche tutte alla stessa distanza ℎ, cioè la distanza della griglia di Frisch dall’anodo.
Il campo elettrico generato dai fili, visto in un piano ortogonale a questi ultimi, ha la seguente
forma:
Ad eccezione della zona molto vicina ai fili anodici, le linee di campo sono essenzialmente parallele.
Così com’è costruita, una camera multiwire costituisce un ottimo rivelatore di posizione di una
particella. Si immagini infatti di osservare una particella incidere in un punto qualsiasi all’interno
della camera a gas, causando la ionizzazione di un atomo e determinando la formazione di una
coppia elettrone-ione. Poiché il campo elettrico sviluppato all’interno di una multiwire è molto
intenso, gli elettroni inizieranno ad essere attirati dall’anodo più vicino, causando valanghe in grado
di determinare variazioni nel potenziale al solito misurabili sperimentalmente. Conoscendo dunque
la posizione degli anodi che hanno ricevuto una valanga elettronica più o meno intensa, si può così
conoscere la posizione in cui la particella ha prodotto la ionizzazione.
Il segnale da parte di un piano di fili, ovviamente, restituisce informazione solo su una coordinata
spaziale, cioè quella di un’asse perpendicolare alla direzione dei fili: è però possibile ottenere una
78
risoluzione spaziale in due dimensioni aggiungendo un secondo piano di fili orientati
perpendicolarmente ai primi. In questo modo, si può conoscere la posizione (𝑥, 𝑦) associata alla
particella incidente.
In generale, come vedremo, nei moderni dispositivi vi sono numerosi piani di multiwire, in modo da
avere una precisione sulla posizione sempre più grande.
- Drift chamber – Parallelamente allo sviluppo delle MWPC, si osservò come la risoluzione spaziale
potesse essere ottenuta misurando differenti tempi di drift da parte degli elettroni generatisi in
seguito alla ionizzazione. Su questo principio si basa la drift chamer.
Una drift chamber può essere schematizzata come una cella rettangolare ove sia posto, ad un
estremo, un elettrodo ad alta tensione, e all’altro estremo un filo anodico posto a tensione positiva.
Infine, all’inizio (o alla fine) della regione attiva della camera è posto uno scintillatore.
79
problematica, tra un filo anodico e l’altro vengono aggiunti fili carichi negativamente, che
“correggono” le linee di campo di ciascun fino anodico in modo che esse non si sovrappongano tra
loro generando le perturbazioni descritte prima.
- Time projection chamber – Oggi, i rivelatori più sofisticati di correnti di ionizzazione sono le time
projection chamber (indicate con TPC). Una TPC è, fondamentalmente, un tracker in grado di
rivelare, in tre dimensioni, la posizione di una particella in numerosi punti dello spazio e,
contemporaneamente, descriverne la perdita energetica 𝑑𝐸/𝑑𝑥 nel mezzo.
La TPC mette insieme gli elementi di una MWPC e di una drift chamber: essa è costituita da un
cilindro di grandi dimensioni riempito di gas, al centro del quale è posto un elettrodo ad alta
tensione in grado di generare un campo elettrico parallelo all’asse del cilindro. Spesso, al campo
elettrico si accompagna anche un campo magnetico, le cui ragioni saranno chiare a breve.
Al termine del tubo, verso cui vengono incanalati gli elettroni, è posta una griglia di fili anodici,
disposti “a ragnatela”, come in figura: parallelamente ad ogni filo sono disposti poi numerosi catodi
rettangolari, detta pad.
Un elettrone prodotto dalla ionizzazione di un atomo del gas verrà accelerato verso la griglia, dove
produrrà, al solito, la valanga elettronica. In questo modo, sfruttando le coordinate cilindriche,
1) La coordinata 𝑧, cioè la distanza dal punto di formazione della particella e la griglia anodica, può
essere determinata conoscendo il tempo di percorrenza degli elettroni, analogamente a quanto
visto in una drift chamber;
2) La coordinata 𝑟, cioè la distanza dal punto di formazione della particella e l’asse del cilindro,
può essere determinata individuando gli anodi che hanno maggiormente percepito la valanga
elettronica;
3) La coordinata 𝜃, cioè l’angolo tra il punto di formazione della particella e un’asse prescelto, può
essere determinata individuando gli anodi, lungo il filo anodico, che hanno maggiormente
percepito la valanga ionica.
Il campo magnetico interno viene invece generato in modo da ridurre gli effetti di diffusione
trasversali al moto di diffusione, “incanalando” gli elettroni in un moto a spirale.
80
Come abbiamo già accennato, un simile dispositivo è inoltre in grado di misurare la perdita
energetica 𝑑𝐸/𝑑𝑥 della particella incidente. Vengono infatti campionate le sue posizioni successive
𝑑𝑥 attraverso le misurazioni di posizione appena descritte; ad ognuna di esse è associato l’arrivo di
cariche di induzione: conoscendo il loro numero, è possibile determinare il numero 𝑁 di cariche
prodotte in seguito alla ionizzazione, e dunque l’energia 𝐸 = 𝑁𝑊 della particella di partenza.
81
Bibliografia
J. Millman – Circuiti e sistemi microelettronici, Bollati Boringhieri (1985);
W. R. Leo – Techniques for nuclear and particle physics experiments: a how-to apporach, Springer-Verlag
(1987);
82