Le presenti dispense sono state scritte per gli studenti di astronomia che devono affrontare l’esame del corso di
Laboratorio di Astronomia I. Si è voluto, con queste dispense, dare un miglior assetto al corso e favorire gli
studenti, che in passato avevano il problema di dover studiare questa materia solo su testi di lingua inglese.
Questa è la prima versione di queste dispense, per cui è possibile che vi siano numerosi
errori ed imperfezioni, nel testo e nelle figure. Pregherei pertanto tutti gli studenti che trovino
errori di vario tipo e coloro che hanno suggerimenti per migliorare la comprensione del testo
stesso, di mettersi in contatto con me.
Mauro D’Onofrio
2
Sommario
1 CAPITOLO 1................................................................................................................ 66
1.1 Il principio di Fermat .................................................................................................. 6
1.2 Applicazioni del principio di Fermat ........................................................................... 8
1.2.1 Legge della riflessione e della rifrazione ............................................................... 8
1.2.2 Il diottro sferico .................................................................................................... 9
1.2.3 La lente sottile .................................................................................................... 10
1.3 Il principio di Fermat e le superfici riflettenti ............................................................ 11
1.3.1 Specchio concavo (un punto coniugato all’infinito) ............................................ 11
1.3.2 Specchio concavo con due punti coniugati.......................................................... 12
1.3.3 Specchio convesso con due punti coniugati......................................................... 12
1.4 Le Sezioni coniche.................................................................................................... 13
2 CAPITOLO 2................................................................................................................ 15
2.1 Introduzione alle aberrazioni..................................................................................... 15
2.1.1 Gli specchi conici ............................................................................................... 15
2.1.2 L’aberrazione sferica .......................................................................................... 16
2.1.3 Un esempio ........................................................................................................ 18
2.1.4 Distribuzione dei raggi vicino al fuoco ............................................................... 18
2.1.5 Gli specchi conici con oggetti ed immagini a distanza finita ............................... 19
2.2 Le aberrazioni fuori asse ........................................................................................... 20
2.3 Compensazione delle aberrazioni .............................................................................. 21
2.3.1 La montatura Cassegrain .................................................................................... 21
2.3.2 La camera Schmidt ............................................................................................. 24
3 CAPITOLO 3................................................................................................................ 24
3.1 Il principio di Fermat e le aberrazioni per una generica superficie di rivoluzione....... 24
3.2 Valutazione dei coefficienti di aberrazione................................................................ 27
3.3 Aberrazioni del raggio e del fronte d’onda ................................................................ 29
3.4 Riassunto delle principali aberrazioni........................................................................ 30
3.4.1 Condizioni aplanatiche ed alcuni esempi............................................................. 32
3.5 Le aberrazioni in presenza di diaframmi.................................................................... 32
3.6 Le nuove relazioni .................................................................................................... 33
3.6.1 I coefficienti di aberrazione ................................................................................ 34
3.6.2 Esempi ............................................................................................................... 36
3.7 Le Aberrazioni per sistemi a più superfici ................................................................. 36
3.7.1 Esempio: i coefficienti di aberrazione per un telescopio Cassegrain .................... 37
3.8 Curvatura di campo................................................................................................... 38
4 CAPITOLO 4................................................................................................................ 41
4.1 I telescopi riflettori.................................................................................................... 41
4.1.1 Il paraboloide ..................................................................................................... 41
4.1.2 I telescopi con due specchi ................................................................................. 42
4.1.3 Il tipo classico .................................................................................................... 45
4.1.4 Il tipo aplanatico ................................................................................................. 46
4.1.5 Altri telescopi con due specchi............................................................................ 47
4.1.6 Confronto tra tipo classico e aplanatico............................................................... 48
4.2 Errori di allineamento nei telescopi a due specchi ..................................................... 51
4.2.1 Errori di centraggio e di inclinazione .................................................................. 51
5 CAPITOLO 5................................................................................................................ 55
3
5.1 La sovrapposizione delle onde .................................................................................. 55
5.2 Somma di onde della stessa frequenza....................................................................... 55
5.2.1 Il metodo algebrico ............................................................................................. 55
5.2.2 Il metodo complesso ........................................................................................... 59
5.2.3 I Fasori ............................................................................................................... 60
5.2.4 Onde stazionarie ................................................................................................. 61
5.3 La sovrapposizione di onde con diversa frequenza .................................................... 62
5.3.1 I battimenti ......................................................................................................... 62
5.4 La velocità di gruppo e di fase................................................................................... 63
5.5 Onde periodiche anarmoniche ................................................................................... 64
5.5.1 Le serie di Fourier .............................................................................................. 65
5.6 Le onde non periodiche ............................................................................................. 68
6 CAPITOLO 6................................................................................................................ 72
6.1 Interferenza............................................................................................................... 72
6.1.1 Considerazioni generali ...................................................................................... 72
6.2 Condizioni per l’interferenza..................................................................................... 75
6.2.1 Coerenza spaziale e temporale ............................................................................ 75
6.3 Le leggi di Fresnel-Arago ......................................................................................... 77
6.4 Interferometri a divisione del fronte d’onda............................................................... 78
6.4.1 L’esperimento di Young ..................................................................................... 78
6.4.2 Altri tipi di interferometro a divisione del fronte d’onda ..................................... 80
6.5 Interferometri a divisione di ampiezza....................................................................... 82
6.5.1 Frange osservabili da una pellicola di materiale dielettrico.................................. 82
6.5.2 Frange di uguale inclinazione ............................................................................. 82
6.5.3 Frange di uguale spessore ................................................................................... 85
6.6 L’interferometro di Michelson .................................................................................. 87
6.7 Altri interferometri.................................................................................................... 90
6.7.1 Frange reali ........................................................................................................ 90
6.7.2 Tipo e localizzazione delle frange....................................................................... 92
6.8 Interferenza multipla ................................................................................................. 93
7 CAPITOLO 7................................................................................................................ 97
7.1 La diffrazione ........................................................................................................... 97
7.1.1 Il principio di Huygens-Fresnel........................................................................... 97
7.1.2 Ostacoli opachi ................................................................................................... 98
7.2 Diffrazione di Fresnel e di Fraunhofer....................................................................... 99
7.2.1 Diversi oscillatori coerenti................................................................................ 100
7.3 Diffrazione di Fraunhofer........................................................................................ 103
7.3.1 La fenditura ideale singola................................................................................ 103
7.3.2 La fenditura rettangolare reale .......................................................................... 105
7.3.3 La fenditura doppia........................................................................................... 107
7.3.4 Il reticolo .......................................................................................................... 108
7.3.5 Spettroscopia con i reticoli................................................................................ 111
7.3.6 Apertura rettangolare e circolare....................................................................... 113
8 CAPITOLO 8.............................................................................................................. 117
8.1 Elementi di ottica di Fourier.................................................................................... 117
8.1.1 Trasformata di una funzione gaussiana ............................................................. 118
8.1.2 La trasformata bidimensionale .......................................................................... 118
8.1.3 Proprietà della Delta di Dirac............................................................................ 119
8.1.4 I sistemi lineari ................................................................................................. 121
8.1.5 L’integrale di convoluzione .............................................................................. 123
4
8.2 Le lenti realizzano le trasformate di Fourier ............................................................ 125
8.3 La diffrazione di Fraunhofer ................................................................................... 127
8.4 Le funzioni di trasferimento .................................................................................... 128
8.4.1 OTF non normalizzata e normalizzata............................................................... 130
9 CAPITOLO 9.............................................................................................................. 134
9.1 Cenni sul funzionamento del LASER...................................................................... 134
9.1.1 Energia e materia in equilibrio .......................................................................... 134
9.1.2 Emissione stimolata.......................................................................................... 136
9.2 Il LASER................................................................................................................ 138
9.2.1 Il Laser ad He-Ne ............................................................................................. 139
9.2.2 Le cavità ottiche risonanti................................................................................. 140
9.2.3 Collimazione di un fascio Laser........................................................................ 142
9.2.4 Coerenza .......................................................................................................... 143
10 BIBLIOGRAFIA ........................................................................................................ 146
5
1 CAPITOLO 1
Si tratta di un metodo molto potente per trattare i problemi di ottica geometrica. Si supponga di
avere una superficie che trasmette e/o riflette i raggi luminosi. Il principio di Fermat afferma
che la traiettoria seguita dal raggio luminoso sarà quella per cui il tempo necessario, per andare
ad esempio dalla sorgente al piano focale, è minimo. Il principio di Fermat può essere esteso
ad un sistema ottico più generale, e nella sua forma moderna asserisce che: La traiettoria vera
seguita da un raggio luminoso è quella per cui il tempo, necessario per andare da un punto
fisso A ad un altro punto fisso B, è stazionario rispetto a piccole variazioni dal percorso vero.
In altre parole il tempo necessario per andare da un punto A ad un altro B non differisce più di
un infinitesimo del secondo ordine dal tempo necessario per andare da A a B lungo un altro
percorso molto prossimo al percorso vero. Quindi in prima approssimazione il tempo per il
percorso vero è uguale a quello per un raggio adiacente al percorso vero.
Il caso più semplice per illustrare il principio di Fermat è mostrato in Fig. 1.1. Una superficie Σ
separa due punti P0 e P1.
n’
n
(x,y) P1
Σ
P0
Fig. 1.1 Un possibile cammino ottico tra due mezzi di indice di rifrazione diversi separati dalla superficie Σ.
Le linee piene rappresentano la traiettoria vera, quelle tratteggiate una ad essa adiacente.Il
tempo per andare da P0 a P1
è sia verificata la condizione di stazionarietà per il
percorso vero, deve essere:
∂τ / ∂x = ∂τ / ∂y = 0 (1.1)
dove x,y sono le coordinate generiche dove il raggio incontra la superficie. In modo
equivalente si può rimpiazzare la frase tempo di viaggio della luce con cammino ottico della
luce. Se dt è un tempo infinitesimo allora cdt è il corrispondente cammino ottico. Il cammino
ottico (OPL) è definito perciò dalla relazione:
d(OPL)=cdt=(c/v)vdt=nds (1.2)
OPL= c ∫ dt = ∫ nds
enunciare il principio di Fermat è perciò
dove v è la velocità della luce nel mezzo di indice di rifrazione n. Il modo generico di
OPL)=0, dove n può essere una funzione di
tutte le coordinate che specificano la posizione.
Consideriamo ora il caso bidimensionale (2D) dove n=n(y,z) e ds= dy 2 + dz 2 . Posto
y’=dy/dz il principio di Fermat si scrive:
P1
δ ∫ n( y , z ) (1 + y '2 )dz = 0 (1.3)
P0
dove ds è stato rimpiazzato da dz (1 + y '2 ) . Assumendo F(y,y’,z) sia l’integrando della (1.3) si
ha:
P1 P1
δ ∫ F ( y, y ', z )dz = ∫ δ F ( y , y ', z )dz = 0 (1.4)
P0 P0
dove
∂F ∂F ∂F ∂F d
δF = δ y+ δ y'= δy+ (δ y ) .
∂y ∂y ' ∂y ∂y ' dz
!"#%$ '& () *+-, )., ) & $/ $+& & $ 0
∂F ∂F d ∂F
∫ −∫
P1 P1
δ ydz + δy P1
δ ydz = 0 (1.5)
∂y ∂y dz ∂y '
P0
P0 P0
1
Il secondo termine nella (1.5) è zero poiché y è nullo agli estremi. Possiamo perciò riscrivere:
∂F d ∂F
∫
P1
− ⋅ δ ydz = 0 (1.6)
∂y dz ∂y '
P0
dy dy y'
tan α = = y' sin α = =
dz ds (1 + y '2 ) (1.9)
dz 1 d dα
cos α = = sin α = cos α
ds (1 + y '2 ) dz dz
7
Per cui possiamo riscrivere la (1.8) come:
∂n ∂n dα
cos α − sin α − n cos α =0 (1.10)
∂y ∂z dz
dα dα dz dα
κ= = = cos α
ds dz ds dz
dα ∂n ∂n
nκ = n cos α = cos α − sin α (1.11)
dz ∂y ∂z
Il principio di Fermat può essere usato per derivare la legge di Snell della riflessione e
rifrazione di un raggio luminoso che attraversa una superficie piana di separazione tra due
mezzi di indice di rifrazione n ed n’. Esaminando la Fig. 1.2 si vede che il cammino ottico è
stazionario se vale la relazione:
y P2
P0
P1 z
Fig.1.2 Un raggio attraversa una superficie piana che divide due mezzi di diverso indice di rifrazione.
8
δ n ∫ ds + n ' ∫ ds = 0
P0 P2
P1 P0
{
δ n z12 + y02 + n ' z 22 + ( y2 − y0 )
2
}= 0 (1.12)
d z22 + ( y2 − y0 )2 δ y0 = 0
n (z
2
1 + y02 ) + n '
d
dy0 dy0
y0 y2 − y0
n − n' =0 (1.13)
(z 2
1 + y02 ) z22 + ( y2 − y0 )2
da cui si vede che i due termini che moltiplicano n ed n’ sono rispettivamente sin(i) e sin(i’) e
quindi la (1.13) è proprio la legge di Snell della rifrazione n sin(i)=n’ sin(i’). Per ottenere la
legge della riflessione basta allora porre n’= e si ottiene i’= . Si lascia allo studente
provare che la (1.13) è effettivamente una condizione di minimo.
La superficie sferica di Fig. 1.3 separa due mezzi omogenei di indice di rifrazione n ed n’. B e
B’ sono due punti coniugati, C è il centro di curvatura della superficie sferica.
Z
B s C B’
s’
Fig. 1.3 La rifrazione su una superficie sferica. Nel disegno si suppone di usare solo i raggi parassiali in modo da
poter confondere la linea retta con la linea curva che rappresenta la superficie sferica.
Rispettando la convenzione sui segni data dalle frecce il cammino ottico è L= n’
Usando la legge del coseno possiamo scrivere:
9
= − R 2 + ( R − s ) − 2 R ( R − s ) cos φ
2
dL
dφ
=−
nR( R − s ) sin φ n ' R(s '− R) sin φ
−
'
=0 (1.14)
che nel limite parassiale in cui à immediatamente la nota relazione del diottro
sferico.
Come altro esempio dell’uso del principio di Fermat vogliamo ora trovare la lunghezza focale
di una lente sottile di indice di rifrazione n, con raggi di curvatura R1 ed R2. Ogni raggio che
connette due punti coniugati deve soddisfare al principio di Fermat, in altre parole il cammino
ottico OPL, dovendo essere lo stesso per tutti i raggi che connettono due punti coniugati, non è
né un minimo né un massimo. Osservando la Fig. 1.4 scriviamo l’espressione del cammino
ottico per il tragitto del raggio lungo l’asse ottico e lungo un raggio parassiale a distanza y
dall’asse ottico:
!#" $
L0=[BO1]+n[O1O2]+f’
Lp=[BO1]+z1+n[P1P2] 2+
P1
P2
$
O1 O2
f’
Z
Fig. 1.4 Una lente sottile è attraversata da due raggi, lungo l’asse ottico e a distanza y da questo, provenienti da un
punto B a distanza infinita. La lente sottile è rappresentata da due piani essendo in gioco solo grandezze parassiali.
dove z2<0 e z1>0 (per la convenzione sui segni) danno le distanze tra l’asse y1 e y2 e la
superficie reale della lente. Posto L0=Lp si ha:
nd + f ' = z1 + n d( − z1 + z2 −) z2 + % (1.15)
10
in cui abbiamo sostituito d=[O1O2] e d 1+z2=[P1P2]. Da questa svolgendo le operazioni si
ottiene:
− f ' = (n − 1)( z1 − z 2 ) (1.16)
dove y1=y2=y per una lente sottile nell’approssimazione parassiale. In questa approssimazione
si ha pure che z1=y2/2R1 e z2= y2/2R2. Dalla Fig. 1.4 si vede inoltre che 2=y2+f’2= f’2(1+y2/
f’2), facendone la radice e l’espansione binomiale si ha f’= y2/2 f’. Sostituendo nella (1.16) le
espressioni per z1, z2 ed f’ si ottiene infine:
1 1 1
= (n − 1) − (1.17)
f' R1 R2
che è la ben nota relazione dei fabbricatori di lenti. In modo simile si può ricavare s ed s’ in
funzione di f’, esercizio che lasciamo allo studente.
Le applicazioni del principio di Fermat viste fino ad ora si applicano al dominio dei raggi
parassiali ed hanno a che fare solo con superfici sferiche. Vediamo ora invece delle
applicazioni che usano superfici riflettenti di forma differente e non hanno la limitazione
imposta prima sull’apertura del fascio luminoso.
y
&
11
Dalla geometria della figura si vede che: 2
= y 2 + ( f − ∆)2 . Eliminando si ottiene
y 2 = 4 f ∆ che in termini di z diviene:
y 2 = −4 f ⋅ z (1.18)
che è l’equazione di un parabola con vertice in (0,0). Il paraboloide si ottiene facendo ruotare la
parabola attorno all’asse z. Sostituendo R ad f usando l’approssimazione parassiale f=2R si ha:
y 2 = 2R ⋅ z
dove R è il raggio di curvatura della superficie nel suo vertice e sia R che z hanno segno
negativo in figura.
Se in Fig. 1.5 si pensa all’oggetto in un punto B distante s dal vertice, la sua immagine cade in
un punto B’ distante s’ dal vertice. Allora dette
incide a distanza y dall’asse ottico, si ha applicando il principio di Fermat:
+ ' = − s( + s ' )
Essendo quindi:
2
= y 2 + (−s − ∆ )2 '2 = y 2 + −(s −' ∆ 2
)
che è l’equazione di un’ellisse con centro (0,a) ed a,b semiassi maggiore e minore
rispettivamente. Posto infatti 2a=s+s’ e b2=ss’ la (1.19) prende la forma canonica:
( z − a )2 y 2
+ 2 =1
a2 b
Il teorema di Fermat porta quindi a concludere che è l’ellissoide la curva più appropriata per i
punti coniugati. Si noti che la sfera ne rappresenta il caso particolare in cui s=s’ e a=b. Si noti
inoltre che la parabola è pure un caso speciale della (1.19) per s=%'&( ) * f.
Nella Fig. 1.6 è mostrato uno specchio convesso con un oggetto virtuale in B e la sua
immagine in B’ sull’asse ottico z. Assumendo la convenzione sui segni appropriata (lo studente
verifichi quale deve essere) si ha applicando il principio di Fermat che:
++ + ' = s2 '
12
d 2 = y 2 + (− s + ∆) 2 + d = s '− s '2 = y 2 + ( s '+ ∆) 2
,
-
B B’
S S’
Fig. 1.6 Lo specchio convesso con due punti coniugati a distanza finita.
Eliminando
ss ' ss '
y 2 − 4z + 4z2 =0 (1.20)
s+s' (s + s ')2
che è identica alla(1.19), con una importante differenza sul segno di s ed s’ (lo studente dica
quale). E’ facile vedere che questa è l’equazione di un iperbole dove b2="! ! #$%& '"! ("! # )
Ognuna delle curve studiate prima è una sezione conica. E’ quindi possibile ricavare una
singola equazione da cui derivare tutti i casi particolari studiati. Partiamo dall’equazione dei
punti coniugati che può scriversi:
ss ' R
=
s + s' 2
4 ss ' ( s − s ') 2
1− e = 2
e =
2
( s + s ')2 ( s + s ')2
y 2 − 2 Rz + (1 − e 2 ) z 2 = 0 (1.21)
13
che descrive tutta la famiglia delle coniche precedenti se si sceglie e opportunamente. Posto
K= e2 le varie sezioni coniche si ottengono ponendo:
Nella discussione sulle aberrazioni che segue useremo K per descrivere tutte le sezioni coniche.
Ricordando la definizione di ingrandimento m=
(m + 1)2
K2 = −
(m − 1) 2
r 2 − 2 Rz + (1 + K ) z 2 = 0 (1.22)
dove r 2 = x 2 + y 2 .
A questo punto è utile calcolare il raggio locale di curvatura Rlc in un punto (r,z) della
superficie dello specchio. La relazione per il raggio di curvatura è:
3/ 2 3/ 2
Rlc = r 1 − K (r 2 / R 2 ) = R 1 − K (ε 2 /16 F 2 ) (1.23)
14
2 CAPITOLO 2
Cominciamo con il calcolare la lunghezza focale di uno specchio concavo, o più precisamente,
la distanza dal vertice dello specchio dove un raggio riflesso incontra l’asse ottico. La Fig. 2.1
mostra un fascio di raggi paralleli incidenti uno specchio concavo ad un altezza r dall’asse
ottico. Contrariamente alle normali convenzioni facciamo viaggiare la luce da destra a sinistra.
Con questa
scelta
le
distanze
misurate
adestra
! del vertice dello specchio sono positive.
r > 0. Dalla geometria della figura si vede che
f = z + z0 , dove
"
Z0 Z
Fig. 2.1 Un raggio incidente parallelo all’asse ottico incide sullo specchio concavo e ne viene riflesso.
r r (1 − tan 2 ϕ )
z0 = = (2.1)
tan 2ϕ 2 tan ϕ
15
Notiamo che tan ϕ = dz / dr e usando la (1.22) del capitolo precedente si ha:
dz r
= = tan ϕ
dr R − (1 + K ) z
R (1 − K ) z r2
f = + − (2.2)
2 2 2( R − (1 + K ) z )
Per eliminare z dalla (2.2) ricaviamo z dalla (1.21) ed espandiamo in serie di potenze
ottenendo:
r2 r4 r6
z= + (1 + K ) 3 + (1 + K )2 + ... (2.3)
2R 8R 16 R5
da cui si vede subito che f = R / 2 per K = −1 , cioè per un paraboloide. Per una sfera o un
ellissoide con K > −1 è f < R / 2 , mentre per un iperboloide è f > R / 2 . La f è costante per
ogni r solo per il paraboloide quando l’oggetto è all’infinito. Per ogni altra conica la variazione
della distanza focale f in funzione di r è:
(1 + K )r 2 (1 + K )(3 + K ) r 4
∆f = f (r ) − f (paraxial) = − − − ... (2.5)
4R 16 R3
Perciò per ogni superficie coniche che non sia un paraboloide l’immagine di un oggetto
all’infinito sarà aberrata. f è indipendente dal segno di r per cui il degrado dell’immagine sarà
simmetrico rispetto all’asse z. Il segno di R invece cambia il segno di f.
LS
A
TS
f A Z
R/2
16
L’aberrazione sferica longitudinale è invece la distanza tra il fuoco reale ed il fuoco parassiale,
cioè f. Osserviamo che:
TSA r
=
LSA ( f − z)
dove sia TSA che LSA sono negative. Usando le relazioni precedenti ed applicando
l’espansione binomiale mantenendo tutti i termini fino al V° ordine, lo studente può verificare
che:
r3 r5
TSA = −(1 + K ) − 3(1 + K )(3 + K ) + ... (2.6)
2R2 8R 4
Il primo termine è detto (TSA3) il secondo (TSA5). Per K = 0 (superficie sferica) entrambi i
termini sono negativi per r > 0 e positivi per r < 0. Il segno di TSA per un iperboloide è
opposto a quello di una sfera o un ellissoide. Si noti inoltre che il segno di TSA è indipendente
dal segno di R. Il rapporto tra i due termini è:
dove F è il rapporto focale ( F = f / D ). Per una sfera TSA5 è il 10% di TSA3 quando F=1.19.
Ciò è sufficiente per trascurare TSA5 per tutti gli specchi sferici eccettuati quelli troppo rapidi
(F piccoli).
Osservando l’eq. (2.3) vediamo che la differenza tra la superficie del paraboloide (non
aberrata) e quella di una generica superficie di costante conica K è, fermandoci al termine in r4,
data da:
r4
∆z = z p − z ( K ) = −(1 + K ) 3 (2.7)
8R
dove p indica il paraboloide. La differenza di cammino ottico tra due raggi che incidono
e
su
rispettivamente su un paraboloide
una
generica
superficie
alla
medesima
altezza
r, è
approssimativamente 2 e di
2(ϕ p − ϕ ) dove ϕ = dz / dr e ϕ p = dz p / dr in approssimazione parassiale. Lo studente può
verificare dalla (2.3) che:
d r3
2(ϕ p − ϕ ) = (2∆z ) = − (1 + K ) 3
dr R
r3
TSA3 = ( R / 2) / ASA3 = − (1 + K ) (2.8)
2R2
p non sia troppo grande.
17
Lo studente esamini quali sono le approssimazioni fatte affinché sia valida la (2.8).
ad
Le procedure seguite per ottenere la (2.8) possono essere generalizzate ogni
coppia
di
oggetti ed immagini coniugati. Tutto ciò di cui si ha bisogno è
la superficie senza aberrazione e quella affetta dall’aberrazione, mantenendo l’approssimazione
parassiale. Si ha che:
d d
ASA3 = (2∆z ) TSA3 = s ' ∆z )
(2 (2.9)
dr dr
Non si dimentichi che qui stiamo considerando il caso in cui n=1 (lo specchio è in aria).
L’importanza della (2.9) sta nella sua utilità quando è applicata a sistemi ottici più complessi
con più di una superficie riflettente.
2.1.3 Un esempio
Consideriamo un punto oggetto a distanza finita da uno specchio ellissoidale che produce come
abbiamo visto un’immagine stigmatica del punto. Se si usa uno specchio sferico anziché
ellissoidalesi
presentano
le aberrazioni.
Seguendo
la
procedura
!
descritta
prima troviamo la
differenza (2.3) abbiamo:
∆z = ze − z s = K e r 4 / 8 R3
dove −1 < K e < 0 per punti coniugati reali. Esprimendo il tutto in funzione dell’ingrandimento
m = − s ' s/ e ricordando le relazioni dei punti coniugati lo studente può verificare che le (2.10)
possono riscriversi nella forma:
m +1 r
3 2
ASA3 = − 3
m −1 R (2.11)
(m + 1)2 r 3
TSA3 = +
m − 1 2R2
Si noti che m<0 per coniugati reali, quindi TSA per uno specchio sferico ha sempre lo stesso
segno per un dato r, indipendentemente dal segno di R. Questo è tale che il fuoco dei raggi
marginali riflessi dallo specchio è sempre più vicino%al
del fuoco parassiale. Si noti
vertice
infine che l’aberrazione sferica è zero quando m="$# è s=s’ e la sfera è la superficie
perfetta in accordo con il principio di Fermat.
Abbiamo visto che TSA è una misura delle dimensioni dell’immagine di un punto oggetto nel
fuoco parassiale. La caustica di aberrazione è tale che la minima dimensione dell’immagine si
ha nel circolo di minor confusione tra il fuoco parassiale e il fuoco marginale. Si può vedere
che le dimensioni dell’immagine nel circolo di minor confusione sono circa 4 volte inferiori a
18
TSA3. Esso si colloca ad una distanza z’=0.75z’(marginale). Le sezioni perpendicolari all’asse
ottico ove convergono i raggi provenienti da diverse r, sono dette “spot diagrams”. Dalla nostra
discussione emerge che il diametro del circolo di minor confusione è r 3 / 4 R2 quando
l’oggetto è all’infinito. L’angolo sotteso da questo spot allo specchio è quindi:
α = r 3 / 2 R 3 = 1/128 F 3 (2.12)
"!!# $ % &' # $ ((# )&(*)&,+)&' -.# &. )# # /
diametro dell’immagine non decresce più essendo raggiunto il limite imposto dalla diffrazione.
Il più piccolo F per cui uno specchio sferico raggiunge il limite di diffrazione θ ≈ λ / D si
# $ !$0 ()$ (/ # $ &-212$ 3 465798 :;
D ≈ 128λ F 3 . Come esempio diciamo che nel visibile F<>==
per D=10 cm e F< ?@BAC D,E*F=9G.H>IJC D K L M to a dispetto dell’aberrazione sferica uno specchio
sferico in luce collimata è effettivamente limitato dalla diffrazione se il rapporto focale è
N D L MOCL PPL Q K L MR LHSUT9Q K VOC MK C*WC D X Y X Z [XZ [C*D X Q T\ WC MOT.AC D ].^_ ` ` _ D ≈ 128λ F 3 e sostituendo il
risultato nella (2.7) e ponendo K=0, la differenza aUbc d _ef.g_ d _ hi` ij ^kkefi0l gk m m nj i0l o k d j m i
limitato dalla diffrazione è approssimativamente ] p qr6s"tu vwuUx y.wu z z { | { v} y di cammino ottico è
~ p rJ"x { | vy u y { v {.
u y wu | { {.u xUz | v {w vwy{ { | { v {wy.tv
{ u z { | u
non è più sferico ma differisce da quello emergente da un paraboloide per p ,y u tu| wu r
La discussione svolta fino ad ora ha riguardato la determinazione di TSA per oggetti a distanza
infinita. Vogliamo ora completare il quadro considerando il caso più generale. Consideriamo la
Fig. 2.3.
S’ Z
1.1.1 S
r r dz r
tan α = tan β = tan ϕ = =
s−z s '− z dr R − (1 + K ) z
19
s '− z =
r
=r
[1 + tan ϕ (2 tan α − tan ϕ )] (2.13)
tan(2ϕ − α ) 2 tan ϕ − tan α (1 − tan 2 ϕ )
Espandendo le funzioni tangente in serie di potenze di r/R e sostituendo per z nella (2.3) dopo
numerosi passi algebrici (lo studente provi) si ottiene:
r2 m +1
2
r2
LSA = ∆s ' = s '− s '0 = − (m − 1) K + × 1 + 2 [K + 3 + 2m( K + 1)]
2
(2.14)
4R m − 1 4 R
r m + 1 3 r m + 3
3 2 2
Quando il punto oggetto non si trova sull’asse ottico compaiono le aberrazioni fuori asse.
Adesso ne vediamo solo una rappresentazione qualitativa, rimandando una più approfondita
analisi al capitolo successivo. Osserviamo la Fig. 2.4. Un paraboloide è investito da un fascio
Z’
f
B b
B’ Z
O’
20
ed usiamo la (2.9) per trovare le aberrazioni al terz’ordine. Omettendo i dettagli di questi
calcoli si trova:
y 2θ yθ 2
AA3 = 3a1 2 + 2a2 + a3θ 3 (2.16)
R R
dove AA3 è l’aberrazione angolare al terz’ordine. I diversi termini nella (2.16) rappresentano
le diverse aberrazioni presenti:
la prima
è
il
Coma,
la
seconda
l’Astigmatismo
"!# $ % &'$ ( ) e* + la
* terza
$'$ # #la$
Distorsione
aberrazioni non deve essere limitata ovviamente al solo piano yz.
2 , $.-
/* '
*0 & "1
* &
Facciamo comunque alcune
( $ 2-
/& ' , & "1
* &3( $ 243& osservazioni. Il coma è proporzionale a y
, $" & "1
* &3( $ 2. 656$ ( ( $ 'è4invariante
!) !) + * rispetto
& # $&75 ad y. L’astigmatismo invece è invariante
, 2 . Infine la distorsione non dipende dal
fuori asse, perciò questa aberrazione non affetta la qualità dell’immagine, solo la sua posizione.
L’ultima aberrazione che non compare nella (2.16) per la particolare trasformazione di
coordinate che abbiamo fatto è la Curvatura di campo.
Fino ad ora ci limitiamo a dire che nell’ambito dell’approssimazione al terz’ordine si possono
identificare 5 aberrazioni monocromatiche che sono: l’aberrazione sferica, coma, astigmatismo,
curvatura di campo e distorsione. Le prime tre affettano la qualità dell’immagine, le ultime due
solo la posizione.
In generale possiamo notare che:
aberrazione trasversa ∝ y nθ m
dove n+m=3.
Nel prossimo capitolo faremo una trattazione più rigorosa delle varie aberrazioni, ma prima
accenniamo al problema della compensazione delle aberrazioni per ridurre gli effetti di queste
sulle nostre immagini.
Abbiamo visto che un sistema ottico perfetto è tale che il fronte d’onda emergente da esso è
sferico. C’è pertanto un forte legame tra la presenza delle aberrazioni e le deviazioni dal fronte
d’onda sferico. Lungo ogni raggio il fronte d’onda reale può essere davanti o dietro al fronte
d’onda perfetto a seconda che esso sia ritardato o avanzato.
Da ciò sembra che introducendo opportunamente nuove superfici riflettenti o lenti sia possibile
ritrasformare il fronte d’onda per farlo diventare il più sferico possibile. Ovviamente ad un
avanzamento del fronte d’onda deve corrispondere un ritardo che dovrà essere introdotto e
viceversa. Nelle due prossime sezioni esamineremo due configurazioni importanti per i
telescopi astronomici: la montatura Cassegrain e Schmidt.
(m + 1) 2
K1 = −1 K 2 = −
(m − 1)2
21
dove m è l’ingrandimento del secondario.
y
d
y1
z
y2
D
S2
f1
f1
A.
y
d
y1
z
y2
D
S2
f1
B.
E’ molto utile descrivere ogni sistema ottico a due specchi per mezzo di un insieme di
parametri adimensionali, definito in Tab. 2.1.
22
Tra questi parametri esistono le seguenti utili relazioni che lo studente può provare a ricavarsi
usando la legge dei punti coniugati per gli specchi, la definizione di ingrandimento trasversale,
e la relazione s2 = kR1 / 2 :
ρ mk ρ (m − 1)
m= ρ= k= (2.17)
ρ −k m −1 m
e anche le:
1 + β = k ( m + 1) η = F1 β (2.18)
naturalmente queste si applicano se l’oggetto è all’infinito, come accade nel caso dei telescopi
astronomici.
m le relazioni precedenti consentono di ricavare k
esempio m "!# $% & & '( % k)"*+ ,-". /"01 23465 2=7989: 8;:<=> > ?6@ ?BA C? D E F E D G?H? @> ? @ ? A D ICE IA IJI
infine determinate scegliendo il diametro del primario e la sua lunghezza focale.
Ora vedremo che la configurazione Cassegrain classica può essere cambiata in una differente
cambiando le costanti coniche di entrambi gli specchi. Questo si può fare mantenendo
l’aberrazione sferica al terz’ordine (SA3) uguale a zero, quindi un cambio di K1 deve essere
accompagnato da una variazione di K2 tale che il fronte d’onda avanzato da uno specchio sia
ritardato dall’altro (al terz’ordine di approssimazione). Nei termini del teorema di Fermat
l’OPL dall’oggetto all’immagine lungo un qualsiasi raggio non cambia. Se ad esempio la
superficie del primario viene maggiormente curvata in Fig. 2.5 essa produce un avanzamento
del fronte d’onda che deve essere compensato da un ritardo introdotto dal secondario.
L’avanzamento e il ritardo sono 2KML 1 e 2KML 2. Partendo dall’eq. (2.3) ognuna delle superfici ha i
seguenti z:
y12
z1 (originale) =
2 R1
y12 y14
z1 (nuovo) = + (1 + K1 ) 3
2 R1 8R1
y22 m + 1 y24
2
z2 (originale) = + 1 −
2 R2 m − 1 8R23
y2 y4
z2 (nuovo) = 2 + (1 + K 2 ) 2 3
2 R2 8 R2
Pertanto:
y14
2∆z1 = (1 + K1 )
4 R13
(2.19)
m + 1 y2
2 4
2∆z2 = K 2 + 3
m − 1 4 R2
23
y24 R13 m +1 k m +1
2 4 2
K1 + 1 = 4 3 K 2 + = 3 K2 + . (2.20)
y1 R2 m − 1 ρ m − 1
Ad esempio scegliendo K2=0 si ha che K1=
ellissoidale ed un secondario sferico è detta Dall-Kirkham. Un'altra possibile combinazione è
con K1= ! "#$&% 2=')()* ++,-/. 01 è detta Ritchey-Chretien. Le soluzioni della (2.20) danno la
famiglia dei telescopi Cassegrain per i quali SA3=0 per un punto all’infinito. Per un dato
insieme di k, m2 14351 6 7 6 8 19:; 7 :< 7 :7 8 =4. >?@7 := A 7 >:14B7C= D >E 7FB7G 1 e K2 che soddisfano la
(2.20). Nella pratica la scelta di K1 e K2 dipende da altre considerazioni, come l’effetto delle
aberrazioni fuori asse e la facilità con cui lo specchio può essere costruito e testato. Nel caso ad
esempio della configurazione Dall-Kirkham gli specchi separati possono essere facilmente
testati ma la configurazione possiede una forte Coma fuori asse e quindi il campo utile risulta
molto piccolo. Viceversa la configurazione Ritchey-Chretien ha Coma nulla ma gli specchi
iperbolici sono difficili da costruire e da testare.
Una camera Schmidt è composta da tre elementi: uno specchio sferico concavo, un diaframma
di apertura posto nel centro di curvatura dello specchio, e una superficie rifrangente
opportunamente modellata per ridurre l’aberrazione sferica (vedi Fig. 2.6).
diaframma
R
Per il momento ignoriamo la presenza della lastra correttrice. Piazzando il diaframma nel
centro di curvatura dello specchio sferico il sistema diviene effettivamente “axis free”, cioè
ogni raggio luminoso entrante nel sistema è equivalente all’asse ottico principale. Questa
caratteristica è vera solo per lo specchio sferico. Pertanto in questo modo si sono eliminate tutte
le aberrazioni fuori asse, eccetto la curvatura di campo che però sappiamo non altera la forma
dell’immagine. Questo sistema è l’ideale per i telescopi a grande campo. La lastra correttrice
ha quindi lo scopo di correggere la rimanente aberrazione sferica. Per trovare la quantità H A. 01
esprime la compensazione tra il fronte d’onda sferico e quello di riferimento di un paraboloide
che è libero dall’aberrazione sferica, posto K=0 nella (2.7) si ha:
2∆z = − r 4 / 4 R3 (2.21)
24
Consideriamo ora una lastra di vetro piana di spessore t e indice di rifrazione n. Ad ogni altezza
y rimuoviamo da una parte della lastra uno spessore di vetro
cammino ottico per ogni raggio parallelo all’asse z sia (n !
à quindi avere:
η 4 r04 f η4
τ= = (2.23)
32(n − 1) f 3 512(n − 1) F 4
Questa equazione ci dice qual’ è lo spessore di vetro che occorre rimuovere per eliminare
l’aberrazione sferica. Dal punto di vista del principio di Fermat non fa differenza com’è
orientata la lastra correttrice. Inoltre questo ragionamento si applica allo stesso modo al caso in
cui l’oggetto non sia all’infinito e quindi che la superficie di riferimento per eliminare
l’aberrazione sferica sia l’ellissoide e non più il paraboloide. La procedura da seguire sarà la
stessa.
Con questo tipo di correzione i raggi parassiali restano essenzialmente invariati, mentre i raggi
marginali vengono deviati in modo che incidendo in un punto diverso dello specchio il loro
punto di fuoco viene a coincidere con quello parassiale. Il problema di questo tipo di correttore
è che introduce una forte aberrazione cromatica. La forma della lastra correttrice è infatti
assimilabile a due prismi uniti per la punta. Se si fa in modo invece di far convergere i raggi
parassiali e marginali nel circolo di minor confusione la lastra correttrice ha una forma
differente, ma il problema dell’aberrazione cromatica è fortemente ridotto.
La superficie di riferimento per far convergere tutti i raggi in un punto è sempre un paraboloide
il cui fuoco deve trovarsi nel circolo di minor confusione. Questo ha quindi un raggio di
curvatura diverso da quello usato precedentemente nella (2.21). Si può dimostrare che con
questo tipo di accorgimento lo spessore di vetro da eliminare è del tipo:
3r02 r 2 r4 fη4 3
τ= − = 4
1− 2 (2.24)
8( n − 1) R 4( n − 1) R
3 3
512( n − 1) F 2η
Rispetto alla precedente lastra correttrice questa è più spessa al centro e più sottile ai bordi. I
raggi che subiscono la deviazione massima sono quelli per cui dτ / dr è massima, il che si
verifica per η = 0.5 e η = 1 .
Calcoliamo infine l’aberrazione cromatica sferica trasversale. Il risultato è:
d dτ f η 3δ n 3
TSA3 = f (τδ n) = f δ n = 3
1− 2 (2.25)
dr dr 64(n − 1) F 4η
Sostituendo η = 0.5 e η = 1 si trova il valore di TSA3 per i raggi che subiscono la massima
deviazione. Il risultato in termini assoluti è:
f δn
TSA3 = (2.26)
256 F n − 1
3
25
che è effettivamente il raggio dell’immagine cromatica.
Questa formulazione è corretta al quart’ordine in termini di r con luce collimata. Ad esempio il
termine SA5 è significativo per camere di piccolo rapporto focale.
Il risultato è un grande campo corretto per le principali aberrazioni con il solo limite imposto
dall’aberrazione cromatica. Si deve notare per precisione che la lastra correttrice ha un asse
ottico e quindi a rigore il sistema non è più “axis free” e quindi compaiono le aberrazioni fuori
asse. Tuttavia esse sono molto ridotte perché la lastra correttrice è molto sottile e può essere
assimilata ad una superficie a piani paralleli.
26
3 CAPITOLO 3
In questo capitolo vedremo l’applicazione del principio di Fermat ad una generica superficie di
rivoluzione e la derivazione delle aberrazioni. L’applicazione qui riportata è particolarmente
utile per i sistemi ottici di interesse per gli astronomi, quali i telescopi, le camere e gli
spettrografi.
Un disegno di una generica superficie di rivoluzione è visibile in Fig. 3.1. L’origine delle
coordinate è nel vertice della superficie di rivoluzione. Il mezzo ha indice di rifrazione n a
sinistra ed n’ a destra.
Y
B(x,y,
n z) n’
Q’
Z0
s’
h’
h
s Z
Z0’
Q
Fig. 3.1 Cammino ottico di un generico raggio attraverso una superficie rifrangente. I punti Q e Q’ sono nel piano
yz. Il punto B è sulla superficie. Il “raggio principale” (chief ray) passa per l’origine del sistema di coordinate.
r2 r4 br 4
z= + (1 + K ) 3 +
2R 8R 8(n '− n )
(3.1)
r 2 r 4 1 + K b r2 α r4
= + 3 + = +
2R 8 R n '− n R
2 8
à in parentesi e r 2 = x 2 + y 2 . Il termine con b include
esplicitamente un termine asferico del tipo usato nel capitolo precedente per trattare la lastra
correttrice. La forma di questo termine è stata scelta per semplificare le relazioni seguenti.
Applicando il principio di Fermat alla Fig. 3.1 si ha:
24
e dalla geometria del sistema si vede che:
[QB ] = ( y − h) 2 + ( z0 − z ) 2 + x 2
1/ 2
(3.3)
[ BQ '] = ( y − h ')2 + ( z0 − z )2 + x 2
1/ 2
Non essendoci nessun diaframma di apertura il raggio tratteggiato che passa per il vertice della
superficie e per i punti Q e Q’ è il chief ray. Esso forma un angolo
lungo il chief ray è − ns + n ' s ' , dove s è negativo ed s’ positivo per la convenzione sui segni.
Per le altre quantità diciamo che !
0’ sono positivi, h ed z0 sono negativi. Sappiamo
inoltre valere le seguenti relazioni:
1/ 2
2y r 2 1 cos θ r 1
4
[QB ] = − s 1 − sinθ + − + 4s 2 R 2 − α s cosθ .
s s s R
La relazione per [BQ’] è simile eccetto per la sostituzione di s’ con s. Usando#" $ %&'
l’espansione binomiale del tipo (1+x)p con p=1/2 e mantenendo solo i termini del quart’ordine
si ha (lo studente provi a fare i conti):
− 2 − − − − '
8 R s R ss R n − n
Una relazione simile si trova per [BQ’] (tenendo opportunamente conto dei segni). Sostituendo
nella (3.2) si trova il cammino ottico di un generico raggio (vedi eq. (3.6)). Sebbene sembri
complessa in apparenza il principio di Fermat permette di semplificare le cose notevolmente.
Per prima cosa notiamo che le prime due parentesi riguardano il chief ray. Poiché il principio
di Fermat ci dice che il cammino ottico deve essere minimo, è opportuno rimuovere dalla (3.6)
il cammino ottico del chief ray definendo una quantità ( ) * +,.- /021 3 3 , 4 , 526 / 7
Φ = OPL-OPL(chief-ray)
(3.5)
=A0 y + A1 y 2 + A '1 x 2 + A2 y 3 + A '2 x 2 y + A3r 4
25
OPL = (− ns + n ' s ') − y (n 'sin θ '− n sin θ )
y 2 n 'cos 2 θ ' n cos 2 θ n 'cos θ '− n cos θ
+ − −
2 s' s R
x n ' n n 'cos θ '− n cos θ
2
+ − −
2 s' s R
x 2 y n sin θ 1 cos θ n 'sin θ ' 1 cos θ '
− − − −
2 s s R s' s' R
y 3 n sin θ cos 2 θ cos θ n 'sin θ ' cos 2 θ ' cos θ '
− − − −
2 s s R s' s' R
r 4 1 n ' n (1 + K ) n 1 cos θ
2
∂ ∂Φ
(OPL) = =0
∂x ∂x
(3.7)
∂ ∂Φ
(OPL) = =0
∂y ∂y
L’eq. (3.7) è soddisfatta per x = y = 0 solo se A0 = 0 e quindi n 'sin θ ' = n sin θ , cioè se vale la
legge di Snell per il chief ray.
Diamo ora un’occhiata alla (3.6) per un’analisi rapida dei suoi termini. Consideriamo
dapprima i termini in x2 e y2. Se ci ricordiamo dell’approssimazione parassiale i termini in
parentesi con i coseni valgono 1 e ritroviamo le leggi del diottro sferico, per cui entrambi sono
nulli. In un secondo livello di approssimazione i termini in coseno sono rimpiazzati da
1 − ϕ 2 / 2 , dove è
x2 2 e y2 2. Perciò i termini A1y2 e A’1x2
rappresentano l’astigmatismo, come avevamo notato nel capitolo precedente. Nei termini in
x2y e y3 i coseni sono rimpiazzati da 1 e i seni dall’angolo, e i corrispondenti termini A2y3 e
A’2x2y rappresentano il Coma. L’ultimo termine A3 rappresenta l’aberrazione sferica.
Ritornando alla (3.6) osserviamo che i termini in x2 e y2 possono essere resi nulli
scegliendo opportunamente s’. Ad esempio il termine in y2 è nullo se:
n ' cos 2
θ ' n cos
2
θ n ' θcos
− n ' θ cos
− = (3.8)
s 't s R
θ − n'
n ' n n ' cos θcos
− = (3.9)
s 's s R
26
dove s’s è il luogo dell’immagine astigmatica sagittale. Quest’immagine è anch’essa un
segmento che giace nel piano definito dall’asse z e dal chief ray. In approssimazione parassiale
è s’t=s’s. La separazione tra le due immagini astigmatiche si ricava immediatamente dalle (3.8)
e (3.9) risolvendo rispetto a 1/s’t e 1/s’s e facendo la differenza:
∆s ' 2
tan θ ' n ' θcos n n 2 '
− n ' θ cos
= + 1 − 2
s 't s s ' n ' R s n
s t
2
dove l’espressione si riduce a:
∆s ' n 2θ 2 1 1
= − (3.10)
s'2
n ' n s ' ns'
Un sistema ottico che soddisfa l’eq. (3.7) per ogni (x,y) entro la propria apertura e che quindi
ha tutti i coefficienti della (3.6) nulli si dice essere un sistema perfetto. Se uno o più di questi
coefficienti è non nullo il sistema è affetto da aberrazioni. Non sorprendentemente le
dimensioni di una data aberrazione sono proporzionali ai coefficienti medesimi.
Occorre ricordare che l’analisi che stiamo facendo è limitata al calcolo delle aberrazioni al
terz’ordine e si limita a trovare le aberrazioni trasversali e angolari di cui si è parlato nei
capitoli precedenti. Questo significa che nella discussione dell’eq. (3.7) occorre conservare
! #"$ % & '" (")! *,+ -". ''*,/% ! ! %0$ % (1 %,/"2 r, x o y è non più grande di 4. Si vede quindi
che A3 è indipendente da 34 2 e A’2 5 676,89 6869 : ; 67< = ;<?> 3@A4 1 e A’1 sono proporzion< = ;<B> 2.
Facendo uso della legge di Snell e della relazione del diottro sferico possiamo semplificare i
termini dell’eq. (3.6):
2
1 K n 1 1 1
2
1
A3 = − 3 (n '− n +) b − − −
8R 8 s R n ' s ' ns (3.11)
n 2 1 1 1 1
A2 = A '2 = θ − −
2 s R n ' s ' ns
dove il primo termine in parentesi quadrata rappresenta il contributo della parte non sferica
della superficie. Si noti che in A2 e A’2 questo contributo è assente e quindi qualsiasi superficie
non sferica non contribuisce alle aberrazioni associate a questi coefficienti. Vedremo oltre che
questo è un caso particolare che non si verifica quando l’introduzione di un diaframma non fa
più coincidere la pupilla d’entrata del sistema con il vertice della superficie.
La valutazione dei rimanenti coefficienti A1 e A’1 dipende dalla distanza scelta per
l’immagine. Ad esempio scegliendo s’=s’s è A’1=0 ed il coefficiente A1 è (al secondo ordine in
>CD
27
n2 1 1
A1 = −θ 2 − (3.12)
2 n ' s ' ns
n2 1 1
A '1 = θ 2
− (3.13)
2 n ' s ' ns
e quindi A1=
1. In ogni caso i termini in K e b sono assenti, ma come prima ricompaiono se
la pupilla d’entrata del sistema non coincide con la superficie. Sesi
sceglie il punto a metà
strada tra l’immagine tangenziale e sagittale si trova che A1= 1 con ognuna delle due
immagini grandi metà. Questo è il punto detto circolo di minor confusione. A causa della
relazione tra A1 e A’1 non ha importanza quale s’ si sceglie per caratterizzare l’astigmatismo.
Un modo diretto per vedere che A1 è una misura diretta dell’astigmatismo si ottiene
confrontando le (3.12) e (3.10) da cui si ricava:
e da questa è semplice ricavare un’espressione per l’astigmatismo trasverso pari alla metà di
quello dell’immagine sagittale (abbreviato TAS):
dove TAS<0 per l’immagine sagittale quando y>0. Quindi nel circolo di minor confusione
l’immagine sarà un cerchio di diametro pari a TAS .
L’ultimo coefficiente di cui parlare è A0 che è:
Ponendo A0=0 si definisce il percorso del chief ray se non ci fosse l’aberrazione. Noi invece
vogliamo trovare la differenza tra la direzione del chief ray vero e quello non aberrato. Per
farlo occorre esprimere i seni e coseni in serie arrestandosi al terz’ordine. Dalla (3.4) abbiamo
che tan θ = h / z0 e tan θ ' = h '/ z '0 . Dall’espansione in serie ricaviamo:
h 1 3 h' 1 3
θ= − θ θ'= − θ' (3.17)
z0 3 z '0 3
Ora espandendo la (3.16) e sostituendo la (3.17) troviamo:
h h' θ3 n2 θ3 n2
A0 = n − n ' − n 1 − 2 = −n 1 − 2 (3.18)
z0 z '0 2 n' 2 n'
Si noti che A0=0 per n’= è per una superficie riflettente. Il coefficiente A0 è una misura
della distorsione. Con A0>0 si ha la distorsione a cuscino e con A0<0 quella a botte.
Il prossimo passo sarà quello di trovare la connessione tra le aberrazioni trasverse e
angolari con i coefficienti A come è stato fatto per A1. Questo si fa stabilendo una connessione
tra i termini non nulli della (3.6) e le deviazioni del fronte d’onda convergente nel punto
immagine dal fronte d’onda sferico prodotto da un sistema perfetto.
28
3.3 Aberrazioni del raggio e del fronte d’onda
Un sistema ottico libero da aberrazioni porta la luce da un punto oggetto Q, per il quale il
fronte d’onda è una sfera con centro in Q, in un punto (gaussiano) Q’ che è a sua volta centro
di un fronte d’onda sferico convergente in Q’, e il cammino ottico lungo un qualsiasi raggio
che
connette
i due punti è costante. Perciò
r. Per un sistema aberrato il fronte d’onda convergente in Q’ non è più sferico,
e dipende!"#"$ %& ' (!#")+* è avanzato o ritardato rispetto al fronte d’onda non aberrato (vedi
Fig. 3.2).
Y
Q’
O
Z
r
a
, - . /0 / 132 4 5 - 6 7 4
8 4 -9 : 6 7 ; -8< 6 7 8 =>8 -: - 9 4 : - ?4 7 ; 6 @
r ACB D A E E B F G>H a. Il raggio di curvatura del fronte d’onda di
riferimento è s’.
I JKLJM+NOJP KRQ S T U OS KRVXWQ U+Y Z KJP QW[ KJW\^]Q Z K _
è l’OPD tra ` r a ` a. La distanza geometrica
tra i due fronti d’onda è b c defCgihj j k l mh3j n o k pf o fq
Φ ( x, y )
∆= = [Σ r ( x , y ) − Σ a ( x , y ) ] (3.19)
n'
Quando rtsuv wx y z{| }~ z{~} y z è ritardato rispetto a quello non aberrato. Differenziando la
(3.19) si ha:
∂∆ 1 ∂Φ 1 ∂Σr ∂Σa
= = − (3.20)
∂y n ' ∂y n ' ∂y ∂y
e una simile relazione con x al posto di y. La quantità in parentesi nella (3.20) è la differenza
tra le pendenze dei due fronti d’onda in un piano parallelo al piano yz. Poiché i raggi sono
sempre perpendicolari ai fronti d’onda, questa è anche la differenza tra le pendenze dei raggi.
Data questa differenza di pendenza si ha un’aberrazione trasversa:
∂∆ s ' ∂Φ ∂∆ s ' ∂Φ
TA y = s ' = TA x = s ' = (3.21)
∂y n ' ∂y ∂x n ' ∂x
29
Ricordando la (3.7) si ottiene:
s'
TAy = A0 + 2 A1 y + A2 ( x 2 + 3 y 2 ) + 4 A3 yr 2
n' (3.22)
s'
TAx = 2 A '1 x + 2 A2 xy + 4 A3 xr 3
n'
che stabiliscono la connessione tra i coefficienti di aberrazione e le aberrazioni geometriche
trasverse. Ovviamente quelle angolari sono date semplicemente dalle:
E’ ora opportuno riassumere i risultati ottenuti fino ad ora presentando delle tabelle di
riferimento utili per i vari casi per le principali aberrazioni al terz’ordine. Le prime due tabelle
si riferiscono al caso generico di una superficie rifrangente e riflettente rispettivamente. Le
seconde due tabelle danno i risultati per le aberrazioni trasversali. E’ bene ripetere che i casi
discussi qui si riferiscono per ora alla specifica situazione in cui la pupilla d’entrata (e d’uscita)
del sistema è coincidente con la superficie.
1 21 1 1
2
1 K
A3 = − n − − + 3 (n '− n ) + b
8 s R n ' s ' ns R
n 2 1 1 1 1
A2 = θ − −
2 s R n ' s ' ns
n2 1 1
A1 = −θ 2
−
2 n ' s ' ns
n n2
A0 = θ 3 2 − 1
2 n'
n m +1 b
2
A3 = K + −
4 R3
m − 1 8
nθ m + 1
A2 = − 2
R m −1
nθ 2
A1 =
R
A0 = 0
30
In relazione alla Tab. 3.2 occorre specificare che valgono le seguenti relazioni per uno
specchio:
1 1 1 m +1 1 1 2
− = − =−
s R R m −1 n ' s ' ns nR
1 1 1 1 y3 s '
2
1 K
TSA = − n 2 − − + 3 (n '− n) + b
2 s R n ' s ' ns R n '
n 2 1 1 1 1 y 2θ s ' 1
TSC = − − = TTC
2 s R n ' s ' ns n ' 3
1 1 yθ 2 s ' s'
TAS = − n 2 − ; ∆s ' = − TAS
n ' s ' ns n ' y
n n2 θ 3s '
TDI = 2 − 1
2 n' n'
y3 m +1
2
by 3
TSA = − 3 K + s '+ s'
R m − 1 2n
y2 m + 1 1
TSC = 2 θ s ' = TTC
R m −1 3
2y
TAS = − θ 2 s '
R
TDI = 0
Ogni aberrazione è designata da due lettere: aberrazione sferica (SA), coma sagittale (SC),
coma tangenziale (TC), astigmatismo (AS), e distorsione (DI). Se l’aberrazione è trasversa un
suffisso T è messo prima, se è angolare si mette invece una A.
Con queste definizioni le espressioni per le aberrazioni trasverse sono:
Tutte le aberrazioni sono calcolate usando i raggi dell’asse y, per cui nel caso più generale
occorre sostituire ad y il raggio
della superficie di rivoluzione. Per quanto riguarda il segno
delle aberrazioni, quando
A3<0: i raggi marginali incontrano il chief ray tra la superficie ed il fuoco gaussiano;
A2>0: la coda della figura a cometa si allontana dall’asse z;
A1<0: l’immagine tangenziale è più vicina alla superficie di quella sagittale;
A0>0: la distorsione è a cuscino.
31
In molti casi pratici il segno delle aberrazioni non ha molta importanza e conta solo la sua
magnitudine. Nel nostro caso:
Questi risultati assumono che le aberrazioni siano singolarmente non nulle una per una, ma
questo ovviamente non accade mai completamente nella realtà.
Un’altra cosa da dire è che il verso di incidenza della luce sulla superficie non cambia nulla
sulle aberrazioni in quanto cambiano i segni delle varie quantità coinvolte, ma il risultato finale
resta invariato.
Esaminiamo i vari termini delle Tab. 3.1 e 3.2 per trovare esempi di superfici che hanno
specifiche caratteristiche di aberrazione.
Per una superficie sferica con b=0 i coefficienti di aberrazione A1, A2 e A3 sono pari a zero
quando n’s’ = ns. Per uno specchio n’ = n e quest’ultima condizione è soddisfatta per s’ = s.
=
è un piano. Questo è un risultato aspettato ma di nessuna utilità non
Ricordando la relazione per lo specchio sferico in approssimazione parassiale si deduce che R
Determiniamo ora i coefficienti di aberrazione al terz’ordine per una singola superficie quando
un diaframma è posto prima o dopo la superficie medesima, cosa che fa cambiare la posizione
della pupilla d’entrata e d’uscita del sistema. In Fig. 3.3 e 3.4 sono rappresentate le due
situazioni. In entrambe il nuovo chief ray è evidenziato con la linea continua rispetto al caso
precedente (linea tratteggiata). Esso passa sempre per il centro della pupilla d’entrata formando
6& 7$ $ 8 9 :;< = > ? ? @)A5@)B ; C @ D ? @ 9 > ;E:6< >5? FG@ D H B 9 B @#> E5F;> < C @ A A >2IJLK:; H D :; C > ;E:6M F@ ? C >
figura con la 3.1 vediamo che un generico raggio che incontrava la superficie in (x,y) in Fig.
3.1 ora incontra la superficie in (x,y+L). Ci si aspetta quindi che la situazione per le aberrazioni
cambi poiché il raggio investe una diversa porzione della superficie. Un esempio tra tutti è il
caso del telescopio Schmidt, dove abbiamo visto che l’introduzione di un diaframma nel centro
32
di curvatura davanti allo specchio sferico annulla tutte le aberrazioni fuori asse, mentre senza
diaframma sono presenti tutte le aberrazioni.
Y
W
n n’
L
h
s Z
Fig. 3.3 Superficie con diaframma collocato davanti. Il chief ray fa adesso un angolo
centro della pupilla d’entrata che coincide col diaframma, impattando la superficie ad un altezza L. In figura L>0,
Y
W
n
n’
L
h
s Z
W
Q
’
Fig. 3.4 Superficie con diaframma collocato dietro. La sua immagine virtuale costituisce la pupilla d’entrata. In
figura L<0 e W e W’ >0.
.
3.6 Le nuove relazioni
Φ = y ( A0 + 2LA1 + 3L2 A2 + 4 L3 A3 )
+ y 2 ( A1 + 3LA2 + 6 L2 A3 ) + x 2 ( A '1 + LA 2 '+ L22A3 )
(3.25)
+ y 3 ( A2 + 4 LA3 ) + x 2 y ( A '2 + LA
4 3 +) A3r 4
= B0 y + B1 y 2 + B '1 x 2 + B2 x(2 y + y 3 +) B3r 4
33
dove si è usato A’2 = A2 per combinare i termini cubici.
Prima di derivare le espressioni complete per i coefficienti Bi ci sono alcune importanti
osservazioni da fare. Per prima cosa il termine L non compare nel termine in r4 e perciò
l’aberrazione sferica è indipendente dalla posizione del diaframma. Secondo, se A3=0 il
coefficiente di coma B2 è indipendente dalla posizione del diaframma ed il coma è dato dalle
relazioni del paragrafo precedente. Se poi sia A2 che A3 sono nulli allora B1 e B’1 sono
indipendenti dalla posizione del diaframma e si riducono ad A1 e A’1 rispettivamente.
L’importanza di queste osservazioni risulterà chiara più avanti.
Il processo per calcolare i coefficienti Bi è piuttosto diretto, sebbene lungo per l’ampio uso
dell’algebra. Noi omettiamo qui tutti i passaggi e presentiamo solo i risultati uniti ad una
discussione per la comprensione del loro utilizzo.
Per cominciare notiamo le seguenti relazioni, valide in approssimazione parassiale, derivate
dalla geometria della Fig. 3.3:
L = −W Ψ, θ = Ψ [1 − (W / s )] (3.26)
dove W è la distanza tra la superficie e la pupilla d’entrata. Per il caso della Fig. 3.4 le
medesime equazioni appena scritte valgono sostituendo W’ a W. Dalla seconda delle (3.26) si
!"# ù s si avvicina a W. Ad un certo punto
l’approssimazione parassiale cessa di valere. Sfortunatamente non c’è una ricetta per sapere
dove cade l’approssimazione fatta, e uno deve verificare se i risultati ottenuti con la teoria al
terz’ordine sono corretti, ad esempio tramite una procedura di ray-tracing.
Nella Tab. 3.5 e 3.6 presentiamo i risultati ottenuti per i Bi per il caso della superficie
rifrangente e per lo specchio. La scelta fatta nel presentare i risultati è di eliminare L e $ &%#
esprimere i risultati in termini di W.
1 1 1
2
K
B3 = − Γ − + 3 (n '− n +) b
8 s R R
W Ψ 1 1 1 1 K
B2 = Γ − − + 3 (n '− n +) b
2 s R W R R
(W Ψ )2 1 1
2
K
B1 = − Γ − + 3 (n '− n +) b
2 W R R
(W Ψ )3 1 1 1 1 1 1 n 2 1 1 1 1
2
K
B0 = Γ − − + − + n 2 − 1 − − + 3 ( n '− n +) b
2 W R W R W s n ' W R W s R
1 1
Nella Tab. 3.5 si è definito Γ = n 2 − .
n ' s ' ns
34
Tab. 3.6 Coefficienti di aberrazione per uno specchio con pupilla d’entrata a distanza W
n m +1 b
2
B3 = K + −
4 R3 m − 1 8
(W Ψ ) K m + 1 1 1 b
B2 = − n + − + (W Ψ )
2 R m − 1 W R 2
K 1 1 2 b
(W Ψ )2
B1 = n 2 + − − (W Ψ )
2
2 R W R 2
K 1 1 1 1 1 1 1 b
B0 = −n(W Ψ )3 3 + − − + − + (W Ψ )3
R R W R W R W s 2
Nella Tab. 3.5 e 3.6 si noti come B3 sia uguale ad A3 come era stato anticipato, mentre gli altri
coefficienti cambiano.
Come prima la scelta di porre B1=0 o B’1=0 localizza le immagini tangenziale e sagittale
rispettivamente. Si trova che:
n ' cos 2
θ ' n cos
2
θ n ' θcos
− n ' θ cos
− = − 6 LΩ
s 't s R
(3.27)
θ − n'
n ' n n ' cos θcos
− = − 2 LΩ
s 's s R
∆s ' ∆s ' LΩ
4
= 2 − (3.28)
s ' W =0
2
s' n '
Come prima si sceglie l’immagine sagittale per valutare l’astigmatismo. Risolvendo la (3.27)
rispetto ad s’s si sostituisce poi il risultato nella relazione B1 = A1 + 2 LΩ e si confronta con la
(3.28) ottenendo:
analoga alla precedente (3.14). Perciò B1 è una misura dell’astigmatismo quando la pupilla
d’entrata non è sulla superficie.
Le relazioni per le aberrazioni trasverse sono simili a prima, ma sostituendo i Bi agli Ai:
4 B3 y 3 s ' B y2 s ' 1
TSA = TSC = 2 = TTC
n' n ' 3 (3.30)
2 B ys ' B s'
TAS = 1 TDI = 0
n' n '
35
3.6.2 Esempi
Facciamo due esempi con uno specchio sferico ed uno parabolico entrambi in luce collimata,
cioè m=0 e con componenti asferiche nulle (b=0).
Per una sfera troviamo A3=B3=n/4R3 quindi ci aspettiamo che sia B2 che B1 dipendano
dalla posizione del diaframma. Vediamo infatti che quando W=R sia B2 che B1 sono 0. Questa
è proprio il primo passo verso il telescopio Schmidt. Se è presente una componente asferica
B3=0 quando b=2n/R3. Questa deve essere messa in W=R per realizzare la camera Schmidt.
Per un paraboloide vediamo che B3=0. Essendo m=0 e K=
2 è
indipendente da W. La coma non è nulla ed il coefficiente dell’astigmatismo dipende da W.
Quindi per un opportuna scelta di W si avrà zero astigmatismo; questo succede per W=R/2,
cioè con il diaframma sul piano focale.
Φ s = Φ1 + Φ 2 + ... + Φ f = ∑ Φ i (3.31)
dove f denota l’ultima superficie. Ogni termine nella (3.31) può essere sostituito dal
corrispondente valore associato alla (3.25) con gli (x,y) appropriati di ogni superficie. Si noti
che una completa descrizione del sistema può essere ottenuta, senza perdere in generalità,
ponendo x=0, cioè considerando solo i raggi nel piano yz. Per l’intero sistema si avrà dunque:
Φ s = ∑ ( B0i yi + B1i yi2 + B2i yi3 + B3i yi4 ) = ∑ (∑ B ji yij +1 ); j = 0,1, 2,3 (3.32)
j i
con la distanza geometrica lungo un raggio arbitrario tra il fronte d’onda di riferimento ed il
fronte d’onda aberrato alla superficie finale data da:
∆ = Φ s ( yi ) / n ' f (3.33)
∂∆ 1 ∂Φ s 1 j ∂yi
= = ( j + 1)∑ B ji yi (3.34)
∂y f n ' f ∂y f n f' i ∂y f
36
Osservando la Fig. 3.5 si capisce che l’ultima derivata può essere sostituita dal rapporto
yi / y f perché dyi ∝ yi ad ogni superficie. Sostituendo si ha:
s ' f ∂Φ s s f ' yi j
j +1
TAjy = = ( j + 1) ∑ B ji y f (3.35)
n ' f ∂y f n f' i y
f
dyi
dyi+1
yi
Qi Q’i
si s’i
si+1
i i+1 i+2
Fig. 3.5 Percorso di due raggi adiacenti da Qi attraverso diverse superfici, dove Qi è un qualsiasi punto oggetto
intermedio sull’asse ottico. Le altezze dyi sono proporzionali a yi.
Completato il formalismo si vede come il calcolo delle aberrazioni per un sistema a più
superfici è solo una questione di calcolo che si ripete, cosa che può essere fatta agilmente da un
calcolatore elettronico.
Se si vuole esprimere i risultati in termini dell’altezza yl dei raggi marginali nel punto della
pupilla d’entrata del sistema, occorre moltiplicare e dividere la (3.35) per l’altezza del raggio yl
elevata alla potenza (j+1). I risultati sono:
j +1
y
B js = ∑ B ji i
i yl
(3.36)
s ' f yl
TAjy = ( j + 1) B js yl
j
n'f yf
θ2 θ 1
B01 = 0 B11 = B21 = B31 = ( K1 + 1) (3.37)
R1 R12 4 R13
37
Per il secondario n=
K 1 1 1 1 1 1 1
B02 = −(W θ )3 32 + − − + −
R2 R2 W R2 W R2 W s2
(Wθ )2 K 2 1 1
2
B12 = − + −
R2 R22 W R2
(3.38)
(Wθ ) K m + 1 1 1
B22 = − 2 2 + −
R2 R2 m − 1 W R2
1 m +1
2
B32 = − 3 K 2 +
4 R2 m − 1
Posto yl=y1 cioè l’altezza del raggio marginale sullo specchio primario, abbiamo:
B js = B j1 + B j 2 ( y2 / y1 ) j +1 (3.39)
1 m + 1
2
k4
B3 s = K1 + 1 − +
K2 (3.40)
4 R13 ρ3 m − 1
Si noti che l’aberrazione sferica è nulla quando il termine entro parentesi è zero (risultato che
avevamo già ottenuto nel precedente capitolo). L’espressione per l’aberrazione sferica
trasversa al terz’ordine diviene quindi:
3
y f
TSA3 = f 1 { }= − { } (3.41)
R1 64 F13
dove il termine entro parentesi graffa è la (3.40) (e valgono le s '2 = mkf1 = kf n; 2 ' = ),1F1 è il
rapporto focale del primario. Le altre aberrazioni si ricavano in modo simile.
Per quanto riguarda l’ultima aberrazione al terz’ordine di cui non abbiamo ancora parlato, la
curvatura di campo, rimarchiamo che questa aberrazione non altera la qualità dell’immagine,
ma essendo in genere tutti i detector (CCD, lastre fotografiche) piani, può produrre una cattiva
qualità dell’immagine soprattutto se il campo è molto esteso.
La camera Schmidt risolve questo problema incurvando le lastre fotografiche. Un altro metodo
è quello di usare una lente correttrice di campo.
Si può dimostrare che data una qualsiasi superficie oggetto ! " ## $%& ' (" ) ' " r,
nell’approssimazione considerate fino ad ora essa è trasformata dal sistema in una superficie * +
38
curvatura 1/r’ dell’immagine si può ricavare (ma
!"# $%" " "#& è una costante (nelle approssimazioni considerate).
di raggio di curvatura r’
Dalla teoria generale di Seidel si ricava che la curvatura di campo è sempre strettamente
legata all’astigmatismo, nel senso che se un sistema è privo di astigmatismo la superficie focale
è sempre curva, e viceversa se la curvatura di campo non c’è (campo piatto), si presentano le
due superfici tangenziale e sagittale dell’astigmatismo.
E’ quindi interessante ricavare la curvatura di campo nel caso in cui l’astigmatismo è nullo
e la superficie viene chiamata superficie di Petzval. Posto ')( * +-,/.0 1 1 2 (3.29) si trova
2LΩ = − A1 e sostituendo nella (3.27) si ottiene:
dove s’p= s’t = s’s è la distanza dall’origine delle coordinate della superficie di Petzval.
Omettendo i passaggi algebrici si arriva alla seguente relazione che esprime la curvatura
κ = 1/ r ' della superficie:
1 1 n '− n
− = − (3.43)
n ' r ' nr n ' nR
L’importanza della (3.43) sta nel fatto che la curvatura della superficie di Petzval non dipende
dalle distanza s’ ed s, né dalla posizione della pupilla d’entrata. Questo risultato si può
estendere ad ogni superficie del sistema ottico, essendo che n’r’ per la i-esima superficie è nr
per la (i+1)-esima, e pertanto si può scrivere:
1 1 n '− n
− = −∑ (3.44)
n ' f r ' f n1r1 i n ' nR i
dove 1 ed f si riferiscono alla prima ed ultima superficie del sistema. Per un oggetto piatto, la
situazione più comune è di avere:
n '− n
κ p = −n ' f ∑ n ' nR
i
(3.45)
i
Perciò per ogni sistema ottico per il quale l’oggetto è piatto, la superficie di Petzval è una
superficie invariante. Se il sistema ha astigmatismo, ognuna delle superfici immagine
astigmatiche avrà la propria curvatura, e tra queste curvature esiste una ben definita relazione:
κ s − κ t = 2(κ p − κ s )
(3.47)
κ p − κ t = 3(κ p − κ s ).
39
Nel prossimo capitolo vedremo di applicare i concetti fino ad ora esposti ai vari telescopi,
cercando di quantificare la magnitudine delle varie aberrazioni.
40
4 CAPITOLO 4
4.1 I telescopi riflettori
4.1.1 Il paraboloide
y2 2y 2
TSC = − 2 θ s ' TAS = − θ s'
R R
y2 θ 2y 2 θ 2
ASC = 2 θ = AAS = θ =
R 16 F 2 R 2F
2 κ +κt 2
κp = κm = s =−
R 2 R
Dalla tabella vediamo che la coda della Coma è diretta verso l’esterno del campo (TSC>0), che
l’immagine tangenziale astigmatica è più vicina allo specchio di quella sagittale (TAS<0), e
che la distorsione e l’aberrazione sferica sono nulle. Per ottenere le quantità angolari abbiamo
diviso per s’ le aberrazioni trasverse ed eliminato il segno meno che per noi è ininfluente in
quanto ci occupiamo solo della magnitudine della aberrazioni. I risultati per le aberrazioni
angolari sono graficati in Fig. 4.1 per tre rapporti focali F. La prima cosa da notare è la
dominanza della Coma anche per piccoli angoli fuori asse, cosa che limita il raggio entro cui
l’immagine può essere considerata buona. In genere per delle mediocri condizioni di seeing,
un’immagine può essere considerata buona quando il suo diametro è di 1 secondo d’arco
(arcsec).
41
1.5
4
Aberrazione angolare (arcsec)
8
4
1.0 10
0.5 10
5 10 15 20
Fig. 4.1. Aberrazione angolare di un paraboloide in luce collimata per vari rapporti focali F. Le linee piene danno
la coma sagittale, quelle tratteggiate l’astigmatismo. Ogni curva è numerata con il proprio rapporto focale.
Assumendo che un’immagine aberrata sia considerata ancora buona entro 1 arcsec vediamo
dalla Fig. 4.1 che, essendo la Coma tangenziale pari a tre volte quella sagittale, il campo utile
per un paraboloide in funzione del suo rapporto focale varia come in Tab. 4.2.
Tab. 4.2. Raggio limite del campo (in arcmin) per un paraboloide
F (arcmin)
4 1.42
8 5.69
10 8.89
Non essendoci altri specchi singoli (diversi dal paraboloide) che abbiano aberrazione sferica
nulla, passiamo direttamente ai telescopi con due specchi.
42
Se il primario è concavo, e quindi f1 > 0, la richiesta di un’immagine reale finale implica
che mk > 0. Se m e k sono entrambi positivi il telescopio è di tipo Cassegrain, se entrambi
negativi il telescopio si dice Gregoriano (Fig. 2.5 B). In ogni caso k < 1 affinché la luce
raggiunga lo specchio primario.
Se il primario è convesso e quindi f1 < 0, un’immagine reale richiede che mk < 0. In questo
caso il secondario deve essere più grande del primario, e quindi k > 1 ed m è negativo. Questo
tipo di telescopio con il secondario concavo è detto Cassegrain inverso.
Le differenti combinazioni di m, k
m k Tipo Secondario
>1 >0 >0 Cassegrain Convesso
=1 >0 Cassegrain Piatto
Da 0 a 1 >0 <0 Cassegrain Concavo
<0 <0 <0 Gregoriano Concavo
<0 >1 >0 Cassegrian inv. Concavo
Ora andremo a ricavare le aberrazioni per i vari tipi di telescopi utilizzando le relazioni viste
nel capitolo precedente.
Riscriviamo prima la quantità W in termini dei parametri normalizzati: W / R2 = ( k − 1) / 2 ρ e
W / s2 = ( k − 1) / k . Con queste sostituzioni dopo numerosi e tediosi passaggi algebrici si
ottengono i coefficienti delle aberrazioni Bis della Tab. 4.4.
1 (m − 1)3 (1 + β ) m + 1
2
1
B3s = 3 K1 + 1 − K 2 + = − [− ]
4 R1 m (m + 1)
3
m − 1 32 f13
θ (m − 1)3 (m − β ) m + 1 θ
2
2 [ ]
B2 s = 2 2 1 + K 2 + = −
m R1 2m( m + 1) m − 1 4 f
θ 2 (m − 1)(m − β ) (m − 1)2 (m − β ) θ2
B1s = 1 + 1 − ( K + 1) = − [− ]
m(m + 1) 4m(1 + β )
2
mR1 2f
θ 3 (m − β )(m 2 − 1) m +1
2
B0 s = (m − β )(3m + β ) + (m − β ) K 2
2
8m (1 + β )
3 2
m −1
I termini entro parentesi quadra [-] ripetono la medesima quantità a sinistra dell’uguale
Si noti che questi coefficienti si applicano ad ogni coppia di specchi conici, comprese le coppie
per le quali l’aberrazione sferica è diversa da zero. Si veda come il coefficiente B3s è l’unico
affetto dalla costante conica dello specchio primario. Un errore su K1 non ha effetto sulle
aberrazioni fuori asse (si pensi a quello che è successo con il telescopio spaziale Hubble).
Imponendo che B3s sia uguale a 0, otteniamo una relazione tra K1, m
(m − 1)3 (1 + β ) m +1
2
K1 + 1 = +
2
K
m3 (m + 1) m − 1
43
e la Tab. 4.4 può riscriversi nella forma 4.5.
Tab. 4.5 Coefficienti di aberrazione per un telescopio a due specchi con B3s=0
θ m 2 (m − β ) θ
B2 s = 1 + 2(1 + β ) ( K1 + 1) = 4 2 [− ]
m 2 R12 f
θ 2 m 2 + β m(m − β ) 2 θ2
B1s = − ( K1 + 1) = − [− ]
mR1 m(1 + β ) 4(1 + β )2 2f
θ 3 (m − β )(m 2 − 1) m 2 (m − β )2
B0 s = m + 3 β + ( K1 + 1)
4m (1 + β )
2 2
2(1 + β )(m − 1)
2
Questi risultati sono basati sulla scelta di localizzare la pupilla d’entrata del sistema con lo
specchio primario (cioè senza l’introduzione di diaframmi). Quando l’aberrazione sferica è 0,
la Coma è indipendente dalla posizione di eventuali diaframmi; e quando SA e Coma sono
nulle l’astigmatismo è indipendente dalla posizione dei diaframmi.
Il vantaggio di esprimere i coefficienti di aberrazione in funzione di m
vantaggi che possono essere facilmente compresi.
Per ricavare le aberrazioni traverse è necessario sostituire ogni Bs nella relazione (3.36)
dove si è posto s '2 / n '2 = kf e y1/y2=1/k. Per ricavare le aberrazioni angolari date in Tab. 4.6 le
aberrazioni traverse sono divise per f e i segni meno sono stati tralasciati.
3
1 y 1
ASA = 1 [− ] = [− ]
8 f1 64 F13
2
θy θ 1
ASC = 1 [− ] = 2 [ ]
− = ATC
4 f 16 F 3
y θ 2
AAS = θ 2 1 [− ] = [− ]
f 2F
ADI = B0s
Avendo quindi ora in mano tutte le relazioni necessarie discutiamo alcune proprietà dei
telescopi con due specchi. Le categorie più comuni sono i cosiddetti telescopi classici, quelli
con il primario parabolico, ed i tipi aplanatici, che hanno zero Coma.
44
4.1.3 Il tipo classico
m +1
2
K2 = −
m −1
θ
ASC =
16 F 2
θ 2 m2 + β
AAS =
2 F m(1 + β )
θ 3 (m − β )(m 2 − 1)(m + 3β )
ADI =
4m 2 (1 + β ) 2
2 (m 2 − 2)(m − β ) + m(m + 1)
km =
R1 m 2 (1 + β )
La prima cosa che si nota è che la Coma in Tab. 4.7 è la stessa di quella di un singolo
paraboloide con lo stesso rapporto focale. Questo vale sia per il Cassegrain che per il
"!# $ %quindi
Gregoriano, & # '$ ( # non
) & * +,-
si # hanno
& * ) ,-./vantaggi
0.& * # ,-.2rispetto
1 3'4 aè questa aberrazione.
generalmente un numero positivo piccolo,
dell’ordine di pochi decimi, mentre m è tipicamente 10 volte maggiore (o anche di più). Una
buona misura si può quindi ottenere ponendo
456/71 .0* $8 * ) %$ & # & .91 3
AAS = mθ 2 / 2F . Il
risultato mostra che un telescopio classico il cui fuoco è nel vertice dello specchio primario ha
un astigmatismo m volte più grande di quello di un paraboloide con lo stesso F. Come per la
Coma non ci sono differenze tra Cassegrain e Gregoriano rispetto a questa aberrazione. Per
456/:$ ( # ) & * +,-# & * ) ,-.2) *:;% ò anche scrivere AAS = θ 2 / 2F , e in questo caso dipende solo dal
1
rapporto focale del primario. Un confronto tra la Coma tangenziale e l’astigmatismo mostra
che è quasi sempre la Coma ad imporre i limiti sul campo focale utile (quello in cui l’immagine
appare ancora buona). Lo studente provi a costruirsi gli “spot 4 <diagrams”
=?> @?A> con un programma di
BC DFEG CFEC GHIJ"K LFM NG OL P NG L7D-C QR L k è approssimativamente 2(m+1)/R . Questa relazione
ray-tracing (ad es. OSLO) per un Cassegrain f/10 con m=4 e
m 1
non è esatta, ma illustra tre caratteristiche della superficie immagine. Primo il segno di km è
opposto per il Cassegrain e il Gregoriano. E’ concava per il Cassegrain e convessa per il
Gregoriano (viste dal secondario). Secondo la curvatura è maggiore per il Cassegrain che per il
Gregoriano. Terzo, la curvatura media aumenta quanto più m aumenta. Questo comunque non
45
è una limitazione poiché il campo coperto è generalmente tanto più piccolo quanto più m
aumenta.
Riassumendo, il telescopio classico a due specchi è limitato nel campo utile dalla Coma.
Confrontato con il singolo paraboloide l’astigmatismo è maggiore, ma dato il piccolo campo
questo è raramente una limitazione. La Coma è l’aberrazione dominante e non dipende dalla
posizione di diaframmi poiché l’aberrazione sferica è nulla. Per questo motivo nei telescopi
infrarossi lo stop di apertura è generalmente posto nella posizione del secondario.
A causa del piccolo campo la distorsione è tipicamente di pochi millesimi di secondo
d’arco e quindi inferiore al seeing, e perciò poco importante.
Il telescopio classico è chiaramente limitato nel campo dalla presenza della Coma fuori asse.
Consideriamo ora quei telescopi che hanno Coma nulla nell’approssimazione al terz’ordine.
Abbiamo già detto che i sistemi che hanno aberrazione sferica e coma nulle vengono detti
aplanatici.
Il telescopio Cassegrain aplanatico, detto Ritchey-Chretien (RC), è il telescopio più
comune tra i telescopi professionali della classe dei 2m; tra questi vi è anche il telescopio
spaziale HST.
La condizione per realizzare l’aplanaticità può essere realizzata con due specchi conici
(iperbolici). Si trova che le condizioni per realizzare l’aplanaticità sono:
2(1 + β )
K1 = −1 −
m 2 (m − β )
(4.2)
m +1 2m(m + 1)
2
K2 = − −
m − 1 (m − β )(m − 1)
3
La costante conica del secondario del RC è più negativa di quella del tipo Cassegrain classico.
Per l’aplanatico Gregoriano (AG) il primario è ora un ellissoide. Per il secondario la costante
conica dell’AG è più negativa di quella del tipo Gregoriano classico, (se m > 1 ), ma la conica
è sempre ellissoidale. La deformazione da applicare allo specchio del RC è comunque opposta
a quella dell’AG. Le aberrazioni risultanti sostituendo le (4.2), sono riassunte in Tab. 4.8.
θ 2 m(2 m + 1) + β
AAS =
2 F 2m(1 + β )
θ 3 (m − β )
ADI = m (m 2 − 2) + (3m 2 − 2)
2
4m (1 + β )
2
2 (m + 1)
km = 2 (m2 − β (m − 1))
R1 m (1 + β )
Come per i telescopi classici assumiamo
magnitudine delle aberrazioni. I risultati sono:
46
θ2 1 θ3 2 2
AAS = m + ADI
, = (m − 2), km = (m + 1). (4.3)
2F 2 4 R1
In confronto con il tipo classico dello stesso rapporto focale, l’astigmatismo per l’RC è
maggiore, mentre quello dell’AG è minore. Ad un dato R1 la curvatura media è maggiore per
l’RC che per l’AG, e le curvature hanno segno opposto.
La distorsione è la stessa per entrambi i tipi, ed è minore che nel caso classico. Al limite del
campo utilizzabile del telescopio aplanatico, la distorsione è di pochi centesimi di secondo
d’arco (quindi deve essere considerata solo per certe peculiari osservazioni). Gli studenti
provino con OSLO a costruire gli “spot diagrams” per un RC f/10 con m=4 e
che rispetto al caso classico il campo utile è circa il doppio. Poiché l’aberrazione sferica e la
Coma sono zero, l’astigmatismo non dipende dalla posizione di eventuali diaframmi
d’apertura. E’ quindi l’astigmatismo che fissa i limiti del campo utile.
Esistono altri tipi di telescopi, meno comuni, che meritano un accenno. Poiché ognuno di essi
ha qualche particolare problema, faremo solo una breve panoramica. Consideriamo solo i tipi
Dall-Kirkham, i telescopi con primario sferico, due tipi di telescopi anastigmatici, e un
aplanatico a campo piatto.
Il telescopio Dall-Kirkham ha un secondario sferico (K2=0) e un primario ellissoidale (con
K1 appropriato per avere zero aberrazione sferica. Il coefficiente della Coma B2s in Tab. 4.4 si
ottiene immediatamente
ponendo K2=0, e analogamente si procede per gli altri coefficienti. Per
-Kirkham ha una Coma che è (m2+1)/2 volte più grande di quella del Cassegrain
classico. Quindi il campo utile è minore dello stesso fattore. Tutte le altre aberrazioni sono
trascurabili entro questo campo. Sebbene il campo utile sia piccolo, gli specchi del Dall-
Kirkham sono facili da costruire e quindi ne sono stati costruiti diversi. Un altro vantaggio di
questo tipo di telescopio è che la qualità dell’immagine è abbastanza insensibile al
disallineamento degli specchi in confronto ai tipi precedentemente descritti.
Un altro tipo di telescopio interessante è quello con un primario sferico (SP). Il principale
vantaggio sta nella facilità di costruzione del primario e nella possibilità di segmentare il
primario in tanti specchi sferici più piccoli. Per annullare l’aberrazione sferica il secondario
deve essere un ellissoide oblato (K>0) nella versione Cassegrain e un iperboloide (K<
versione Gregoriano. Il principale svantaggio è la grande aberrazione fuori asse. Relativamente
al Cassegrain ed al Gregoriano le aberrazioni fuori asse sono molto grandi. Pertanto il campo
utile è molto piccolo a meno di introdurre altri elementi ottici.
Un altro tipo di telescopio è quello che cerca di correggere contemporaneamente
l’aberrazione sferica, la coma e l’astigmatismo. Ovviamente ciò richiede delle restrizioni sui
parametri normalizzati. Per i telescopi aplanatici anastigmatici le relazioni tra i parametri sono:
La condizione per avere un fuoco reale richiede quindi 0<m<0.5 quando il primario è concavo.
Per ogni m in questo intervallo il secondario è a sua volta concavo ed il piano focale è
localizzato tra i due specchi e quindi relativamente inaccessibile. Inoltre per una scelta
ragionevole di m, diciamo 0.25, il secondario oscura il primario in modo significativo.
Un altro tipo di telescopio anastigmatico si ha se il primario è convesso e k>1. dalle
relazioni (4.4) si vede quindi che m<0, e quindi c’è un fuoco reale e la configurazione è quella
di un Cassegrain inverso. Per m<0, la superficie focale sta tra i due specchi poiché !"#
47
Disegnando la configurazione si vede che occorre porre una superficie che blocchi parte del
fascio incidente per evitare che la superficie focale veda la luce incidente direttamente. Per
m< parte della luce riflessa dal secondario passa al di là del primario. Un esempio si ha
quando entrambi gli specchi sono sferici e concentrici, con il secondario più grande del
primario, ma questa configurazione è poco utile per un telescopio (a volte è stata usata come
base per la camera di uno spettrografo).
L’aplanatico a campo piatto è definito da km = 0 per cui le relazioni tra i parametri
normalizzati divengono:
m2 m(m 2 + m − 1)
β= mk = (4.5)
m −1 m2 − 1
Un analisi di queste relazioni porta a due possibili tipi. Un Cassegrain con secondario
concavo e fuoco tra gli specchi, e un Cassegrain inverso. Ognuno di questi ha diversi problemi
di inaccessibilità dell’immagine e di forte vignettatura, come per i corrispondenti anastigmatici.
Infine lo studente può verificare che una soluzione esiste per il telescopio anastigmatico a
campo piatto, ma lo specchio secondario risulta più grande del primario e quindi è poco pratica
come telescopio.
Dalla discussione precedente risulta chiaro che il telescopio a due specchi, classico o
aplanatico, può essere facilmente modificato per venire incontro alle varie esigenze degli
astronomi. C’è una grande flessibilità nel “design” per ottenere i richiesti ingrandimenti e per
facilitare l’accessibilità del piano focale, pur mantenendo una vignettatura accettabile. Alcuni
problemi possono essere risolti introducendo nuovi elementi ottici.
E’ utile a questo punto scegliere dei valori per i parametri che rappresentano i nostri
telescopi e fare un confronto tra le diverse configurazioni discusse sopra. Scegliamo per i nostri
telescopi a confronto un medesimo diametro per il primario e un medesimo rapporto focale di
sistema. Facciamo in modo inoltre che
à del piano focale.
In Tab. 4.9 diamo i dati dei diversi telescopi a confronto.
Parametri CC CG RC AG
K1 !" # $%& '()*
K2 +-,-. //0 +1. 231 +2. 4 /,0 +1. 516 ,
CC=Cassegrain classico; CG=Gregoriano classico; RC=Ritchey-Chretien;
AG=Gregoriano aplanatico; F1=2.5; F=10; 7 =0.25; m=4.
Le caratteristiche importanti per ogni telescopio basate sui parametri di Tab. 4.9 sono riassunte
in Tab. 4.10.
Tab. 4.10 Caratteristiche dei telescopi a due specchi derivate dalle scelte di Tab.4.9
Parametri CC CG RC AG
m 4.00 8-9-: ;; 4.00 8-9-: ;;
k 0.25 8;: 9< = 0.25 8;: 9< =
18 k 0.75 1.417 0.75 1.417
mk 1.000 1.667 1.000 1.667
ATC 2.03 2.03 0.00 0.00
48
AAS 0.92 0.92 1.03 0.80
ADI 0.079 0.061 0.075 0.056
kmR1 7.25 7.625
kpR1 4.00
4.00
Dai risultati di Tab. 4.10 possiamo dedurre il campo utile per ogni telescopio dove
l’aberrazione angolare dominante ha le dimensioni del disco di seeing atmosferico. Per un
seeing di 1 arcsec il campo utile di un CC con le caratteristiche date in Tab. 4.9 e 4.10 è di 9
arcmin (l’aberrazione dominante è la Coma), di 18 arcmin per un RC (l’aberrazione dominante
è l’astigmatismo), e di 20 arcmin per un AG. Perciò il campo è circa un fattore 2 più grande per
un telescopio aplanatico, e pertanto l’area è 4 volte più grande.
Per quanto concerne la curvatura vediamo che in valore assoluto la curvatura media è
maggiore e quella di Petzval minore per i tipi Cassegrain rispetto ai Gregoriani. Per gli
aplanatici la curvatura media è maggiore rispetto ai telescopi classici.
Se le aberrazioni fossero la sola condizione discriminante per la scelta di un telescopio, dai
dati mostrati si potrebbe concludere che il tipo aplanatico Gregoriano sia quello da scegliere.
Altri fattori però sono importanti per la scelta finale, che fanno spostare la nostra preferenza
verso il tipo RC. Queste sono visibili nelle righe 2-4 di Tab. 4.10. Si ricordi infatti che k è il
rapporto tra il diametro del secondario ed il primario e quindi k2 è la minima frazione di area
del primario oscurata dal secondario. Il parametro (1 k) rappresenta la separazione del primario
e del secondario in unità di f1, mentre mk è la distanza dal secondario al piano focale nelle
stesse unità.
L’ostruzione della luce da parte del secondario è visibilmente maggiore per i tipi
Gregoriani rispetto a quelli classici. Confrontando i valori di (1 k) osserviamo che la
separazione primario-secondario è 1.9 volte maggiore per i Gregoriani, e la distanza tra il
secondario ed il piano focale è circa il 70% più grande per i Gregoriani. Pertanto per la
lunghezza fisica di un Gregoriano è sostanzialmente maggiore. Questo ha due serie
conseguenze per la scelta finale del telescopio in particolare per i costi. Il primo problema è che
la cupola che ospita il telescopio viene a costare molto di più. Secondo i costi del telescopio
stesso crescono essendo più massiccio e più lungo. Inoltre risulta anche più difficile allineare le
ottiche quanto più il telescopi è lungo.
Una caratteristica del Gregoriano che è utile per certe applicazioni specifiche è che
ponendo un diaframma nella pupilla d’uscita del telescopio si può sopprimere la luce diffusa
dai supporti della struttura.
Data
la preferenza per
iltipo
!RC
" " facciamo
# %ora
$ & ' il( confronto
) * +, - . - )/* 01tra
0( ) diversi
. * * +1- )tipi
) 123di. 4/RC
& 5& 6che
6 & hanno
49
Si noti innanzitutto che la lunghezza totale del telescopio è tanto più corta quanto più il
rapporto focale del primario è piccolo, cioè quanto più rapido è il primario. Questo implica
anche una maggior facilità di allineamento delle ottiche. Vediamo anche che l’astigmatismo è
maggiore quanto più rapido è il primario. A dispetto di ciò i vantaggi di un telescopio più corto
sono evidenti. Resta da dire che la scelta tra RC e CC non è così marcata come quella tra
Cassegrain e Gregoriano. Alcuni grandi telescopi (come il Keck) hanno ad esempio scelto il
tipo Cassegrain classico, per la maggiore flessibilità di questo design.
50
4.2 Errori di allineamento nei telescopi a due specchi
Z’
1
4
3 L’
2
Z
dove L’ è la distanza tra il centro dello stop di apertura (che coincide in questo caso con il
"! #$&%"' ( ! ) ) %"*% '+) % , #-*! #/.% 0 è l’angolo tra il chief-ray riflesso e l’asse del secondario.
Sostituendo le (4.6) nelle Tab. del capitolo precedente, si può dimostrare che i nuovi
coefficienti di aberrazione si ottengono dalle relazioni:
dove Bis sono i coefficienti per un telescopio perfettamente allineato dati in Tab. (4.5) e
51
1 1 m + 1 m +1
B22 (dis ) = K2 − m − 1 − α m − 1
R22 R2
(4.8)
1
2
W 2Wθ
B12 (dis ) = − α + + 2θ α + 1 − + K 2 −
R2 R2 R2 R2 R2 R2 R2
3(1 + β ) (m − 1)3 m +1
ATC=ATC(cen) − 2 K2 − + α (m − 1) (4.9)
16 F f 2(1 + β ) m −1
campo. Per un telescopio aplanatico ATC(cen)=0 e sostituendo K2 dalla (4.2) si ottiene:
3(1 + β )(m − 1) m 1
ATC = − α − 1 + (4.10)
16 F 2 fk (m − β )( m − 1)
Mentre per un telescopio classico lo studente provi a ricavarsi, prendendo ATC(cen) dalla Tab.
4.7 e sostituendo K2= -1)]2 la:
3θ y
3(1 + β )(m − 1) m
ATC = 2
− 2 α− (4.11)
16 F 16 F fk
indica che il risultato vale per un punto preso lungo l’asse y. Dalle (4.10) e (4.11) si
y
vede che la Coma può essere annullata da una combinazione di un opportuno tilt e un
! " # $ % &'&() *,+.- /0+ 12 +435$," $76 859;:=< >?.@ < A <N O5B C PD Q: ?EQSC A R F BT B OU? C ?PLGEV <HW X BQC FY Z,A F [ I J D;?EJ? F KL< @ > ?B C < M A ? < I J D
appropriato decentraggio del secondario.
Per illustrare gli effetti di questi errori sull’immagine finale consideriamo nuovamente i
Si vede che la montatura Gregoriana è più sensibile al tilt di quella Cassegrain, mentre per il
decentraggio c’è poca differenza, sebbene gli aplanatici ne siano maggiormente affetti. Si
ricordi che data la maggior lunghezza del Gregoriano, il Cassegrain risulta più adatto a
soddisfare le tolleranze richieste. E’ importante realizzare inoltre che il contributo di Coma
dovuto al disallineamento è più grande quanto più diminuisce il rapporto focale del primario,
cioè quanto più rapido è lo specchio.
52
Rispetto al telescopio RC-3 di Tab. 4.11 notiamo che, per lo stesso tilt e decentraggio,
ATC(tilt) è 2.8 volte maggiore e ATC(decentr) è circa 8 volte maggiore.
Ritornando ai telescopi aplanatici, vediamo che ATC=0 per
m 1
α= 1 + (4.12)
fk (m − β )(m − 1)
L’importanza della (4.12) è che, anche se il primario ed il secondario non sono perfettamente
allineati, c’è un angolo di tilt che compensa il decentraggio e dà un’immagine libera da Coma.
Per quanto riguarda l’astigmatismo consideriamo solo il caso in cui la Coma dovuta al
disallineamento è zero. Applicando questa condizione si ha che:
m −1
α= K2 −1 (4.13)
R2 m + 1
1 (m − 1)3 m
B1s = B1s (cen) −
2f f
K2
(1 + β ) θ y + f 2(m − β )(m − 1) (4.14)
"$# % &'% &'(*) &*+ (&, ) '% # - . ) (&%/, (0 (*0 1 - , , %2/3 4
x5768:9;
< = > ?@*A B;CDCE576/F; GIH y576J;H y=5.42
arcmin. Entro 5 arcmin attorno all’asse ottico l’astigmatismo si mantiene inferiore a 0.2 arcsec.
Lo studente può provare a controllare gli spot-diagrams ottenuti con OSLO simulando un
disallineamento degli specchi.
Se l’errore nel posizionamento del secondario è solo nella sua posizione ma non nel suo
allineamento, si introducono ugualmente delle aberrazioni, in particolare l’aberrazione sferica e
la Coma. La prima è maggiore della seconda. Anche l’astigmatismo viene introdotto da questo
errore ma è sempre trascurabile rispetto alle altre due aberrazioni.
Senza dimostrarlo diamo i risultati per l’aberrazione sferica nel caso del telescopio classico e
aplanatico:
53
m(m 2 − 1) ds2
ASA(classico) =
16 F 3 f1
(4.16)
m(m 2 − 1) 2 ds2
ASA(aplan.) = 1+
(m − 1)( m − β ) f1
3
16 F
Un confronto con le relazioni precedenti mostra che i telescopi aplanatici sono più sensibili dei
telescopi classici agli errori di posizionamento del secondario. Si noti la dipendenza da F3 per
cui un primario rapido è più sensibile a questo errore.
Un confronto delle dimensioni relative di ASA e ATC per i telescopi aplanatici con secondario
spostato è riassunto in Tab. 4.13.
RC AG
ASA 0.912 0.846
ATC 0.252 0.174
dove le aberrazioni sono date in arcsec e la Coma è data relativamente ad un angolo di campo
di 18 arcmin. I parametri dei telescopi sono gli stessi considerati precedentemente.
54
5 CAPITOLO 5
5.1 La sovrapposizione delle onde
∂2 Ψ ∂2 Ψ ∂2 Ψ 1 ∂2 Ψ
+ + 2 = 2 2 (5.1)
∂x 2 ∂y 2 ∂z v ∂t
1(r, t 2(r,
Una significativa proprietà di questa equazione è la sua linearità.
t n(r, t) sono
r, t) e le sue derivate
soluzioni individuali della (5.1) ogni combinazione lineare di esse sarà anch’essa soluzione.
Pertanto,
! n
!
Ψ (r , t ) = ∑ Ci Ψ i (r , t ) (5.2)
i =1
dove i coefficienti Ci sono costanti arbitrarie. Noto come principio di sovrapposizione, questa
proprietà suggerisce che il risultato di una perturbazione elettromagnetica in un punto dello
spazio è la somma algebrica delle singole onde che la costituiscono. Si tenga a mente che
questo risultato solo nel caso lineare: altri tipi di onde, come quelle sonore, possono in alcuni
casi generare risposte non lineari. Ad esempio un fascio laser collimato ad alta intensità (il
campo elettrico può raggiungere i 1010 V/cm) può produrre effetti non lineari.
In molti casi possiamo trascurare la natura vettoriale della luce. Per esempio se le onde
luminose si propagano tutte lungo una stessa direzione ed hanno un medesimo piano di
vibrazione costante, esse possono essere descritte in termini di una sola componente del
campo, e quindi trattate come quantità scalari. Nel seguito rappresenteremo la perturbazione
elettromagnetica con la quantità scalare E(r, t), soluzione dell’eq. (5.1).
Ci sono diversi metodi per sommare onde della stessa frequenza; ne esaminiamo alcuni che
possono essere utili in diversi contesti.
dove E0 è l’ampiezza del disturbo armonico che si propaga lungo l’asse positivo x. Per separare
la parte spaziale da quella temporale scriviamo:
55
α ( x, ε ) = − (kx + ε )
cosicché:
E ( x, t ) = E0 sin [ω t + α ( x, ε )] (5.4)
E1 = E01 sin(ω t + α1 )
(5.5)
E2 = E02 sin(ω t + α 2 )
E = E1 + E2 (5.6)
che per esteso è:
Poiché le quantità entro parentesi sono costanti nel tempo si può porre:
che non è una sostituzione ovvia, ma sarà legittimata quando risolveremo per E0
Quadrando e sommando le (5.9) si ottiene:
Una singola perturbazione risulta dalla sovrapposizione delle onde sinusoidali E1 ed E2. L’onda
risultante è anch’essa armonica e con la stessa frequenza e velocità, ma la sua ampiezza e la
56
sua fase sono differenti. Si noti che quando E01 E02 nella (5.11) α ≈ α1 e quando
E02 E01 è α ≈ α 2 , la risultante è in fase con la componente dominante. Essendo la densità di
flusso proporzionale al quadrato dell’ampiezza, si vede anche che la densità di flusso risultante
dalla sovrapposizione non è semplicemente la somma delle densità di flusso delle singole
componenti, ma c’è un termine addizionale; questo contributo 2 E01 E02 cos(α 2 − α1 ) è detto
termine di interferenza. Il fattore cruciale è la quantità δ = α 2 − α1 . Quando
δ = 0, ±2π , ±4π .... la risultante ampiezza è massima, mentre per δ = ±π , ±3π ... è minima. Nel
primo caso le onde sono in fase e le creste si sovrappongono, nel secondo le creste d’onda sono
fuori fase di 180° . In Fig. 5.1 A e B la linea continua in grassetto rappresenta l’onda risultante.
A.
B.
Si osservi che la differenza di fase può essere introdotta da una differenza nel cammino ottico
attraversato dalle due onde, come pure da una differenza di fase iniziale, cioè:
57
2π
δ = (kx1 + ε 1 ) + (kx2 + ε 2 ) = ( x1 − x2 ) + (ε1 − ε 2 ) (5.13)
λ
dove
x 1 ex2sono
le distanze
! ! dalle
"$#$ sorgenti
&delle
% '! due
! ! onde
(' ) al p* %
! +
è la
, ,
1- 2 e:
2π
δ= ( x1 − x2 ) (5.14)
λ
Questo vale anche nel caso in cui le perturbazioni provenienti da una stessa sorgente viaggiano
lungo strade differenti. Essendo n = c / v =λ0 / λ si ha:
2π
δ= n( x1 − x2 ) (5.15)
λ0
La quantità n(x1-x2) è detta differenza di cammino ottico ed indicata con OPD (optical path
./ 0 0 1 2 1 34 1 578
6 4 63 9;:=<>@?AB >=C DE
Λ / λ0 = ( x1 − x2 ) / λ è il numero di onde nel mezzo
corrispondenti alla differenza di cammino; una strada è diverse lunghezze d’onda più lunga
dell’altra. Poiché ad ogni lunghezza d’onda si può associare una variazione di fase di 2F
radianti, δ = 2π ( x1 − x2 ) / λ o:
δ = k0 Λ (5.16)
dove
JK L L M N L OkP 0NQSèRilTJnumero
KU$K P+L KWdiVX$propagazione
N L Y[Z Z nel vuoto. Una strada è quindi G=H I dianti più lunga
1 \ 2 è costante, indipendentemente dal suo valore, sono dette
coerenti.
Un caso speciale di interesse è quello della sovrapposizione di due onde:
dove E01=E02 e k]_^` a 2 b c 1. Lo studente può provare a ricavare quindi il seguente risultato
della sovrapposizione:
k ∆x ∆x
E = 2 E01 cos sin ω t − k x + (5.18)
2 2
Questo mette in luce chiaramente il ruolo svolto dalla differenza di cammino d_e , specialmente
fg$h ijkl mWkijmon kikpm q'm n n mr its h n mWu v λ la risultante ha un ampiezza che è
1 wyx 2). Se ∆x z
circa 2E01, mentre se ∆x = λ / 2 è zero. Nel primo caso si parla di interferenza costruttiva, nel
secondo di interferenza distruttiva.
Si può dimostrare che la sovrapposizione di un qualsiasi numero di onde armoniche
coerenti con una medesima frequenza e direzione di propagazione è sempre un’onda armonica
della stessa frequenza, cioè in generale la somma:
n
E = ∑ E0i cos(αi ± ω t ) (5.19)
i =1
58
è data da:
E = E0 cos(α ± ω t ) (5.20)
dove abbiamo usato il coseno al posto del seno e le quantità E0 ed
delle (5.10) e (5.11).
Consideriamo ora l’emissione di una comune sorgente di luce (quali un bulbo
incandescente, una candela, una lampadina). Possiamo pensare questa sorgente come costituita
di un numero enorme N di atomi che emettono radiazione. Un torrente di fotoni si manifesta
nel suo complesso come un’onda elettromagnetica. E’ utile immaginare il fotone come un
impulso oscillatorio di breve durata. Ogni atomo è una sorgente indipendente di fotoni e quindi
di treni d’onda fatti di brevi impulsi oscillatori. La durata dell’emissione di un singolo fotone
varia da 1 a 10 ns. In altre paralo la fase del treno d’onda è costante al massimo per 10 ns, dopo
di che varia rapidamente e casualmente. Pertanto in ogni evento la fase della luce emessa da un
(t) rimarrà costante rispetto alla fase della luce di un altro atomo (t) per al più 10 ns.
i j
Poiché la densità di flusso è proporzionale alla media temporale di E02, presa in un ampio
intervallo di tempo, si avrà in questo caso che:
poiché il termine con il coseno in media va a zero. Questo è il medesimo processo che accade
in un orchestra dove diversi strumenti (ad esempio N violini) suonano insieme, ed il risultato
finale dà sempre l’effetto di un violino aumentato di intensità N volte.
Per questo motivo due lampadine, che emettono singolarmente luce che varia rapidamente di
fase, e sarà quindi difficile assistere a fenomeni di interferenza usando questo tipo di sorgenti.
All’estremo opposto se le N sorgenti sono coerenti ed in fase l’intensità totale sarà:
N iα
E = ∑ E0 j e j e + iω t (5.24)
j =1
La quantità
N
E0eiα = ∑ Eoj e
iα j
(5.25)
j =1
59
è nota come ampiezza complessa dell’onda risultante. Poiché
possiamo sempre calcolare l’intensità risultante usando la (5.25) e (5.26). Per esempio se N=2
− −
E02 = ( E01eiα1 + E02eiα 2 )( E01e iα1 + E02e iα 2 ) (5.27)
5.2.3 I Fasori
La somma descritta dall’eq. (5.25) può essere rappresentata graficamente come un’addizione di
vettori nel piano complesso. L’ampiezza complessa è nota come fasore ed è specificata dalla
sua magnitudine e fase (il fasore si descrive quindi con il simbolo E0∠α1 ). Immaginiamo di
avere una perturbazione descritta dalla
E1 = E01 sin(ω t + α1 )
In Fig. 5.2 A) l’onda è rappresentata da un vettore di lunghezza E01 che ruota in senso
antiorario con velocità , e la sua proiezione sull’asse verticale è E01 1). In B) è
mostrata la somma di due fasori.
A) I B) I
E02
E0
E01
E01
E1
R R
60
come abbiamo visto precedentemente. Gli studenti provino a sommare i fasori
5∠0°,10∠ 45°,1∠ − 15°,10∠120° e 8∠180° .
Abbiamo già detto che la somma di soluzioni dell’eq. D’onda è essa stessa una soluzione.
Perciò in generale,
Ψ ( x, t ) = C1 f ( x − vt ) + C2 g ( x + vt )
soddisfa l’equazione d’onda. Ad esempio esaminiamo due onde armoniche della stessa
frequenza che si propagano in direzioni opposte (un caso pratico si ha quando l’onda incidente
è riflessa da uno specchio). Immaginiamo che l’onda incidente provenga da sinistra e incida
sullo specchio ad x=0 e sia data dalla:
EI = E0 I sin(kx + ω t + ε I ) (5.29)
ER = E0 R sin(kx + ω t + ε R ) (5.30)
E = E0 I [sin(kx + ω t ) + sin(kx − ω t )]
Questa è l’equazione di un’onda stazionaria. Il suo profilo non si muove nello spazio. In ogni
punto x=x’ l’ampiezza è una costante data da 2 E0 I sin kx ' , e E(x’,t) varia armonicamente come
cos "! # $ %
&' % ()! % * è ad x=0, + , -.
/ 0)12 3 45 6 6 67 8:9; < = >< ?8 @ A BC; è sempre nulla. Questi sono
detti punti nodali. A metà strada tra i punti nodali, cioè a x=D E FG
HI J KL)M N O PQ R R RS T U VXWY Z [ [ UX\UXY S
vaolre massimo ±2E0I.
Se la riflessione sullo specchio non è perfetta, l’onda risultante conterrà sia una componente
che si muove sia una componente stazionaria. In quest’ultimo caso si avrà un trasferimento di
energia, cosa che non avveniva nel puro caso stazionario.
Le onde stazionarie esistono anche in due e tre dimensioni. Il fenomeno è assi comune. Si
pensi alle onde prodotte da una chitarra, alla superficie di un tamburo,etc. Con il fenomeno
delle onde stazionarie è associato il ben noto fenomeno della risonanza. L’orecchio umano ad
esempio è una cavità risonante. Il Laser è un altro esempio di sistema che sfrutta la proprietà
della risonanza per costruire la propria potenza emissiva.
61
5.3 La sovrapposizione di onde con diversa frequenza
Fino ad ora abbiamo visto la sovrapposizione di onde con la stessa frequenza. Nella realtà non
esistono le onde puramente monocromatiche, ma solo le onde quasi monocromatiche, per le
quali ci dovrà essere un ristretto intervallo di frequenze. Lo studio di questo tipo di luce ci
porterà agli importanti concetti di lunghezza di banda e di tempo di coerenza.
Vediamo ora come si comportano le onde con diversa frequenza.
5.3.1 I battimenti
ω1 + ω 2 ω1 − ω 2
ω≡ ωm ≡
2 2
(5.33)
k +k k −k
k ≡ 1 2 km ≡ 1 2
2 2
per cui,
E = 2 E01 cos(km x − ω m t ) cos(kx − ω t ) (5.34)
L’onda totale può essere pensata come un’onda di frequenza ω ma con un’ampiezza variabile
nel tempo o modulata E0 ( x, t ) = 2 E01 cos(k m x − ω mt ) , tale che:
E ( x, t ) = E0 ( x, t ) cos(kx − ω t ) (5.35)
saranno sempre piuttosto grandi. Inoltre, se sono
! " #! %$'& 1 ( ) 2, allora m
1 2
ω * ω e E ( x, t ) varierà lentamente, mentre E(x,t)
0
varierà rapidamente. La densità di flusso è proporzionale a:
62
Si noti che E02 ( x, t ) oscilla attorno al valore 2E012 con una frequenza angolare 2ω m che è nota
come frequenza di battimento. Quindi E0 varia con la frequenza di modulazione, mentre E02
con la frequenza di battimento. Un esempio è dato in Fig. 5.3.
A.
B.
Fig. 5.3 La sovrapposizione di onde con diversa frequenza. In A si vedono le due onde con diversa frequenza con
due tratteggi diversi. In B la linea continua rappresenta (in modo approssimativo) l’andamento dell’onda
risultante, mentre la linea tratteggiata l’andamento della modulazione.
Con l’avvento del Laser l’osservazione dei battimenti è stata molto facilitata. Frequenze di
battimento da pochi Hz a 1010 Hz possono essere osservate. Il fenomeno dei battimenti è utile
per misurare piccole variazioni di frequenza. L’effetto Doppler è una comune applicazione di
questo fenomeno.
63
E ( x, t ) = E0 ( x, t ) cos(kx − ω t )
consiste di un’onda di alta frequenza ω , con ampiezza modulata da una funzione coseno.
Supponiamo per un momento che l’onda non sia modulata, cioè che E0=costante. Ogni picco
dell’onda si muoverebbe con la velocità di fase
v =ω /k
Questa è la velocità di fase dell’onda, che sia o non sia modulata. Nel secondo caso i picchi
cambiano ampiezza periodicamente durante il passaggio dell’onda. C’è però un altro moto
importante da considerare, quello della modulazione dell’onda. Supponiamo allora adesso che
le due onde E1(x,t) ed E2(x,t) avanzino con la stessa velocità v1=v2. In questo caso l’onda
risultante, con i battimenti, è stazionaria, e si propagherà con la medesima velocità vg=v=
v1=v2. Con il nome di velocità di gruppo intendiamo la velocità con cui si propaga la
modulazione. Questo avviene nei mezzi non dispersivi in cui la velocità di fase è indipendente
dalla lunghezza d’onda, cosicché le due onde hanno la stessa velocità.
Più in generale essendo E0 ( x, t ) = 2 E01 cos(k m x − ω mt ) possiamo scrivere che la modulazione
viaggia ad una velocità dipendente dalla fase dell’inviluppo, e quindi
ω m ω1 − ω 2 ∆ω
vg = = = (5.36)
km k1 − k2 ∆k
dω
vg = (5.37)
dk ω
La modulazione (o segnale) si propaga ad una velocità vg che può essere maggiore, uguale o
minore di v, velocità di fase dell’onda. In un mezzo a dispersione normale vg<v, mentre nel
caso di dispersione anomala vg>v. Essendo v la (5.37) dà:
dv
vg = v + k (5.38)
dk
Di conseguenza in un mezzo non dispersivo in cui v è indipendente da !"$#&% g=v. nel
vuoto '() c, v=c, e vg=c. Nei mezzi dispersivi (v1*,+ 2) in cui n(k) è nota, -./ c/n e si può
riscivere la (5.38) nella forma:
c kc dn k dn
vg = − 2 = v 1 − (5.39)
n n dk n dk
Per i mezzi ottici (lenti) l’indice di rifrazione cresce con la frequenza (dn/dk>0) e quindi vg<v.
Lo studente si ponga il problema se un segnale possa viaggiare ad una velocità maggiore di c.
64
La sovrapposizione di onde armoniche di diversa ampiezza e lunghezza d’onda può dar luogo
ad un onda risultante periodica, ma anarmonica, cioè non sinusoidale. Nella realtà sono le onde
puramente armoniche che non esistono, e quindi occorre sviluppare un metodo per studiare
questo nuovo tipo di onde.
2π 2π
f ( x ) = C0 + C1 cos x + ε1 + C2 cos x + ε 2 + ... (5.40)
λ λ/2
dove le C sono costanti e naturalmente la f(x) può corrispondere ad una f(x-vt). E’ più
conveniente riformulare la (5.40) servendosi dell’identità trigonometrica
A0 ∞ ∞
f ( x) = + ∑ Am cos mkx + ∑ Bm sin mkx (5.41)
2 m=1 m =1
dove il primo termine è stato scritto così per convenienza matematica (si veda oltre). Il
processo di determinazione delle costanti Am e Bm prende il nome di analisi di Fourier. Lo
studente può provare a ricavarsi questi coefficienti integrando la (5.41) tra 0 e <
=?>A@ > B C
> D
E
F/@ G
dell’ortogonalità delle funzioni trigonometriche. Si ottiene:
2 λ
λ ∫0
A0 = f ( x)dx
2 λ
λ ∫0
Am = f ( x ) cos mkxdx (5.42)
2 λ
Bm = ∫ f ( x ) sin mkxdx
λ 0
+1 se 0 < x < λ / 2
f ( x) =
−1 se λ / 2 < x < λ
65
vedi Fig. 5.4. Poiché f(x) è dispari Am=0 e
2 λ/2 2 λ
λ ∫0 λ ∫λ / 2
Bm = ( +1) sin mkxdx + (−1) sin mkxdx =
1 1
= [− cos mkx ]0λ / 2 + [cos mkx ]λλ / 2
mπ mπ
+1
0
x
4 4
B1 = B2 = 0 B3 =
π 3π
4
B4 = 0 B5 = ,...
5π
da cui:
4 1 1
f ( x) = (sin kx + sin 3kx + sin 5kx + ...) (5.43)
π 3 5
La Fig. 5.5 mostra come l’onda sintetizzata si avvicina alla f(x) quanti più termini della serie si considerano.
+1
0
x
Fig. 5.5 La sovrapposizione dei primi due termini della serie. Considerando le armoniche successive si riproduce
sempre meglio l’onda quadra.
66
Per passare dal dominio spaziale a quello temporale basta sostituire kx con . Pertanto
abbiamo visto che ogni onda anarmonica può sempre essere pensata come una sovrapposizione
di onde armoniche di diversa frequenza. Possiamo quindi scrivere:
∞ ∞
A
f ( x ± vt ) = 0 + ∑ Am cos mk ( x ± vt ) + ∑ Bm sin mk ( x ±vt ) (5.44)
2 m=1 m =1
+1
0
x
4 4 sin m 2π / a
A0 = e Am =
a a m2π / a
L’espressione entro parentesi che riscriviamo come sinc u = (sin u ) / u è molto importante
perché comparirà da ora in poi in diversi contesti. Lo studente è quindi invitato a ripassarsi le
proprietà di questa funzione (vedi ad es. Hecht 1998, pag. 48). Essendo il limite di questa
funzione 1 per x che tende a zero, gli Am possono rappresentare tutti i coefficienti se m=0,1,2,...
Rispetto alla Fig. 5.4 l’origine è ora in x=0, e la serie contiene tutti termini in coseno anziché in
seno, ma le armoniche sono inalterate: le sinusoidi che danno l’onda quadra dispari divengono
cosinusoidi per l’onda pari.
Se la larghezza dell’impulso dell’ onda quadra è 2( , cioè una qualunque frazione della
lunghezza d’onda, la serie di Fourier si scrive:
2 ∞ 4
f ( x) = + ∑ sinc m2π / a cos mkx (5.45)
a m =1 a
1 2 1 1
f ( x) = + (cos kx − cos 3kx + cos 5kx − ...) (5.46)
2 π 3 5
67
Si noti che al decrescere delle dimensioni dell’impulso occorrono sempre più coefficienti della
serie (cioè più armoniche) per riprodurre l’onda. Questo può essere capito osservando il
rapporto:
Am sin m 2π / a
= (5.47)
A1 m sin 2π / a
Si vede che per a=4 il nono termine (m=9) è piccolo, A9 1. Mentre per a=400,
A9
1. Possiamo quindi ipotizzare che non è il numero totale di termini della serie che è
importante, ma piuttosto le dimensioni relative delle più piccole caratteristiche dell’onda che
devono essere riprodotte rispetto alla lunghezza d’onda. Per un’onda di forma complessa
occorrono molte armoniche, o componenti ad alta frequenza per riprodurre l’onda.
a)
1 A0
A1
A2 A3
mk
0 k 2k 3k 4k 5k .....
0 2# 4# 6# 8# 10# .....
$ %& % ./ 0 1 2 354 0 358 9 1 : 2 3 9 = >
?
@ A
' ( ' )* +,
- *67 * * ;<
b)
1/2
mk
B C DE FG HI J K L L L L L
0 k 2k 3k 4k 5k .....
Fig M N M O5P QR
S T UV W X Y Z5[ W \ ] ^ Z5_ ` X a \ Y Z5\ bc5` d efg h
68
c)
1/4
mk
0 2k 4k 6k 8k 10k .....
Facciamo
;< = = > ? @BAC= D la
EGF stessa
HI? JKBLMK cosa <SAMET< T;* EG
NPOQRponendo +-,/
U V. W X/
0 1S
< 24
Y Z3 57
[G68\ ]_
3 9 : è^ `Ia mantenendo
bcBdMc e/\ f chginalterata
ikj lm iSi m n o lap i q larghezza
a lroS\ so
produciamo con questi cambiamenti è quella di allontanare i picchi. Si vede immediatamente
però che lo spettro delle frequenze necessarie per riprodurre l’onda cambia. In particolare
t uv7w xy tkz tk{ | w }uMw x~ tkw 7 Mw { { w xy h7wk x z uM t v7G
wk}uMt x// | w wkwSz tS{ ux~ xw
somiglia sempre di più ad un singolo impulso, lo spazio tra ognuno dei coefficienti A(mk)
decresce B hM - PM
7
1 ∞
∫0 B(k ) sin kxdk
∞
π ∫0
f ( x) = A( k ) cos kxdk + (5.48)
+∞
A(k ) = ∫
−∞
f ( x ) cos kxdx
+∞
(5.49)
B(k ) = ∫
−∞
f ( x) sin kxdx
La somiglianza con le serie è quindi ovvia. Si noti anche come le ampiezze dei contributi alla
sintesi variano con la funzione sinc introdotta prima.
69
70
6 CAPITOLO 6
6.1 Interferenza
Il fenomeno dell’interferenza si presenta spesso sotto i nostri occhi in diversi contesti, si pensi
ad esempio alla configurazione di colori che si vedono in una sottile macchia d’olio su di un
pavimento di asfalto, o all’interazione tra le onde in una piscina d’acqua.
Noi abbiamo già detto nel precedente capitolo che l’origine di questo fenomeno risiede
nella sovrapposizione delle onde. Si ricordi infatti che l’espressione che descrive la
perturbazione ottica è un’equazione differenziale lineare alle derivate parziali omogenea del
secondo ordine. Come abbiamo visto le soluzioni di questa equazione obbediscono al Principio
di Sovrapposizione. Pertanto il risultante campo elettrico E in un punto dello spazio dove due o
più onde si sovrappongono è uguale al vettore somma delle singole perturbazioni.
Nel presente capitolo esamineremo i diversi tipi di interferometro, che dividiamo in due
grandi gruppi: gli interferometri a divisione del fronte d’onda e quelli a divisione di ampiezza.
Nel primo caso porzioni del fronte d’onda primario sono usate sia direttamente come sorgenti
di onde secondarie, sia in congiunzione con altri elementi ottici per produrre sorgenti
secondarie di onde virtuali. Queste onde secondarie sono fatte nuovamente incontrare per
interferire. Nel secondo caso l’onda primaria è divisa in due segmenti che attraversano due
percorsi differenti con diverso cammino ottico prima di ricombinarsi.
Abbiamo già esaminato il problema della sovrapposizione scalare di due onde, e in molti casi i
risultati ottenuti sono applicabili ancora nel presente contesto. Tuttavia la luce è un fenomeno
vettoriale; il campo elettrico e il campo magnetico sono campi vettoriali. Capire questo fatto ci
aiuta molto a comprendere il fenomeno dell’interferenza. E’ vero che in molte situazioni la
natura vettoriale della luce è di poca importanza pratica. Vedremo oltre in quali condizioni è
possibile trascurare la natura vettoriale della luce.
In accordo con il Principio di Sovrapposizione l’intensità del campo elettrico E, in un
punto dello spazio, derivante dai singoli campi E1, E2, ... è dato da:
E = E1 + E2 + ... (6.1)
La perturbazione ottica varia rapidamente nel tempo con una frequenza generalmente compresa
nell’intervallo 4.3×1014 -- 7.5×1014 Hz, cosa che rende impossibile misurare il valore
istantaneo del campo. La densità di flusso irradiata I può invece essere misurata direttamente
con diversi tipi di sensori (fotocellule, bolometri, emulsioni fotografiche, CCD, l’occhio).
Molti dei risultati qui di seguito presentati non fanno particolare riferimento alla forma del
fronte d’onda, perciò i risultati sono abbastanza generali.
Per semplicità consideriamo due sorgenti S1 e S2 che emettono onde monocromatiche delle
stessa frequenza in un mezzo omogeneo. Sia la loro separazione a λ e si scelga un punto di
osservazione P molto lontano (tale che le onde in P possano essere considerate piane, vedi Fig.
6.1). Per il momento si considerino solo delle onde polarizzate linearmente della forma:
E1 (r , t ) = E 01 cos(k1 ⋅ r − ω t + ε1 )
(6.2)
E 2 (r , t ) = E 02 cos(k 2 ⋅ r − ω t + ε 2 )
72
S2
S1
Fig. 6.1 Onde sferiche provenienti da due sorgenti S1 e S2 che si incontrano a grande distanza in P.
I= E2
T
è la costante dielettrica del mezzo, v la velocità di propagazione nel mezzo, ed E 2 è
la media temporale del modulo quadro del vettore campo elettrico. Trascurando le costanti
(rimanendo quindi nel medesimo mezzo) possiamo scrivere anche:
I = E2
T
E 2 = E ⋅ E = E12 + E 22 + 2E1 ⋅ E2
I = I1 + I 2 + I12
se:
I1 = E12
T
I2 = E 2
2 T (6.3)
I12 = 2 E1 ⋅ E2 T
L’ultima espressione è nota come termine di interferenza. Per il calcolo specifico si ha:
Separando il termine dipendente dal tempo e facendo la media temporale (si ricordi che
1 t +T
f (t ) T = ∫ f (t ' dt
) 'e nel nostro caso il periodo delle funzioni armoniche è
T t
si ha:
1
E1 ⋅ E 2 T = E 01 ⋅ E 02 cos(k1 ⋅ r + ε1 − k2 ⋅ r − ε 2 ) (6.5)
2
73
1 1
poiché cos 2 ω t ; sin 2 ω t
= = ; sin ω t cos ω t T
= 0.
T 2 T 2
Il termine di interferenza è quindi:
con δ = (k1 ⋅ r − k2 ⋅ r + ε1 − ε 2 ) differenza di fase che deriva dal diverso cammino ottico e dalla
diversa fase iniziale. Si noti che se E01 e E02 sono perpendicolari I12=0 e I=I1+I2. Il caso più
comune nella discussione che segue è quello in cui i vettori sono paralleli, per cui è possibile
passare alla semplice notazione scalare:
E 201
I1 = E12 =
T 2
E2
I 2 = E 22 = 02 (6.7)
T 2
I12 = 2 I1I 2 cos δ
e la densità di flusso totale diviene:
Nei vari punti dello spazio l’intensità totale può essere maggiore, minore o uguale ad I1+I2 a
"! # $ %'& è:
I max = I1 + I 2 + 2 I1 I 2 (6.9)
(
)
*+$ ,.-/ 0#12 /3/ 0#42 / 5 5 56 798
: ; < = >+? @ < 9> A B C 7
= ; D E ; D ; 7
F @G< CIH
C ? ;J= >= @ A K; 7
= ;L? >#< = D := = C M@L;JA @
differenza di fase tra le due onde è data H@KN:A = C OA C.C 7
= ; D CPH
C.12 Q.R SUTVWSIX TVTZY V3[ \ X S
]_^` \ VWT
a
b.c T#X d b'e R SfTVWSfX TVT+[ ` Tg Y3[ \ X ShSGi
1+I2<I<Imax e si parla di interferenza parzialmente
j k#l m n om m p qr
s#t.u nv w_xy z {.j k#l v |.}3~N ~
~N ~
P 3 _ ~
.}I
.~N |_ +I . Per
9 # ' 1 2
la condizione di interferenza parzialmente distruttiva con I1+I2>I>Imin. Il
minimo di intensità si ha per onde fuori fase di 180 gradi, in cui i ventri dell’onda si
¡¡ ¢
£ ¢U ¤ ¤ ¥¦ ¥ § ¥ ¨ ¦ # © ª '¥«
δ
I = 2 I 0 (1 + cos δ ) = 4 I 0 cos 2 (6.11)
2
da cui si vede che Imin=0 e Imax=4I0.
L’eq. (6.8) vale anche se le onde emesse dalle sorgenti S1 e S2 sono sferiche (purché
Å λ ). In questo caso possiamo scrivere che la fase è
a
74
La (6.11) sarà valida quando la separazione tra S1 e S2 è piccola rispetto alle distanze r1 ed r2.
Se poi le sorgenti hanno uguale intensità abbiamo:
1
I = 4 I 0 cos 2 [k (r1 − r2 ) + (ε1 − ε 2 )]
2
! ! ! " ! #%$
& $(' $( )
$+* , -
$($
. / 01 243 5 6738
6739: : : ; :%<>= ?,= @7A(B<
C ?+01 2D
0E-5 :F7G @ C @ H H I J
K
<C I/ LM: 5 D
;N<M= = @ amo anche
riscrivere che il massimo si ha per:
O 2 O
Ognuna di queste due equazioni definisce una famiglia di superfici che sono iperboloidi di
rivoluzione con fuochi in S1 e S2. Se le sorgenti sono in fase all’inizio ( 1 2) le (6.13) si
semplificano in:
r1 − r2 = 2mπ / k = mλ
1 (6.14)
r1 − r2 = m 'π / k = m 'λ
2
per il massimo e minimo rispettivamente.
Le frange chiare e scure che si vedono interponendo uno schermo nella regione di interferenza
si dicono frange d’interferenza. I vari ordini di interferenza si susseguono al variare di m. Nella
PQ @ = N? G G <RI K
zona centrale tra S1 e S2 le frange appariranno sottili e parallele (dato infatti il piccolo valore di
a).
Se due fasci di luce devono interferire per produrre delle frange d’interferenza stabili, devono
avere approssimativamente la stessa frequenza. Una variazione significativa della frequenza
produrrebbe una differenza di fase fortemente variabile nel tempo, per cui il termine I12 sarebbe
uguale a zero in media.
Le frange più chiaramente visibili si hanno quando le due onde hanno circa la stessa
ampiezza. Le regioni scure e chiare corrispondono allora all’interferenza totalmente distruttiva
e costruttiva rispettivamente.
Le onde non devono essere necessariamente in fase per osservare le frange; basta che la
differenza di fase sia il più possibile costante, cioè che le onde siano coerenti.
Si ricordi che data la natura corpuscolare dei processi di emissione, una convenzionale sorgente
quasi monocromatica produrrà luce che è sempre un insieme di treni d’onda di fotoni. Pertanto
in ogni punto dello spazio illuminato il campo elettromagnetico oscillerà rapidamente
rimanendo in fase con se stesso per un tempo dell’ordine di 10 ns. Questo intervallo di tempo
nel quale possiamo rappresentare l’onda come una sinusoide, viene detto intervallo temporale
di coerenza. L’intervallo medio di tempo nel quale la luce oscilla in un modo prevedibile viene
detto tempo di coerenza della radiazione. Maggiore è il tempo di coerenza, maggiore è la
coerenza temporale della sorgente.
75
Osservata da un punto fisso dello spazio l’onda luminosa apparirà circa sinusoidale per un
certo numero di oscillazioni, dopo di che cambierà bruscamente la sua fase. L’intervallo
spaziale nel quale la luce oscilla in modo regolare è detta lunghezza di coerenza. Pertanto sarà
conveniente pensare al fascio di luce come ad una progressione, più o meno sinusoidale, di
gruppi d’onda di lunghezza media lc le cui fasi sono scorrelate l’una con l’altra.
Se la luce fosse puramente monocromatica, l’onda sarebbe una perfetta sinusoide con una
lunghezza di coerenza infinita. Tutte le sorgenti reali non sono così ed emetteranno quindi un
certo intervallo di frequenze, sia pur piccolo. Per esempio una comune lampada ha
generalmente una lunghezza di coerenza di alcuni millimetri, mentre certi tipi di laser hanno
una lunghezza di coerenza di decine di Km.
In Fig. 6.2 abbiamo disegnato le onde sferiche provenienti da una sorgente puntiforme
monocromatica. I diversi cerchi rappresentano le creste dell’onda. Scelto un punto P1 dello
spazio data la coerenza illimitata potremo sapere come sarà l’onda in ogni altro punto, essendo
l’onda sempre uguale a se stessa. Per contrasto in Fig. 6.3 mostriamo una sorgente che cambia
frequenza di momento in momento. In questo caso si è persa la coerenza temporale, ma punti
che sono tra loro vicini avranno solamente una parziale coerenza temporale, a cui corrisponde
una lunghezza di coerenza. La distanza più piccola entro cui l’onda rimane sinusoidale, entro
cui cioè la fase è prevedibile, rappresenta la lunghezza di coerenza dell’onda.
Se adesso pensiamo ad una sorgente estesa, ogni singolo punto della sorgente emetterà
simili treni d’onda che interferiranno tra loro in tutto lo spazio ove si propagano le onde. Nella
realtà ognuna di queste sorgenti emetterà onde che rimangono tra loro in fase per al più 10 ns,
per cui nello spazio tutt’intorno la perturbazione risultante darà luogo ad un’onda con un tempo
di coerenza che sarà minore o uguale a 10 ns. Questo accade normalmente per la luce solare o
per la luce di un candela. Lo stesso dicasi per due lampadine che rimarranno in fase per un
tempo simile, non producendo quindi frange di interferenza osservabili e stazionarie. Oggi con
i laser i fenomeni di interferenza si possono studiare invece molto bene.
76
Fig. 6.3 Onde che sono solo parzialmente coerenti
Nel paragrafo precedente si è assunto che le due onde interagenti fossero linearmente
polarizzate e con i vettori paralleli. In realtà le stesse relazioni si possono applicare a contesti
più complicati, anche nel caso di nessuna polarizzazione. Per apprezzare ciò si ricordi che ogni
stato di polarizzazione della luce può essere sintetizzato per mezzo di due stati tra loro
ortogonali, e per la luce naturale questi due stati sono tra loro incoerenti.
Supponiamo ora che il campo E di un’onda piana possa essere separato nelle sue
componenti parallela E e perpendicolare E ⊥ . Pertanto, ogni onda piana, polarizzata o no, può
essere scritta nella forma (E + E ⊥ ) . Immaginiamo che due onde (E 1 + E⊥1 ) e
(E 2 + E⊥ 2 ) emesse da due sorgenti coerenti identiche si sovrappongono in una regione dello
spazio. La densità di flusso risultante consisterà di due sistemi di frange indipendenti
(E 1 + E 2 ) 2 e (E⊥1 + E⊥ 2 )2 . Perciò sebbene noi abbiamo ricavato le equazioni precedenti
T T
specificamente per lo stato di polarizzazione lineare, esse sono applicabili ad ogni stato di
polarizzazione, inclusa la luce naturale.
Si noti che E⊥1 ed E ⊥ 2 sono sempre tra loro perpendicolari, mentre E 1 e E 2 possono non
esserlo. Essi saranno paralleli solo quando i due fasci saranno tra loro paralleli (cioè quando
k1=k2). La natura vettoriale del processo di interferenza non può essere ignorata. Ci sono molte
situazioni pratiche in cui i due fasci sono paralleli, e quindi in questi casi la teoria scalare è
sufficiente a spiegare il fenomeno.
Fresnel e Arago hanno condotto uno studio intensivo delle condizioni in cui si realizza
l’interferenza tra fasci di luce polarizzata. I loro risultati possono riassumersi come segue:
1. Due fasci di luce coerente con stati di polarizzazione tra loro ortogonali, non possono
mai interferire, nel senso che I12=0 e le frange non si formano;
77
2. Due fasci di luce coerente con stati di polarizzazione tra loro paralleli interferiranno
sempre, anche nel caso di luce naturale;
3. I due stati di polarizzazione perpendicolari che costituiscono la luce naturale non
possono tra loro interferire e formare frange osservabili, anche se uno dei due è ruotato
artificialmente e allineato all’altro. Questo perché sono tra loro incoerenti.
Il principale problema nel produrre il fenomeno dell’interferenza è che le due sorgenti devono
essere coerenti. Il laser è l’unico apparecchio in grado di produrre un fascio sufficientemente
coerente. Come è stato possibile allora studiare il fenomeno prima della costruzione stessa del
Laser? Thomas Young risolse brillantemente questo problema dividendo in due porzioni (tra
loro coerenti) uno stesso fronte d’onda.
Consideriamo un’ipotetica onda piana che illumini una sottile e lunga fenditura (Fig. 6.4).
P
r2
S2 ym
r1
S a
!
m
B
S1
s
a o
Dalla prima fenditura la luce viene diffratta (vedi Cap. 7) ed emerge un fronte d’onda
cilindrico. Questa nuova onda viene ora fatta incidere su due fenditure parallele, sottili e molto
vicine S1 e S2. Con questa geometria il fronte d’onda primario che arriva sulle due fenditure
sarà esattamente in fase, e le due fenditure si comporteranno come due sorgenti coerenti.
Pertanto dove la luce proveniente da queste due sorgenti si incontrerà si avrà il fenomeno
dell’interferenza (se la differenza di cammino ottico è ovviamente inferiore alla lunghezza di
coerenza c tc). Oggi si può fare a meno della prima fenditura se si ha a disposizione una
deve
a o
essere molto grande in rapporto alla distanza a delle due fenditure.
La differenza di cammino ottico tra i due raggi nei cammini S1P e S 2 P può essere
determinata, con buona approssimazione, tracciando la perpendicolare da S2 a S1P . Si ha
quindi:
(S B ) = (S P ) − (S P ) = r − r
1 1 2 1 2 (6.15)
78
r1 − r2 = a sin θ ≈ aθ (6.16)
Essendo
a
r1 − r2 ≈ y (6.17)
s
In accordo con quanto detto nel paragrafo precedente si ha interferenza costruttiva quando
r1 − r2 = mλ (6.18)
s
ym ≈ mλ (6.19)
a
mλ
θm = (6.20)
a
s s s
∆y ≡ ym +1 − ym ≈ (m + 1)λ − mλ = λ (6.21)
a a a
k (r1 − r2 )
I = 4 I 0 cos 2 (6.22)
2
se naturalmente i due fasci incidenti in P sono coerenti ed hanno stessa intensità I0.
Con r1 − r2 ≈ ya / s la densità di flusso totale diviene:
yaπ
I = 4 I 0 cos 2 (6.23)
sλ
79
degrado nella qualità (contrasto) delle frange. Se poi la lunghezza di coerenza diviene più
piccola della differenza di cammino ottico, le frange spariscono.
Se la sorgente primaria è di luce bianca, tutti i colori che la costituiscono arriveranno in
y=0 in fase, per cui l’ordine zero di interferenza sarà bianco, mentre tutti gli altri massimi
mostreranno le varie lunghezze d’onda, essendo ym
In conclusione l’esperimento di Young consiste di due fenditure in fase poste ad una
distanza s>>a. In generale s è così grande che il sistema di frange osservate corrisponde alla
configurazione di frange osservate nella diffrazione di Fraunhoffer (vedi Cap. 7).
Lo studente provi a pensare alle due fenditure come ad una funzione costituita da due delta
di Dirac e provi a riflettere sulla trasformata di Fourier di una funzione di questo tipo. Si
accorgerà che la trasformata di una funzione di questo tipo consiste in una funzione coseno.
I più comuni tra questi tipi di interferometro sono il doppio specchio di Fresnel, il doppio
prisma di Fresnel, e lo specchio di Lloyd.
Il doppio specchio di Fresnel è mostrato in Fig. 6.5. Un fronte d’onda cilindrico esce dalla
fenditura S ed è riflesso dai due specchi. Le frange di interferenza si formano nella regione di
spazio dove i due fronti d’onda riflessi si sovrappongono (punto P). Uno schermo impedisce al
fascio primario di giungere in P senza essere riflesso dagli specchi.
schermo
S P
r1
r2
A B
S1
S2
Fig. 6.5 Il doppio specchio di Fresnel. Le linee tratteggiate sono tutte pari ad R. La geometria è esagerata.
80
Le immagini S1 e S2 della sorgente S nei due specchi possono essere considerate come sorgenti
separate e coerenti, distanti a l’una dall’altra. Dalla legge della riflessione si ha che SA = S1 A e
SB = S 2 B , ed è anche SA + AP = r1 e SB + BP = r2 . La differenza di cammino ottico tra i due
raggi è allora r1 r2. I vari massimi si hanno quindi per r1 − r2 = mλ , come per l’interferometro
di Young. La separazione tra le frange è data da:
s
λ ∆y ≈
a
è molto piccolo se si
dove s è la distanza tra il paino delle due sorgenti virtuali e lo schermo P.
La geometria è esagerata per chiarire la figura; l’angolo
! ! " # #
%$ & & '( " & & ! '
! % " ) '+*-,./0
decresce a decresce e le frange si allargano.
Il doppio prisma di Fresnel è mostrato in Fig. 6.6. Un singolo fronte d’onda cilindrico incide su
entrambi i prismi. Nella regione di sovrapposizione dei due fasci si formano le frange.
S1
a S >
S2
Fig. 6.6 Il doppio prisma di Fresnel. Consiste di due prismi sottili attaccati per la loro base.
Per un punto sullo schermo è come se ci fossero due sorgenti S1 e S2 distanti a da cui proviene
luce coerente. L’espressione per la separazione delle frange è la stessa usata precedentemente.
Lo specchio di Lloyd, di cui non mostriamo la figura, funziona con lo stesso principio. Un
fronte d’onda cilindrico si sovrappone con il fronte d’onda riflesso da uno specchio di
materiale o dielettrico o metallico. Rispetto ai casi precedenti c’è da notare che per effetto della
riflessione la differenza di fase subisce una variazione di 1 243
576 895 :; < = à di flusso diviene:
yaπ
I = 4 I 0 sin 2
sλ
81
Le frange dello specchio di Lloyd sono complementari a quelle dell’interferometro di Young;
ai massimi dell’uno corrispondono i minimi dell’altro. Ad y=0 si avrà una frangia scura
anziché chiara.
S
E1r
E2r
n1 D
A C
nf d
B
82
paralleli quando lasciano la pellicola e possono essere fatti incontrare usando una lente
convergente o semplicemente possono essere focalizzati sulla retina dall’occhio accomodato
per la visione all’infinito.
Dalla Fig. 6.7 si vede che la differenza di cammino ottico tra i due fasci è:
( ) ( )
Λ = n f AB + BC − n1 AD
( ) (6.24)
( ) ( )
ed essendo AB = BC = d / cosθ t si ha:
( )
2n f d
Λ= − n1 AD
cosθ t
δ = k0 Λ ± π
o più esplicitamente
4π n f 4π d 2
δ= d cos θ t ± π = (n f − n 2 sin 2 θ i )1/ 2 ± π (6.26)
λ0 λ0
Il segno della differenza di fase non è importante per cui scegliamo il segno
di
!semplificare
#" $% & ' un po’i conti. In luce riflessa si avrà un massimo di interferenza in P quando
è per multipli pari di ( ) * +,-. / 0 12 3 / 14 365 78) 97:<;- ò riscriversi:
λf
d cos θ t = (2m + 1) (6.27)
4
λf
d cos θ t = 2m (6.28)
4
83
Si noti la presenza di multipli pari e dispari di λ f / 4 . Si ricordi che queste equazioni vanno
modificate nel caso in cui n1 > n f > n2 o se n1 < n f < n2
non è presente in questo caso.
Se la lente usata per mettere a fuoco i raggi riflessi dalla pellicola ha una piccola apertura, si
vedranno le frange solo su una piccola porzione di questa (solo i raggi che lasciando la
sorgente vengono riflessi nella lente saranno visibili). Per una sorgente estesa la luce
raggiungerà la lente da varie direzioni, e le frange si distribuiranno su una più vasta area di
pellicola. L’angolo i di incidenza, relativo alla posizione di P, controllerà di fatto !"
che appaiono nel punto P1 (Fig. 6.8) vengono dette frange di uguale inclinazione.
sorgente estesa
lente
schermo
film
P1
Tutti i raggi inclinati di uno stesso angolo arrivano nello stesso punto. Si ricordi però che un
punto di una sorgente estesa è incoerente rispetto ad un altro punto. E’ ogni singolo raggio che
diviso in due dal film produce l’interferenza. La medesima inclinazione garantisce l’arrivo
nello stesso punto. L’immagine della sorgente estesa riflessa nella superficie sarà attraversata
da frange chiare e scure. Ognuna di queste è un arco di circonferenza il cui centro è nel punto
di intersezione tra il film e la perpendicolare tracciata da P1 al film.
Quando lo spessore della pellicola cresce la separazione AC tra E1r e E2r cresce fino a che
uno dei due raggi non è più in grado di entrare nella lente (o nella pupilla dell’occhio) e le
frange spariscono. La separazione può anche essere ridotta cambiando i, guardando ad #
esempio il film con un angolo di incidenza prossimo alla normale. Si vedono in questo caso le
frange circolari (dette anche frange di Haidinger).
84
6.5.3 Frange di uguale spessore
Esiste
un’intera classe di frange di interferenza in cui il parametro dominante è n fd i
t) nella (6.26) e sono note come frange di uguale spessore. Esse derivano quindi da una
variazione di spessore del film. Le bande di interferenza di questo tipo sono simili alle isoipse
di una mappa topografica. Ogni frangia è il luogo di tutti i punti del film che hanno lo stesso
spessore (questo se nf non varia). Pertanto esse sono molto utili per testare la qualità delle
ottiche (lenti, prismi, etc.). Per esempio la superficie da esaminare può essere posta in contatto
con una superficie otticamente piatta (cioè che non devia più di
!
L’aria nello spazio tra le due superfici si comporta come una sottile pellicola generando le
frange di interferenza. Se la superficie da analizzare è anch’essa piatta, appariranno delle
frange rettilinee egualmente spaziate, come accade osservando uno strato d’aria a forma di
cuneo (il cuneo si forma perché microgranuli di polvere di diverse dimensioni sono disposti tra
le due superfici sovrapposte). Due vetri separati da una parte da un foglio di carta sottile
possono dare la medesima configurazione di frange (Fig.6.9).
occhio
E1r
E2r
sorgente
estesa
BS
foglio di
carta
=
Fig. 6.9 Frange che originano da uno strato sottile d’aria a forma di cuneo.
Osservate ad inclinazione quasi normale le frange originate da un film non uniforme vengono
d" # # "%$ & ' ()"+*,.-/, 0 " ' 132
4
" &51(76 1(" 8
9 8# # , : "+6 ;"%$ 8& <'%1(' ()8: 8 =>@? A%BC D D E F E GH A%BC.I A JKJKC GL
ottico tra i due raggi riflessi è approssimativamente data dalla (6.25), dove d è lo spessore in un
punto particolare, tale che:
d = xα
Per pC I I L? CMA ? LF CBCN i la condizione per avere massimi di interferenza diviene:
1
(m + )λ0 = 2n f d m = 2α xm n f (6.29)
2
Poiché n f = λ0 / λ f , xm si scriverà:
85
m + 1/ 2
xm = λf (6.30)
2α
I massimi si hanno a distanze dal vertice del cuneo d’aria pari a λ f / 4α , 3λ f / 4α , ...e le frange
consecutive sono separate da una distanza , data da:
∆x = λ f / 2α (6.31)
Si noti che la differenza di spessore nel film d’aria tra due massimi consecutivi è λ f / 2 . Poiché
il raggio riflesso dalla superficie più bassa attraversa il film due volte ( i t
adiacenti differiscono in cammino ottico di λ f . Si noti inoltre che lo spessore del film nei vari
massimi è dato da:
m + 1/ 2
dm = λf (6.32)
2
occhio
BS
E2r E1r
Una lente è piazzata su una superficie otticamente piatta ed illuminata con luce quasi
monocromatica ad incidenza normale. L’uniformità degli anelli concentrici che si formano è
una misura del grado di perfezione della lente. Sia R il raggio di curvatura della lente. La
relazione tra la distanza x e lo spessore del film d’aria d è data da:
x 2 = R 2 − ( R − d )2 = 2 Rd − d 2
86
Essendo R>>d si ha che:
x 2 = 2 Rd
Assumiamo di poter esaminare solo i primi due raggi riflessi E1r e E2r . Il massimo di
interferenza di ordine m si avrà come per la pellicola sottile quando lo spessore è in accordo
con la relazione:
1
(m + )λ0 = 2n f d m f
2
Il raggio dell’m-esimo anello brillante sarà quindi:
1/ 2
1
xm = m + λ f R (6.33)
2
e quello dell’m-esimo anello scuro:
xm = (mλ f R)1/ 2 (6.34)
Se i due vetri sono perfettamente a contatto nel punto centrale (x0=0) vi sarà lì un minimo di
interferenza (d tende a zero). In luce trasmessa avremo invece un massimo.
Gli anelli di Newton (che sono frange di Fizeau) si possono distinguere dalle frange
circolari di Haidinger per il modo in cui il diametro dell’anello varia con l’ordine m. Nel
centro degli anelli di Haidinger si ha ad esempio un massimo. Un altro modo per testare la
qualità delle ottiche fa uso delle tecniche interferometriche (vedi prossimi paragrafi).
M2
BE BS
S M1
detector
Fig. 6.11 L’interferometro di Michelson. M1 ed M2 sono specchi; BS=Beam Splitter; BE=Beam Expander
87
Una sorgente S emette luce che viene collimata da una lente BE su di un BS. Il fascio è diviso
in due parti; entrambi i fasci vengono riflessi dai due specchi M1 ed M2, e ripassando per il BS,
si rifondono dando luogo alle frange di interferenza. Eventualmente queste possono essere fatte
convergere da una lente su di un detector.
Poiché il BS ha la parte semi-argentata riflettente su di una faccia (la parte scura in figura)
il raggio che va verso M2 passa tre volte per il BS, mentre quello per M1, una sola volta.
Conseguentemente i due raggi percorrono un diverso cammino ottico e quando si incontrano
nuovamente danno luogo alle frange di interferenza (se il cammino ottico è minore della
lunghezza di coerenza della sorgente). Se si usa luce non laser occorre inserire una lastra di
vetro compensatrice nel ramo OM1 per poter vedere le frange. Con luce laser invece i due
specchi possono essere anche a distanze diverse dal BS, che le frange continuano a vedersi.
Una delle esperienze del corso consiste nella misura del contrasto delle frange in funzione della
mutua distanza degli specchi. Tramite queste misure è possibile ricavare la lunghezza di
coerenza della sorgente laser (vedi dispense di laboratorio).
Si
rifletta
che
data
la dispersione
della
luce
nel BS il cammino ottico sarà una funzione di
ù possibile monocromatiche.
Per comprendere come le frange si formino si osservi la Fig. 6.12.
M2 M’1 S2 S1
S
X
MQ WY Z
O’ Z
detector
2d
[ [ [
d 2 1
Fig. 6.12 Schema concettuale dell’interferometro di Michelson in cui non consideriamo la lente collimatrice.
Un osservatore nella posizione del detector vedrà simultaneamente entrambi gli specchi M1 ed
M2 insieme alla sorgente !"$#%'& (
& ) *+ (,.- ,/0& 21& *$#43# 5 62 7 &
8 9 : 9 ,/ 8 9 ,2; (
& + /,
che M’1 corrisponde all’immagine dello specchio M1 nel BS. La posizione di questi elementi
nel diagramma dipende dalla loro posizione relativa rispetto al BS (ad esempio M’1 può essere
davanti, dietro o coincidente con M2< #=>) ?@ 9 : & - &'A 1 BA 2 sono le immagini della sorgente
negli specchi M1 ed M2 rispettivamente.
Consideriamo ora un singolo punto di una sorgente estesa che emette luce in tutte le
direzioni, e seguiamo un singolo raggio che in un punto O incontra il BS e si separa in due. I
due raggi vengono riflessi quindi da M1 ed M2. Per un osservatore posto nel detector i due
raggi riflessi sembrano provenire da due sorgenti separate S1 ed S2, che si comportano come
due sorgenti coerenti.
Come mostra la figura la differenza di cammino è 2dcosC , che rappresenta una differenza
di fase di k0DEF GH I . C’è inoltre un’ulteriore differenza di fase di JBK L M
N L O
P N4Q RSMS K N TLML UV L P P W
che il raggio che passa per il ramo OM2 subisce una riflessione interna nel BS.
Per questo motivo risulta un’interferenza distruttiva quando:
88
dove m è un intero. Se questa condizione è soddisfatta per il punto S, allora sarà
olo di raggio O’S, dove O’ è
localizzato sull’asse del detector. Un osservatore vedrà con il proprio occhio un sistema di
frange circolari concentriche. A causa della piccola apertura dell’occhio l’osservatore non potrà
però vedere le frange a meno di non utilizzare una lente convergente, come in Fig.6.12.
Se usiamo come sorgente una lampada che contiene un gran numero di frequenze (ad
esempio una lampada al mercurio), la dipendenza di m 0 richiede che ogni componente
formi il proprio sistema di frange.
In generale se si vuole utilizzare una sorgente che non sia un laser, la differenza di
cammino ottico deve essere prossima a zero se si vuole osservare le frange.
In luce laser quasi monocromatica le frange appaiono come un sistema di anelli chiari e
scuri. Ogni anello corrisponde ad un dato ordine m. Movendo M2 verso M’1, d decresce e per
la (6.35) cos ! m cresce (mentre ! m decresce). Gli anelli si addensano verso il centro e gli ordini
più alti spariscono via via ogni qualvolta d "# $ % # & $ #
"')( 0/2. Gli anelli rimanenti si allargano
man mano fino a riempire l’intero schermo. Quando si raggiunge d=0 la frangia centrale
* + , -/.+ ,/0 10 0 23 24 5 6, * -2879:4 4 , ;<25 +83 =<+ > > , * , ;? =<+8> = 4 ,<+A@+ ;0 * 2< otta dalla riflessione interna
al BS, l’intero schermo apparirà scuro (ma la mancanza di perfezione negli elementi ottici può
rendere questa situazione inosservabile). Movendo ancora M2 le frange riappaiono e sembrano
allontanarsi dal centro dello schermo.
La costruzione di Fig. 6.12 rappresenta una sola delle possibili configurazioni, quella in cui
i raggi emergenti sono coppie parallele. Poiché questi raggi non si incontrano, essi non possono
formare un’immagine senza l’ausilio di una lente (che molto spesso è proprio il nostro occhio
accomodato per la visione all’infinito). Le frange risultanti sono quelle di uguale inclinazione.
Oltre a queste frange virtuali all’infinito vi sono anche frange reali formate da raggi
convergenti. Si pensi infatti alla Fig. 6.1. A tutti gli effetti S1 e S2 sono due sorgenti coerenti
separate nello spazio. Queste frange appaiono nello spazio davanti all’interferometro, dove si
pone generalmente il detector.
Quando gli specchi dell’interferometro sono inclinati l’uno rispetto all’altro, facendo un
piccolo angolo (cioè quando M1 e M2 non sono perpendicolari), si formano le frange di uguale
spessore o di Fizeau. Tra M2 ed M’1 si forma un sottile strato d’aria a forma di cuneo che crea
il sistema di frange parallele e rettilinee. I raggi che interferiscono appaiono divergere da un
punto dietro agli specchi e l’occhio deve mettersi a fuoco su questo punto per rendere le frange
localizzate osservabili. Movendo opportunamente l’orientazione dei due specchi si possono
realizzare frange rettilinee, circolari, ellittiche, paraboliche o iperboliche, e questo vale sia per
le frange reali che virtuali.
L’interferometro di Michelson può essere usato per fare misure molto precise di
spostamento (o di lunghezza d’onda della luce). Infatti quand23 2B4 ., 5 5 6+ 2B4 +C-/12D,<+CE 0/2,
ogni frangia si muove nella posizione precedentemente occupata dall’altra. Potendo contare il
numero di frange che si spostano si risale allo spostamento tramite l’equazione:
∆d = N (λ0 / 2 )
L’interferometro di Michelson può essere usato insieme a dei filtri polarizzatori per verifica le
leggi di Fresnel-Arago. Inserendo i polarizzatori nei due rami si possono infatti vedere i
cambiamenti prodotti nelle frange dalla variazione dell’angolo di polarizzazione.
89
6.7 Altri interferometri
detector
BE
S
specchio
BS
Le due onde all’interno dell’apparato viaggiano su due percorsi separati. Una differenza di
cammino ottico può essere introdotta da un leggero “tilt” di uno dei BS. Essendo separati i due
percorsi, l’interferometro è un po’ difficile da allineare. Le sue applicazioni sono comunque
innumerevoli. Generalmente lungo uno dei due percorsi viene interposto un oggetto (che può
essere un vetro, un’ampolla con del gas, un tubo con del plasma, etc.) che produce una
differenza di cammino ottico.
Un altro tipo di interferometro molto usato è quello di Sagnac (Fig. 6.14). Esso è molto
facile da allineare ed è piuttosto stabile. Tra le sue applicazioni abbiamo anche l’uso come
giroscopio. Ne esistono versioni a tre specchi, come in figura, o anche a due soli specchi.
La principale caratteristica è che ci sono due percorsi identici ma opposti per i due rami
dell’interferometro. Un leggero spostamento nell’orientazione dei due specchi produce le
frange di interferenza. Poiché i due rami sono sovrapposti e quindi inseparabili,
l’interferometro non può essere utilizzato in modo convenzionale.
Prima di parlare più in dettaglio delle frange reali e virtuali, consideriamo un altro tipo di
interferometro, detto interferometro di Pohl. Si tratta semplicemente di uno strato di materiale
trasparente illuminato da una sorgente puntiforme. In questo caso le frange sono reali e
possono quindi essere intercettate da uno schermo posto nelle vicinanze del detector, senza
bisogno di una lente convergente.
90
BE
S
specchio
BS
detector
Il principio fisico che soggiace a tutti i tipi di interferometro considerati per sorgenti
puntiformi, può essere facilmente apprezzato per mezzo della Fig. 6.15 a) e b).
a) b)
P
P
S2
S2
S1 S S1 S
2d d
Fig. 6.15 Illuminazione da parte di una sorgente puntiforme di due superfici parallele a) e di due superfici
inclinate b).
Le due superfici parallele o inclinate rappresentano le configurazioni in cui possono trovarsi gli
specchi o anche il materiale trasparente dell’interferometro di Pohl.
Assumiamo che P sia un punto dove si ha interferenza costruttiva. Uno schermo piazzato
in questo punto intercetterà un massimo di interferenza, insieme al resto del sistema delle
frange, senza bisogno di una lente che converga i raggi. S1 ed S2 sono le due sorgenti virtuali
coerenti che danno luogo all’interferenza (e sono le immagine sugli specchi della sorgente S).
Sia l’interferometro di Michelson e di Sagnac hanno questo tipo di frange.
91
6.7.2 Tipo e localizzazione delle frange
Regione di
localizzazione delle
frange reali
S
Regione di
localizzazione delle
P frange virtuali
92
6.8 Interferenza multipla
Fino ad ora abbiamo esaminato le situazioni in cui due soli raggi coerenti si combinano per dar
luogo all’interferenza. Esistono comunque circostanze in cui un numero molto maggiore di
onde mutuamente coerenti si combinano per interferire. Occorre cioè considerare le altre onde
riflesse E3r , E 4r ,... Una lastra di vetro leggermente argentata da entrambe le parti per renderla
altamente riflettente, genererà un gran numero di riflessioni interne. Consideriamo ora solo il
caso in cui la pellicola ed il substrato siano di materiale dielettrico, in modo da evitare
variazione di fase più complicate dovute alle superfici metalliche.
Indichiamo con r e t rispettivamente i coefficienti di riflessione e trasmissione quando il
raggio passa dall’aria al vetro e con r’ e t’ quando il raggio passa dal vetro all’aria. In Fig. 6.17
vediamo come si comportano le ampiezze dei vari raggi riflessi e trasmessi.
E0
E0t
E0tr’
E0tr’ 2 E0r
E0tr’ 3
Fig. 6.17 Interferenza multipla da una pellicola sottile trasparente a piani paralleli
Le ampiezze scalari delle onde riflesse e trasmesse sono indicate in figura. Consideriamo prima
l’insieme dei raggi paralleli riflessi. Le differenze di fase derivano da una combinazione di
differenti cammini ottici e variazioni di fase introdotte dalle varie riflessioni. Tuttavia le onde
sono mutuamente coerenti e se sono focalizzate da una lente produrranno interferenza. La
densità di flusso risultante ha una forma semplice in due casi particolari. In primo luogo
ricordiamo che la differenza di cammino ottico tra due raggi adiacenti è:
Λ = 2n f d cosθ t (6.36)
Si noti allora che tutte le onde, eccetto la prima (E1r), hanno un numero dispari di riflessioni
interne alla pellicola. Ne segue che ad ogni riflessione interna la componente del campo
elettrico parallela al piano di incidenza cambia fase (di 0 o
93
incidenza), mentre la componente perpendicolare non ha variazioni. Chiaramente allora tutte le
onde dopo la prima avranno la stessa fase essendoci un numero dispari di riflessioni interne.
Come primo caso particolare consideriamo allora il caso in cui Λ = mλ . La seconda, la terza,
la quarta e le successive onde saranno tutte in fase in P (punto di convergenza della lente che
focalizza i raggi paralleli uscenti dalla pellicola). L’onda E1r invece è fuori fase di
tutte le altre onde. L’ampiezza totale risultante nel punto P sarà allora:
dove poiché Λ = mλ abbiamo rimpiazzato r’ con r. La serie geometrica in parentesi converge
a 1/(1 − r 2 ) per r2<1, per cui:
E0trt '
E0 r = E0 r − (6.37)
(1 − r 2 )
essendo tt ' = − 1 r 2 (vedi leggi di Stokes), ne segue che E0r = 0. Pertanto quando Λ = mλ le onde
riflesse n. 2, 3, 4 e successive cancellano esattamente la prima onda riflessa dando come
risultato un minimo di interferenza.
1
Il secondo caso speciale si ha per Λ = (m + )λ . Adesso il primo e il secondo raggio sono
in fase e tutti gli altri sono fu
2
è il secondo è fuori fase con il terzo, il terzo con
il quarto, e così via. L’ampiezza scalare risultante è allora:
tt ' r2
E0 r = E0 r 1 + 2
= E0 (6.38)
(1 + r ) (1 + r )
2
4r 2 E02
Ir = (6.39)
(1 + r 2 )2 2
2r 2 (1 − cos δ )
I r = Ii
(1 + r 4 ) − 2r 2 cos δ
(6.40)
(tt ' 2)
=
It Ii
(1 + r 4 ) − 2r 2 cos δ
94
[2r /(1 − r 2 )]2 sin 2 (δ / 2)
I r = Ii
1 + [2r /(1 − r 2 )]2 sin 2 (δ / 2)
(6.41)
1
It = Ii
1 + [2r /(1 − r )] sin 2 (δ / 2)
2 2
dove l’energia non è assorbita, cioè tt’+ r2 = 1 e Ii = It + Ir. Questo non sarà vero se lo strato
che copre la pellicola è di materiale non dielettrico, come nel caso di un metallo semi-
trasparente.
4π n f
d cos θ t = (2m + 1)π
λ0
2
2r
F ≡ 2
(6.42)
1− r
Ir F sin 2 (δ / 2)
=
Ii 1 + F sin 2 (δ / 2)
(6.43)
It 1
=
Ii 1 + F sin 2 (δ / 2)
Il termine al denominatore delle (6.43) è noto come funzione di Airy; esso rappresenta la
densità di flusso trasmessa.
95
7 CAPITOLO 7
7.1 La diffrazione
Il principio di Huygens consiste appunto nel pensare ogni punto di un fronte d’onda come
sorgente secondaria di onde sferiche. L’inviluppo dei fronti d’onda sferici ad un dato tempo t
costituisce il nuovo fronte d’onda. La tecnica escogitata considera però soltanto alcuni fronti
d’onda secondari, e per questo motivo non è in grado di dar spiegazione a tutte le
caratteristiche
dell’immagine
! " " ottenuta
# $% per
" diffrazione.
& ' )(* & +( Ad
,-esempio
& $( &" ( le& ( . onde
,(sonore
" / ,)( (" (& & (
non passa e si forma l’ombra. Poiché il principio di Huygens risulta indipendente da ogni
considerazione sulla lunghezza d’onda, con esso si può prevedere un fronte d’onda uguale per
le due perturbazioni, sia sonora che luminosa.
La difficoltà di questa impostazione fu risolta da Fresnel aggiungendo il concetto di
interferenza. Il principio di Huygens-Fresnel afferma quindi che ogni punto non oscurato di un
fronte d’onda, ad un dato istante, è una sorgente di onde sferiche secondarie (con la stessa
frequenza dell’onda primaria). L’ampiezza della nuova perturbazione in ogni punto è quindi
data dalla sovrapposizione di tutte le onde secondarie (tenendo conto della loro ampiezza e
della01*
fase
2 3*2 relativa).
45671 8 8 3!9%: ;593 <#=> ? ? @*A> B C DB E@ F G HI>
è grande rispetto all’apertura h, si avrà che
l’effetto della perturbazione sarà avvertito anche a grandi angoli rispetto alla direzione
originaria (vedi Fig. 7.1).
a) b)
raggio
luminoso
J K L M N M OQP RS%P T UWV X Y Y Z U [ [ K \ P]L X U ^_X [ ` K \ P a bb h. Il raggio luminoso prosegue indisturbato il suo cammino; b) Caso
c d e e f'c g h h i f j g k l dm n h. Il raggio viene sparpagliato a vari angoli rispetto alla direzione rettilinea.
97
Il caso limite dell’ottica geometrica si ha quindi per λ → 0 .
Il principio di Huygens-Fresnel ha alcuni problemi, che esamineremo più avanti, oltre ad
essere fino a questo punto piuttosto ipotetico, per cui anticipiamo che una trattazione più
rigorosa di questo problema è stata sviluppata da Kirchhoff, che è anch’essa
un’approssimazione valida quando le dimensione della fenditura sono grandi rispetto a
difficoltà vengono dal fatto che si cercano le soluzioni di un’equazione differenziale alle
derivate parziali le cui condizioni al contorno sono imposte dal tipo di ostacolo. La soluzione
rigorosa si ottiene perciò solo in alcuni casi speciali. E’ bene sottolineare che il problema di
determinare la soluzione esatta di un particolare fenomeno di diffrazione è tra i problemi più
difficili dell’ottica fisica. Soluzioni rigorose non esistono a tutt’oggi in molte situazioni anche
di interesse pratico. In ogni caso il semplice metodo di Huygens-Fresnel ci sarà utile per
risolvere molte situazioni di carattere sperimentale.
La diffrazione può essere pensata come dovuta all’interazione delle onde elettromagnetiche
con un ostacolo fisico. E’ utile a questo proposito riesaminare cosa realmente accade quando
ad esempio l’ostacolo è un oggetto opaco.
Una possibile descrizione è quella di uno schermo considerato come un continuo, cioè in
cui la sua struttura microscopica può essere trascurata. Per un metallo non assorbente (con
conduttività infinita) possiamo scrivere le equazioni di Maxwell per il metallo ed il mezzo
circostante e far combaciare i due al confine tra i due mezzi. Soluzioni precise si possono
ricavare per configurazioni molto semplici.
Esaminando lo schermo su scala microscopica immaginiamo la nuvola elettronica intorno
ad ogni atomo messa in vibrazione dal campo elettrico della radiazione incidente. Il modello
classico degli oscillatori armonici va abbastanza bene per ciò che concerne il nostro problema,
cosicché possiamo trascurare la descrizione quanto-meccanica. L’ampiezza e la fase di un dato
oscillatore all’interno dello schermo sono determinate dal campo elettrico totale attorno ad
esso. Questo è dovuto alla sovrapposizione della radiazione incidente e al campo prodotto da
tutti gli altri oscillatori in vibrazione.
Un grande schermo opaco senza aperture, sia esso un foglio di carta nero o uno strato di
alluminio, ha un immediato effetto sulla radiazione incidente: dopo di esso il campo
elettromagnetico è nullo. Gli elettroni vicini alla superficie illuminata sono posti in
oscillazione dalla radiazione incidente. Essi a loro volta riemettono radiazione (della stessa
frequenza), che in ultima analisi è riflessa indietro, assorbita o entrambe le cose. Se l’onda
incidente si propaga anche all’interno del materiale si eccitano via via strati sempre maggiori di
oscillatori, e se lo schermo è spesso abbastanza l’onda si affievolisce fino a scomparire. Ma
anche un materiale ordinario se è sufficientemente sottile diviene trasparente alla radiazione.
Adesso rimuoviamo un piccolo dischetto di materiale dallo schermo, cosicché la luce passi
attraverso l’apertura. Gli oscillatori che uniformemente ricoprono il dischetto sono rimossi con
esso, così i rimanenti elettroni dello schermo non sono più affetti da quest’ultimi. In prima
approssimazione possiamo assumere che la mutua interazione degli oscillatori è
completamente trascurabile, per cui gli elettroni dello schermo sono completamente
indifferenti alla rimozione degli elettroni del dischetto. Il campo nella regione oltre l’apertura
sarà allora quello che esisteva prima della rimozione del dischetto, cioè zero, meno il
contributo del dischetto stesso. A parte il segno, è come se la sorgente e lo schermo fossero
stati rimossi lasciando solo gli oscillatori del dischetto, piuttosto che viceversa. In altre parole
il campo di diffrazione può essere pensato come dovuto esclusivamente da un insieme di
98
ipotetici oscillatori armonici distribuiti sulla regione dell’apertura. Da qui naturalmente
l’analogia con il principio di Huygens-Fresnel.
Possiamo aspettarci comunque, che l’interazione tra gli oscillatori non sia del tutto nulla,
ma che vada via via scemando con la distanza. In questa visione più realistica gli oscillatori in
prossimità dell’apertura saranno affetti dalla rimozione del dischetto. Per aperture grandi, il
numero di oscillatori rimossi è molto più grande del numero di oscillatori ai confini
dell’apertura. In questo caso, se il punto di osservazione è abbastanza lontano dall’apertura, il
principio di Huygens-Fresnel è in grado di predire un corretto andamento del campo. Se invece
l’apertura è piccola, o il punto di osservazione è prossimo all’apertura stessa, gli effetti al
bordo diverranno importanti e possiamo aspettarci delle deviazioni dall’andamento previsto
dalla semplice applicazione del principio di Huygens-Fresnel.
non si vede più l’immagine dell’apertura. Muovendo ancora più lontano cambia solo la
dimensione della figura di diffrazione ma non la sua forma. Questo fenomeno è noto come
diffrazione di Fraunhofer. Se a questo punto potessimo cambiare la lunghezza d’onda della
radiazione e farla tendere progressivamente a zero, si rivedrebbe la configurazione di Fresnel,
le frange andrebbero via via sparendo e si tornerebbe a vedere l’immagine della fenditura così
|~
:
come predetto dall’ottica geometrica.
O O ¡¢ £¤¥ ¦§ ¨© ª¤ © ¤ « «¤¬ ® ¦ § § © ¯ ¦ ¨°¤® ¦±:© ¤ ¥ °¤ ¬ °² ³¤
´ © °®¤® ¦ ¥ µ ° ¯ ® ¦¶R·¸¤¸¤¦ ¬¹º° µ ¨® ¦¨:¥ ¥ ¤ © » ¯ ¦ ¨°¤¼6¥ ¨°¨¤ ° µ © ª« ¦¬ ¨° µ ° ¦®½+£:¥ ¦³¥ ¤ ª¹© ¤
la diffrazione di Fraunhofer. In sostanza se le onde che arrivano sullo schermo sono piane e
quelle che arrivano in P sono pure piane, si ha sempre la diffrazione di Fraunhofer. Se invece la
curvatura di entrambi i fronti d’onda è significativa prevale la diffrazione di Fresnel.
Ogni punto dell’apertura deve essere pensato come sorgente secondaria di onde sferiche.
Pertanto quando S è vicina all’apertura su di essa arrivano onde sferiche e quindi su ogni punto
l’onda incidente avrà intensità leggermente diversa, mentre se il fronte d’onda è piano, su ogni
punto arrivano onde con la stessa intensità. Più o meno la stessa cosa accade per le onde che
vanno dall’apertura al punto P. Anche se ogni punto dell’apertura emette onde della stessa
ampiezza, se P è vicino le onde che convergeranno su di esso sono sferiche e varieranno
pertanto in ampiezza per la diversa distanza di ogni punto dell’apertura da P. Si comprende
quindi la maggior semplicità della diffrazione di Fraunhofer. Come regola pratica, si ha
diffrazione di Fraunhofer su di un apertura a, quando
R > a2 / λ
dove R è la più picc¾¿ ÀÁ ¿ ¿ ÂÁ Ã Ä Å À Æ Ç ÂÅ È ÀÉÂÊ+ËÂÅ È ÀÊ ÌÍ_Î ÏÐ Ñ ÒÓ Ð Ô ÕÌ Ö Ñ Ì× ÒÐ ÖØÙ R=ÚÜÛ Ý
dimensioni finite dell’apertura è di poca importanza. Inoltre una crescita di Þß à áâã ä å æ çä è
fenomeno della diffrazione di Fraunhofer.
99
Una
realizzazione
pratica
della
diffrazione
!"di#!Fraunhofer
$&%(' ) * sipuò
+ realizzare ponendo una
è localizzata nel fuoco della
lente L1, e il piano di osservazione è collocato nel fuoco della lente L2.
L1 L2
8 7
Come ponte logico tra lo studio dell’interferenza e della diffrazione consideriamo un insieme
di N oscillatori armonici disposti lungo una retta come in Fig. 7.3 (si pensi ad un sistema di
antenne).
r1
r2
r3
6
r...
rN
100
Gli oscillatori sono tutti identici anche nella loro polarizzazione. Per il momento assumiamo
che gli oscillatori non abbiano una differenza intrinseca di fase, cioè i fasori hanno tutti lo
stesso angolo di fase iniziale. I raggi mostrati in figura sono tutti tra loro quasi paralleli e si
incontrano in un punto P molto distante. Se la dimensione dell’insieme di oscillatori è piccola,
l’ampiezza delle onde che arrivano separatamente in P sarà essenzialmente uguale, avendo
percorso circa la medesima distanza, cioè,
La somma delle onde sferiche che interferiscono per dare il campo elettrico risultante in P, è
dato dalla parte reale della:
E = E0 (r )ei ( kr1 −ωt ) + E0 (r )ei ( kr2 −ωt ) + ... + E0 (r )ei ( krN −ω t ) (7.1)
dove abbiamo usato la notazione esponenziale anziché quella trigonometrica per comodità di
calcolo. E’ chiaro che in questo caso non dobbiamo preoccuparci della natura vettoriale della
luce per cui possiamo scrivere la (7.1) nella forma:
(eiδ N − 1) /(eiδ − 1)
sin N δ / 2
E = E0 (r )e −iωt ei[ kr1 + ( N −1)δ / 2] (7.5)
sin δ / 2
Si noti che se definiamo R come la distanza dal centro dell’insieme lineare di oscillatori ed il
punto P, cioè
1
R = ( N − 1)d sin θ + r1
2
101
l’eq. (7.5) diviene:
−ω t ) sin N δ / 2
E = E0 (r )ei ( kR (7.6)
sin δ / 2
Infine allora, la densità di flusso all’interno della figura di diffrazione di N sorgenti identiche
coerenti è data da EE * / 2 per E complessa, da cui:
sin 2 ( N δ / 2)
I = I0 (7.7)
sin 2 (δ / 2)
dove I0 è la densità di flusso di ogni singola sorgente che arriva in P. Per N=0, I=0, per N=1,
2
I=I0, e per N=2, I=4I0cos
à visto precedentemente.
La dipendenza funzionale di I è più chiara mettendo la (7.7) nella forma:
lentamente.
L’espressione
combinata
dà
luogo
ad
!
una
serie
di
massimi
# $&%piccati
' ( )*+separati
,-/.021)da
0 4 56 7 8 9 m"
±1, ±2, .... Poiché 3 si ha:
d sin θ m = mλ (7.9)
d sin θ m = mλ − ε / k (7.10)
Concentrandoci
® ¯°±® ±²³´ ³¡µ sul massimo ´º» ±« centrale
® º ® ±¯m=0,
³¡ª ½ vediamo che possiamo spostare la sua orientazione
0 ¶ · ¸¹ · ¸· ·/¼
Per il principio di reversibilità, che asserisce che in assenza di assorbimento il mot
dell’onda è reversibile, porta a concludere che il campo di un antenna trasmittente o ricevente è
lo stesso. Un insieme di antenne, come ad esempio un radiotelescopio può quindi essere
¾¿ÀÁ  Á ÃÄ ÀÁ Å ÃÆ¿Ç È ÀÆÃ¿Àþ¾ÃÅ Á ¿ÀÂÆÄ É É È Å È ÀÊ ÂÆÄÉ Â Ë È/Á Å ÂÃÌÀÄË Ä ÀÌÃÍ Â ÀÁ È ÀÀÂÎ Ï2È Å¿ÀÆÂ Á áÐ
l’output del sistema corrisponde al segnale che arriva sulle antenne da una specifica direzione
dello spazio.
Esaminiamo ora il caso di una sorgente lineare di oscillatori (ad esempio una fenditura con
 Ñ&Ò Ó ÔÕÖרÙÚ×Û Ü¡ÝØÞÚß à Û ásà Üâ Öß ×Û ß/ã á Û Û áÝá/Ú××Úäß â Ü¡ß ×Üâ äßÝØÜà å Ø æ æ á Û Üâ ØçØ å Ø ר à à Ø 䨿 è Ú×Ü
all’altro è sorgente di onde sferiche secondarie, per cui emette secondo la legge:
ε
E = 0 sin(ω t − kr )
r
102
dove abbiamo indicato esplicitamente la dipendenza da 1/r dell’ampiezza e la quantità ε 0 è
detta forza dell’oscillatore. Un segmento ∆yi di questa fenditura conterrà un numero di
oscillatori ∆yi ( N / D) , dove D è la lunghezza della fenditura. Immaginiamo di dividere la
fenditura in M segmenti per cui il contributo al campo elettrico dell’i-esimo segmento è:
ε N ∆yi
Ei = 0 sin(ω t − kri )
ri D
se ∆yi è così piccolo che gli oscillatori contenuti in esso hanno una differenza di fase relativa
trascurabile e il loro campi si possono sommare scalarmente. Per N → ∞ la forza di ogni
singolo oscillatore deve tendere a zero, se vogliamo che il campo in P sia un numero finito.
Definiamo pertanto una costante ε L come una forza degli oscillatori per unità di lunghezza,
cioè:
1
ε L ≡ lim (ε 0 N ) (7.11)
D N →∞
Con questa posizione possiamo scrivere il campo totale in P per M segmenti come:
M
εL
E =∑ sin(ω t − kri )∆yi (7.12)
i =1 ri
D/2 sin(ω t − kr )
E = εL ∫ dy (7.13)
−D /2 r
dove r=r(y). L’approssimazione usata per valutare la (7.13) deve dipendere dalla posizione di
P dalla fenditura e farà quindi la distinzione tra diffrazione di Fresnel e di Fraunhofer.
La sorgente lineare coerente non esiste ovviamente come entità fisica, ma è utile come
strumento matematico.
Sia ora il punto di osservazione P molto lontano dalla sorgente lineare coerente e sia R D .
In queste circostante r(y) non devia mai apprezzabilmente da R cosicché il contributo al campo
in P dall’elemento dy si scrive:
εL
dE = sin(ω t − kr )dy (7.14)
R
103
εL
dove dy è l’ampiezza dell’onda. Si noti che non abbiamo scritto R al posto di r nella fase in
R
quanto, al contrario dell’ampiezza, la fase è molto sensibile all’approssimazione che
utilizziamo. Espandiamo allora r(y) nel modo seguente:
dove è misurato nel piano xz. Il terzo termine può essere ignorato quando il suo contributo
alla fase è insignificante anche per y=±D/2; cioè (π D 2 / 4λ R) cos 2 θ deve essere trascurabile.
Questo è vero per tutti i valori di
R è molto grande. In questa situazione, detta
condizione di Fraunhofer, la distanza r è lineare in y.
Pertanto si ha:
εL D/2
E=
R ∫ −D /2
sin[ω t − k ( R − y sin θ )]dy (7.16)
e finalmente,
ε L D sin[(kD / 2) sin θ ]
E= sin(ω t − kR) (7.17)
R (kD / 2) sin θ
ε L D sin β
E= sin(ω t − kR) (7.18)
R β
1 ε D sin β
2 2
I (θ ) = L (71.9)
2 R β
dove sin 2 (ω t − kR) = 1/ 2
"!"# $ % & '# $ (& )* + !* , - - . / 0, 1 2 !3 4 563 / / . 56,
T
principale. Nell’approssimazione di Fraunhofer pertanto si ha che la densità di flusso irradiata
da una fenditura singola idealizzata come una sorgente lineare coerente è:
2
sin β
I (θ ) = I (0) = I (0) sinc β
2
(7.20)
β
7 8 8 9 : ; <= >8 > ??69 @ A > BB @ @ < A : <B C C D B 8 8 9"EFG9 8 @ B9 8 H A 9 8 8 > < : 9"I B C 9"H9 AKJL?> 8 G A B @ <6> :6< M :> H > B : <
N
Ocontenente
C G8 8 <6I B"A B H questo
> ; B ?69 :asse.
@ 9B"P Si9 A noti
<6H9 che RS TKU"V U βW X=YZ (π[ \ DUL/W λ] )^ _sinX \θ` X",a Zquando
AKJ Q'poiché \ X U ^ Xb ]DX ^ X \` λX laè quindi
densità di
equivalente per la (7.18) a quella di una sorgente puntiforme localizzata al centro del sistema.
Al contrario quando λ c D de è piccolo, sine f'g6h"i j k l m'i j nl op q r è la densità di flusso è costante
s h tvu w u u q x y qz {xr y qkoh"y z"| h { }q u w t z"t z ~ ~ r q x y q zz }w { zL~ r t xh {u h s w {u q | r t 6hp hh 6h u u hr { } h
sferiche.
104
7.3.2 La fenditura rettangolare reale
P F
dz
Pertanto ogni strisciolina può essere rimpiazzata da un’emissione puntiforme lungo l’asse z. In
effetti ognuno di questi emettitori irradia un’onda circolare nel piano xz (y=0). Il problema è
stato ridotto a trovare il campo nel piano xz dovuto ad un infinito numero di sorgenti
puntiformi coerenti che attraversano tutta la fenditura lungo l’asse z. Dobbiamo quindi
calcolare l’integrale dei contributi dE provenienti da ogni elemento dz nell’approssimazione di
Fraunhofer. Ma questa è a sua volta ancora una sorgente lineare coerente, cosicché la soluzione
è proprio la (7.20), con β = (kb / 2) sin θ , dove b è la dimensione lungo z della fenditura. In
&'( ) * +-, . ) +/) 01+ ) ) +2+-+ ) ) ( 3 4. 3 (5( 06!. ) ) 0 6 0 ) ( , +25. 3 02( 7 7 .50 ) * 3 0 8'9 0 +2(50: ; < =>?@ A B é C DED
è grande. I minimi si ottengono risolvendo l’equazione:
105
L’intensità minima, uguale a zero si ha per sin è per
! "
quindi i minimi si ottengono dall’equazione:
b sin θ m = mλ . (7.22)
tan β = β (7.23)
0ottenuta
2 1 3 4567 8ponendo
9:
; <=>? @uguale
A
BC DEFaG zero MNON P
IQI R S I entro parentesi nella (7.21). Essi # $%& ''(*)+ ,.-/
H
I I IJ ilKL numeratore
TU V V UXDobbiamo
WY Z [ Y \ [ ]^[aT Uquesto
V V _ Y `a[punto
U \ \ Ycb rimarcare
]^V _ Y ^d]V che
] e f ilg hprincipio
ij k jXhj l l di
mcnHuygens-Fresnel
o p p q m r o shjcnotq j u non
hj lu tiene conto
ov o j hjck shv s
di questo problema introducendo un termine detto fattore di obliquità. Nella diffrazione di
Fraunhofer
m v v sxk yjcz{l’apertura
hshxu o mXv q s e los*schermo
|q m hnjf sono così lontani che si può trascurare questo problema, a
w ww
f
In Fig. 7.5 è disegnata la distribuzione della densità di flusso in funzione di }
0)
1
Fig. 7.5 Andamento approssimato della densità di flusso nella diffrazione di Fraunhofer da una fenditura singola.
Si presti attenzione al fatto che i massimi secondari non riproducono esattamente la curva reale, non essendo
simmetrici.
Si noti innanzitutto che i massimi secondari sono molto deboli. I minimi di luce sono di
difficile localizzazione sperimentalmente, per cui la (7.22) non può essere usata per ricavare la
lunghezza d’onda della luce.
106
Se la sorgente emette luce bianca i vari massimi mostrano una successione di colori che va
dal blu al rosso. Ogni tipo di sorgente puntiforme è in grado di produrre il fenomeno osservato;
dalla luce del sole che passa attraverso un buco alla luce di un lampione notturno lontano.
Può sembrare a prima vista che il massimo principale sia sempre allineato con il centro
della fenditura. Questo non è sempre vero. La figura di diffrazione è in realtà centrata sull’asse
della lente L2, ed ha esattamente la stessa forma e localizzazione indipendentemente dalla
posizione della fenditura, se la sua orientazione non è cambiata e sono valide le
approssimazioni considerate.
contributi delle due fenditure si sovrappongono, e sebbene siano uguale come ampiezza,
possono essere significativamente diversi come fase. Poiché l’onda primaria eccita le sorgenti
secondarie nello stesso modo, avremo tutte sorgenti coerenti e quindi interferenza tra le varie
onde secondarie. Se la luce incidente incide normalmente alle fenditure, le sorgenti secondarie
sono tutte in fase e le frange di interferenza osservate dipenderanno dal diverso cammino ottico
i, ci sarà una differenza di fase costante tra tutte le onde secondarie di cui tenere
attraversato dalle onde secondarie delle due fenditure. Se la luce incidente arriva sulle fenditure
conto.
Il risultato è che sullo schermo si vedranno delle frange di interferenza modulate dalla
! " ! ! # %$ &' ( )"*+! & & ,! ' - ). /012 2 3 4 516 3 7 16 589 4 6 : l’analisi
figura di diffrazione mostrata prima.
/= >:@? 3= 15A16 B 4 C149 16 1D19 B 4%= 15:8CC 85: 6 13 C 7 3 C 3 B 10 3 ? 16 E: C B 3A8C B 3 7 16 534 9 9 3 C: 4 B :
fatta per la singola fenditura. Adesso ognuna delle due aperture è divisa in tante striscioline
(dz× ; <
lungo l’asse z. Il contributo totale, nell’approssimazione di Fraunhofer sarà allora:
b/2 a +b / 2
E = C∫ F ( z )dz + C ∫ F ( z )dz (7.24)
−b / 2 a −b / 2
sin β
E = bC [sin(ω t − kR) + sin(ω t − kR + 2α )] (7.25)
β
dove α ≡ (ka / 2) sin θ e, come prima β ≡ ~ (kb / 2)sin θ . Questa è proprio la somma dei due
campi nel punto P, da ognuna delle due fenditure. Semplificando la (7.25):
sin β
E = 2bC cosα sin(ω t − kR + α ) (7.26)
β
sin 2 β 2
I (θ ) = 4 I 0 cos α (7.27)
β
2
107
!"# %$%" $&
Se nella (7.27) b diviene molto piccolo (kb à
%!"* +! , " %! - +&.+./"+$
. $ 01)2/34 5
vista nell’esperimento di Young. Se invece a')(
(7.27) diviene I (θ ) = 4 I 0 (sin 2 β / β 2 ) che è equivalente a quella per una singola fenditura, a
0
parte il fattore 4. Graficando la (7.27) in Fig.(7.6) vediamo che il termine di interferenza cos2
è modulato dal termine di diffrazione sin 2 β / β 2 .
jkl m
4I0
op q o q pq n
f gh i gh i q
Fig. 7.6 Andamento approssimato della densità di flusso nella diffrazione di Fraunhofer da una fenditura doppia.
687:9 ;9 7:9<= 9 ;> 9 < 5 4 9? 9@ 5 ;;A/< 3 =CB 1DEFDGEFDHEFI I I F 7 3 ;J = 3 97:9 ;9 7:9? 3 > A ;K 5 = 9< 3 = 0/1LDEM GF
DHEM GFD)N EM GFI I I
01)H B O PQRST UT%V WTR X
La curva di Fig. 7.6 è ottenuta nel caso particolare che a=3b (cioè
terzo massimoO8secondario
[/\ ] ] R [:R] T V cade
^_U\ `sul
RT _primo
a ` ^/R Xbminimo
R V V ^cV T _dia ` diffrazione.
\ X T%URUR d d ` \ e Se
R ^_fosse
TP a=mb ci sarebbero
invece 2(mYZ
7.3.4 Il reticolo
La procedura per ottenere la densità di flusso per un’onda che incide su N fenditure (reticolo di
diffrazione) è la stessa di quella usata per due sole fenditure. Consideriamo allora il caso di N
fenditure larghe b e separate da una distanza a. Il contributo dovuto alla j-esima fenditura si
scrive:
sin β
E j = bC sin(ω t − kR + 2α j ) (7.28)
β
108
dove è sempre α ≡ (ka / 2) sin θ e, come prima β ≡ ~ (kb / 2)sin θ . Si noti che questa è
equivalente all’espressione per una singola sorgente lineare coerente. Sommando tutti i
contributi si ottiene:
N −1
sin β
E = ∑ bC sin(ω t − kR + 2α j ) (7.29)
j=0 β
sin β sin Nα
E = bC sin[ω t − kR + ( N − 1)α ] (7.30)
β α
2
sin β sin Nα
2
I (θ ) = I 0 (7.31)
β α
Si noti che la densità di flusso emessa nella direzione è I (0) = N 2 I 0 , dove I0 è la densità di
flusso emessa da ogni singola sorgente. Come prima la figura di interferenza è modulata dalla
figura di diffrazione. Se le aperture delle fenditure potessero essere portate a zero, la (7.31)
diverrebbe uguale alla (7.8), cioè il sistema si comporterebbe come un insieme di oscillatori
armonici coerenti.
!
"$# %
& '( ) #
* #,+# - .
I massimi principali
a sin θ m = mλ (7.32)
con m=0, ±1, ±2, ±3, .... I minimi con densità di flusso uguale a zero si hanno per:
π 2π 3π ( N − 1)π ( N + 1)π
α =± ,± , ± ,..., ± ,± ,... (7.33)
N N N N N
!
! 23( * &- ( )
#
* #,*
Tra due consecutivi massimi principali ci sono perciò N/10 ra ogni
coppia di minimi ci deve essere un massimo secondario che sarà localizzato a:
3π 5π
α =± ,± ,... (7.34)
2N 2N
+Lo
- studente
4 +( ) ( )'provi
( - ( - #5a "
calcolarsi
67'# "
l’intensità
- relativa dei massimi
6
+ 4 4 secondari
) )+-
rispetto ai 8 massimi
( 8 8
9 # 4 "( -
à che per grandi N ed
ha una densità di flusso:
2
sin β 2
2
I ≈ I (0) (7.35)
β 3π
109
Al crescere di N le righe si fanno via via più sottili, mantenendo però la stessa distanza relativa
a.
Esistono diversi tipi di reticoli di diffrazione. I primi tipi ad apparire agli inizi
dell’ottocento consistevano in una sottile griglia di fili (metallici o di tessuto) paralleli
sottilmente ed equamente spaziati. Il fronte d’onda nel passaggio attraverso questo sistema
incontrando zone trasparenti e zone opache, diventa modulato in ampiezza. Questo tipo di
configurazione è detta infatti reticolo di trasmissione a modulazione di ampiezza.
Un altro tipo di reticolo di trasmissione si ottiene strisciando con una punta di diamante un
vetro trasparente, producendo zone rettilinea ove la luce viene diffusa. Quando il reticolo è
totalmente trasparente, cosicché la modulazione in ampiezza è trascurabile, le variazioni
regolari di spessore inducono una modulazione di fase. Si parla allora di reticolo di
trasmissione a modulazione di fase. Il fronte d’onda emergente conterrà variazioni periodiche
nella sua forma piuttosto che nella sua ampiezza.
In riflessione quest’ultimo tipo di reticolo lavora altrettanto bene e si parla quindi di
reticolo di riflessione a modulazione di fase. Generalmente sono costruiti facendo evaporare
dell’alluminio su una lastrina di vetro su cui viene fatto strisciare una punta di diamante.
Al giorno d’oggi molti reticoli sono fatti con tecniche olografiche.
L’equazione del reticolo, guardando ad esso in direzione normale è dunque:
a sin θ m = mλ
I valori di m specificano i vari massimi principali. Per una sorgente a spettro continuo, come
una lampada a tungsteno, l’ordine
m=0
è una riga bianca, mentre per gli ordini superiori poiché
l’eq. del reticolo dipende da à una continua distribuzione di colori. Più piccolo è a più
piccolo sarà il numero degli ordini visibile. Nel caso di incidenza obliqua l’eq. del reticolo
diviene:
a(sin θ m − sin θ i ) = mλ (7.36)
sia per la riflessione che per la trasmissione. Questa espressione si applica indipendentemente
dall’indice di rifrazione del reticolo di trasmissione stesso.
Il principale difetto di questo tipo di reticoli è che essi distribuiscono la luce incidente su un
numero di ordini spettrali a bassa densità di flusso. La maggior parte dell’energia cade nel
massimo principale (ordine zero), che è nella direzione speculare, come se si avesse uno
specchio piano. L’ordine zero è di poca utilità per la spettroscopia perché tutte le
sovrappongono. Per questo motivo i reticoli moderni hanno una forma particolare (reticoli detti
“ blazed”) che consente di orientare l’ordine zero in una direzione diversa dall’angolo di
riflessione speculare (Fig.
7.7).
Le posizioni degli
m sono determinate dai valori di a
i.
i m sono misurate dalla normale al piano del reticolo (la linea a punti e trattini in figura
7.7), mentre la direzione del picco di diffrazione è determinata dalla direzione normale al piano
delle scanalature (linea tratteggiata in figura 7.7).
(( ( + + ( (3+
! "# !$ %# $ & %' $ ) %* %' ' $ # * *, i-/.0 12 -/.4 $5 0=0. Per
riflessione speculare invece è i 6 r -87 9 :;<= > ? @A @B B C > D@EF= B à ad un particolare ordine non
nullo G <H EF@I m= JLK M N A C @ è a sin(−2γ ) = mλ D= B3CF= > C F= B H ? CO= FPQ:
110
7.3.5 Spettroscopia con i reticoli
Le informazioni astronomiche che possono essere ricavate dall’uso della spettroscopia con i
reticoli sono tantissime e vanno dalla misura della temperatura di una stella, alle misure di
velocità di stelle e galassie, al redshift dei quasar. Oggi si fa spettroscopia dalla banda X
all’infrarosso, e questo fa capire quanto sia raffinata la tecnica di costruzione di questi reticoli.
Il passo dei reticoli è oggi guidato con tecniche interferometriche, che consentono precisioni
altissime nella costruzione di reticoli ad elevata risoluzione.
Esaminiamo ora alcune delle principali caratteristiche degli spettri ottenuti con i reticoli.
La larghezza di una riga spettrale è definita dalla distanza angolare tra i minimi adiacenti ogni
massimo principale (quindi per la 7.33 ∆α = 2π / N ). Per un incidenza obliqua possiamo
ridefinire come (ka / 2)(sin θ − sin θ i ) , cosicché una piccola variazione in è data da:
'
0
direzione
dell’ordine zero
dove l’angolo di incidenza è costante. Perciò anche quando la luce incidente è monocromatica
è:
∆θ = 2λ /( Na cos θ m ) (7.38)
che è l’allargamento strumentale delle righe. Si noti la dipendenza da Na, cioè dalla larghezza
del reticolo.
Un’altra quantità importante è la differenza
Come nel caso del prisma la dispersione angolare è definita dalla relazione:
≡ dθ / d λ (7.39)
111
Questo significa che la separazione angolare tra due righe successive cresce al crescere
dell’ordine. La differenza angolare tra due righe può divenire piccola al punto che esse in parte
si sovrappongono; è necessario quindi definire il potere risolutivo cromatico del reticolo:
dove (∆λ )min è la più piccola differenza di lunghezza d’onda risolvibile, o limite di risoluzione.
Il criterio di Lord Rayleigh per la risoluzione di due righe con uguale densità di flusso richiede
che il massimo principale di una coincida con il primo minimo dell’altra. Si ha in questa
situazione che la separazione angolare è metà dell’allargamento strumentale. Combinando la
(7.38) e la (7.40) si ha pertanto:
o anche:
Ilpotere
risolutivo
è quindi
funzione
della
ò superare
larghezza del reticolo, dell’angolo di incidenza e di
la quantità 2 Na / λ , e il più grande valore si
ha quando il reticolo è montato in auto-collimazione, cioè quando γ ≈ θ i ≈ −θ m , per cui è:
Na sin θ i
(7.44)
λ
La precisa differenza in lunghezza d’onda per cui ciò accade è detta intervallo spettrale libero,
(fsr = “free spectral range”). Un reticolo ad alta risoluzione blazed per il primo ordine in modo
da avere il più grande intervallo spettrale libero, avrà quindi un alto numero di scanalature (fino
anche a 1200 tratti per mm), per mantenere il suo potere risolutivo R. L’eq. (7.43) mostra che R
può essere mantenuto costante diminuendo il numero di tratti e aumentando lo spazio tra essi.
Questo però richiede un aumento dell’ordine m e quindi una diminuzione dell’intervallo
spettrale libero, con la conseguenza che gli ordini si sovrappongono. Se invece si tiene costante
N e si fa crescere a, R ed m crescono e quindi (∆λ )fsr diminuisce ugualmente. Aumentando a,
l’allargamento strumentale diminuisce (le righe diventano più sottili), ma anche la dispersione
diminuisce, con l’effetto che le righe dello spettro si avvicinano l’una all’altra.
112
7.3.6 Apertura rettangolare e circolare
un’onda sferica. Se v A è la forza degli oscillatori per unità di area, assunta costante su tutta
l’apertura, il singolo contributo in P sarà:
v
A i (ωt − kr )
dE = e dS
r
Y
P
z
y
r dS
Z
R
w
P0
La distanza r tra dS e P è:
r = [ X 2 + (Y − y )2 + ( Z − z )2 ]1/ 2 (7.46)
113
quando questa distanza tende ad infinito si hanno le condizioni di Fraunhofer, per cui possiamo
rimpiazzare r con la distanza OP, cioè R, nel termine di ampiezza, se l’apertura è piccola. Il
termine di fase deve essere trattato con più attenzione. Espandiamo quindi r nel seguente
modo:
Nel caso R sia molto grande rispetto alle dimensioni dell’apertura il secondo termine della
(7.47) è trascurabile. Poiché P è molto lontano, è sempre piccolo anche se Z e Y sono
abbastanza grandi, per cui possiamo stare tranquilli circa la direzionalità dell’emissione (fattore
di obliquità). Possiamo quindi scrivere:
e, prendendo solo i primi due termini dell’espansione binomiale della (7.48), si ha:
r = R[1 − (Yy + Zz ) / R 2 ]
ei (ωt −kR )
∫∫
E= eik (Yy + Zz ) / R dS
A
(7.49)
R Apertura
ei (ω t − kR ) b/2 a /2
∫ eikYy / R dy ∫−
E=
A
−b / 2
e ikZz / R dz (7.50)
R a /2
da cui:
E=
(7.51)
R α ' β '
2
sin α ' sin β '
2
I (Y , Z ) = I (0) (7.52)
α' β'
114
dove I(0) è la densità di flusso in P0. La forma tridimensionale della (7.52) è simile alla Fig. 7.5
pensata in tre dimensioni. Quando
!
" #
$ % &' (!$ &
)
*+,.-0/ *
&
*1!
% ' " 2
% "
" &' 3 ")" 4 576 a 8.9 576 b rispettivamente, si ha I(Y,Z)=0.
Si noti che la dimensione della figura di diffrazione nella direzione Y e Z varia inversamente
con la dimensione dell’apertura y, z. Una fenditura con un’apertura rettangolare orizzontale
produce una figura con un rettangolo verticale al centro.
Per quanto riguarda l’apertura circolare, diciamo soltanto che il calcolo del campo prodotto
in un punto P molto lontano, parte dall’eq. (7.49). Diamo qui solo il risultato finale del
processo di integrazione, per cui chi vuole approfondire veda direttamente il calcolo dai testi
citati in bibliografia. La densità di flusso I(: ;=< > ? @
A B C(D ? ? D < D
E
2 J (ka sin θ )
2
I (θ ) = I (0) 1 (7.53)
ka sin θ
dove J1(x) è la funzione di Bessel del primo tipo di ordine 1 (che si trova sotto forma di tabella
in molti testi). A causa della simmetria assiale, il massimo centrale molto piccato corrisponde
ad un dischetto luminoso noto come disco di Airy. Il disco è circondato da un primo anello
scuro che si ha quando si annulla la funzione J1(x). Questo avviene quando x=kaq/R=3.83,
dove a è il raggio dell’apertura circolare, e q è la distanza P0P. Il raggio del primo anello scuro
è pertanto:
Rλ
q1 = 1.22 (7.54)
2a
Se pensiamo all’apertura come ad una lente, l’immagine di una stella sul piano focale f ≈ R ,
sarà un dischetto di Airy di dimensioni:
fλ
q1 ≈ 1.22
D
115
8 CAPITOLO 8
8.1 Elementi di ottica di Fourier
Abbiamo già introdotto nel Capitolo 5 alcuni concetti sulle trasformate di Fourier e sul loro
utilizzo in ottica. Vogliamo ora cercare di vedere come l’analisi di Fourier permette di trattare i
processi ottici in termini di frequenze spaziali. La motivazione principale è quella di cercare di
capire come i sistemi ottici processano la luce per formare le immagini, e sapere l’ampiezza e
la fase del fronte d’onda che le formano.
Per prima cosa ricordiamo che una funzione generica f(x) può essere espressa come
combinazione lineare di un numero infinito di armoniche:
1
∞ ∞
I fattori che determinano l’importanza dei contributi delle diverse frequenze spaziali k, sono
A(k) e B(k), che sono dati dalla:
+∞
A(k ) = ∫
−∞
f ( x ' ) cosk x dx
' '
+∞
(8.2)
B (k ) = ∫
−∞
f ( x ' ) sink x dx
' '
Passando alla notazione complessa esponenziale si può arrivare a scrivere (lo studente provi a
fare i vari passaggi o li cerchi nei libri citati in bibliografia):
+∞
1
∫ F (k )e
−ik x
f ( x) = dk (8.3)
2π −∞
se si ha che:
+∞
F (k ) = ∫
−∞
f ( x )eik x dx (8.4)
F (k ) = { f ( x)} (8.5)
In letteratura si trovano diversi modi di definire la trasformata di Fourier, per cui bisogna stare
attenti alla notazione utilizzata.
Si noti che A(k) e B(k) sono rispettivamente la parte reale e la parte immaginaria della
F(k), cioè:
La F(k) essendo una quantità complessa può essere scritta in termini di un’ampiezza reale
F (k ) , detta spettro di ampiezza, e di un termine reale di fase k), detto spettro di fase:
117
F (k ) = F (k ) eiΦ (k ) (8.7)
La f(x) è detta trasformata inversa di F(k), o simbolicamente:
f ( x) = {F (k )} = { { f ( x )}} (8.8)
Ovviamente se f fosse una funzione del tempo t anziché dello spazio x, sarebbe sufficiente
sostituire t ad x k (frequenza angolare spaziale).
f ( x ) = Ce− ax
2
(8.9)
+∞
∫ (Ce
− ax 2
F (k ) = )eik x dx (8.10)
−∞
+∞
C − k 2 / 4a
F (k ) = ∫ e − β dx
2
e (8.11)
a −∞
F (k ) = e − k
2
/ 4a
(8.12)
che è ancora una gaussiana, questa volta con k come variabile. Le deviazioni standard sono nei
due casi σ x = 1/ 2a e σ k = 1/ 2a per cui è σ xσ k = 1 .
∫∫
i (k x x +k y y )
F (k x , k y ) = f ( x, y )e dxdy (8.14)
−∞ −∞
118
Le quantità kx e ky sono le frequenze angolari spaziali lungo i due assi. L’estensione al caso
tridimensionale è quindi evidente. In generale una perturbazione può essere sintetizzata da una
combinazione lineare di onde piane aventi diverso numero di propagazione e diverse direzioni
−[ i ( k x + k y + k z )]
di propagazione. Infatti nel caso 3D le funzioni elementari sono del tipo e x y z , cioè
e −ik ⋅r che sono onde piane. Pertanto anche in 2D le funzioni elementari sono “orientate” in
direzioni diverse. Questo significa che per un dato insieme di valori di kx e ky , gli esponenti o
la fase delle funzioni elementari saranno costanti lungo delle linee:
k x x + k y y = costante = A
ky
α = tan −1 = tan −1 x
kx y
α = −2
x
1
+ −2
y
e quindi kα = k x2 + k y2
Tutto questo significa che per costruire una funzione 2D oltre ai termini armonici kx e ky, si
dovranno includere termini che sono orientati in direzioni diverse dalle direzioni x e y. Un
modo per visualizzare la cosa, ad esempio il fronte emergente da una fenditura, è quello di
pensare al nuovo fronte come ad una sovrapposizione di onde piane che emergono dalla
fenditura in tutte le direzioni. Queste sono le componenti di Fourier che vanno in tutte le
direzioni con specifici valori della frequenza angolare. Il termine con frequenza angolare nulla
corrisponde all’onda non deviata, mentre le frequenze angolari più alte formano un angolo
maggiore con l’asse ottico.
Molti fenomeni fisici sono di tipo impulsivo (sia spaziale che temporale), ed è utile sapere
come risponde un sistema a questo tipo di stimolo. L’idealizzazione matematica di questo tipo
di stimolo si realizza tramite l’uso della funzione è definita dalla:
0 x ≠ 0
δ ( x) =
∞ x = 0
e dalla:
+∞
∫ δ ( x)dx = 1
! " #$% & (' ! )*+! #, !.- $- ! ,
−∞
119
+∞
∫ δ ( x) f ( x)dx = f (0)
−∞
(8.15)
0 x ≠ x0
δ ( x − x0 ) =
∞ x = x0
∫ δ ( x − x ) f ( x)dx = f ( x )
−∞
0 0
estrae proprio il valore della f per x=x0. Ricordando la (8.3) una generica funzione f(x) può
scriversi:
+∞ 1 +∞ +∞
f ( x) = ∫ 2π ∫ e
− ik ( x − x ')
d k f ( x ')dx ' = ∫ δ ( x − x ') f ( x ')dx '
−∞ −∞
−∞
da cui:
1 +∞
δ ( x − x ') =
2π ∫
−∞
e − ik ( x − x ') d k (8.16)
1 +∞ 1 +∞
δ ( x) =
2π ∫ −∞
e −ik x d k =
2π ∫ −∞
eik x d k
Questo implica che la funzione "!# $ %'& ò essere vista come la trasformata di Fourier
inversa di 1, cioè δ ( x ) = ( −1{1} e quindi ( {δ ( x )} = 1 . Possiamo immaginare un impulso
quadrato che via via diviene più stretto ed alto; per una larghezza infinitesima la sua
trasformata sarà di estensione infinita, o in altre parole, una costante. Se l’impulso si trova in
una posizione x=x0, la sua trasformata cambia fase ma non ampiezza, e si ha:
( {δ ( x − x0 )} = eik x 0
(8.17)
In generale si può dimostrare che la trasformata di Fourier di una funzione che viene spostata
nello spazio (o nel tempo) è la trasformata della funzione non spostata per un termine
esponenziale che è lineare nella fase. Questa proprietà è particolarmente utile quando andiamo
a prendere in considerazione l’immagine di diverse sorgenti puntiformi identiche ma separate.
Vediamo ad esempio una f(x) data dalla somma di tanti impulsi separati:
f ( x) = ∑ δ ( x − x j )
j
120
{ f ( x )} = ∑ e
ik x j
e quindi
{ f ( x )} = eik d / 2 + e − ik d / 2 = 2 cos(k d / 2)
! " # $% & $" # $ ! ' # $ " $%()*(+' +,- ) ,)*. / 0 12314 235 0 637%8
6 /7
3 697;:0 8 7
: 7 </1 27 / ? 6
=>
2
7 4
dovrebbe
@
2
3 5 0
6
3
far
0 A ricordare l’esperimento di Young, e in particolare la (6.22). Se la fase di una delle
è spostata si ha invece:
B
{ f ( x )} = eik d / 2 + e − ik d / 2 = 2i sin(k d / 2)
Si ricordi che ci sono due modi alternativi per considerare la trasformata complessa, sia come
somma di parte reale e immaginaria (eq. 8.6), sia come prodotto di un termine di ampiezza e
uno di fase (eq. 8.7). Si capisce dal risultato precedentemente ottenuto che le funzioni coseno e
seno sono funzioni speciali: il primo è associato ai contributi puramente reali, il secondo a
quelli puramente immaginari. Molte funzioni, anche armoniche, sono la combinazione di parte
reale e immaginaria. Per esempio, una funzione coseno spostata in ascissa, non è più né pari né
/ C6/ ? 1 ? 1 e@ 0haD E quindi
dispari, FHG IJK Luna
MKNK LO JLPRreale
parte Q JLS K TeLUW V U LTX YNZ P9MK Q Si
immaginaria. Q U [ noti
U LS P9che
MKNQ P quando
V UR\ [ PRZ la
U9Mfunzione
JURQ JLS K Tcoseno
LK
] è
è^
radianti.
g (Y , Z ) = L{ f ( y, z )} (8.18)
_ +∞ +∞
g (Y , Z ) = ∫ ∫ f ( y ' z, δ' )y (− y' δ z)− (z 'dy dz) ' '
−∞ −∞
121
+∞ +∞
g (Y , Z ) = ∫∫
−∞ −∞
f ( y ', z ') {δ ( y '− y )δ ( z '− z )}dy ' dz ' (8.19)
La quantità L{δ ( y '− y )δ ( z '− z )} è la risposta del sistema ad una funzione
punto (y’,z’) nello spazio oggetto, ed è detta risposta all’impulso.
Apparentemente, se la risposta all’impulso di un sistema è nota, l’output può essere calcolato
direttamente dalla (8.19). Se le sorgenti elementari sono coerenti, i segnali di input e di output
saranno campi elettrici, se incoerenti saranno densità di flusso.
Si consideri ad esempio la Fig. 8.1.
Y
y piano oggetto
Z
piano immagine
Una sorgente luminosa incoerente nel piano oggetto (y,z) può essere pensata come la somma di
un numero enorme di sorgenti infinitesime (il quadratino nero in figura). Ognuna di esse
produce uno spot luminoso sul piano focale della lente. Assumiamo che l’ingrandimento sia
unitario. Si noti che se l’ingrandimento fosse maggiore di 1, l’immagine apparirebbe più
grande dell’oggetto e di conseguenza tutti i dettagli spaziali sarebbero più grandi, e le
frequenze che compongono l’immagine meno elevate.
Se I0(y,z) è la densità di flusso sul piano oggetto di un elemento dydz localizzato in (y,z),
esso emetterà un flusso I0(y,z) dydz. A causa della diffrazione (e delle aberrazioni) la luce è
sbrodolata su di uno spot luminoso, piuttosto che focalizzata in un punto. La densità di flusso
che arriva nell’elemento i-esimo (Y,Z) sarà:
dIi (Y , Z ) = S ( y, z; Y , Z ) I0 ( y , z )dydz
La funzione S prende il nome di Point Spread Function (PSF). A causa dell’incoerenza della
sorgente il contributo di ogni sorgente infinitesima sarà additivo e quindi
122
+∞ +∞
I i (Y , Z ) = ∫ ∫ I 0 ( y, z ) S ( y , z; Y , Z )dydz (8.20)
−∞ −∞
Se la lente fosse perfetta, cioè non avesse aberrazioni, e fossimo limitati solo dalla diffrazione,
la funzione S corrisponderebbe alla figura di diffrazione di un punto localizzato in (y,z).
Evidentemente se diciamo che l’input è
0, z0), allora
I 0 ( y, z ) = Aδ ( y − y0 )δ ( z − z0 ) , dove A è una costante che porta con se le unità di misura.
Pertanto si ha:
+∞ +∞
I i (Y , Z ) = A∫ ∫ δ ( y − y0 )δ ( z − z0 ) S ( y, z; Y , Z )dydz (8.21)
−∞ −∞
I i (Y , Z ) = AS ( y0 , z0 ; Y , Z )
!"#$% &' (% #$) * &$ +* ,+ $- * . //0#1+ /,*2#$43 * (5( 6* $+61+ $+ ' - /,#$7* (58# 9 &: ;4< =
un sistema corretto dalle aberrazioni, la PSF coincide con il disco di Airy. Se il sistema è
invariante spazialmente il punto oggetto in input può essere mosso a piacere senza alcuna
variazione nella sua immagine, se non nella posizione. Si può dire anche che la PSF è la stessa
per ogni punto (y,z). In pratica questo non accade mai completamente e la PSF varia anche se
di poco.
Se abbiamo a che fare con luce coerente, invece che incoerente, dobbiamo di nuovo
> ? =1@ A BC D E D CGF=5A =1@ A C HCIBAA H5JFK @ A1LMHEINF1C @ O EGP ? K O E ?Q =F= ? BA1C @ @ AD E JJD C @ C =O EGK R E H5JA C S S EIBC K
campo elettrico. Di nuovo il sistema sarà descritto da una PSF, sebbene questa volta sia una
PSF d’ampiezza. Per un’apertura circolare limitata dalla diffrazione, la PSF sarà la figura di
diffrazione medesima. Infine occorre considerare l’interferenza che si ha sul piano immagine
tra le varie sorgenti coerenti che interagiscono. Al contrario per sorgenti incoerenti, l’unico
processo che avviene sul piano immagine è la somma dei vari contributi di flusso.
+∞
g( X ) = ∫ f ( x )h( X − x)dx
−∞
Non trattiamo qui l’aspetto matematico di questa operazione, ma citiamo solo alcune proprietà
utili per la nostra trattazione. Lo studente che vuole approfondire consulti i libri citati nella
bibliografia.
Supponiamo di avere due funzioni f(x) e h(x) le cui trasformate di Fourier siano
rispettivamente F (k ) = T { f ( x)} e H (k ) = T {h( x )} . Per il teorema di convoluzione si ha:
U U UVU
{g} = { f ⊗ h} = { f }⋅ (h} (8.22)
o anche
G (k ) = F (k ) H (k )
123
dove G (k ) = { g} .
Come esempio consideriamo la convoluzione di due impulsi rettangolari il cui risultato è un
impulso triangolare (vedi Fig. 8.2). Si vede che il semplice prodotto delle trasformate è la
trasformata della funzione g.
Nello spazio k l’analoga della (8.22) è il teorema di convoluzione in frequenza, dato dalla:
1
{ f ⋅ h} =
{ f } ⊗ {h}
(8.23)
2π
cioè la trasformata del prodotto è la convoluzione delle trasformate.
f x h g
1 1 1
d d 2d
è sufficiente modulare in qualche modo l’ampiezza per ottenere l’impulso che si desidera.
Assumendo ad esempio un profilo d’onda indipendente dal tempo,
E ( x, 0) = f ( x )e −ik0x
+∞
∫ −∞
f ( x)e−ik0x eikx dx (8.24)
Ponendo k ' = k − k0 si ha:
+∞
) ∫
F (k ' = f x( e)ik ' x dx = F k( − k0 ) (8.25)
−∞
124
− ik0 x
E ( x, 0) = a / π e − ax e
2
La Fig. 8.3 mostra un fronte d’onda piano parallelo che incide su di una fenditura, e una lente
localizzata a distanza f da essa, che produce un fascio parallelo di raggi che a due a due
convergono
nel
piano
focale
della
lente
medesima, per poi proseguire e formare l’immagine
0 t è detto piano delle trasformate, ed in esso
vediamo la figura di diffrazione (alla Fraunhofer) prodotta dalla fenditura. In altre parole si
dice che la funzione di apertura, cioè la distribuzione del campo elettrico sul piano della
fenditura (che in questo caso coincide con il piano focale oggetto della lente), è trasformata
dalla lente nella figura di diffrazione. In realtà questo è vero solo in parte, poiché la lente non
forma l’immagine su di un piano (si ricordino le aberrazioni).
E’importante notare che il campo di diffrazione di Fraunhofer corrisponde esattamente alla
trasformata della funzione di apertura. Nel caso esaminato la fenditura è nel piano focale
oggetto della lente e tutti i raggi diffratti mantengono la stessa fase durante il percorso
(cammino ottico) fino al piano delle trasformate. Questo non accade quando l’oggetto non è nel
piano focale oggetto della lente. Ci sarà allora una deviazione di fase, ma con nessuna
conseguenza, perché noi andiamo ad osservare la densità di flusso, in cui l’informazione sulla
fase è mediata, e le distorsioni di fase sono quindi inosservabili.
Nelle nostre esperienze di laboratorio andremo a vedere tramite nell’esperienza di “Abbe”
come si comportano le lenti come trasformatori di Fourier per vari tipi di oggetto.
R R
0 t R
i
f f
! " # $ # %&')( * + ,- ! . . / ' 0 0 '-
' * 1 '. , 1 - ! 0 * / '1 , ( 2 ! ' 1 3). 3 + ' ( ,43 " " , 0 0 3 5
0 di una lente converge a formare la figura di
6 7 8 8 9 : ; 7 < = >?= > @BA 7 : = <C8 < D : @ ?> E
t della lente (o paino delle trasformate), per poi proseguire e formare l’immagine
F G H H I J K K G L L J)M G H N O P M J)Q
i.
125
i è il piano dell’immagine, cioè il piano coniugato al piano oggetto. Si vede che
l’immagine è capovolta e ingrandita.
La lente forma quindi due configurazioni di interesse: la prima è la trasformata di Fourier sul
piano focale della lente, l’altra è l’immagine dell’oggetto sul piano coniugato al piano oggetto.
Possiamo pensare al piano focale della lente come ad un insieme di sorgenti secondarie,
secondo il principio di Huygens-Fresnel. Si capisce quindi come l’immagine della fenditura sia
il risultato di un doppio processo di diffrazione; la prima produce la ben nota configurazione di
diffrazione, mentre la seconda ricostruisce l’immagine. Se non ci fosse la lente non si potrebbe
vedere l’immagine della fenditura, e si vedrebbe solo la configurazione di diffrazione. Questo
modo di vedere il processo di formazione dell’immagine è stato per la prima volta proposto da
Abbe nel 1873. Naturalmente al posto della fenditura singola si può usare un reticolo. Si
osservi inoltre che se la lente non è grande abbastanza da prendere tutta la luce diffratta dalla
fenditura, l’immagine che si forma non è più corrispondente perfettamente all’originale. Poiché
sono le alte frequenze ad essere lontane dall’asse ottico, la perdita di queste provoca una
mancanza di definizione e di risoluzione dell’immagine. Si può dire che, a meno che la lente
non abbia un’apertura infinita, essa si comporta come un filtro che lascia passare
"! si vedrà la trasformata di Fourier del reticolo, ed essendo
preferibilmente le basse frequenze.
t
di dimensioni finite e quindi non periodico, la trasformata sarà dominata da alcune componenti
discrete (le armoniche principali), mentre le armoniche secondarie saranno via via più deboli.
La trasformata avrà quindi una ben precisa configurazione. Se invece l’oggetto è più
complicato, al limite continuo, occorreranno infinite armoniche per riprodurlo, e quindi
l’immagine della trasformata sarà molto più complessa.
Si consideri allora la costruzione di Fig. 8.4. #$&%' ( $)*)++
, - - )/. 0 è posto ora ad una distanza
0qualsiasi
1 2
3541 1 6da
7 48una
09 : ;lente
2< i l’immagine
Lt, e una seconda lente Li è posta ad una distanza opportuna in modo da
dell’oggetto.
I Lt
I Li I
0 t
i
= >@?A B CD/E
è il piano della trasformata della prima lente. Si vede come la lente Li
?
DF G BH DC&E
t t
126
Se una mascherina o un filtro è posto nel piano t, oscurando alcune frequenze spaziali, si
impedisce loro di raggiungere il piano immagine, realizzando quindi un filtraggio spaziale. In
generale si vede che le frequenze spaziali elevate contribuiscono a definire i bordi netti delle
immagini, dove si passa rapidamente da una zona illuminata al buio. Rimovendo queste
frequenze, ad esempio con un filtraggio, la nuova immagine risulta più arrotondata e perde di
definizione e di risoluzione.
La teoria delle trasformate di Fourier porta ad una interessante interpretazione del fenomeno
della diffrazione alla Fraunhofer. Nel capitolo precedente abbiamo visto che per effetto della
diffrazione da un’apertura generica, su cui incide un’onda piana monocromatica, il campo nel
piano immagine (Y,Z) è dato da una eq. del tipo:
ei (ωt − kR )
E (Y , Z ) = A
R ∫∫
apertura
eik (Yy − Zz ) / R dydz (8.27)
A( y , z ) = A0 ( y, z )eiΦ ( y , z ) (8.28)
che chiamiamo funzione di apertura. Con questa variazione la (8.27) può scriversi:
+∞ +∞
E (Y , Z ) = ∫ ∫ A( y , z )e ik Yy+ Zz R dydz
( )/
(8.29)
−∞ −∞
I limiti di integrazione possono essere estesi all’infinito perché la funzione di apertura è zero al
di fuori dell’apertura.
Può essere utile a questo punto pensare al contributo infinitesimo dE(Y,Z) nel punto P
come ad un’onda piana che si propaga nella direzione k, ed avente ampiezza A( y , z )dydz . Per
rafforzare ora la somiglianza tra la (8.14) e la (8.29), definiamo le frequenze spaziali:
kY ≡ kY / R = k sin φ = k cos β
(8.30)
k Z ≡ kZ / R = k sin θ = k cos γ
Per ogni punto nel piano immagine c’è quindi una corrispondente frequenza spaziale. Il campo
di diffrazione può quindi essere scritto:
127
+∞ +∞
E (kY , k Z ) = ∫ ∫ A( y , z )ei ( kY y + kZ z ) dydz (8.31)
−∞ −∞
siamo quindi al punto cruciale: la distribuzione del campo nella diffrazione di Fraunhofer è la
trasformata di Fourier della funzione di apertura, simbolicamente scriveremo:
E (kY , k Z ) = { A( y , z )} (8.32)
La distribuzione del campo elettrico nel piano immagine è lo spettro di frequenze spaziali della
funzione di apertura. La trasformata inversa è quindi la funzione di apertura medesima, cioè:
1 +∞ +∞
A( y , z ) =
2π ∫ ∫
−∞ −∞
E (kY , k Z )e −i (kY y +kZ z )d kY d k Z (8.33)
o simbolicamente:
A( y , z ) =
{E (kY , k Z )} (8.34)
Come abbiamo già detto più è localizzato il segnale, più è distribuito su di un’area vasta la sua
trasformata. Più piccola è l’apertura più larga è la figura di diffrazione.
Fino a tempi recenti il modo tradizionale di determinare la qualità di un sistema ottico è stato
quello di valutare i suoi limiti di risoluzione. Migliore la risoluzione, migliore si pensava fosse
il sistema nel suo complesso. Supponiamo allora di osservare con un sistema ottico un insieme
di linee di spessore via via decrescente. Come abbiamo visto prima, anche per un sistema ottico
perfetto, vi è un limite imposto dalla diffrazione, oltre il quale non sarà più possibile
distinguere una linea. Possiamo pensare a questo limite come ad un taglio nel campo delle
frequenze che producono l’immagine. Un analogia che mette in risalto il limite di questo
approccio al problema, è per esempio quello di pensare di valutare l’alta fedeltà di un sistema
sonoro sulla base di un suo limite nel campo delle frequenze. La limitazione di questo schema
diviene evidente quando si introduce un detector dopo il sistema ottico (o sonoro). Avendo
questi in generale una loro sensibilità e risoluzione, sembra ragionevole pensare che il sistema
ottico da associare ad esso non debba avere necessariamente avere prestazioni eccezionali, se
poi il detector che usiamo non è in grado di rilevarle. Il nostro orecchio ad esempio è sensibile
in un certo intervallo di frequenze, per cui non è necessario possedere un impianto sonoro in
grado di emettere onde di altissima frequenza, dato che noi non le sentiremmo.
Fino ad ora abbiamo già rappresentato un oggetto come un insieme di punti sorgente,
ognuno dei quali è trasformato dal sistema ottico in una PSF, e quindi per convoluzione
nell’immagine completa. Adesso affrontiamo il problema dell’analisi dell’immagine da un
punto di vista diverso. Consideriamo l’oggetto come la sorgente di un impulso luminoso che è
esso stesso fatto di onde piane, che viaggiano lungo le direzioni date dalla (8.30), e quindi
corrispondenti a determinate frequenze spaziali. La domanda che ci si pone è quindi: come il
sistema modifica l’ampiezza e la fase di ogni onda piana nell’attraversamento del sistema
dall’oggetto all’immagine?
Un parametro utile a questo proposito è il contrasto o modulazione, definito dalla:
I max − I min
Modulazione ≡ (8.35)
I max + I min
128
Definiamo quindi il rapporto tra il contrasto dell’oggetto e il contrasto dell’immagine a tutte le
frequenze spaziali come “Modulation Transfer Function” (MTF).
In Fig. 8.5 sono graficate le MTF di due ipotetiche lenti in funzione della frequenza spaziale di
un ipotetico detector. Entrambe valgono 1 in corrispondenza di una frequenza nulla e diventano
nulle ad una data frequenza, ove non sono più in grado di risolvere l’oggetto. Se fossimo
limitati solo dalla diffrazione queste frequenze di taglio dipenderebbero solo dall’apertura delle
lenti. Supponiamo ora di dover accoppiare una delle due lenti ad un detector che non è in grado
di percepire frequenze oltre una certa soglia (linea tratteggiata in figura).
MTF
2
frequenza spaziale
Fig. 8.5 Il contrasto di due lenti in ordinata e la frequenza di un ipotetico detector in ascissa.
A dispetto del fatto che la lente N. 1 ha una frequenza di taglio maggiore della N. 2 si vede che
la lente N. 2 è in grado di fornire migliori prestazioni della N. 1, fino al limite di frequenza del
detector.
Se l’input di un sistema è fatto ad esempio da una rete, cioè da una serie di impulsi
quadrati, il contrasto nell’immagine è dovuto alla sovrapposizione del contrasto delle singole
componenti di Fourier che compongono l’oggetto. Un punto importante da sottolineare è che
gli elementi di un sistema ottico funzionano come operatori lineari che trasformano i vari
impulsi sinusoidali in input in altrettanti impulsi sinusoidali in output. Tuttavia la distribuzione
della densità di flusso non sarà identica in input e in output. Ad esempio l’ingrandimento altera
le frequenze spaziali di output, la diffrazione e le aberrazioni riducono l’ampiezza delle
sinusoidi (contrasto), e infine, le aberrazioni fuori asse ed il non perfetto centraggio delle
ottiche, producono uno spostamento (shift) nella posizione della sinusoide di output
corrispondente all’introduzione di una variazione di fase. Indipendentemente dalla simmetria
della PSF se l’oggetto è armonico l’immagine è armonica. Pertanto se pensiamo ad un oggetto
come composto da una serie di armoniche di Fourier, ognuna di esse è trasformata dal sistema
ottico in un output armonico, e l’immagine è data dalla serie di queste armoniche, che come
abbiamo detto cambiano rispetto all’input in ampiezza e fase. La funzione che descrive come la
singola armonica cambia nell’attraversare il sistema si chiama “Optical Transfer Function”
(OTF). Essa è una quantità complessa dipendente dalla frequenza spaziale il cui modulo è la
MTF e la cui fase è la “Phase Transfer Function” (PTF). La prima è una misura della riduzione
in contrasto tra l’oggetto e l’immagine su tutto lo spettro, la seconda rappresenta la fase
relativa. Differenze di fase nei sistemi ottici si hanno però solo fuori asse, e quindi la PTF è
spesso meno importante della MTF. Tuttavia ci sono casi in cui la PTF ha un ruolo cruciale.
In generale possiamo dire che la MTF è oggi molto usata per specificare le proprietà di tutti
i tipi di sistemi ottici (e non), dalle lenti, ai nastri magnetici, alle pellicole, ai telescopi,
129
all’atmosfera, all’occhio, e così via. Essa ha il vantaggio che se tutte le singole MTF delle
componenti di un sistema sono note, la MTF del sistema nel suo complesso è semplicemente il
prodotto di tutte le singole MTF. Le lenti però fanno eccezione, poiché le aberrazioni di una
lente possono essere corrette da quelle di un altra, esse non sono indipendenti, e non si può
applicare quanto detto prima.
Abbiamo visto che un’immagine, nelle condizioni di invarianza spaziale ed incoerenza, può
essere espressa come la convoluzione della densità di flusso dell’oggetto e della PSF del
sistema, cioè dalla relazione:
I i (Y , Z ) = I 0 ( y , z ) ⊗ S ( y, z ) (8.36)
dove si è fatto uso del teorema di convoluzione. Si vede che è l’operazione di moltiplicazione
che produce l’alterazione delle frequenze dell’oggetto e le converte in quelle dell’immagine. In
altre parole è la {S(y,z)} che trasforma lo spettro dell’oggetto in quello dell’immagine. Questo
è proprio ciò che abbiamo definito essere il ruolo dell’OTF, e pertanto chiamiamo OTF non
normalizzata la funzione:
(kY , k Z ) ≡ {S ( y , z )}
Verifichiamo ora quanto detto precedentemente riguardo al fatto che un impulso armonico si
conserva tale dopo la trasformazione. A questo proposito supponiamo di avere un’onda mono
dimensionale con
I 0 ( z ) = 1 + a cos(k Z z + ε )
+∞
I i ( Z ) = ∫−∞ {1 + a cos[k Z ( Z − z ) + ε ]}S ( z )dz (8.38)
+∞ +∞ +∞
I i ( Z ) = ∫−∞ S ( z )dz + a cos(k Z Z + ε ) ∫−∞ cos k Z zS ( z ) dz + a sin(k Z Z + ε ) ∫−∞ sin k Z zS ( z )dz
+∞
I i ( Z ) = ∫−∞ S ( z )dz + c {S ( z )}a cos(k Z Z + ε ) + s {S ( z )}a sin(k Z Z + ε )
130
{ f ( z )} = c { f ( z )} + s { f ( z )}
o
F (k Z ) = A(k Z ) + iB(k Z )
e le seguenti relazioni:
dove
1/ 2
F (k Z ) = A2 (k Z ) + B 2 (k Z )
B (k Z )
ϕ (k ) = tan −1
A(k Z )
{ f ( z )} ≡ (k Z ) = (k Z )eiΦ ( kZ )
(8.39)
dove
La (8.38) può quindi riscriversi
+∞
I i ( Z ) = ∫−∞ S ( z )dz + a (k Z ) cos[k Z Z + ε − Φ(k Z )]
(8.40)
Si noti che questa è una funzione della stessa forma della funzione di ingresso. Se la PSF è
simmetrica (cioè pari) s {S ( z )} = 0, (k Z ) = c {S ( z )} e Φ (k Z ) = 0 ; non c’è quindi variazione
il valore che assume a frequenza zero, cioè S ( z )dz . La PSF normalizzata diviene
−∞
quindi:
S ( z)
Sn ( z) = +∞
(8.41)
∫−∞
S ( z ) dz
e la OTF normalizzata,
{S ( z )}
T (k Z ) ≡ = {S n ( z )}
+∞
(8.42)
∫
−∞
S ( z ) dz
o in due dimensioni
Φ ( kY , kZ )
T (kY , k Z ) = M (kY , k Z )ei (8.43)
dove M (kY , k Z ) ≡
131
I i ( Z ) = 1 + aM (k Z ) cos[k Z Z + ε − Φ(k Z )]
132
9 CAPITOLO 9
9.1 Cenni sul funzionamento del LASER
Durante il decennio 1950-1960 sono nati due strumenti molto importanti per la scienza
moderna, e per l’ottica in particolare; essi sono il MASER il cui acronimo sta per Microwave
Amplification by Stimulated Emission of Radiation, ed il LASER (Light Amplification by
Stimulated Emission of Radiation). Alla base di questi strumenti ci sono gli studi di molte
persone, ma in particolare di C.H. Townes, A.M. Prokhorov e N.G. Basov, A.L. Schawlow,
T.H. Maiman.
Il laser è uno strumento quanto-meccanico, nel senso che si basa sulle proprietà con cui gli
atomi interagiscono con la radiazione elettromagnetica. Per capire in modo approssimativo il
meccanismo di funzionamento, facciamo una breve panoramica sui meccanismi di emissione
delle lampade ordinarie e delle stelle. A questo fine sarà necessario richiamare alcune nozioni
di teoria dell’assorbimento e dell’emissione della radiazione elettromagnetica da parte degli
atomi della materia.
La teoria quantistica ha le sue origini negli studi sulla radiazione di corpo nero degli anni
intorno al 1859. In quegli anni C. Darwin pubblicava L’origine della Specie e G.R. Kirchhoff
studiava la radiazione termica emessa dai corpi in equilibrio con la radiazione. Egli caratterizzò
le proprietà di emissione e di assorbimento della radiazione tramite i coefficienti
è l’energia emessa per unità di area e di tempo in un intervallo piccolo di
!"$# % !& !'" ( ) * +-,+* .
à ad es. W/m2/ 0-1 2
3 4 è la frazione di energia incidente
assorbita per unità di area e di tempo nel medesimo interva5 5 6'789: ;6;-<=$>;8 ? à di misura
@essendo
ABCDE F F una
GH I Jfrazione).
BHG KABL Entrambi
JM N
J'L DEE i O
coefficienti
E P P EJ'G Q Q Jdipendono dalla
M RE$RE BEG H- ABGnatura
L E M P G$S-del
NA corpo e dalla
N
J
L J'G H-ABG @ P M G$S T ò emettere o assorbire
P E O-N
Kirchhoff
J'G HJCBUsiS V
accorse
WX Y XWX Zche
Z X[ la densità di flusso spettrale, cioè l’energia per unità di area e di
ελ
Iλ = (9.1)
αλ
è la stessa per ogni materiale, indipendentemente dal colore, dalle dimensioni, dalla forma, etc,
\^]_ `
\ a]\cb de df]g e e gih \ j-`
\ k g h lk g^\^]g e e gim n-oqi
p rst u à di Iv sono W/m3 o J/m3s. Sebbene
Kirchhoff non fu in grado di fornire un’espressione generale per Iv , egli notò che per un corpo
sp w xzy {
p w}| rtq~ v =1) è Iv , e che la radiazione che emerge da un piccolo buco di una cavità
isolata è a tutti gli effetti equivalente a quella di un corpo nero perfetto alla medesima
temperatura. La comunità scientifica si mise al lavoro, e dopo diverse difficoltà, si arrivò ad
una determinazione sperimentale della I alle varie temperature (vedi Fig. 9.1).
Un altro risultato importante in questo settore fu ottenuto J. Stephan e L. Boltzmann
separatamente. Essi derivarono la seguente relazione valida per un corpo nero:
P = σ AT 4 (9.2)
134
Questa relazione ci dice che la potenza totale irradiata a tutte le lunghezze d’onda per un corpo
nero la cui superficie radiante è A, dipende solo dalla temperatura (assoluta) alla sua quarta
è un
!"#$$ ×10-8 W/m2K4.
Il (W/m3)
T alta
T bassa
iFj
bX/k
Si noti come il massimo di intensità si sposta verso le piccole & ' (*) + , - ) , + ,/., ( ( '10 , 2/3, + ' 0 4+ '56 (
modo in cui si sposta il massimo prende il nome di legge di Wien, la quale ci dice che:
P = ε σ AT 4
La temperatura a cui ci si riferisce è la temperatura assoluta definita da Lord Kelvin, per cui gli
0° C corrispondono a 273 K.
Fu a questo punto che tutti i tentativi teorici di riprodurre le curve di Fig. 9.1 fallirono e si
aprì la strada alla meccanica quantistica. Wien produsse una relazione che funzionava per le
3: ) ) 7( ,< =>? @ A B C DEFBG B ? HIKJH?LB MKA BDM ? HNCO P Q RST UVR W XFYZ [FT \ ] UR ^ U`_Ya*R Y bc dFbW RKe fggP hY
sua formula
2π hc 2 1
Iλ = (9.4)
λ 5 λkhcBT
e − 1
135
riproduceva bene i dati sperimentali, sebbene Planck non aveva idea precisa del motivo per cui
funzionava. Nella (9.4) h è la costante di Planck, c è la velocità della luce, e kB è la costante di
Boltzmann. Planck assunse che gli atomi delle pareti della cavità di corpo nero, si
comportassero come degli oscillatori che assorbono e riemettono radiazione indipendentemente
dal materiale. Non essendo isolati gli atomi che compongono le pareti non si comportano come
oscillat
continuo. Tuttavia con i modelli tradizionali le cose non funzionavano e così Planck decise di
servirsi dei metodi probabilistici sviluppati da Boltzmann in quegli stessi anni. Egli assunse
che il pacchetto di energia minimo che poteva essere emesso e assorbito fosse dato dalla
quantità !#"$ % &% ' () *,+% &) +*- .!/ ì per la prima volta quantizzata. Oggi sappiamo che ogni
oscillatore può emettere o assorbire solo multipli interi di questa quantità.
N i = N 0 e− Ei / k BT
dove N0 è una costante per una data temperatura. Maggiore è il valore di E, l’energia dello stato
eccitato, più piccolo è il numero degli atomi che si troveranno in quello stato. Poiché noi siamo
interessati alle transizioni tra i vari stati eccitati scriveremo che il rapporto delle popolazioni di
atomi che occupano due livelli energetici i e j è:
−E /k T
Nj e j B
= − Ei / k BT (9.5)
Ni e
e quindi anche:
− ( E j − Ei ) / k B T − hν ji / k B T
N j = Ni e = Ni e (9.6)
dove si è fatto uso del fatto che il passaggio dallo stato energetico Ej ad Ei è accompagnato
dall’emissione di un fotone di frequenza ji.
Nel 1916 Einstein ideò una teoria semplice ed elegante per trattare il problema
dell’assorbimento e dell’emissione di fotoni da parte di un mezzo materiale immerso in un
campo di radiazione elettromagnetica.
Supponiamo che un atomo si trovi nel suo stato fondamentale. Un fotone con una data
quantità di energia interagisce con esso, facendo si che l’atomo passi in uno stato eccitato. In
questo nuovo stato l’atomo rimane per circa 10 ns, dopo di che riemette un fotone ritornando al
suo stato fondamentale. Questo processo è noto come emissione spontanea. Se il mezzo è
abbastanza denso l’atomo può scambiare l’energia in eccesso posseduta con il mezzo tramite
gli urti. C’è però una terza alternativa, quella apprezzata per la prima volta da Einstein, ed è
136
che l’atomo ancora nel suo stato eccitato interagisca nuovamente con un altro fotone. L’atomo
emette quindi un secondo fotone in fase, con la stessa frequenza e la stessa polarizzazione, e
avente la stessa direzione del fotone incidente. Questo processo è noto come emissione
stimolata. La velocità con cui avviene il processo di assorbimento stimolato è dato dalla:
dN i
= − Bij N i uν (9.7)
dt ass.
cioè dipende proporzionalmente (tramite il coefficiente Bji) dalla densità di energia del campo
di radiazione incidente u , e dal numero di atomi che si trovano nello stato Ni. Nel caso
dell’emissione stimolata si ha invece:
dN j
= − B ji N j uν (9.8)
dt em.
dN j
= − Aji N j (9.9)
dt sp .
Si ricordi che la velocità di transizione (cioè il numero di atomi che subiscono la transizione
per secondo) divisa per il numero di atomi, è la probabilità di transizione per secondo .
Pertanto la probabilità per secondo dell’emissione spontanea è =Aji. L’inverso della
probabilità di transizione per secondo è la vita media
Le tre costanti Aji, Bji, e Bij sono dette coefficienti di Einstein. Seguendo il suo
ragionamento, assumiamo che 1) ci sia equilibrio termodinamico tra la radiazione e il gas di
atomi ad ogni T; 2) che la densità di energia ha le caratteristiche di un corpo nero; 3) che la
popolazione dei livelli energetici segua la legge di Maxwell-Boltzmann. In un sistema di
questo tipo, il numero di transizioni (i → j ) deve essere uguale al numero di transizioni
( j → i ) , e quindi deve essere:
Bij N i uν = B ji N j uν + Aji N j
− hν ji / kB T Bij uν
e =
Aji + B ji uν
Aji / B ji
uν = hν ji / kB T
(9.10)
( Bij / B ji )e −1
137
Einstein mise in evidenza che per T → ∞ , anche uν → ∞ se Bij = B ji = B per T grandi. Tuttavia
essendo i coefficienti indipendenti dalla temperatura, devono risultare uguali a tutte le T.
Pertanto la probabilità di emissione stimolata e uguale alla probabilità di assorbimento
stimolato. Posto quindi Aji=A si può riscrivere:
A 1
uν = (9.11)
− 1
hν ji / kB T
B e
A 8π hν 3
= (9.12)
B c3
9.2 Il LASER
E’evidente da quanto discusso prima che il Laser funziona con il meccanismo dell’inversione
di popolazione. Un fotone incidente della frequenza opportuna può in questo caso stimolare
una vera e propria valanga di fotoni tutti uguali tra loro, tutti in fase. L’onda incidente
continuerà a crescere fintanto che altri processi, come la diffusione, non interverranno a frenare
il processo, e fino a quando il meccanismo che realizza l’inversione di popolazione è in grado
di funzionare. In effetti energia elettrica, chimica o ottica deve essere spesa per sostenere
l’inversione di popolazione.
Il primo tipo di Laser, quello ideato da Maiman (Fig. 9.2), era costituito da un cristallo di
Al2O3 contenente un 0.05% di Cr2O3, quindi un rubino sintetico rosa pallido le cui facce
vengono lavorate piatte e tra loro parallele, e argentate (una solo parzialmente) a formare una
cavità risonante.
Il mezzo attivo è inserito all’interno di una lampada a scarica contenente del gas a forma di
elica, che fornisce l’energia di pompaggio per instaurare l’inversione. Il rubino appare rosso
perché gli atomi di Cromo hanno bande di assorbimento nella regione blu e verde dello spettro.
Accendendo il tubo si genera una scarica di luce intensa che dura pochi millisecondi. Molta
dell’energia viene dissipata in calore, ma molti degli ioni Cr3+ sono eccitati nelle bande di
assorbimento. Gli atomi eccitati si diseccitano in circa 100 ns, restituendo energia al lattice del
cristallo e facendo transizioni non radiative. Preferenzialmente però essi rimangono per circa 3
ms in uno stato metastabile prima di decadere, in molti casi spontaneamente, nello stato
fondamentale. Quest’ultimo salto emette la radiazione caratteristica rossa tipica del Laser. In
138
questa fase dominano le transizioni al livello fondamentale e si ha un’emissione a banda larga
centrata attorno a 694.3 nm con luce incoerente emessa in tutte le direzioni.
Aumentando la velocità di pompaggio si assiste al fenomeno dell’inversione di
popolazione, e i primi fotoni emessi per stimolazione cominciano la reazione a catena. Un
fotone emesso innesca a sua volta l’emissione di un altro fotone identico, togliendo energia
dagli atomi nello stato metastabile e trasformandola in luce coerente.
raggio laser
L’onda continua a crescere in quanto passa avanti e indietro all’interno del mezzo attivo (il
rubino). Poiché una delle superfici di questo è solo parzialmente riflettente un intenso impulso
di luce laser rossa (che dura circa 0.5 ms ed ha una larghezza di banda di 0.1 nm) emerge da
una faccia del rubino.
Si noti quanto il tutto sia semplice. La banda larga di assorbimento facilita l’eccitazione,
mentre la lunga vita media degli stati metastabili innescano l’inversione di popolazione.
Il grado di coerenza di questo tipo di Laser va da 0.1 m ai 10 m (vedi oltre).
Come un oscillatore il Laser a rubino genera impulsi luminosi dell’ordine dei millisecondi
nell’intervallo di energia tra 50 J e 100 J, ma esistono tecniche per superare quest’energia. Il
Laser a rubino commerciale opera ad un’efficienza minore dell’1%, producendo un raggio con
un diametro che va da 1 mm a circa 25 mm, con una divergenza tra 0.25 mrad a circa 7 mrad.
Dopo che Maiman annunciò il primo tipo di Laser si ebbe una crescente attività in questo
settore, e già nel febbraio del 1961 fu prodotto il primo tipo di Laser He-Ne ad onda continua
(c-w). Esso permette una potenza continua di pochi milliwatt, spesso per una lunghezza d’onda
del visibile (632.8 nm). E’un strumento abbastanza facile da costruire e di poco costo e
semplice da usare. Per questo è molto usato nei laboratori come il nostro.
Il meccanismo di pompaggio è generalmente fornito da una scarica elettrica. Gli elettroni
liberi e gli ioni del gas sono accelerati dalla presenza di un campo elettrico, e per collisione si
determina un’ulteriore eccitazione e ionizzazione del gas. Molti atomi di He dopo essersi
diseccitati dai livelli di eccitazione più elevati, si concentrano nei livelli eccitati a lunga vita
media 21S e 23S che sono metastabili e dai quali non ci sono transizioni radiative permesse. Gli
atomi eccitati di He collidono in modo non elastico e trasferiscono energia agli atomi di Ne nel
loro stato fondamentale, portandoli agli stati di eccitazione 5s e 4s, che decadono negli stati 4p
e 3p realizzando l’inversione di popolazione. Le transizioni tra gli stati 5s e 4s sono proibite.
139
L’emissione spontaneadi
fotoni inizia
quindi
la reazione
a
catena.
Le transizioni
! " dominanti
$#% & &
corrispondono alla
p decadono a loro volta nello stato 3s, sostenendo quindi il meccanismo di inversione.
L
m=
λ/2
mv
νm = (9.13)
2L
dove v è la velocità dell’onda nel mezzo. Esiste pertanto un numero infinito di possibili
oscillazioni stazionarie, detti modi longitudinali della cavità, ognuno dei quali con una
frequenza ben precisa B m. Due modi consecutivi sono perciò separati da una differenza di
frequenza costante,
v
ν m+1 − ν m = ∆ν = (9.14)
2L
o c/2L se la velocità della luce è c. Per un Laser a gas lungo un metro è C D EF GHJILKNMOP modi
risonanti sono considerevolmente più stretti in frequenza delle normali transizioni atomiche
spontanee. Questi modi, se l’apparecchio è costruito in modo che ve ne siano uno o più,
saranno i soli che la cavità sostiene, e quindi il raggio emergente è ristretto attorno a questa
frequenza. In altre parole è la cavità che permette di sostenere uno o più modi stazionari, ed è
per questo motivo che la luce Laser è altamente monocromatica rispetto a tutte le altre sorgenti
luminose. Perciò sebbene le transizioni degli atomi del rubino allo stato fondamentale sono
piuttosto larghe in termini di banda (0.53 nm corrispondenti a 330 GHz), e questo a causa delle
interazioni degli ioni del Cromo con il lattice del cristallo, la larghezza di banda determinata
dalla cavità per un singolo modo risonante è molto più stretta, dell’ordine di 0.00005 nm (30
MHz).
Un possibile modo per generare solo un singolo modo risonante nella cavità è quello in cui
la separazione tra i modi data dalla (9.14) sia maggiore della larghezza di banda delle
transizioni del mezzo attivo (in questo caso il rubino). Per un Laser a rubino una cavità di pochi
cm è sufficiente per generare un solo modo risonante. Lo svantaggio di questo modo di operare
140
è che si diminuisce la regione attiva che contribuisce alla costruzione del raggio e quindi si
diminuisce la potenza del Laser.
Oltre ai modi longitudinali si possono avere però anche dei modi trasversali sostenuti dalla
cavità. Poiché essi sono perpendicolari all’asse di propagazione z, essi sono noti con il termine
di modi TEMmn. Gli indici m ed n sono il numero intero di linee nodali trasversali nelle
direzioni x ed y attraverso il raggio emergente. Questo significa che visto in sezione il raggio
Laser apparirà diviso in una o più regioni. Il TEM00 è l’ordine trasversale più basso ed è il più
usato. La sua densità di flusso è circa una gaussiana, non vi sono variazioni di fase nel campo
elettrico su tutto il raggio in sezione, ed è quindi completamente coerente spazialmente; la sua
divergenza angolare è la più piccola possibile. Si noti però che l’ampiezza non è costante su
tutto il fronte d’onda, per cui è leggermente disomogeneo.
Anche la forma degli specchi non deve essere necessariamente piana. Diverse
configurazioni con specchi piani accoppiati a specchi concavi, o con due specchi concavi, sono
state realizzate, ed ognuna ha i suoi propri vantaggi e svantaggi, in termini ad esempio di
stabilità della luce Laser. In un Laser instabile il raggio all’interno della cavità si allontana
progressivamente dall’asse ottico e si perde. In una configurazione stabile, con specchi che
sono rispettivamente 100% e 98% riflettenti, il raggio può viaggiare avanti e indietro anche 50
volte o più. I Laser instabili sono i più usati quando si ha bisogno di potenza, in quanto il
raggio deviando progressivamente dall’asse investe altre regioni del rubino, aumentando il
potere di estrazione di fotoni. A seconda quindi dell’utilizzo che si deve fare della luce Laser si
scelgono i tipi di cavità risonanti che meglio si adattano agli scopi che ci si prefigge.
D0
I/I0=1/e2
Fig. 9.3 Cavità risonante con specchi concavi. A seconda delle dimensioni dei raggi di curvatura degli specchi
rispetto alla distanza L, il Laser risulta più o meno stabile. Si veda la Fig. 13.12 di Hecht 1998.
Quando gli specchi che formano la cavità sono curvi c’è la tendenza a focalizzare il raggio
Laser, producendo una sezione minima del raggio D0 (Beam Waist=cintura del fascio) . In Fig.
9.3 è rappresentata una situazione ipotetica in cui il raggio Laser ha un minimo diametro D0 al
centro della cavità (il luogo ove cade il minimo dipende dalla curvatura degli specchi usati). Il
fascio laser in figura è rappresentato come limitato da due linee curve. Esse rappresentano il
raggio gaussiano ove l’intensità del fascio è I/I0 =1/e2 , con I0 intensità del fascio per r = 0.
L’angolo sotteso dal diametro del fascio in cui I/I0 =1/e2 si dice convergenza o divergenza del
fascio.
Per l’ottica geometrica il fascio dovrebbe convergere in un punto, ma per effetto della
diffrazione questo non succede. Per un Laser TEM00, come quello da noi utilizzato, vale la
relazione:
4λ
D0 = (9.15)
πθ
141
è la lunghezza d’onda della radiazio
D0 = cost.
Perciò per un fascio fortemente collimato il diametro D0 deve essere grande. La variazione
delle dimensioni del fascio in prossimità del Beam Waist è data dalla:
D = D0 1 + (θ z / D0 )2 (9.16)
dove z è la distanza lungo il raggio dal Beam Waist. Definiamo come intervallo di Rayleigh la
distanza dal Beam Waist in cui il diametro del fascio diviene D0 2 . Questo accade quando il
secondo termine nella (9.16) è uguale ad 1, cioè per z = z R = D0 / θ . Se si grafica il raggio di
curvatura del fronte d’onda del Laser in funzione di z, si può vedere che esso ha un minimo
proprio per z = ±zR. L’estensione 2zR può essere presa come la regione di collimazione del
fascio gaussiano.
L’intervallo di Rayleigh può scriversi in vari modi:
D0 4λ π D02
zR = = =
θ πθ 2 4λ
Le quantità D0!
!"$# R descrivono completamente le caratteristiche di un fascio Laser e sono tra
loro mutuamente correlate. Ad esempio per un Laser He-%'&)( * +-,..0/
12436587 00 con un
diametro D0 9
:6; 11'<!= :>?$@ +-A!B CD1E ? 9'FHG R=1.25 m.
A.
B.
142
Sono due modi diversi di espandere un fascio Laser
(Beam
Expander).
Nel caso A. si può
dimostrare che la nuova divergenza del fascio è è l’ingrandimento del sistema
di lenti dato dal rapporto delle focali delle due lenti. Nel caso B. la densità di potenza nel fuoco
della Ia lente è così alta che in taluni casi si possono verificare delle scariche elettriche. Il
principale vantaggio del caso B. rispetto al caso A. è che si possono piazzare dei diaframmi
(molto piccoli) nel punto di convergenza in modo da realizzare un filtraggio spaziale e ripulire
il fascio dalle alte frequenze spurie.
9.2.4 Coerenza
Nel caso di un Laser, l’interferenza di un fascio con se stesso ci può dare informazioni sulla sua
coerenza. Se infatti l’ampiezza o la fase o la lunghezza d’onda cambiano tra due punti,
l’interferenza mostrerà di quanto e ci darà un’idea della variazione spaziale e temporale di
coerenza. Un sistema di frange ben visibile diverrà via via meno visibile man mano che la
coerenza del fascio diminuisce. Questa perdita di visibilità delle frange è usata per misurare la
coerenza della luce Laser.
La visibilità delle frange può essere misurata dal contrasto tra le frange di interferenza:
I max − I min
C= (9.17)
I max + I min
dove Imax è l’intensità delle frange luminose e Imin quella delle frange scure. Questo contrasto si
può misurare per mezzo di un interferometro di Michelson al variare delle lunghezza di uno dei
bracci dell’interferometro. La visibilità delle frange può essere misurata prendendo diverse
immagini CCD per diverse distanze di uno dei due specchi, cioè per diversi cammini ottici. Se
la sorgente fosse monocromatica pura non si avrebbe ovviamente nessuna variazione di
contrasto tra le frange.
La misura della distanza c a cui si raggiunge il primo minimo di contrasto è detta
lunghezza di coerenza del Laser. Essa è legata alla larghezza di banda dalla relazione:
∆ν = c / c
λ
x1 − x2 = m
2
con m intero e dove x1 2 è la differenza di cammino tra i due bracci dell’interferometro. Per
un minimo invece si ha:
λ
x1 − x2 = m
4
con m disperi intero. Se vogliamo che il contrasto vada a zero dobbiamo avere un massimo per
il primo modo e un minimo per il secondo e terzo. Quindi essendo simmetrico il secondo e
terzo modo si ha:
143
λ1
x1 − x2 = m
2
λ λ
x1 − x2 = m 2 + 2
2 4
λ1 λ (λ − λ ) λ
m −m 2 = m 1 2 = 2
2 2 2 4
o anche
λ2
m∆λ = (9.18)
2
∆λ ∆ν
Essendo = e lasciando perdere l’indice 2 che non serve più, si ha allora
λ ν
ν
∆ν = (9.19)
2m
λ
Poiché ∆x = x1 − x2 = m , risolvendo per m e sostituendo si ottiene:
2
ν λν c
∆ν = = = (9.20)
2m 4∆x 4∆x
Quindi dalla misura della separazione
bracci dell’interferometro ove si realizza il primo minimo di contrasto, si può ottenere la
misura della differenza di frequenza tra i due modi assiali del Laser. Si può vedere e si può
dimostrare che esistono altri minimi separati da altrettanti massimi di interferenza anche oltre
la distanza ! ! "#! "$% &&')(* + ∆ν = 3c / 4∆x, 5c / 4∆x , etc. Infine si realizzi che la
trasformata di Fourier della funzione di visibilità ci dà lo spettro di frequenza della sorgente.
144
10 BIBLIOGRAFIA
146