Sei sulla pagina 1di 144

Mauro D’Onofrio

ELEMENTI DI OTTICA PER


ASTRONOMI

Appunti delle lezioni del corso di Laboratorio di Astronomia I


Premessa
Padova 3/10/01.

Le presenti dispense sono state scritte per gli studenti di astronomia che devono affrontare l’esame del corso di
Laboratorio di Astronomia I. Si è voluto, con queste dispense, dare un miglior assetto al corso e favorire gli
studenti, che in passato avevano il problema di dover studiare questa materia solo su testi di lingua inglese.
Questa è la prima versione di queste dispense, per cui è possibile che vi siano numerosi
errori ed imperfezioni, nel testo e nelle figure. Pregherei pertanto tutti gli studenti che trovino
errori di vario tipo e coloro che hanno suggerimenti per migliorare la comprensione del testo
stesso, di mettersi in contatto con me.

Mauro D’Onofrio

2
Sommario

1 CAPITOLO 1................................................................................................................ 66
1.1 Il principio di Fermat .................................................................................................. 6
1.2 Applicazioni del principio di Fermat ........................................................................... 8
1.2.1 Legge della riflessione e della rifrazione ............................................................... 8
1.2.2 Il diottro sferico .................................................................................................... 9
1.2.3 La lente sottile .................................................................................................... 10
1.3 Il principio di Fermat e le superfici riflettenti ............................................................ 11
1.3.1 Specchio concavo (un punto coniugato all’infinito) ............................................ 11
1.3.2 Specchio concavo con due punti coniugati.......................................................... 12
1.3.3 Specchio convesso con due punti coniugati......................................................... 12
1.4 Le Sezioni coniche.................................................................................................... 13
2 CAPITOLO 2................................................................................................................ 15
2.1 Introduzione alle aberrazioni..................................................................................... 15
2.1.1 Gli specchi conici ............................................................................................... 15
2.1.2 L’aberrazione sferica .......................................................................................... 16
2.1.3 Un esempio ........................................................................................................ 18
2.1.4 Distribuzione dei raggi vicino al fuoco ............................................................... 18
2.1.5 Gli specchi conici con oggetti ed immagini a distanza finita ............................... 19
2.2 Le aberrazioni fuori asse ........................................................................................... 20
2.3 Compensazione delle aberrazioni .............................................................................. 21
2.3.1 La montatura Cassegrain .................................................................................... 21
2.3.2 La camera Schmidt ............................................................................................. 24
3 CAPITOLO 3................................................................................................................ 24
3.1 Il principio di Fermat e le aberrazioni per una generica superficie di rivoluzione....... 24
3.2 Valutazione dei coefficienti di aberrazione................................................................ 27
3.3 Aberrazioni del raggio e del fronte d’onda ................................................................ 29
3.4 Riassunto delle principali aberrazioni........................................................................ 30
3.4.1 Condizioni aplanatiche ed alcuni esempi............................................................. 32
3.5 Le aberrazioni in presenza di diaframmi.................................................................... 32
3.6 Le nuove relazioni .................................................................................................... 33
3.6.1 I coefficienti di aberrazione ................................................................................ 34
3.6.2 Esempi ............................................................................................................... 36
3.7 Le Aberrazioni per sistemi a più superfici ................................................................. 36
3.7.1 Esempio: i coefficienti di aberrazione per un telescopio Cassegrain .................... 37
3.8 Curvatura di campo................................................................................................... 38
4 CAPITOLO 4................................................................................................................ 41
4.1 I telescopi riflettori.................................................................................................... 41
4.1.1 Il paraboloide ..................................................................................................... 41
4.1.2 I telescopi con due specchi ................................................................................. 42
4.1.3 Il tipo classico .................................................................................................... 45
4.1.4 Il tipo aplanatico ................................................................................................. 46
4.1.5 Altri telescopi con due specchi............................................................................ 47
4.1.6 Confronto tra tipo classico e aplanatico............................................................... 48
4.2 Errori di allineamento nei telescopi a due specchi ..................................................... 51
4.2.1 Errori di centraggio e di inclinazione .................................................................. 51
5 CAPITOLO 5................................................................................................................ 55
3
5.1 La sovrapposizione delle onde .................................................................................. 55
5.2 Somma di onde della stessa frequenza....................................................................... 55
5.2.1 Il metodo algebrico ............................................................................................. 55
5.2.2 Il metodo complesso ........................................................................................... 59
5.2.3 I Fasori ............................................................................................................... 60
5.2.4 Onde stazionarie ................................................................................................. 61
5.3 La sovrapposizione di onde con diversa frequenza .................................................... 62
5.3.1 I battimenti ......................................................................................................... 62
5.4 La velocità di gruppo e di fase................................................................................... 63
5.5 Onde periodiche anarmoniche ................................................................................... 64
5.5.1 Le serie di Fourier .............................................................................................. 65
5.6 Le onde non periodiche ............................................................................................. 68
6 CAPITOLO 6................................................................................................................ 72
6.1 Interferenza............................................................................................................... 72
6.1.1 Considerazioni generali ...................................................................................... 72
6.2 Condizioni per l’interferenza..................................................................................... 75
6.2.1 Coerenza spaziale e temporale ............................................................................ 75
6.3 Le leggi di Fresnel-Arago ......................................................................................... 77
6.4 Interferometri a divisione del fronte d’onda............................................................... 78
6.4.1 L’esperimento di Young ..................................................................................... 78
6.4.2 Altri tipi di interferometro a divisione del fronte d’onda ..................................... 80
6.5 Interferometri a divisione di ampiezza....................................................................... 82
6.5.1 Frange osservabili da una pellicola di materiale dielettrico.................................. 82
6.5.2 Frange di uguale inclinazione ............................................................................. 82
6.5.3 Frange di uguale spessore ................................................................................... 85
6.6 L’interferometro di Michelson .................................................................................. 87
6.7 Altri interferometri.................................................................................................... 90
6.7.1 Frange reali ........................................................................................................ 90
6.7.2 Tipo e localizzazione delle frange....................................................................... 92
6.8 Interferenza multipla ................................................................................................. 93
7 CAPITOLO 7................................................................................................................ 97
7.1 La diffrazione ........................................................................................................... 97
7.1.1 Il principio di Huygens-Fresnel........................................................................... 97
7.1.2 Ostacoli opachi ................................................................................................... 98
7.2 Diffrazione di Fresnel e di Fraunhofer....................................................................... 99
7.2.1 Diversi oscillatori coerenti................................................................................ 100
7.3 Diffrazione di Fraunhofer........................................................................................ 103
7.3.1 La fenditura ideale singola................................................................................ 103
7.3.2 La fenditura rettangolare reale .......................................................................... 105
7.3.3 La fenditura doppia........................................................................................... 107
7.3.4 Il reticolo .......................................................................................................... 108
7.3.5 Spettroscopia con i reticoli................................................................................ 111
7.3.6 Apertura rettangolare e circolare....................................................................... 113
8 CAPITOLO 8.............................................................................................................. 117
8.1 Elementi di ottica di Fourier.................................................................................... 117
8.1.1 Trasformata di una funzione gaussiana ............................................................. 118
8.1.2 La trasformata bidimensionale .......................................................................... 118
8.1.3 Proprietà della Delta di Dirac............................................................................ 119
8.1.4 I sistemi lineari ................................................................................................. 121
8.1.5 L’integrale di convoluzione .............................................................................. 123

4
8.2 Le lenti realizzano le trasformate di Fourier ............................................................ 125
8.3 La diffrazione di Fraunhofer ................................................................................... 127
8.4 Le funzioni di trasferimento .................................................................................... 128
8.4.1 OTF non normalizzata e normalizzata............................................................... 130
9 CAPITOLO 9.............................................................................................................. 134
9.1 Cenni sul funzionamento del LASER...................................................................... 134
9.1.1 Energia e materia in equilibrio .......................................................................... 134
9.1.2 Emissione stimolata.......................................................................................... 136
9.2 Il LASER................................................................................................................ 138
9.2.1 Il Laser ad He-Ne ............................................................................................. 139
9.2.2 Le cavità ottiche risonanti................................................................................. 140
9.2.3 Collimazione di un fascio Laser........................................................................ 142
9.2.4 Coerenza .......................................................................................................... 143
10 BIBLIOGRAFIA ........................................................................................................ 146

5
1 CAPITOLO 1

1.1 Il principio di Fermat

Si tratta di un metodo molto potente per trattare i problemi di ottica geometrica. Si supponga di
avere una superficie che trasmette e/o riflette i raggi luminosi. Il principio di Fermat afferma
che la traiettoria seguita dal raggio luminoso sarà quella per cui il tempo necessario, per andare
ad esempio dalla sorgente al piano focale, è minimo. Il principio di Fermat può essere esteso
ad un sistema ottico più generale, e nella sua forma moderna asserisce che: La traiettoria vera
seguita da un raggio luminoso è quella per cui il tempo, necessario per andare da un punto
fisso A ad un altro punto fisso B, è stazionario rispetto a piccole variazioni dal percorso vero.
In altre parole il tempo necessario per andare da un punto A ad un altro B non differisce più di
un infinitesimo del secondo ordine dal tempo necessario per andare da A a B lungo un altro
percorso molto prossimo al percorso vero. Quindi in prima approssimazione il tempo per il
percorso vero è uguale a quello per un raggio adiacente al percorso vero.
Il caso più semplice per illustrare il principio di Fermat è mostrato in Fig. 1.1. Una superficie Σ
separa due punti P0 e P1.

n’
n

(x,y) P1

Σ
P0

Fig. 1.1 Un possibile cammino ottico tra due mezzi di indice di rifrazione diversi separati dalla superficie Σ.

Le linee piene rappresentano la traiettoria vera, quelle tratteggiate una ad essa adiacente.Il
tempo per andare da P0 a P1     
è sia verificata la condizione di stazionarietà per il
percorso vero, deve essere:

∂τ / ∂x = ∂τ / ∂y = 0 (1.1)

dove x,y sono le coordinate generiche dove il raggio incontra la superficie. In modo
equivalente si può rimpiazzare la frase tempo di viaggio della luce con cammino ottico della
luce. Se dt è un tempo infinitesimo allora cdt è il corrispondente cammino ottico. Il cammino
ottico (OPL) è definito perciò dalla relazione:

d(OPL)=cdt=(c/v)vdt=nds (1.2)
OPL= c ∫ dt = ∫ nds
enunciare il principio di Fermat è perciò
 
dove v è la velocità della luce nel mezzo di indice di rifrazione n. Il modo generico di
OPL)=0, dove n può essere una funzione di
tutte le coordinate che specificano la posizione.
Consideriamo ora il caso bidimensionale (2D) dove n=n(y,z) e ds= dy 2 + dz 2 . Posto
y’=dy/dz il principio di Fermat si scrive:

P1
δ ∫ n( y , z ) (1 + y '2 )dz = 0 (1.3)
P0

dove ds è stato rimpiazzato da dz (1 + y '2 ) . Assumendo F(y,y’,z) sia l’integrando della (1.3) si
ha:
P1 P1
δ ∫ F ( y, y ', z )dz = ∫ δ F ( y , y ', z )dz = 0 (1.4)
P0 P0

dove
∂F ∂F ∂F ∂F d
δF = δ y+ δ y'= δy+ (δ y ) .
∂y ∂y ' ∂y ∂y ' dz

             !"#%$ '&  ()  *+-,  ).,  ) & $/ $ +& & $  0

∂F ∂F d  ∂F 
∫ −∫
P1 P1
δ ydz + δy P1
  δ ydz = 0 (1.5)
∂y ∂y dz  ∂y ' 
P0
P0 P0

1
Il secondo termine nella (1.5) è zero poiché y è nullo agli estremi. Possiamo perciò riscrivere:

 ∂F d  ∂F  

P1
 −    ⋅ δ ydz = 0 (1.6)
 ∂y dz  ∂y '  
P0

Poiché quest’espressione è nulla per ogni y deve essere: 1


∂F d  ∂F 
−  =0 (1.7)
∂y dz  ∂y ' 

che è l’equazione richiesta per soddisfare il principio di Fermat.


Ora prendendo l’eq. (1.7) rimpiazzando la F ed eseguendo i differenziali si ottiene:

∂n d  ny '  ∂n d  y'  y' dn


(1 + y '2 ) −   = (1 + y '2 ) − n  − =0 (1.8)
∂y dz  (1 + y '2 )  ∂y dz  (1 + y '2 )  (1 + y '2 ) dz

Usando alcune sostituzioni trigonometriche la (1.8) si semplifica notevolmente, infatti è:

dy dy y'
tan α = = y' sin α = =
dz ds (1 + y '2 ) (1.9)
dz 1 d dα
cos α = = sin α = cos α
ds (1 + y '2 ) dz dz

7
Per cui possiamo riscrivere la (1.8) come:

∂n ∂n dα
cos α − sin α − n cos α =0 (1.10)
∂y ∂z dz

Notiamo infine che la curvatura 


   

 
  
   
è definita
dall’equazione:

dα dα dz dα
κ= = = cos α
ds dz ds dz

per cui la (1.10) si può riscrivere:

dα ∂n ∂n
nκ = n cos α = cos α − sin α (1.11)
dz ∂y ∂z

Quest’equazione ci dice come varia la curvatura di un raggio luminoso in un mezzo il cui


indice di rifrazione è una funzione uniformemente variabile con la posizione. Si noti che per
n=cost la curvatura è zero ed il raggio viaggia in linea retta.

1.2 Applicazioni del principio di Fermat

Vediamo ora alcune utili applicazioni del principio di Fermat.

1.2.1 Legge della riflessione e della rifrazione

Il principio di Fermat può essere usato per derivare la legge di Snell della riflessione e
rifrazione di un raggio luminoso che attraversa una superficie piana di separazione tra due
mezzi di indice di rifrazione n ed n’. Esaminando la Fig. 1.2 si vede che il cammino ottico è
stazionario se vale la relazione:

y P2

P0

P1 z

Fig.1.2 Un raggio attraversa una superficie piana che divide due mezzi di diverso indice di rifrazione.

8
δ  n ∫ ds + n ' ∫ ds  = 0
P0 P2

 P1 P0 

che diviene dopo il calcolo degli integrali:

{
δ n z12 + y02 + n ' z 22 + ( y2 − y0 )
2
}= 0 (1.12)

Differenziando, essendo y0 la variabile indipendente si ottiene:

 d  z22 + ( y2 − y0 )2   δ y0 = 0
n (z
2
1 + y02 ) + n '
d
 
 dy0 dy0 

poiché l’espressione in parentesi è indipendente da y0 dovrà essere allora, eseguendo le


derivate:

y0 y2 − y0
n − n' =0 (1.13)
(z 2
1 + y02 )  z22 + ( y2 − y0 )2 
 

da cui si vede che i due termini che moltiplicano n ed n’ sono rispettivamente sin(i) e sin(i’) e
quindi la (1.13) è proprio la legge di Snell della rifrazione n sin(i)=n’ sin(i’). Per ottenere la
legge della riflessione basta allora porre n’=  e si ottiene i’=  . Si lascia allo studente
provare che la (1.13) è effettivamente una condizione di minimo.

1.2.2 Il diottro sferico

La superficie sferica di Fig. 1.3 separa due mezzi omogenei di indice di rifrazione n ed n’. B e
B’ sono due punti coniugati, C è il centro di curvatura della superficie sferica.


Z
B s C B’

s’

Fig. 1.3 La rifrazione su una superficie sferica. Nel disegno si suppone di usare solo i raggi parassiali in modo da
poter confondere la linea retta con la linea curva che rappresenta la superficie sferica.

Rispettando la convenzione sui segni data dalle frecce il cammino ottico è L=   n’

Usando la legge del coseno possiamo scrivere:

9
= − R 2 + ( R − s ) − 2 R ( R − s ) cos φ
2

' = R 2 + ( s '− R ) + 2 R ( s '− R ) cos φ


2

Sostituendo   


          è la variabile, per cui applicando il
principio di Fermat si ottiene:

dL

=− 
nR( R − s ) sin φ n ' R(s '− R) sin φ

'
=0  (1.14)

che nel limite parassiale in cui        à immediatamente la nota relazione del diottro
sferico.

1.2.3 La lente sottile

Come altro esempio dell’uso del principio di Fermat vogliamo ora trovare la lunghezza focale
di una lente sottile di indice di rifrazione n, con raggi di curvatura R1 ed R2. Ogni raggio che
connette due punti coniugati deve soddisfare al principio di Fermat, in altre parole il cammino
ottico OPL, dovendo essere lo stesso per tutti i raggi che connettono due punti coniugati, non è
né un minimo né un massimo. Osservando la Fig. 1.4 scriviamo l’espressione del cammino
ottico per il tragitto del raggio lungo l’asse ottico e lungo un raggio parassiale a distanza y
dall’asse ottico:

!#" $
L0=[BO1]+n[O1O2]+f’
Lp=[BO1]+z1+n[P1P2] 2+

P1
P2
$
O1 O2
f’
Z

Fig. 1.4 Una lente sottile è attraversata da due raggi, lungo l’asse ottico e a distanza y da questo, provenienti da un
punto B a distanza infinita. La lente sottile è rappresentata da due piani essendo in gioco solo grandezze parassiali.

dove z2<0 e z1>0 (per la convenzione sui segni) danno le distanze tra l’asse y1 e y2 e la
superficie reale della lente. Posto L0=Lp si ha:

nd + f ' = z1 + n d( − z1 + z2 −) z2 + % (1.15)

10
in cui abbiamo sostituito d=[O1O2] e d  1+z2=[P1P2]. Da questa svolgendo le operazioni si
ottiene:

− f ' = (n − 1)( z1 − z 2 ) (1.16)

Essendo quindi i raggi di curvatura dati dalle relazioni:

R12 = y12 + ( R1 − z1 ) 2 = R12 + y 2 − 2 R1 z1


R22 = y22 + (− R2 + z2 )2 = R22 + y 2 − 2 R2 z 2

dove y1=y2=y per una lente sottile nell’approssimazione parassiale. In questa approssimazione
si ha pure che z1=y2/2R1 e z2= y2/2R2. Dalla Fig. 1.4 si vede inoltre che  2=y2+f’2= f’2(1+y2/
f’2), facendone la radice e l’espansione binomiale si ha  f’= y2/2 f’. Sostituendo nella (1.16) le
espressioni per z1, z2 ed  f’ si ottiene infine:

1 1 1 
= (n − 1)  −  (1.17)
f'  R1 R2 

che è la ben nota relazione dei fabbricatori di lenti. In modo simile si può ricavare s ed s’ in
funzione di f’, esercizio che lasciamo allo studente.

1.3 Il principio di Fermat e le superfici riflettenti

Le applicazioni del principio di Fermat viste fino ad ora si applicano al dominio dei raggi
parassiali ed hanno a che fare solo con superfici sferiche. Vediamo ora invece delle
applicazioni che usano superfici riflettenti di forma differente e non hanno la limitazione
imposta prima sull’apertura del fascio luminoso.

1.3.1 Specchio concavo (un punto coniugato all’infinito)

Consideriamo lo specchio concavo di Fig. 1.5. I raggi paralleli provenienti da sinistra da


distanza infinita sono fatti convergere dallo specchio ad una distanza f dal vertice dello
specchio. Per convenienza assumiamo f,    
         
     
!  "# $ %
raggi lungo l’asse ottico e a quelli distanti y da questo, vediamo che OPL uguali implicano che
2f = & '( f)!+* ,
-&. f+/


y
&

Fig. 1.5 Raggi riflessi da un riflettore concavo.

11
Dalla geometria della figura si vede che: 2
= y 2 + ( f − ∆)2 . Eliminando  si ottiene
y 2 = 4 f ∆ che in termini di z diviene:
y 2 = −4 f ⋅ z (1.18)

che è l’equazione di un parabola con vertice in (0,0). Il paraboloide si ottiene facendo ruotare la
parabola attorno all’asse z. Sostituendo R ad f usando l’approssimazione parassiale f=2R si ha:

y 2 = 2R ⋅ z

dove R è il raggio di curvatura della superficie nel suo vertice e sia R che z hanno segno
negativo in figura.

1.3.2 Specchio concavo con due punti coniugati

Se in Fig. 1.5 si pensa all’oggetto in un punto B distante s dal vertice, la sua immagine cade in
un punto B’ distante s’ dal vertice. Allora dette    
                
incide a distanza y dall’asse ottico, si ha applicando il principio di Fermat:
+ ' = − s( + s ' )
Essendo quindi:

2
= y 2 + (−s − ∆ )2 '2 = y 2 + −(s −' ∆ 2
)

eliminando     "! # 


   $
ss ' ss '
y 2 − 4z + 4z2 =0 (1.19)
s+s' s(+ s 2' )

che è l’equazione di un’ellisse con centro (0,a) ed a,b semiassi maggiore e minore
rispettivamente. Posto infatti 2a=s+s’ e b2=ss’ la (1.19) prende la forma canonica:

( z − a )2 y 2
+ 2 =1
a2 b

Il teorema di Fermat porta quindi a concludere che è l’ellissoide la curva più appropriata per i
punti coniugati. Si noti che la sfera ne rappresenta il caso particolare in cui s=s’ e a=b. Si noti
inoltre che la parabola è pure un caso speciale della (1.19) per s=%'&( ) * f.

1.3.3 Specchio convesso con due punti coniugati

Nella Fig. 1.6 è mostrato uno specchio convesso con un oggetto virtuale in B e la sua
immagine in B’ sull’asse ottico z. Assumendo la convenzione sui segni appropriata (lo studente
verifichi quale deve essere) si ha applicando il principio di Fermat che:
++ + ' = s2 '

mentre la geometria della figura dà:

12
d 2 = y 2 + (− s + ∆) 2 + d = s '− s '2 = y 2 + ( s '+ ∆) 2

,
-

B B’

S S’

Fig. 1.6 Lo specchio convesso con due punti coniugati a distanza finita.

Eliminando    
         
 

 

  
    



ss ' ss '
y 2 − 4z + 4z2 =0 (1.20)
s+s' (s + s ')2

che è identica alla(1.19), con una importante differenza sul segno di s ed s’ (lo studente dica
quale). E’ facile vedere che questa è l’equazione di un iperbole dove b2="! ! #$%& '"! ("! # )

1.4 Le Sezioni coniche

Ognuna delle curve studiate prima è una sezione conica. E’ quindi possibile ricavare una
singola equazione da cui derivare tutti i casi particolari studiati. Partiamo dall’equazione dei
punti coniugati che può scriversi:

ss ' R
=
s + s' 2

(vale in approssimazione parassiale). Ricordando l’equazione dell’ellisse e le definizioni di a e


b in termini di s ed s’, e riprendendo la definizione di eccentricità e=c/a dell’ellisse (dove
c2=a2*+ 2), si ha che:

4 ss ' ( s − s ') 2
1− e = 2
e =
2

( s + s ')2 ( s + s ')2

che insieme alla precedente danno:

y 2 − 2 Rz + (1 − e 2 ) z 2 = 0 (1.21)

13
che descrive tutta la famiglia delle coniche precedenti se si sceglie e opportunamente. Posto
K= e2 le varie sezioni coniche si ottengono ponendo:

Ellissoide oblato e2<0 K>0


Sfera e=0 K=0
Ellissoide prolato 0< e<1 -1<K<0
Paraboloide e=1 K=-1
Iperboloide e>1 K<-1

Nella discussione sulle aberrazioni che segue useremo K per descrivere tutte le sezioni coniche.
Ricordando la definizione di ingrandimento m=      

         
 

(m + 1)2
K2 = −
(m − 1) 2

La superficie di rivoluzione generica sarà quindi descritta da un equazione del tipo:

r 2 − 2 Rz + (1 + K ) z 2 = 0 (1.22)

dove r 2 = x 2 + y 2 .
A questo punto è utile calcolare il raggio locale di curvatura Rlc in un punto (r,z) della
superficie dello specchio. La relazione per il raggio di curvatura è:

Rlc = (1 + z '2 )3/ 2 / z "

dove z ' = dz / dr e z " = d 2 z / dr 2 .


Risolvendo la (1.22) per z e svolgendo i calcoli si ha:

3/ 2 3/ 2
Rlc = r 1 − K (r 2 / R 2 )  = R 1 − K (ε 2 /16 F 2 )  (1.23)

dove F = f / D e r = ε D / 2 con     !


Per K=0 si ha Rlc=R. Esplorando la famiglia delle coniche si vede che andando dalla sfera
all’ellissoide, al paraboloide e all’iperboloide si ha che Rlc diviene progressivamente più
grande per un dato r ed R. Alternativamente la curvatura locale 1/Rlc decresce. Nel vertice si ha
quindi che r → 0 e Rlc → R. Vicino al vertice tutte le superfici considerate hanno la stessa
forma e quindi in approssimazione parassiale sono identiche.
In conclusione abbiamo visto che le superfici coniche riflettenti danno immagini perfette
per una singola coppia di punti coniugati. Un dato specchio conico in generale non soddisferà
al principio di Fermat per altre coppie di punti coniugati; questo implica la presenza di
aberrazioni che esamineremo nei prossimi capitoli.

14
2 CAPITOLO 2

2.1 Introduzione alle aberrazioni

Fino ad ora si è visto che nell’approssimazione parassiale tutte le superfici producono


immagini stigmatiche, nel senso che i punti oggetto e immagine sono coniugati secondo
l’equazione di Gauss. Nel precedente capitolo si è inoltre visto che le superfici coniche
possono anch’esse, in vari casi, produrre immagini stigmatiche indipendentemente
dall’approssimazione parassiale.
In questo capitolo iniziamo a vedere cosa succede quando il principio di Fermat non è
strettamente soddisfatto, cioè quando viene a mancare l’approssimazione parassiale. Vedremo
che l’immagine di un punto non rimane puntiforme ma si sparpaglia a produrre una figura di
aberrazione. All’inizio faremo il caso dei sistemi ottici più semplici, calcolando le aberrazioni
degli specchi ed introdurremo il concetto di compensazione delle aberrazioni, facendo infine il
caso dei due principali telescopi astronomici, analizzando le configurazioni Schmidt e
Cassegrain.

2.1.1 Gli specchi conici

Cominciamo con il calcolare la lunghezza focale di uno specchio concavo, o più precisamente,
la distanza dal vertice dello specchio dove un raggio riflesso incontra l’asse ottico. La Fig. 2.1
mostra un fascio di raggi paralleli incidenti uno specchio concavo ad un altezza r dall’asse
ottico. Contrariamente alle normali convenzioni facciamo viaggiare la luce da destra a sinistra.
Con questa

 scelta
    le
 distanze
  misurate
    adestra
 ! del vertice dello specchio sono positive.
r > 0. Dalla geometria della figura si vede che
f = z + z0 , dove

"

Z0 Z

Fig. 2.1 Un raggio incidente parallelo all’asse ottico incide sullo specchio concavo e ne viene riflesso.

r r (1 − tan 2 ϕ )
z0 = = (2.1)
tan 2ϕ 2 tan ϕ

15
Notiamo che tan ϕ = dz / dr e usando la (1.22) del capitolo precedente si ha:
dz r
= = tan ϕ
dr R − (1 + K ) z

Sostituendo nella (2.1) e ponendo f = z + z0 si ottiene:

R (1 − K ) z r2
f = + − (2.2)
2 2 2( R − (1 + K ) z )

Per eliminare z dalla (2.2) ricaviamo z dalla (1.21) ed espandiamo in serie di potenze
ottenendo:
r2 r4 r6
z= + (1 + K ) 3 + (1 + K )2 + ... (2.3)
2R 8R 16 R5

che sostituendo da luogo alla:


R (1 + K )r 2 (1 + K )(3 + K )r 4
f = − − − ... (2.4)
2 4R 16 R 3

da cui si vede subito che f = R / 2 per K = −1 , cioè per un paraboloide. Per una sfera o un
ellissoide con K > −1 è f < R / 2 , mentre per un iperboloide è f > R / 2 . La f è costante per
ogni r solo per il paraboloide quando l’oggetto è all’infinito. Per ogni altra conica la variazione
della distanza focale f in funzione di r è:

(1 + K )r 2 (1 + K )(3 + K ) r 4
∆f = f (r ) − f (paraxial) = − − − ... (2.5)
4R 16 R3

Perciò per ogni superficie coniche che non sia un paraboloide l’immagine di un oggetto
all’infinito sarà aberrata. f è indipendente dal segno di r per cui il degrado dell’immagine sarà
simmetrico rispetto all’asse z. Il segno di R invece cambia il segno di f.

2.1.2 L’aberrazione sferica

Definiamo aberrazione sferica trasversa (TSA) l’intersezione di un raggio riflesso a distanza r


dal vertice con il piano focale parassiale (Fig. 2.2).

LS
 A

TS
f A Z

R/2

Fig. 2.2 L’aberrazione sferica trasversa (TSA) e longitudinale (LSA).

16
L’aberrazione sferica longitudinale è invece la distanza tra il fuoco reale ed il fuoco parassiale,
cioè f. Osserviamo che:

TSA r
=
LSA ( f − z)

dove sia TSA che LSA sono negative. Usando le relazioni precedenti ed applicando
l’espansione binomiale mantenendo tutti i termini fino al V° ordine, lo studente può verificare
che:

r3 r5
TSA = −(1 + K ) − 3(1 + K )(3 + K ) + ... (2.6)
2R2 8R 4

Il primo termine è detto (TSA3) il secondo (TSA5). Per K = 0 (superficie sferica) entrambi i
termini sono negativi per r > 0 e positivi per r < 0. Il segno di TSA per un iperboloide è
opposto a quello di una sfera o un ellissoide. Si noti inoltre che il segno di TSA è indipendente
dal segno di R. Il rapporto tra i due termini è:

TSA5 3(3 + K )r 2 3(3 + K )


= =
TSA3 4R2 64 F 2

dove F è il rapporto focale ( F = f / D ). Per una sfera TSA5 è il 10% di TSA3 quando F=1.19.
Ciò è sufficiente per trascurare TSA5 per tutti gli specchi sferici eccettuati quelli troppo rapidi
(F piccoli).
Osservando l’eq. (2.3) vediamo che la differenza tra la superficie del paraboloide (non
aberrata) e quella di una generica superficie di costante conica K è, fermandoci al termine in r4,
data da:

r4
∆z = z p − z ( K ) = −(1 + K ) 3 (2.7)
8R

dove p indica il paraboloide. La differenza di cammino ottico tra due raggi che incidono
 
e  su
rispettivamente su un paraboloide

una generica

  
superficie

   
 alla

 medesima
  
 altezza

 
  r, è
approssimativamente 2 e di
2(ϕ p − ϕ ) dove ϕ = dz / dr e ϕ p = dz p / dr in approssimazione parassiale. Lo studente può
verificare dalla (2.3) che:

d r3
2(ϕ p − ϕ ) = (2∆z ) = − (1 + K ) 3
dr R

detta aberrazione sferica angolare (ASA).


La relazione tra l’aberrazione trasversa e quella angolare è:

r3
TSA3 = ( R / 2) / ASA3 = − (1 + K ) (2.8)
2R2
           
p non sia troppo grande.
17
Lo studente esamini quali sono le approssimazioni fatte affinché sia valida la (2.8).
  

ad
Le procedure seguite per ottenere la (2.8) possono essere generalizzate  ogni

  coppia
  di
oggetti ed immagini coniugati. Tutto ciò di cui si ha bisogno è
la superficie senza aberrazione e quella affetta dall’aberrazione, mantenendo l’approssimazione
parassiale. Si ha che:

d d
ASA3 = (2∆z ) TSA3 = s ' ∆z )
(2 (2.9)
dr dr

Non si dimentichi che qui stiamo considerando il caso in cui n=1 (lo specchio è in aria).
L’importanza della (2.9) sta nella sua utilità quando è applicata a sistemi ottici più complessi
con più di una superficie riflettente.

2.1.3 Un esempio

Consideriamo un punto oggetto a distanza finita da uno specchio ellissoidale che produce come
abbiamo visto un’immagine stigmatica del punto. Se si usa uno specchio sferico anziché
ellissoidalesi
presentano
   le  aberrazioni.
  
   Seguendo

   la
 procedura
 !  descritta
  prima troviamo la
differenza (2.3) abbiamo:

∆z = ze − z s = K e r 4 / 8 R3

fermandosi all’approssimazione al terz’ordine. Dalla (2.9) si ha quindi immediatamente:

ASA3 = K e (r 3 / R3 ) TSA3 = K e (r 3 / R3 ) s ' (2.10)

dove −1 < K e < 0 per punti coniugati reali. Esprimendo il tutto in funzione dell’ingrandimento
m = − s ' s/ e ricordando le relazioni dei punti coniugati lo studente può verificare che le (2.10)
possono riscriversi nella forma:

 m +1  r
3 2

ASA3 = −   3
 m −1  R (2.11)
(m + 1)2 r 3
TSA3 = +
m − 1 2R2

Si noti che m<0 per coniugati reali, quindi TSA per uno specchio sferico ha sempre lo stesso
segno per un dato r, indipendentemente dal segno di R. Questo è tale che il fuoco dei raggi
marginali riflessi dallo specchio è sempre più vicino%al    del fuoco parassiale. Si noti
vertice
infine che l’aberrazione sferica è zero quando m="$# è s=s’ e la sfera è la superficie
perfetta in accordo con il principio di Fermat.

2.1.4 Distribuzione dei raggi vicino al fuoco

Abbiamo visto che TSA è una misura delle dimensioni dell’immagine di un punto oggetto nel
fuoco parassiale. La caustica di aberrazione è tale che la minima dimensione dell’immagine si
ha nel circolo di minor confusione tra il fuoco parassiale e il fuoco marginale. Si può vedere
che le dimensioni dell’immagine nel circolo di minor confusione sono circa 4 volte inferiori a
18
TSA3. Esso si colloca ad una distanza z’=0.75z’(marginale). Le sezioni perpendicolari all’asse
ottico ove convergono i raggi provenienti da diverse r, sono dette “spot diagrams”. Dalla nostra
discussione emerge che il diametro del circolo di minor confusione è r 3 / 4 R2 quando
l’oggetto è all’infinito. L’angolo sotteso da questo spot allo specchio è quindi:

α = r 3 / 2 R 3 = 1/128 F 3 (2.12)

 
   
               "!!# $ % &'  #  $ ((# )&(*)&,+)&' -.# &. )# # /
diametro dell’immagine non decresce più essendo raggiunto il limite imposto dalla diffrazione.
Il più piccolo F per cui uno specchio sferico raggiunge il limite di diffrazione θ ≈ λ / D si
 #  $ !$0 ()$ (/ # $ &-212$ 3 465798 :;
D ≈ 128λ F 3 . Come esempio diciamo che nel visibile F<>==
per D=10 cm e F< ?@BAC D,E*F=9G.H>IJC D K L M to a dispetto dell’aberrazione sferica uno specchio
sferico in luce collimata è effettivamente limitato dalla diffrazione se il rapporto focale è
N D L MOCL PPL Q K L MR LHSUT9Q K VOC MK C*WC D X Y X Z [X Z [C*D X Q T\ WC MOT.AC D ].^_ ` ` _ D ≈ 128λ F 3 e sostituendo il
risultato nella (2.7) e ponendo K=0, la differenza aUbc d _ef.g_ d _ hi` ij ^kkefi0l gk m m nj i0l o k d j m i
limitato dalla diffrazione è approssimativamente ] p qr6s"tu vwuUx y.wu z z { | { v} y di cammino ottico è
~  p € rJ"x ‚ { | vy ‚ u ƒy „{ v‚ {.…† ‡ ‡ u y „†ˆwu | {‰ Š{.u xUz | †v‚ {w ‹ †vwy{ „{ | Œ{ v‚ {wy.tv†ˆ‡ …{ ‰ ‰ Šu †ˆ‡ z { | u ‰ †
non è più sferico ma differisce da quello emergente da un paraboloide per  p €,y u ‡ t†u†| wu r

2.1.5 Gli specchi conici con oggetti ed immagini a distanza finita

La discussione svolta fino ad ora ha riguardato la determinazione di TSA per oggetti a distanza
infinita. Vogliamo ora completare il quadro considerando il caso più generale. Consideriamo la
Fig. 2.3.


 Ž ‘

S’ Z

1.1.1 S

Fig. 2.3 Geometria dei raggi per punti a distanza finita.

Dalla geometria del sistema si ricava:

r r dz r
tan α = tan β = tan ϕ = =
s−z s '− z dr R − (1 + K ) z

dove ϕ = γ + α = β − γ . Risolvendo per s’ si trova:

19
s '− z =
r
=r
[1 + tan ϕ (2 tan α − tan ϕ )] (2.13)
tan(2ϕ − α ) 2 tan ϕ − tan α (1 − tan 2 ϕ )

Espandendo le funzioni tangente in serie di potenze di r/R e sostituendo per z nella (2.3) dopo
numerosi passi algebrici (lo studente provi) si ottiene:

r2   m +1   
2
r2 
LSA = ∆s ' = s '− s '0 = − (m − 1)  K +    × 1 + 2 [K + 3 + 2m( K + 1)]
2
(2.14)
4R   m − 1    4 R 

dove s’0 è l’immagine per i raggi parassiali.


Osservando che TSA = LSA tan β = r ∆s '/(s '− z ) si ricava la relazione:

r   m + 1    3  r    m + 3   
3 2 2

TSA = − s '0    K +    1 +    K −    (2.15)


 R    m − 1    4  R    m − 1   

Qui TSA=TSA3+TSA5. In generale fortunatamente TSA3 è sufficiente a caratterizzare le


aberrazioni di sistemi ottici semplici.

2.2 Le aberrazioni fuori asse

Quando il punto oggetto non si trova sull’asse ottico compaiono le aberrazioni fuori asse.
Adesso ne vediamo solo una rappresentazione qualitativa, rimandando una più approfondita
analisi al capitolo successivo. Osserviamo la Fig. 2.4. Un paraboloide è investito da un fascio

Z’
f
B b

B’ Z
O’

Fig. 2.4 Un fascio collimato incide ad un angolo


      
                  è la nuova origine del
sistema di riferimento ruotato.
            "!#%$& #'(  ) * +,.- / 0 1 1 23+4 4 5 * +&67 5 ,* 5 6(0 - 2 0,#;(+<05 =>=0 ?5 ,23* 0 @25 ,A;,
8:9
punto B’ fuori dall’asse ottico e la distanza BB’ è approssimativamente f B C
D EAF GH(I J K L M L I3M NI
formerebbe immagini perfette in B’ è comunque un paraboloide con centro in O’ ed asse ottico
z’. Come fatto prima noi cerchiamo allora la distanza O P>Q R SUT#V(W X Q Y:Z#V(W\[(S R S ]^_ ^Y Z#Y(`W _([Y S `^3a P

20
ed usiamo la (2.9) per trovare le aberrazioni al terz’ordine. Omettendo i dettagli di questi
calcoli si trova:
y 2θ yθ 2
AA3 = 3a1 2 + 2a2 + a3θ 3 (2.16)
R R

dove AA3 è l’aberrazione angolare al terz’ordine. I diversi termini nella (2.16) rappresentano
le diverse aberrazioni presenti:
   
 
la prima
 
 
è 
il  Coma,

 la

seconda
  l’Astigmatismo
 "!# $ % & '$ (  ) e* + la
* terza
$ '$ # #la$
Distorsione
aberrazioni non deve essere limitata ovviamente al solo piano yz.
2 , $.- /* ' *0 & "1 * &
Facciamo comunque alcune
( $ 2- /& ' ,  & "1 * &3( $ 243& osservazioni. Il coma è proporzionale a y
  , $" & "1 * &3( $ 2. 656$ ( ( $ 'è4invariante
!) !) + * rispetto
& # $&75 ad y. L’astigmatismo invece è invariante
, 2 . Infine la distorsione non dipende dal
fuori asse, perciò questa aberrazione non affetta la qualità dell’immagine, solo la sua posizione.
L’ultima aberrazione che non compare nella (2.16) per la particolare trasformazione di
coordinate che abbiamo fatto è la Curvatura di campo.
Fino ad ora ci limitiamo a dire che nell’ambito dell’approssimazione al terz’ordine si possono
identificare 5 aberrazioni monocromatiche che sono: l’aberrazione sferica, coma, astigmatismo,
curvatura di campo e distorsione. Le prime tre affettano la qualità dell’immagine, le ultime due
solo la posizione.
In generale possiamo notare che:

aberrazione trasversa ∝ y nθ m

dove n+m=3.
Nel prossimo capitolo faremo una trattazione più rigorosa delle varie aberrazioni, ma prima
accenniamo al problema della compensazione delle aberrazioni per ridurre gli effetti di queste
sulle nostre immagini.

2.3 Compensazione delle aberrazioni

Abbiamo visto che un sistema ottico perfetto è tale che il fronte d’onda emergente da esso è
sferico. C’è pertanto un forte legame tra la presenza delle aberrazioni e le deviazioni dal fronte
d’onda sferico. Lungo ogni raggio il fronte d’onda reale può essere davanti o dietro al fronte
d’onda perfetto a seconda che esso sia ritardato o avanzato.
Da ciò sembra che introducendo opportunamente nuove superfici riflettenti o lenti sia possibile
ritrasformare il fronte d’onda per farlo diventare il più sferico possibile. Ovviamente ad un
avanzamento del fronte d’onda deve corrispondere un ritardo che dovrà essere introdotto e
viceversa. Nelle due prossime sezioni esamineremo due configurazioni importanti per i
telescopi astronomici: la montatura Cassegrain e Schmidt.

2.3.1 La montatura Cassegrain

La configurazione Cassegrain è mostrata in Fig. 2.5. Essa è costituita da uno specchio


paraboloide primario e da un secondario iperboloide. In questo modo si fa sì che l’aberrazione
sferica totale sia zero. Le costanti coniche sono:

(m + 1) 2
K1 = −1 K 2 = −
(m − 1)2

21
dove m è l’ingrandimento del secondario.
y

d
y1
z
y2
D

S2
f1
f1

A.
y

d
y1
z
y2
D

S2

f1

B.

Fig. 2.5 A. La montatura Cassegrain. B. La montatura Gregoriana.

E’ molto utile descrivere ogni sistema ottico a due specchi per mezzo di un insieme di
parametri adimensionali, definito in Tab. 2.1.

TAB. 2.1 I parametri normalizzati di un telescopio di tipo Cassegrain

k=y2/y1 Rapporto tra le dimensioni dei due specchi


 /R Rapporto dei raggi di curvatura dei due specchi
2 1
m= 2’/s2 Ingrandimento trasversale del secondario
f1 
Distanza dal vertice del primario al fuoco finale
F1= f1 / D Rapporto focale del primario
W= (1 − k ) f1 Distanza dal secondario al primario
F= f / D Rapporto focale del sistema. f è la focale complessiva del sistema.

22
Tra questi parametri esistono le seguenti utili relazioni che lo studente può provare a ricavarsi
usando la legge dei punti coniugati per gli specchi, la definizione di ingrandimento trasversale,
e la relazione s2 = kR1 / 2 :

ρ mk ρ (m − 1)
m= ρ= k= (2.17)
ρ −k m −1 m

e anche le:

1 + β = k ( m + 1) η = F1 β (2.18)

naturalmente queste si applicano se l’oggetto è all’infinito, come accade nel caso dei telescopi
astronomici.
      
  
    
m le relazioni precedenti consentono di ricavare k
esempio m "!# $% & & '( % k)"*+ ,-". /"01 23465 2=7989: 8;:<=> > ?6@ ?BA C? D E F E D G?H? @> ? @ ? A D ICE IA IJI
infine determinate scegliendo il diametro del primario e la sua lunghezza focale.
Ora vedremo che la configurazione Cassegrain classica può essere cambiata in una differente
cambiando le costanti coniche di entrambi gli specchi. Questo si può fare mantenendo
l’aberrazione sferica al terz’ordine (SA3) uguale a zero, quindi un cambio di K1 deve essere
accompagnato da una variazione di K2 tale che il fronte d’onda avanzato da uno specchio sia
ritardato dall’altro (al terz’ordine di approssimazione). Nei termini del teorema di Fermat
l’OPL dall’oggetto all’immagine lungo un qualsiasi raggio non cambia. Se ad esempio la
superficie del primario viene maggiormente curvata in Fig. 2.5 essa produce un avanzamento
del fronte d’onda che deve essere compensato da un ritardo introdotto dal secondario.
L’avanzamento e il ritardo sono 2KML 1 e 2KML 2. Partendo dall’eq. (2.3) ognuna delle superfici ha i
seguenti z:

y12
z1 (originale) =
2 R1
y12 y14
z1 (nuovo) = + (1 + K1 ) 3
2 R1 8R1
y22   m + 1   y24
2

z2 (originale) = + 1 −   
2 R2   m − 1   8R23
y2 y4
z2 (nuovo) = 2 + (1 + K 2 ) 2 3
2 R2 8 R2

Pertanto:

y14
2∆z1 = (1 + K1 )
4 R13
(2.19)
  m + 1   y2
2 4
2∆z2 =  K 2 +    3
  m − 1   4 R2

dove R1 ed R2 sono mantenuti costanti. Applicando la condizione 2KML 1 = 2KML 2 si ottiene:

23
y24 R13   m +1   k   m +1  
2 4 2

K1 + 1 = 4 3  K 2 +    = 3 K2 +   . (2.20)
y1 R2   m − 1   ρ   m − 1  
  
         
     
Ad esempio scegliendo K2=0 si ha che K1=
ellissoidale ed un secondario sferico è detta Dall-Kirkham. Un'altra possibile combinazione è
con K1= ! "#$&% 2=')()* ++,-/. 01 è detta Ritchey-Chretien. Le soluzioni della (2.20) danno la
famiglia dei telescopi Cassegrain per i quali SA3=0 per un punto all’infinito. Per un dato
insieme di k, m2 14351 6 7 6 8 19:; 7 :< 7 :7 8 =4. >?@7 := A 7 >:14B7 C= D >E 7FB7 G 1 e K2 che soddisfano la
(2.20). Nella pratica la scelta di K1 e K2 dipende da altre considerazioni, come l’effetto delle
aberrazioni fuori asse e la facilità con cui lo specchio può essere costruito e testato. Nel caso ad
esempio della configurazione Dall-Kirkham gli specchi separati possono essere facilmente
testati ma la configurazione possiede una forte Coma fuori asse e quindi il campo utile risulta
molto piccolo. Viceversa la configurazione Ritchey-Chretien ha Coma nulla ma gli specchi
iperbolici sono difficili da costruire e da testare.

2.3.2 La camera Schmidt

Una camera Schmidt è composta da tre elementi: uno specchio sferico concavo, un diaframma
di apertura posto nel centro di curvatura dello specchio, e una superficie rifrangente
opportunamente modellata per ridurre l’aberrazione sferica (vedi Fig. 2.6).

diaframma
R

Fig. 2.6 La configurazione della camera Schmidt.

Per il momento ignoriamo la presenza della lastra correttrice. Piazzando il diaframma nel
centro di curvatura dello specchio sferico il sistema diviene effettivamente “axis free”, cioè
ogni raggio luminoso entrante nel sistema è equivalente all’asse ottico principale. Questa
caratteristica è vera solo per lo specchio sferico. Pertanto in questo modo si sono eliminate tutte
le aberrazioni fuori asse, eccetto la curvatura di campo che però sappiamo non altera la forma
dell’immagine. Questo sistema è l’ideale per i telescopi a grande campo. La lastra correttrice
ha quindi lo scopo di correggere la rimanente aberrazione sferica. Per trovare la quantità H A. 01
esprime la compensazione tra il fronte d’onda sferico e quello di riferimento di un paraboloide
che è libero dall’aberrazione sferica, posto K=0 nella (2.7) si ha:

2∆z = − r 4 / 4 R3 (2.21)

24
  
          
Consideriamo ora una lastra di vetro piana di spessore t e indice di rifrazione n. Ad ogni altezza
y rimuoviamo da una parte della lastra uno spessore di vetro
cammino ottico per ogni raggio parallelo all’asse z sia (n       !
à quindi avere:

(n − 1)τ = 2∆z = − r 4 / 4 R3 (2.22)

Definendo η = r / r0 dove r0 è il raggio del diaframma di apertura. Essendo f = − R / 2 si ha


che:

η 4 r04 f η4
τ= = (2.23)
32(n − 1) f 3 512(n − 1) F 4

Questa equazione ci dice qual’ è lo spessore di vetro che occorre rimuovere per eliminare
l’aberrazione sferica. Dal punto di vista del principio di Fermat non fa differenza com’è
orientata la lastra correttrice. Inoltre questo ragionamento si applica allo stesso modo al caso in
cui l’oggetto non sia all’infinito e quindi che la superficie di riferimento per eliminare
l’aberrazione sferica sia l’ellissoide e non più il paraboloide. La procedura da seguire sarà la
stessa.
Con questo tipo di correzione i raggi parassiali restano essenzialmente invariati, mentre i raggi
marginali vengono deviati in modo che incidendo in un punto diverso dello specchio il loro
punto di fuoco viene a coincidere con quello parassiale. Il problema di questo tipo di correttore
è che introduce una forte aberrazione cromatica. La forma della lastra correttrice è infatti
assimilabile a due prismi uniti per la punta. Se si fa in modo invece di far convergere i raggi
parassiali e marginali nel circolo di minor confusione la lastra correttrice ha una forma
differente, ma il problema dell’aberrazione cromatica è fortemente ridotto.
La superficie di riferimento per far convergere tutti i raggi in un punto è sempre un paraboloide
il cui fuoco deve trovarsi nel circolo di minor confusione. Questo ha quindi un raggio di
curvatura diverso da quello usato precedentemente nella (2.21). Si può dimostrare che con
questo tipo di accorgimento lo spessore di vetro da eliminare è del tipo:

3r02 r 2 r4 fη4  3 
τ= − = 4 
1− 2  (2.24)
8( n − 1) R 4( n − 1) R
3 3
512( n − 1) F  2η 

Rispetto alla precedente lastra correttrice questa è più spessa al centro e più sottile ai bordi. I
raggi che subiscono la deviazione massima sono quelli per cui dτ / dr è massima, il che si
verifica per η = 0.5 e η = 1 .
Calcoliamo infine l’aberrazione cromatica sferica trasversale. Il risultato è:

d dτ f η 3δ n  3 
TSA3 = f (τδ n) = f δ n = 3 
1− 2  (2.25)
dr dr 64(n − 1) F  4η 

Sostituendo η = 0.5 e η = 1 si trova il valore di TSA3 per i raggi che subiscono la massima
deviazione. Il risultato in termini assoluti è:

f δn
TSA3 = (2.26)
256 F n − 1
3

25
che è effettivamente il raggio dell’immagine cromatica.
Questa formulazione è corretta al quart’ordine in termini di r con luce collimata. Ad esempio il
termine SA5 è significativo per camere di piccolo rapporto focale.
Il risultato è un grande campo corretto per le principali aberrazioni con il solo limite imposto
dall’aberrazione cromatica. Si deve notare per precisione che la lastra correttrice ha un asse
ottico e quindi a rigore il sistema non è più “axis free” e quindi compaiono le aberrazioni fuori
asse. Tuttavia esse sono molto ridotte perché la lastra correttrice è molto sottile e può essere
assimilata ad una superficie a piani paralleli.

26
3 CAPITOLO 3
In questo capitolo vedremo l’applicazione del principio di Fermat ad una generica superficie di
rivoluzione e la derivazione delle aberrazioni. L’applicazione qui riportata è particolarmente
utile per i sistemi ottici di interesse per gli astronomi, quali i telescopi, le camere e gli
spettrografi.

3.1 Il principio di Fermat e le aberrazioni per una generica superficie di


rivoluzione

Un disegno di una generica superficie di rivoluzione è visibile in Fig. 3.1. L’origine delle
coordinate è nel vertice della superficie di rivoluzione. Il mezzo ha indice di rifrazione n a
sinistra ed n’ a destra.
Y

B(x,y,
n z) n’
Q’
Z0
s’
h’

h
s Z
Z0’
Q

Fig. 3.1 Cammino ottico di un generico raggio attraverso una superficie rifrangente. I punti Q e Q’ sono nel piano
yz. Il punto B è sulla superficie. Il “raggio principale” (chief ray) passa per l’origine del sistema di coordinate.

I punti Q e Q’ sono l’oggetto e l’immagine rispettivamente, ed un generico raggio interseca la


superficie in B(x,y,z). Poiché la superficie è simmetrica rispetto all’asse z non si perde in
generalità ponendo Q e Q’ nel piano yz. L’equazione della generica superficie di rivoluzione
arrestata al quart’ordine in termini di r è (vedi capitolo precedente):

r2 r4 br 4
z= + (1 + K ) 3 +
2R 8R 8(n '− n )
(3.1)
r 2 r 4 1 + K b  r2 α r4
= +  3 + = +
2R 8  R n '− n  R
2 8
    
   
à in parentesi e r 2 = x 2 + y 2 . Il termine con b include
esplicitamente un termine asferico del tipo usato nel capitolo precedente per trattare la lastra
correttrice. La forma di questo termine è stata scelta per semplificare le relazioni seguenti.
Applicando il principio di Fermat alla Fig. 3.1 si ha:

OPL = n [QB ] + n '[ BQ '] (3.2)

24
e dalla geometria del sistema si vede che:

[QB ] = ( y − h) 2 + ( z0 − z ) 2 + x 2 
1/ 2

(3.3)
[ BQ '] = ( y − h ')2 + ( z0 − z )2 + x 2 
1/ 2

   
   
Non essendoci nessun diaframma di apertura il raggio tratteggiato che passa per il vertice della
superficie e per i punti Q e Q’ è il chief ray. Esso forma un angolo
lungo il chief ray è − ns + n ' s ' , dove s è negativo ed s’ positivo per la convenzione sui segni.
Per le altre quantità diciamo che    !
0’ sono positivi, h ed z0 sono negativi. Sappiamo
inoltre valere le seguenti relazioni:

h = s sin θ z0 = s cos θ s 2 = z02 + h 2


(3.4)
θ z' 0 = s '
h ' = s ' sin θ ' cos
s 2 =' z0 2 +' h 2
' '

Sostituendo in [QB] si ottiene:

1/ 2
 2y r 2  1 cos θ  r  1
4

[QB ] = − s 1 − sinθ +  −  + 4s 2  R 2 − α s cosθ   .
 s s s R   

La relazione per [BQ’] è simile eccetto per la sostituzione di s’ con s. Usando#" $ %&'
l’espansione binomiale del tipo (1+x)p con p=1/2 e mantenendo solo i termini del quart’ordine
si ha (lo studente provi a fare i conti):

y 2  cos 2 θ cos θ  x 2  1 cos θ 


[QB ] = − s + y sinθ −  − −  − 
2  s R  2 s R 
x2 y  1 cosθ  y
3
 cos 2 θ cosθ 
− sin θ  − −
 2s sin θ  − 
2s s R   s R 
r4  1  1 (1 + K ) cos θ  1  1 cos θ  b cos θ 
2

−  2 − −  −  − ' 
8  R  s R  ss R  n − n 

Una relazione simile si trova per [BQ’] (tenendo opportunamente conto dei segni). Sostituendo
nella (3.2) si trova il cammino ottico di un generico raggio (vedi eq. (3.6)). Sebbene sembri
complessa in apparenza il principio di Fermat permette di semplificare le cose notevolmente.
Per prima cosa notiamo che le prime due parentesi riguardano il chief ray. Poiché il principio
di Fermat ci dice che il cammino ottico deve essere minimo, è opportuno rimuovere dalla (3.6)
il cammino ottico del chief ray definendo una quantità ( ) * +,.- /021 3 3 , 4 , 526 / 7
Φ = OPL-OPL(chief-ray)
(3.5)
=A0 y + A1 y 2 + A '1 x 2 + A2 y 3 + A '2 x 2 y + A3r 4

dove i coefficienti Ai sono i termini in parentesi nella (3.6).

25
OPL = (− ns + n ' s ') − y (n 'sin θ '− n sin θ )
y 2  n 'cos 2 θ ' n cos 2 θ n 'cos θ '− n cos θ 
+  − − 
2  s' s R 
x  n ' n n 'cos θ '− n cos θ 
2
+  − − 
2 s' s R
x 2 y  n sin θ  1 cos θ  n 'sin θ '  1 cos θ '  
−  − −  − 
2  s  s R  s'  s' R  
y 3  n sin θ  cos 2 θ cos θ  n 'sin θ '  cos 2 θ ' cos θ '  
−   − −  − 
2  s  s R  s'  s' R 

r 4  1  n ' n (1 + K )  n  1 cos θ  
2

+  2 − − (n 'cos θ '− n cos θ )  +  − 


8  R  s ' s R  ss R  

r4  n '  1 cos θ ' 2 b 


+   −  − ( n 'cos θ ' − n cos θ ) 
8  s '  s ' R  n '− n 
(3.6)

Applicando il principio di Fermat nella forma δ (OPL) = 0 si avrà:

∂ ∂Φ
(OPL) = =0
∂x ∂x
(3.7)
∂ ∂Φ
(OPL) = =0
∂y ∂y

L’eq. (3.7) è soddisfatta per x = y = 0 solo se A0 = 0 e quindi n 'sin θ ' = n sin θ , cioè se vale la
legge di Snell per il chief ray.
Diamo ora un’occhiata alla (3.6) per un’analisi rapida dei suoi termini. Consideriamo
dapprima i termini in x2 e y2. Se ci ricordiamo dell’approssimazione parassiale i termini in
parentesi con i coseni valgono 1 e ritroviamo le leggi del diottro sferico, per cui entrambi sono
nulli. In un secondo livello di approssimazione i termini in coseno sono rimpiazzati da
1 − ϕ 2 / 2 , dove è  
 

   
 x2  2 e y2  2. Perciò i termini A1y2 e A’1x2
rappresentano l’astigmatismo, come avevamo notato nel capitolo precedente. Nei termini in
x2y e y3 i coseni sono rimpiazzati da 1 e i seni dall’angolo, e i corrispondenti termini A2y3 e
A’2x2y rappresentano il Coma. L’ultimo termine A3 rappresenta l’aberrazione sferica.
Ritornando alla (3.6) osserviamo che i termini in x2 e y2 possono essere resi nulli
scegliendo opportunamente s’. Ad esempio il termine in y2 è nullo se:

n ' cos 2
θ ' n cos
2
θ n ' θcos
− n ' θ cos
− = (3.8)
s 't s R

dove s’t è la distanza dell’immagine astigmatica tangenziale. Vedremo oltre che


quest’immagine è un segmento perpendicolare al piano definito dall’asse z e dal chief ray.
Analogamente il termine in x2 è nullo se:

θ − n'
n ' n n ' cos θcos
− = (3.9)
s 's s R

26
dove s’s è il luogo dell’immagine astigmatica sagittale. Quest’immagine è anch’essa un
segmento che giace nel piano definito dall’asse z e dal chief ray. In approssimazione parassiale
è s’t=s’s. La separazione tra le due immagini astigmatiche si ricava immediatamente dalle (3.8)
e (3.9) risolvendo rispetto a 1/s’t e 1/s’s e facendo la differenza:

∆s ' 2
tan θ ' n ' θcos n  n 2  '
− n ' θ cos
=  + 1 − 2  
s 't s s ' n ' R s n 

    
s t  
      
2
dove l’espressione si riduce a:

∆s ' n 2θ 2  1 1
=  −  (3.10)
s'2
n '  n s ' ns' 

dove s’ è sufficiente a localizzare l’immagine se   


  s o s’t. Si noti la proporzionalità della
separazione tra le immagini e perciò anche tra la lunghezza delle immagini da  2.
A questo punto della nostra analisi possiamo dire che l’applicazione del principio di
Fermat ci ha condotti a ritrovare la legge di Snell e a introdurre la questione delle aberrazioni
parlando delle immagini astigmatiche. Nel prossimo paragrafo vedremo di specificare le varie
aberrazioni e di valutare la loro “magnitudine” in un’immagine.

3.2 Valutazione dei coefficienti di aberrazione

Un sistema ottico che soddisfa l’eq. (3.7) per ogni (x,y) entro la propria apertura e che quindi
ha tutti i coefficienti della (3.6) nulli si dice essere un sistema perfetto. Se uno o più di questi
coefficienti è non nullo il sistema è affetto da aberrazioni. Non sorprendentemente le
dimensioni di una data aberrazione sono proporzionali ai coefficienti medesimi.
Occorre ricordare che l’analisi che stiamo facendo è limitata al calcolo delle aberrazioni al
terz’ordine e si limita a trovare le aberrazioni trasversali e angolari di cui si è parlato nei
capitoli precedenti. Questo significa che nella discussione dell’eq. (3.7) occorre conservare
 ! #"$ % & '" (")! *,+ -". ''*,/% ! ! %0$ % (1 %,/"2 r, x o y è non più grande di 4. Si vede quindi
che A3 è indipendente da  34 2 e A’2 5 676,89 6869 : ; 67< = ;<?> 3@A4 1 e A’1 sono proporzion< = ;<B> 2.
Facendo uso della legge di Snell e della relazione del diottro sferico possiamo semplificare i
termini dell’eq. (3.6):

2
1 K  n 1 1   1
2
1
A3 = −  3 (n '− n +) b  −  −   − 
8R  8  s R   n ' s ' ns  (3.11)
n 2  1 1  1 1 
A2 = A '2 = θ  −  − 
2  s R  n ' s ' ns 

dove il primo termine in parentesi quadrata rappresenta il contributo della parte non sferica
della superficie. Si noti che in A2 e A’2 questo contributo è assente e quindi qualsiasi superficie
non sferica non contribuisce alle aberrazioni associate a questi coefficienti. Vedremo oltre che
questo è un caso particolare che non si verifica quando l’introduzione di un diaframma non fa
più coincidere la pupilla d’entrata del sistema con il vertice della superficie.
La valutazione dei rimanenti coefficienti A1 e A’1 dipende dalla distanza scelta per
l’immagine. Ad esempio scegliendo s’=s’s è A’1=0 ed il coefficiente A1 è (al secondo ordine in
>CD

27
n2  1 1
A1 = −θ 2  −  (3.12)
2  n ' s ' ns 

Se viceversa si sceglie s’=s’t allora è A1=0 e

n2  1 1 
A '1 = θ 2
 −  (3.13)
2  n ' s ' ns 

e quindi A1=

1. In ogni caso i termini in K e b sono assenti, ma come prima ricompaiono se
la pupilla d’entrata del sistema non coincide con la superficie. Sesi
 sceglie il punto a metà
strada tra l’immagine tangenziale e sagittale si trova che A1= 1 con ognuna delle due
immagini grandi metà. Questo è il punto detto circolo di minor confusione. A causa della
relazione tra A1 e A’1 non ha importanza quale s’ si sceglie per caratterizzare l’astigmatismo.
Un modo diretto per vedere che A1 è una misura diretta dell’astigmatismo si ottiene
confrontando le (3.12) e (3.10) da cui si ricava:

∆s '/ s '2 = −2 A1 / n ' (3.14)

e da questa è semplice ricavare un’espressione per l’astigmatismo trasverso pari alla metà di
quello dell’immagine sagittale (abbreviato TAS):

TAS = − y (∆s '/ s ') = 2 A1 ys '/ n ' (3.15)

dove TAS<0 per l’immagine sagittale quando y>0. Quindi nel circolo di minor confusione
l’immagine sarà un cerchio di diametro pari a TAS .
L’ultimo coefficiente di cui parlare è A0 che è:

A0 = −(n 'sin θ '− n sin θ ). (3.16)

Ponendo A0=0 si definisce il percorso del chief ray se non ci fosse l’aberrazione. Noi invece
vogliamo trovare la differenza tra la direzione del chief ray vero e quello non aberrato. Per
farlo occorre esprimere i seni e coseni in serie arrestandosi al terz’ordine. Dalla (3.4) abbiamo
che tan θ = h / z0 e tan θ ' = h '/ z '0 . Dall’espansione in serie ricaviamo:

h 1 3 h' 1 3
θ= − θ θ'= − θ' (3.17)
z0 3 z '0 3
Ora espandendo la (3.16) e sostituendo la (3.17) troviamo:

h h' θ3  n2  θ3  n2 
A0 = n − n ' − n 1 − 2  = −n 1 − 2  (3.18)
z0 z '0 2  n'  2  n' 

Si noti che A0=0 per n’=  è per una superficie riflettente. Il coefficiente A0 è una misura
della distorsione. Con A0>0 si ha la distorsione a cuscino e con A0<0 quella a botte.
Il prossimo passo sarà quello di trovare la connessione tra le aberrazioni trasverse e
angolari con i coefficienti A come è stato fatto per A1. Questo si fa stabilendo una connessione
tra i termini non nulli della (3.6) e le deviazioni del fronte d’onda convergente nel punto
immagine dal fronte d’onda sferico prodotto da un sistema perfetto.

28
3.3 Aberrazioni del raggio e del fronte d’onda

Un sistema ottico libero da aberrazioni porta la luce da un punto oggetto Q, per il quale il
fronte d’onda è una sfera con centro in Q, in un punto (gaussiano) Q’ che è a sua volta centro
di un fronte d’onda sferico convergente in Q’, e il cammino ottico lungo un qualsiasi raggio
 
        
     
che
  connette
     i due punti è costante. Perciò
r. Per un sistema aberrato il fronte d’onda convergente in Q’ non è più sferico,
e dipende!"#"$ %& ' (!#")+* è avanzato o ritardato rispetto al fronte d’onda non aberrato (vedi
Fig. 3.2).
Y

Q’

O
Z

„
„ r
a

, - . /0 / 132 4 5 - 6 7 4
8 4 -9 : 6 7 ; -8< 6 7 8 =>8 -: - 9 4 : - ?4 7 ; 6 @
r ACB D A E E B F G>H a. Il raggio di curvatura del fronte d’onda di
riferimento è s’.
I JKLJM+NOJP KRQ S T U OS KRVXWQ U+Y Z KJP QW[ KJW\^]Q Z K _
è l’OPD tra ` r a ` a. La distanza geometrica
tra i due fronti d’onda è b c defCgihj j k l mh3j n o k pf o fq

Φ ( x, y )
∆= = [Σ r ( x , y ) − Σ a ( x , y ) ] (3.19)
n'

Quando rtsuv wx y z{| }~€ z{~‚} y z è ritardato rispetto a quello non aberrato. Differenziando la
(3.19) si ha:

∂∆ 1 ∂Φ 1  ∂Σr ∂Σa 
= =  −  (3.20)
∂y n ' ∂y n '  ∂y ∂y 

e una simile relazione con x al posto di y. La quantità in parentesi nella (3.20) è la differenza
tra le pendenze dei due fronti d’onda in un piano parallelo al piano yz. Poiché i raggi sono
sempre perpendicolari ai fronti d’onda, questa è anche la differenza tra le pendenze dei raggi.
Data questa differenza di pendenza si ha un’aberrazione trasversa:

∂∆ s ' ∂Φ ∂∆ s ' ∂Φ
TA y = s ' = TA x = s ' = (3.21)
∂y n ' ∂y ∂x n ' ∂x

29
Ricordando la (3.7) si ottiene:

s'
TAy =  A0 + 2 A1 y + A2 ( x 2 + 3 y 2 ) + 4 A3 yr 2 
n' (3.22)
s'
TAx =  2 A '1 x + 2 A2 xy + 4 A3 xr  3

n'
che stabiliscono la connessione tra i coefficienti di aberrazione e le aberrazioni geometriche
trasverse. Ovviamente quelle angolari sono date semplicemente dalle:

TAy = s ' AAy TAx = s ' AAx (3.23)

3.4 Riassunto delle principali aberrazioni

E’ ora opportuno riassumere i risultati ottenuti fino ad ora presentando delle tabelle di
riferimento utili per i vari casi per le principali aberrazioni al terz’ordine. Le prime due tabelle
si riferiscono al caso generico di una superficie rifrangente e riflettente rispettivamente. Le
seconde due tabelle danno i risultati per le aberrazioni trasversali. E’ bene ripetere che i casi
discussi qui si riferiscono per ora alla specifica situazione in cui la pupilla d’entrata (e d’uscita)
del sistema è coincidente con la superficie.

Tab. 3.1. Coefficienti di aberrazione per una generica superficie rifrangente

1 21 1   1 
2
1  K
A3 = −  n  −   −  + 3 (n '− n ) + b 
8   s R   n ' s ' ns  R 
n 2  1 1  1 1 
A2 = θ  −  − 
2  s R  n ' s ' ns 
n2  1 1 
A1 = −θ 2
 − 
2  n ' s ' ns 
n  n2 
A0 = θ 3  2 − 1
2  n' 

Se la superficie è sferica gli ultimi due termini in A3 scompaiono

Tab. 3.2. Coefficienti di aberrazione per una generica superficie riflettente

n  m +1   b
2

A3 =  K +   −
4 R3
  m − 1   8
nθ  m + 1 
A2 = − 2  
R  m −1 
nθ 2
A1 =
R
A0 = 0

30
In relazione alla Tab. 3.2 occorre specificare che valgono le seguenti relazioni per uno
specchio:

1 1 1  m +1  1 1 2
− =   − =−
s R R  m −1  n ' s ' ns nR

Tab. 3.3. Aberrazioni trasverse per una generica superficie rifrangente

1  1 1   1  y3 s '
2
1  K
TSA = −  n 2  −   −  + 3 (n '− n) + b 
2   s R   n ' s ' ns  R  n '
n 2  1 1  1 1  y 2θ s ' 1
TSC =  −  −  = TTC
2  s R  n ' s ' ns  n ' 3
 1 1  yθ 2 s ' s'
TAS = − n 2  −  ; ∆s ' = − TAS
 n ' s ' ns  n ' y
n  n2  θ 3s '
TDI =  2 − 1
2  n'  n'

Tab. 3.4 Aberrazioni trasverse per una superficie riflettente

y3   m +1  
2
by 3
TSA = − 3  K +    s '+ s'
R   m − 1   2n
y2  m + 1  1
TSC = 2  θ s ' = TTC
R  m −1  3
2y
TAS = − θ 2 s '
R
TDI = 0

Ogni aberrazione è designata da due lettere: aberrazione sferica (SA), coma sagittale (SC),
coma tangenziale (TC), astigmatismo (AS), e distorsione (DI). Se l’aberrazione è trasversa un
suffisso T è messo prima, se è angolare si mette invece una A.
Con queste definizioni le espressioni per le aberrazioni trasverse sono:

4 A3 y 3 s ' A y 2s ' 2 A ys ' A s'


TSA = , TSC = 2 , TAS = 1 , TDI = 0 (3.24)
n' n' n' n'

Tutte le aberrazioni sono calcolate usando i raggi dell’asse y, per cui nel caso più generale
occorre sostituire ad y il raggio
 della superficie di rivoluzione. Per quanto riguarda il segno
delle aberrazioni, quando

A3<0: i raggi marginali incontrano il chief ray tra la superficie ed il fuoco gaussiano;
A2>0: la coda della figura a cometa si allontana dall’asse z;
A1<0: l’immagine tangenziale è più vicina alla superficie di quella sagittale;
A0>0: la distorsione è a cuscino.

31
In molti casi pratici il segno delle aberrazioni non ha molta importanza e conta solo la sua
magnitudine. Nel nostro caso:

TAS=diametro del circolo di minor confusione, 3TSC=lunghezza della figura a cometa,


TSA=raggio del disco di aberrazione nel fuoco parassiale.

Questi risultati assumono che le aberrazioni siano singolarmente non nulle una per una, ma
questo ovviamente non accade mai completamente nella realtà.
Un’altra cosa da dire è che il verso di incidenza della luce sulla superficie non cambia nulla
sulle aberrazioni in quanto cambiano i segni delle varie quantità coinvolte, ma il risultato finale
resta invariato.

3.4.1 Condizioni aplanatiche ed alcuni esempi

Esaminiamo i vari termini delle Tab. 3.1 e 3.2 per trovare esempi di superfici che hanno
specifiche caratteristiche di aberrazione.
Per una superficie sferica con b=0 i coefficienti di aberrazione A1, A2 e A3 sono pari a zero
quando n’s’ = ns. Per uno specchio n’ = n e quest’ultima condizione è soddisfatta per s’ = s.

=  

     

 è un piano. Questo è un risultato aspettato ma di nessuna utilità non
Ricordando la relazione per lo specchio sferico in approssimazione parassiale si deduce che R

avendo lo specchio piano nessun potere diottrico.


Per uno specchio sferico la condizione n’s’ = ns si traduce nella relazione n’s’ = ns =
R(n+n’). Questa definisce le posizione di un oggetto e di un immagine per una sfera aplanatica,
dove il termine aplanatico significa che il sistema ha aberrazione sferica e coma nulle. Una
lente di questo tipo è usata spesso come obiettivo di un microscopio.
Un paraboloide (K=   ! "#! $    %& ' &)( %*+ , &)& - " . . & /  $  "#0 1 " .  ! &2   & 34%&)! $ %&)"
astigmatismo sono presenti. Pertanto questo tipo di specchio, sebbene perfetto in asse ha un
limitato campo di vista utile quando è usato come telescopio.
Per uno specchio conico con b=0 la condizione di aberrazione sferica nulla determina la
relazione tra K ed m già incontrata nel capitolo precedente usata per stabilire la costante conica
del secondario della configurazione Cassegrain.
Uno specchio sferico (K=0) in condizione m=5, & s’=s=R e quindi zero aberrazione
sferica e coma, cioè è aplanatico.
Uno specchio sferico in luce collimata ha aberrazioni non nulle sia in asse che fuori asse.
Vedremo che solo con l’introduzione di un diaframma nel centro di curvatura dello specchio si
potranno sfruttare le potenzialità dello specchio sferico.

3.5 Le aberrazioni in presenza di diaframmi

Determiniamo ora i coefficienti di aberrazione al terz’ordine per una singola superficie quando
un diaframma è posto prima o dopo la superficie medesima, cosa che fa cambiare la posizione
della pupilla d’entrata e d’uscita del sistema. In Fig. 3.3 e 3.4 sono rappresentate le due
situazioni. In entrambe il nuovo chief ray è evidenziato con la linea continua rispetto al caso
precedente (linea tratteggiata). Esso passa sempre per il centro della pupilla d’entrata formando
6&  7$  $ 8 9 : ;< = > ? ? @)A5@)B ; C @ D ? @ 9 > ; E :6< >5? F G@ D H B 9 B @#> E5F ;> < C @ A A >2IJLK: ; H D : ; C > ; E :6M F@ ? C >
figura con la 3.1 vediamo che un generico raggio che incontrava la superficie in (x,y) in Fig.
3.1 ora incontra la superficie in (x,y+L). Ci si aspetta quindi che la situazione per le aberrazioni
cambi poiché il raggio investe una diversa porzione della superficie. Un esempio tra tutti è il
caso del telescopio Schmidt, dove abbiamo visto che l’introduzione di un diaframma nel centro

32
di curvatura davanti allo specchio sferico annulla tutte le aberrazioni fuori asse, mentre senza
diaframma sono presenti tutte le aberrazioni.
Y
W

n n’
L

 
h
s Z

Fig. 3.3 Superficie con diaframma collocato davanti. Il chief ray fa adesso un angolo
      
     
    
centro della pupilla d’entrata che coincide col diaframma, impattando la superficie ad un altezza L. In figura L>0,

Y
W

n
n’
L


h
s Z
W
Q

Fig. 3.4 Superficie con diaframma collocato dietro. La sua immagine virtuale costituisce la pupilla d’entrata. In
figura L<0 e W e W’ >0.
.
3.6 Le nuove relazioni

La procedura per trovare le nuove relazioni per le aberrazioni è semplicemente quella di


sostituire ad y la quantità y+L nella (3.5). Raccogliendo i termini per le varie potenze di x,y ed
r e cancellando tutte le costanti indipendenti da queste variabili si ha:

Φ = y ( A0 + 2LA1 + 3L2 A2 + 4 L3 A3 )
+ y 2 ( A1 + 3LA2 + 6 L2 A3 ) + x 2 ( A '1 + LA 2 '+ L22A3 )
(3.25)
+ y 3 ( A2 + 4 LA3 ) + x 2 y ( A '2 + LA
4 3 +) A3r 4
= B0 y + B1 y 2 + B '1 x 2 + B2 x(2 y + y 3 +) B3r 4

33
dove si è usato A’2 = A2 per combinare i termini cubici.
Prima di derivare le espressioni complete per i coefficienti Bi ci sono alcune importanti
osservazioni da fare. Per prima cosa il termine L non compare nel termine in r4 e perciò
l’aberrazione sferica è indipendente dalla posizione del diaframma. Secondo, se A3=0 il
coefficiente di coma B2 è indipendente dalla posizione del diaframma ed il coma è dato dalle
relazioni del paragrafo precedente. Se poi sia A2 che A3 sono nulli allora B1 e B’1 sono
indipendenti dalla posizione del diaframma e si riducono ad A1 e A’1 rispettivamente.
L’importanza di queste osservazioni risulterà chiara più avanti.

3.6.1 I coefficienti di aberrazione

Il processo per calcolare i coefficienti Bi è piuttosto diretto, sebbene lungo per l’ampio uso
dell’algebra. Noi omettiamo qui tutti i passaggi e presentiamo solo i risultati uniti ad una
discussione per la comprensione del loro utilizzo.
Per cominciare notiamo le seguenti relazioni, valide in approssimazione parassiale, derivate
dalla geometria della Fig. 3.3:

L = −W Ψ, θ = Ψ [1 − (W / s )] (3.26)

dove W è la distanza tra la superficie e la pupilla d’entrata. Per il caso della Fig. 3.4 le
medesime equazioni appena scritte valgono sostituendo W’ a W. Dalla seconda delle (3.26) si
   
             !"# ù s si avvicina a W. Ad un certo punto
l’approssimazione parassiale cessa di valere. Sfortunatamente non c’è una ricetta per sapere
dove cade l’approssimazione fatta, e uno deve verificare se i risultati ottenuti con la teoria al
terz’ordine sono corretti, ad esempio tramite una procedura di ray-tracing.
Nella Tab. 3.5 e 3.6 presentiamo i risultati ottenuti per i Bi per il caso della superficie
rifrangente e per lo specchio. La scelta fatta nel presentare i risultati è di eliminare L e $ &%#
esprimere i risultati in termini di W.

Tab. 3.5 Coefficienti generali di aberrazione con pupilla d’entrata a distanza W

1 1 1  
2
K
B3 = −  Γ  −  + 3 (n '− n +) b 
8   s R  R 
W Ψ   1 1  1 1  K 
B2 =  Γ  −  −  + 3 (n '− n +) b 
2   s R  W R  R 
(W Ψ )2   1 1  
2
K
B1 = −  Γ  −  + 3 (n '− n +) b 
2   W R  R 
(W Ψ )3   1 1  1 1 1 1   n 2  1 1  1 1  
2
K
B0 =  Γ  −  − + −  + n  2 − 1  −   −  + 3 ( n '− n +) b 
2   W R  W R W s   n ' W R W s  R 

 1 1 
Nella Tab. 3.5 si è definito Γ = n 2  − .
 n ' s ' ns 

34
Tab. 3.6 Coefficienti di aberrazione per uno specchio con pupilla d’entrata a distanza W

n   m +1   b
2

B3 = K +   −
4 R3   m − 1   8
(W Ψ )  K  m + 1  1 1   b
B2 = − n +  −  + (W Ψ )
2  R  m − 1  W R   2
 K  1 1 2  b
(W Ψ )2
B1 = n  2 +  −   − (W Ψ )
2

2  R  W R   2
 K 1  1 1   1 1 1 1  b
B0 = −n(W Ψ )3  3 +  −   − + −   + (W Ψ )3
 R R  W R   W R W s  2

Nella Tab. 3.5 e 3.6 si noti come B3 sia uguale ad A3 come era stato anticipato, mentre gli altri
coefficienti cambiano.
Come prima la scelta di porre B1=0 o B’1=0 localizza le immagini tangenziale e sagittale
rispettivamente. Si trova che:

n ' cos 2
θ ' n cos
2
θ n ' θcos
− n ' θ cos
− = − 6 LΩ
s 't s R
(3.27)
θ − n'
n ' n n ' cos θcos
− = − 2 LΩ
s 's s R

dove Ω = A2 + 2 LA3 . Come per la (3.14) si trova anche che:

∆s '  ∆s ' LΩ
4
= 2  − (3.28)
 s ' W =0
2
s' n '

Come prima si sceglie l’immagine sagittale per valutare l’astigmatismo. Risolvendo la (3.27)
rispetto ad s’s si sostituisce poi il risultato nella relazione B1 = A1 + 2 LΩ e si confronta con la
(3.28) ottenendo:

∆s ' s/ 2 ' = − B12 n / ' (3.29)

analoga alla precedente (3.14). Perciò B1 è una misura dell’astigmatismo quando la pupilla
d’entrata non è sulla superficie.
Le relazioni per le aberrazioni trasverse sono simili a prima, ma sostituendo i Bi agli Ai:

4 B3 y 3 s ' B y2 s ' 1
TSA = TSC = 2 = TTC
n' n ' 3 (3.30)
2 B ys ' B s'
TAS = 1 TDI = 0
n' n '

35
3.6.2 Esempi

Facciamo due esempi con uno specchio sferico ed uno parabolico entrambi in luce collimata,
cioè m=0 e con componenti asferiche nulle (b=0).
Per una sfera troviamo A3=B3=n/4R3 quindi ci aspettiamo che sia B2 che B1 dipendano
dalla posizione del diaframma. Vediamo infatti che quando W=R sia B2 che B1 sono 0. Questa
è proprio il primo passo verso il telescopio Schmidt. Se è presente una componente asferica
B3=0 quando b=2n/R3. Questa deve essere messa in W=R per realizzare la camera Schmidt.
Per un paraboloide vediamo che B3=0. Essendo m=0 e K=
 
 
2 è
indipendente da W. La coma non è nulla ed il coefficiente dell’astigmatismo dipende da W.
Quindi per un opportuna scelta di W si avrà zero astigmatismo; questo succede per W=R/2,
cioè con il diaframma sul piano focale.

3.7 Le Aberrazioni per sistemi a più superfici


Il vantaggio di usare il principio di Fermat per studiare le aberrazioni risulta particolarmente
evidente quando si vuole analizzare il comportamento di sistemi complessi a più superfici. Per
ognuna delle superfici del sistema (incontrate dal raggio di luce), diciamo ad esempio la i-
esima, l’oggetto e l’immagine sono nei punti Qi e Q’i localizzati alle distanze si e s’i
rispettivamente. Tra l’oggetto e l’immagine la differenza di cammino ottico tra il raggio
arbitrario ed il chief-ray è data dall’eq. (3.25), dove i Wi sono le distanze tra la posizione della
superficie e la pupilla d’entrata. Se si segue il percorso di un singolo raggio dall’oggetto
originale alla sua immagine definitiva, allora la differenza di cammino ottico per il sistema nel
suo complesso sarà:

Φ s = Φ1 + Φ 2 + ... + Φ f = ∑ Φ i (3.31)

dove f denota l’ultima superficie. Ogni termine nella (3.31) può essere sostituito dal
corrispondente valore associato alla (3.25) con gli (x,y) appropriati di ogni superficie. Si noti
che una completa descrizione del sistema può essere ottenuta, senza perdere in generalità,
ponendo x=0, cioè considerando solo i raggi nel piano yz. Per l’intero sistema si avrà dunque:

Φ s = ∑ ( B0i yi + B1i yi2 + B2i yi3 + B3i yi4 ) = ∑ (∑ B ji yij +1 ); j = 0,1, 2,3 (3.32)
j i

con la distanza geometrica lungo un raggio arbitrario tra il fronte d’onda di riferimento ed il
fronte d’onda aberrato alla superficie finale data da:

∆ = Φ s ( yi ) / n ' f (3.33)

Per trovare le aberrazioni trasverse all’immagine finale si applicano le relazioni viste


precedentemente. Ad esempio per l’aberrazione j-esima, in riferimento all’ultima superficie si
ha:

∂∆ 1 ∂Φ s 1 j ∂yi
= = ( j + 1)∑ B ji yi (3.34)
∂y f n ' f ∂y f n f' i ∂y f

36
Osservando la Fig. 3.5 si capisce che l’ultima derivata può essere sostituita dal rapporto
yi / y f perché dyi ∝ yi ad ogni superficie. Sostituendo si ha:

s ' f ∂Φ s s f '   yi   j
j +1

TAjy = = ( j + 1)  ∑ B ji    y f (3.35)
n ' f ∂y f n f'  i y  
  f  

dyi
dyi+1

yi

Qi Q’i
si s’i
si+1
i i+1 i+2

Fig. 3.5 Percorso di due raggi adiacenti da Qi attraverso diverse superfici, dove Qi è un qualsiasi punto oggetto
intermedio sull’asse ottico. Le altezze dyi sono proporzionali a yi.

Completato il formalismo si vede come il calcolo delle aberrazioni per un sistema a più
superfici è solo una questione di calcolo che si ripete, cosa che può essere fatta agilmente da un
calcolatore elettronico.

Se si vuole esprimere i risultati in termini dell’altezza yl dei raggi marginali nel punto della
pupilla d’entrata del sistema, occorre moltiplicare e dividere la (3.35) per l’altezza del raggio yl
elevata alla potenza (j+1). I risultati sono:

j +1
y 
B js = ∑ B ji  i 
i  yl 
(3.36)
s ' f  yl 
TAjy =   ( j + 1) B js yl
j

n'f  yf 

dove con il suffisso s si intende il coefficiente di aberrazione del sistema.

3.7.1 Esempio: i coefficienti di aberrazione per un telescopio Cassegrain

Come esempio consideriamo un telescopio Cassegrain dove assumiamo che il diaframma di


apertura coincida con lo specchio primario, per cui i coefficienti di aberrazione possono essere
ricavati dalla tabella 3.2. Ponendo n=1, m=0 e b=0 si ha:

θ2 θ 1
B01 = 0 B11 = B21 = B31 = ( K1 + 1) (3.37)
R1 R12 4 R13

37
 
        
   

Per il secondario n=

K 1  1 1  1 1 1 1  
B02 = −(W θ )3  32 +  −  − + −  
 R2 R2  W R2  W R2 W s2  
(Wθ )2  K 2  1 1  
2

B12 = −  + −  
R2  R22  W R2  
  (3.38)
(Wθ )  K  m + 1   1 1  
B22 = − 2  2 +    − 
R2  R2  m − 1   W R2  

1   m +1  
2

B32 = − 3  K 2 +   
4 R2   m − 1  

Posto yl=y1 cioè l’altezza del raggio marginale sullo specchio primario, abbiamo:

B js = B j1 + B j 2 ( y2 / y1 ) j +1 (3.39)

dove 1, 2 ed s indicano il primario, il secondario ed il telescopio nel suo complesso.


Usando i parametri normalizzati introdotti nel precedente capitolo (possiamo scrivere
k = y2 / y1 ; ρ = R2 / R1 ; W = (1 − k ) f1 = −(1 − k ) R1 / 2 ) e quindi l’aberrazione sferica finale risulta:

1    m + 1   
2
k4
B3 s =  K1 + 1 − +
K2    (3.40)
4 R13  ρ3   m − 1   

Si noti che l’aberrazione sferica è nulla quando il termine entro parentesi è zero (risultato che
avevamo già ottenuto nel precedente capitolo). L’espressione per l’aberrazione sferica
trasversa al terz’ordine diviene quindi:

3
y  f
TSA3 = f  1  { }= − { } (3.41)
 R1  64 F13

dove il termine entro parentesi graffa è la (3.40) (e valgono le s '2 = mkf1 = kf n; 2 ' = ),1F1 è il
rapporto focale del primario. Le altre aberrazioni si ricavano in modo simile.

3.8 Curvatura di campo

Per quanto riguarda l’ultima aberrazione al terz’ordine di cui non abbiamo ancora parlato, la
curvatura di campo, rimarchiamo che questa aberrazione non altera la qualità dell’immagine,
ma essendo in genere tutti i detector (CCD, lastre fotografiche) piani, può produrre una cattiva
qualità dell’immagine soprattutto se il campo è molto esteso.
La camera Schmidt risolve questo problema incurvando le lastre fotografiche. Un altro metodo
è quello di usare una lente correttrice di campo.
Si può dimostrare che data una qualsiasi superficie oggetto  ! " ## $%& ' (" ) ' " r,
nell’approssimazione considerate fino ad ora essa è trasformata dal sistema in una superficie * +

38
     
   curvatura 1/r’ dell’immagine si può ricavare (ma

         !"# $%" "    "#& è una costante (nelle approssimazioni considerate).
di raggio di curvatura r’

Dalla teoria generale di Seidel si ricava che la curvatura di campo è sempre strettamente
legata all’astigmatismo, nel senso che se un sistema è privo di astigmatismo la superficie focale
è sempre curva, e viceversa se la curvatura di campo non c’è (campo piatto), si presentano le
due superfici tangenziale e sagittale dell’astigmatismo.
E’ quindi interessante ricavare la curvatura di campo nel caso in cui l’astigmatismo è nullo
e la superficie viene chiamata superficie di Petzval. Posto ')( * +-,/.0 1 1 2 (3.29) si trova
2LΩ = − A1 e sostituendo nella (3.27) si ottiene:

n ' n n 'cos θ '− n cos θ


= + + A1 (3.42)
s 'p s R

dove s’p= s’t = s’s è la distanza dall’origine delle coordinate della superficie di Petzval.
Omettendo i passaggi algebrici si arriva alla seguente relazione che esprime la curvatura
κ = 1/ r ' della superficie:

1 1  n '− n 
− = −  (3.43)
n ' r ' nr  n ' nR 

L’importanza della (3.43) sta nel fatto che la curvatura della superficie di Petzval non dipende
dalle distanza s’ ed s, né dalla posizione della pupilla d’entrata. Questo risultato si può
estendere ad ogni superficie del sistema ottico, essendo che n’r’ per la i-esima superficie è nr
per la (i+1)-esima, e pertanto si può scrivere:

1 1  n '− n 
− = −∑   (3.44)
n ' f r ' f n1r1 i  n ' nR i

dove 1 ed f si riferiscono alla prima ed ultima superficie del sistema. Per un oggetto piatto, la
situazione più comune è di avere:

 n '− n 
κ p = −n ' f ∑  n ' nR 
i
(3.45)
i

Perciò per ogni sistema ottico per il quale l’oggetto è piatto, la superficie di Petzval è una
superficie invariante. Se il sistema ha astigmatismo, ognuna delle superfici immagine
astigmatiche avrà la propria curvatura, e tra queste curvature esiste una ben definita relazione:

s ' p − s 't = 3(s ' p − s 's ) (3.46)


cioè la distanza tra la superficie di Petzval e la superficie dell’immagine tangenziale è tre volte
quella tra la superficie di Petzval e la superficie dell’immagine sagittale. Tra le curvature delle
varie superfici esistono inoltre le seguenti relazioni:

κ s − κ t = 2(κ p − κ s )
(3.47)
κ p − κ t = 3(κ p − κ s ).

39
Nel prossimo capitolo vedremo di applicare i concetti fino ad ora esposti ai vari telescopi,
cercando di quantificare la magnitudine delle varie aberrazioni.

40
4 CAPITOLO 4
4.1 I telescopi riflettori

In questo capitolo prenderemo in considerazione le caratteristiche dei telescopi riflettori in


molti casi di interesse pratico per un astronomo. I telescopi rifrattori, sebbene ancora in uso,
non possono competere con i riflettori per il piccolo diametro che possono raggiungere, e
quindi non verranno qui considerati.
Prenderemo in considerazione i diversi tipi di riflettori, discutendo le aberrazioni ad essi
associate e analizzando i vantaggi e svantaggi del loro uso. A causa delle aberrazioni ci sono
severe limitazioni nel campo utile dei diversi tipi di riflettore. Queste aberrazioni verranno
presentate in termini di misura angolare, come fossero misurate in cielo (e quindi espresse in
secondi d’arco).
Vedremo il caso più comune dei telescopi con due specchi allineati e discuteremo in breve
l’effetto del disallineamento tra gli specchi.
I più recenti telescopi hanno la caratteristica di essere molto rapidi, cioè di avere una corta
lunghezza focale del primario. Per un più completo trattamento di questo argomento si veda ad
esempio il libro di Wilson (1996).

4.1.1 Il paraboloide

Il singolo specchio parabolico è il più semplice esempio di telescopio libero dall’aberrazione


sferica. Esso è quasi sempre usato con il diaframma di apertura coincidente con lo specchio
medesimo e quindi le aberrazioni sono quelle calcolate all’inizio del capitolo precedente. In
Tab. 4.1 le riassumiamo e aggiungiamo i risultati per la curvatura di campo.

Tab. 4.1 Aberrazioni di un paraboloide

y2 2y 2
TSC = − 2 θ s ' TAS = − θ s'
R R
y2 θ 2y 2 θ 2
ASC = 2 θ = AAS = θ =
R 16 F 2 R 2F
2 κ +κt 2
κp = κm = s =−
R 2 R

Dalla tabella vediamo che la coda della Coma è diretta verso l’esterno del campo (TSC>0), che
l’immagine tangenziale astigmatica è più vicina allo specchio di quella sagittale (TAS<0), e
che la distorsione e l’aberrazione sferica sono nulle. Per ottenere le quantità angolari abbiamo
diviso per s’ le aberrazioni trasverse ed eliminato il segno meno che per noi è ininfluente in
quanto ci occupiamo solo della magnitudine della aberrazioni. I risultati per le aberrazioni
angolari sono graficati in Fig. 4.1 per tre rapporti focali F. La prima cosa da notare è la
dominanza della Coma anche per piccoli angoli fuori asse, cosa che limita il raggio entro cui
l’immagine può essere considerata buona. In genere per delle mediocri condizioni di seeing,
un’immagine può essere considerata buona quando il suo diametro è di 1 secondo d’arco
(arcsec).

41
1.5
4
Aberrazione angolare (arcsec)

8
4
1.0 10

0.5 10

      
5 10 15 20

Fig. 4.1. Aberrazione angolare di un paraboloide in luce collimata per vari rapporti focali F. Le linee piene danno
la coma sagittale, quelle tratteggiate l’astigmatismo. Ogni curva è numerata con il proprio rapporto focale.

Assumendo che un’immagine aberrata sia considerata ancora buona entro 1 arcsec vediamo
dalla Fig. 4.1 che, essendo la Coma tangenziale pari a tre volte quella sagittale, il campo utile
per un paraboloide in funzione del suo rapporto focale varia come in Tab. 4.2.

Tab. 4.2. Raggio limite del campo (in arcmin) per un paraboloide

F (arcmin)
4 1.42
8 5.69
10 8.89

Quindi il singolo paraboloide ha un campo utile molto piccolo, soprattutto se è piccolo il


rapporto focale. Poiché la Coma è indipendente dalla posizione di un eventuale diaframma che
modifichi la pupilla d’entrata del sistema (quando l’aberrazione sferica è 0), porre un
diaframma non cambierebbe la situazione. Dato il campo limitato si può anche facilmente
capire che il campo è praticamente piatto, cioè la curvatura di Petzval p    
  
m
sono nulle.

Non essendoci altri specchi singoli (diversi dal paraboloide) che abbiano aberrazione sferica
nulla, passiamo direttamente ai telescopi con due specchi.

4.1.2 I telescopi con due specchi

Nel capitolo 2 abbiamo introdotto lo schema di un telescopio Cassegrain ed un insieme di


parametri normalizzati in Tab.2.1 utili a descrivere ogni tipo di telescopio con due specchi. E’
istruttivo studiare le relazioni esistenti tra i parametri normalizzati, poiché esse definiscono i
confini possibili per ogni parametro per ogni tipo di telescopio. Per tutti i tipi deve
naturalmente essere reale l’immagine finale.

42
Se il primario è concavo, e quindi f1 > 0, la richiesta di un’immagine reale finale implica
che mk > 0. Se m e k sono entrambi positivi il telescopio è di tipo Cassegrain, se entrambi
negativi il telescopio si dice Gregoriano (Fig. 2.5 B). In ogni caso k < 1 affinché la luce
raggiunga lo specchio primario.
Se il primario è convesso e quindi f1 < 0, un’immagine reale richiede che mk < 0. In questo
caso il secondario deve essere più grande del primario, e quindi k > 1 ed m è negativo. Questo
tipo di telescopio con il secondario concavo è detto Cassegrain inverso.
Le differenti combinazioni di m, k      
     

Tab. 4.3. Combinazione dei parametri per i telescopi a due specchi.

m k  Tipo Secondario
>1 >0 >0 Cassegrain Convesso
=1 >0  Cassegrain Piatto
Da 0 a 1 >0 <0 Cassegrain Concavo
<0 <0 <0 Gregoriano Concavo
<0 >1 >0 Cassegrian inv. Concavo

Ora andremo a ricavare le aberrazioni per i vari tipi di telescopi utilizzando le relazioni viste
nel capitolo precedente.
Riscriviamo prima la quantità W in termini dei parametri normalizzati: W / R2 = ( k − 1) / 2 ρ e
W / s2 = ( k − 1) / k . Con queste sostituzioni dopo numerosi e tediosi passaggi algebrici si
ottengono i coefficienti delle aberrazioni Bis della Tab. 4.4.

Tab. 4.4 I coefficienti generali di aberrazione per i telescopi a due specchi

1  (m − 1)3 (1 + β )   m + 1  
2
1
B3s = 3  K1 + 1 −  K 2 +     = − [− ]
4 R1 m (m + 1) 
3
 m − 1    32 f13

θ  (m − 1)3 (m − β )   m + 1   θ
2

2 [ ]
B2 s = 2 2 1 +  K 2 +     = −
m R1  2m( m + 1)   m − 1    4 f
θ 2  (m − 1)(m − β )  (m − 1)2 (m − β )  θ2
B1s = 1 +  1 − ( K + 1)  = − [− ]
m(m + 1)  4m(1 + β )
2
mR1   2f
θ 3 (m − β )(m 2 − 1)   m +1  
2

B0 s =  (m − β )(3m + β ) +   (m − β ) K 2 
2

8m (1 + β )
3 2
  m −1  
I termini entro parentesi quadra [-] ripetono la medesima quantità a sinistra dell’uguale

Si noti che questi coefficienti si applicano ad ogni coppia di specchi conici, comprese le coppie
per le quali l’aberrazione sferica è diversa da zero. Si veda come il coefficiente B3s è l’unico
affetto dalla costante conica dello specchio primario. Un errore su K1 non ha effetto sulle
aberrazioni fuori asse (si pensi a quello che è successo con il telescopio spaziale Hubble).
Imponendo che B3s sia uguale a 0, otteniamo una relazione tra K1, m   

(m − 1)3 (1 + β )   m +1  
2

K1 + 1 = +
 2 
K  
m3 (m + 1)   m − 1  

43
e la Tab. 4.4 può riscriversi nella forma 4.5.

Tab. 4.5 Coefficienti di aberrazione per un telescopio a due specchi con B3s=0

θ  m 2 (m − β )  θ
B2 s = 1 + 2(1 + β ) ( K1 + 1)  = 4 2 [− ]
m 2 R12   f
θ 2  m 2 + β m(m − β ) 2  θ2
B1s =  − ( K1 + 1)  = − [− ]
mR1  m(1 + β ) 4(1 + β )2  2f
θ 3 (m − β )(m 2 − 1)  m 2 (m − β )2 
B0 s =  m + 3 β + ( K1 + 1) 
4m (1 + β )
2 2
 2(1 + β )(m − 1)
2

Questi risultati sono basati sulla scelta di localizzare la pupilla d’entrata del sistema con lo
specchio primario (cioè senza l’introduzione di diaframmi). Quando l’aberrazione sferica è 0,
la Coma è indipendente dalla posizione di eventuali diaframmi; e quando SA e Coma sono
nulle l’astigmatismo è indipendente dalla posizione dei diaframmi.
Il vantaggio di esprimere i coefficienti di aberrazione in funzione di m      
 
vantaggi che possono essere facilmente compresi.
Per ricavare le aberrazioni traverse è necessario sostituire ogni Bs nella relazione (3.36)
dove si è posto s '2 / n '2 = kf e y1/y2=1/k. Per ricavare le aberrazioni angolari date in Tab. 4.6 le
aberrazioni traverse sono divise per f e i segni meno sono stati tralasciati.

Tab. 4.6 Le aberrazioni angolari per un telescopio a due specchi

3
1 y  1
ASA =  1  [− ] = [− ]
8  f1  64 F13
2
θy  θ 1
ASC =  1  [− ] = 2 [ ]
− = ATC
4 f  16 F 3
y  θ 2
AAS = θ 2  1  [− ] = [− ]
 f  2F
ADI = B0s

Per la curvatura di campo si possono infine ricavare le seguenti relazioni:

B1s (sec) / θ '2 = B1s (pri) / θ 2 ,


2  m( m − β ) − (m + 1) 
kp =
R1  , (4.1)
m(1 + β ) 
2  (m 2 − 2)(m − β ) + m (m + 1) m(m − β )2 
km =  − ( K1 + 1)  .
mR1  m (1 + β ) 2(1 + β ) 2

Avendo quindi ora in mano tutte le relazioni necessarie discutiamo alcune proprietà dei
telescopi con due specchi. Le categorie più comuni sono i cosiddetti telescopi classici, quelli
con il primario parabolico, ed i tipi aplanatici, che hanno zero Coma.

44
4.1.3 Il tipo classico

Questa categoria è quella in cui K1=


 
 
           
     
   
richiede allora che la costante conica del secondario sia:

 m +1
2

K2 = −  
 m −1 

Per il Cassegrain, m>0 e il secondario è un iperboloide; per il Gregoriano ed il Cassegrain


inverso m<0 e il secondario è un ellissoide prolato. Sostituendo il valore di K1 nelle relazioni
precedenti si ottengono le relazioni semplificate date in Tab. 4.7.

Tab. 4.7 Aberrazioni del telescopio a due specchi classico

θ
ASC =
16 F 2
θ 2  m2 + β 
AAS =
2 F  m(1 + β ) 
θ 3 (m − β )(m 2 − 1)(m + 3β )
ADI =
4m 2 (1 + β ) 2
2  (m 2 − 2)(m − β ) + m(m + 1) 
km =  
R1  m 2 (1 + β ) 

La prima cosa che si nota è che la Coma in Tab. 4.7 è la stessa di quella di un singolo
paraboloide con lo stesso rapporto focale. Questo vale sia per il Cassegrain che per il
 "! # $ % quindi
Gregoriano, & # '$ ( # non
) & * + ,-
si # hanno
& * ) ,-./vantaggi
0 . & * # ,-.2rispetto
1 3 '4 aè questa aberrazione.
generalmente un numero positivo piccolo,
dell’ordine di pochi decimi, mentre m è tipicamente 10 volte maggiore (o anche di più). Una
buona misura si può quindi ottenere ponendo
456 /71 . 0* $8 * ) % $ & # & .91 3 
AAS = mθ 2 / 2F . Il
risultato mostra che un telescopio classico il cui fuoco è nel vertice dello specchio primario ha
un astigmatismo m volte più grande di quello di un paraboloide con lo stesso F. Come per la
Coma non ci sono differenze tra Cassegrain e Gregoriano rispetto a questa aberrazione. Per
456 /:$ ( # ) & * + ,-# & * ) ,-.2) *:; % ò anche scrivere AAS = θ 2 / 2F , e in questo caso dipende solo dal
1
rapporto focale del primario. Un confronto tra la Coma tangenziale e l’astigmatismo mostra
che è quasi sempre la Coma ad imporre i limiti sul campo focale utile (quello in cui l’immagine
appare ancora buona). Lo studente provi a costruirsi gli “spot 4 <diagrams”
=?> @?A> con un programma di
BC DFE G CFEC GHIJ"K LFM N G O L P N G L7D-C QR L k è approssimativamente 2(m+1)/R . Questa relazione
ray-tracing (ad es. OSLO) per un Cassegrain f/10 con m=4 e
m 1
non è esatta, ma illustra tre caratteristiche della superficie immagine. Primo il segno di km è
opposto per il Cassegrain e il Gregoriano. E’ concava per il Cassegrain e convessa per il
Gregoriano (viste dal secondario). Secondo la curvatura è maggiore per il Cassegrain che per il
Gregoriano. Terzo, la curvatura media aumenta quanto più m aumenta. Questo comunque non

45
è una limitazione poiché il campo coperto è generalmente tanto più piccolo quanto più m
aumenta.
Riassumendo, il telescopio classico a due specchi è limitato nel campo utile dalla Coma.
Confrontato con il singolo paraboloide l’astigmatismo è maggiore, ma dato il piccolo campo
questo è raramente una limitazione. La Coma è l’aberrazione dominante e non dipende dalla
posizione di diaframmi poiché l’aberrazione sferica è nulla. Per questo motivo nei telescopi
infrarossi lo stop di apertura è generalmente posto nella posizione del secondario.
A causa del piccolo campo la distorsione è tipicamente di pochi millesimi di secondo
d’arco e quindi inferiore al seeing, e perciò poco importante.

4.1.4 Il tipo aplanatico

Il telescopio classico è chiaramente limitato nel campo dalla presenza della Coma fuori asse.
Consideriamo ora quei telescopi che hanno Coma nulla nell’approssimazione al terz’ordine.
Abbiamo già detto che i sistemi che hanno aberrazione sferica e coma nulle vengono detti
aplanatici.
Il telescopio Cassegrain aplanatico, detto Ritchey-Chretien (RC), è il telescopio più
comune tra i telescopi professionali della classe dei 2m; tra questi vi è anche il telescopio
spaziale HST.
La condizione per realizzare l’aplanaticità può essere realizzata con due specchi conici
(iperbolici). Si trova che le condizioni per realizzare l’aplanaticità sono:

2(1 + β )
K1 = −1 −
m 2 (m − β )
(4.2)
 m +1 2m(m + 1)
2

K2 = −   −
 m − 1  (m − β )(m − 1)
3

La costante conica del secondario del RC è più negativa di quella del tipo Cassegrain classico.
Per l’aplanatico Gregoriano (AG) il primario è ora un ellissoide. Per il secondario la costante
conica dell’AG è più negativa di quella del tipo Gregoriano classico, (se m > 1 ), ma la conica
è sempre ellissoidale. La deformazione da applicare allo specchio del RC è comunque opposta
a quella dell’AG. Le aberrazioni risultanti sostituendo le (4.2), sono riassunte in Tab. 4.8.

Tab. 4.8 Le aberrazioni dei telescopi aplanatici

θ 2  m(2 m + 1) + β 
AAS =
2 F  2m(1 + β ) 
θ 3 (m − β )
ADI =  m (m 2 − 2) + (3m 2 − 2)
2 
4m (1 + β )
2

2  (m + 1) 
km =  2 (m2 − β (m − 1)) 
R1  m (1 + β ) 

                  
Come per i telescopi classici assumiamo
magnitudine delle aberrazioni. I risultati sono:

46
θ2  1 θ3 2 2
AAS = m +  ADI
, = (m − 2), km = (m + 1). (4.3)
2F  2 4 R1

In confronto con il tipo classico dello stesso rapporto focale, l’astigmatismo per l’RC è
maggiore, mentre quello dell’AG è minore. Ad un dato R1 la curvatura media è maggiore per
l’RC che per l’AG, e le curvature hanno segno opposto.
La distorsione è la stessa per entrambi i tipi, ed è minore che nel caso classico. Al limite del
campo utilizzabile del telescopio aplanatico, la distorsione è di pochi centesimi di secondo
d’arco (quindi deve essere considerata solo per certe peculiari osservazioni). Gli studenti
  
  
provino con OSLO a costruire gli “spot diagrams” per un RC f/10 con m=4 e
che rispetto al caso classico il campo utile è circa il doppio. Poiché l’aberrazione sferica e la
Coma sono zero, l’astigmatismo non dipende dalla posizione di eventuali diaframmi
d’apertura. E’ quindi l’astigmatismo che fissa i limiti del campo utile.

4.1.5 Altri telescopi con due specchi

Esistono altri tipi di telescopi, meno comuni, che meritano un accenno. Poiché ognuno di essi
ha qualche particolare problema, faremo solo una breve panoramica. Consideriamo solo i tipi
Dall-Kirkham, i telescopi con primario sferico, due tipi di telescopi anastigmatici, e un
aplanatico a campo piatto.
Il telescopio Dall-Kirkham ha un secondario sferico (K2=0) e un primario ellissoidale (con
K1 appropriato per avere zero aberrazione sferica. Il coefficiente della Coma B2s in Tab. 4.4 si
ottiene immediatamente
    ponendo K2=0, e analogamente si procede per gli altri coefficienti. Per
-Kirkham ha una Coma che è (m2+1)/2 volte più grande di quella del Cassegrain
classico. Quindi il campo utile è minore dello stesso fattore. Tutte le altre aberrazioni sono
trascurabili entro questo campo. Sebbene il campo utile sia piccolo, gli specchi del Dall-
Kirkham sono facili da costruire e quindi ne sono stati costruiti diversi. Un altro vantaggio di
questo tipo di telescopio è che la qualità dell’immagine è abbastanza insensibile al
disallineamento degli specchi in confronto ai tipi precedentemente descritti.
Un altro tipo di telescopio interessante è quello con un primario sferico (SP). Il principale
vantaggio sta nella facilità di costruzione del primario e nella possibilità di segmentare il
primario in tanti specchi sferici più piccoli. Per annullare l’aberrazione sferica il secondario     
deve essere un ellissoide oblato (K>0) nella versione Cassegrain e un iperboloide (K< 
versione Gregoriano. Il principale svantaggio è la grande aberrazione fuori asse. Relativamente
al Cassegrain ed al Gregoriano le aberrazioni fuori asse sono molto grandi. Pertanto il campo
utile è molto piccolo a meno di introdurre altri elementi ottici.
Un altro tipo di telescopio è quello che cerca di correggere contemporaneamente
l’aberrazione sferica, la coma e l’astigmatismo. Ovviamente ciò richiede delle restrizioni sui
parametri normalizzati. Per i telescopi aplanatici anastigmatici le relazioni tra i parametri sono:

β = − m(2m + 1), k = 1 − 2m, mk = m(1 − 2m). (4.4)

La condizione per avere un fuoco reale richiede quindi 0<m<0.5 quando il primario è concavo.
Per ogni m in questo intervallo il secondario è a sua volta concavo ed il piano focale è
localizzato tra i due specchi e quindi relativamente inaccessibile. Inoltre per una scelta
ragionevole di m, diciamo 0.25, il secondario oscura il primario in modo significativo.
Un altro tipo di telescopio anastigmatico si ha se il primario è convesso e k>1. dalle
relazioni (4.4) si vede quindi che m<0, e quindi c’è un fuoco reale e la configurazione è quella
di un Cassegrain inverso. Per    m<0, la superficie focale sta tra i due specchi poiché !"#

47
Disegnando la configurazione si vede che occorre porre una superficie che blocchi parte del
fascio incidente per evitare che la superficie focale veda la luce incidente direttamente. Per
m< parte della luce riflessa dal secondario passa al di là del primario. Un esempio si ha
quando entrambi gli specchi sono sferici e concentrici, con il secondario più grande del
primario, ma questa configurazione è poco utile per un telescopio (a volte è stata usata come
base per la camera di uno spettrografo).
L’aplanatico a campo piatto è definito da km = 0 per cui le relazioni tra i parametri
normalizzati divengono:
m2 m(m 2 + m − 1)
β= mk = (4.5)
m −1 m2 − 1

Un analisi di queste relazioni porta a due possibili tipi. Un Cassegrain con secondario
concavo e fuoco tra gli specchi, e un Cassegrain inverso. Ognuno di questi ha diversi problemi
di inaccessibilità dell’immagine e di forte vignettatura, come per i corrispondenti anastigmatici.
Infine lo studente può verificare che una soluzione esiste per il telescopio anastigmatico a
campo piatto, ma lo specchio secondario risulta più grande del primario e quindi è poco pratica
come telescopio.

4.1.6 Confronto tra tipo classico e aplanatico

Dalla discussione precedente risulta chiaro che il telescopio a due specchi, classico o
aplanatico, può essere facilmente modificato per venire incontro alle varie esigenze degli
astronomi. C’è una grande flessibilità nel “design” per ottenere i richiesti ingrandimenti e per
facilitare l’accessibilità del piano focale, pur mantenendo una vignettatura accettabile. Alcuni
problemi possono essere risolti introducendo nuovi elementi ottici.
E’ utile a questo punto scegliere dei valori per i parametri che rappresentano i nostri
telescopi e fare un confronto tra le diverse configurazioni discusse sopra. Scegliamo per i nostri
telescopi a confronto un medesimo diametro per il primario e un medesimo rapporto focale di
sistema. Facciamo in modo inoltre che  
                   à del piano focale.
In Tab. 4.9 diamo i dati dei diversi telescopi a confronto.

Tab. 4.9 Parametri per i telescopi a due specchi a confronto

Parametri CC CG RC AG
 
K1      !" # $%& '()*
K2 +-,-. //0 +1. 231 +2. 4 /,0 +1. 516 ,
CC=Cassegrain classico; CG=Gregoriano classico; RC=Ritchey-Chretien;
AG=Gregoriano aplanatico; F1=2.5; F=10; 7 =0.25; m=4.

Le caratteristiche importanti per ogni telescopio basate sui parametri di Tab. 4.9 sono riassunte
in Tab. 4.10.

Tab. 4.10 Caratteristiche dei telescopi a due specchi derivate dalle scelte di Tab.4.9

Parametri CC CG RC AG
m 4.00 8-9-: ;; 4.00 8-9-: ;;
k 0.25 8;: 9< = 0.25 8;: 9< =
18 k 0.75 1.417 0.75 1.417
mk 1.000 1.667 1.000 1.667
ATC 2.03 2.03 0.00 0.00

48
AAS 0.92 0.92 1.03 0.80
ADI 0.079 0.061 0.075 0.056
  
   
kmR1 7.25 7.625
kpR1 4.00  

4.00  

Le aberrazioni sono date per un angolo di campo di 18 arcmin e sono


espresse in arcsec.

Dai risultati di Tab. 4.10 possiamo dedurre il campo utile per ogni telescopio dove
l’aberrazione angolare dominante ha le dimensioni del disco di seeing atmosferico. Per un
seeing di 1 arcsec il campo utile di un CC con le caratteristiche date in Tab. 4.9 e 4.10 è di 9
arcmin (l’aberrazione dominante è la Coma), di 18 arcmin per un RC (l’aberrazione dominante
è l’astigmatismo), e di 20 arcmin per un AG. Perciò il campo è circa un fattore 2 più grande per
un telescopio aplanatico, e pertanto l’area è 4 volte più grande.
Per quanto concerne la curvatura vediamo che in valore assoluto la curvatura media è
maggiore e quella di Petzval minore per i tipi Cassegrain rispetto ai Gregoriani. Per gli
aplanatici la curvatura media è maggiore rispetto ai telescopi classici.
Se le aberrazioni fossero la sola condizione discriminante per la scelta di un telescopio, dai
dati mostrati si potrebbe concludere che il tipo aplanatico Gregoriano sia quello da scegliere.
Altri fattori però sono importanti per la scelta finale, che fanno spostare la nostra preferenza
verso il tipo RC. Queste sono visibili nelle righe 2-4 di Tab. 4.10. Si ricordi infatti che k è il
rapporto tra il diametro del secondario ed il primario e quindi k2 è la minima frazione di area
del primario oscurata dal secondario. Il parametro (1 k) rappresenta la separazione del primario
e del secondario in unità di f1, mentre mk è la distanza dal secondario al piano focale nelle
stesse unità.
L’ostruzione della luce da parte del secondario è visibilmente maggiore per i tipi
Gregoriani rispetto a quelli classici. Confrontando i valori di (1 k) osserviamo che la
separazione primario-secondario è 1.9 volte maggiore per i Gregoriani, e la distanza tra il
secondario ed il piano focale è circa il 70% più grande per i Gregoriani. Pertanto per la
lunghezza fisica di un Gregoriano è sostanzialmente maggiore. Questo ha due serie
conseguenze per la scelta finale del telescopio in particolare per i costi. Il primo problema è che
la cupola che ospita il telescopio viene a costare molto di più. Secondo i costi del telescopio
stesso crescono essendo più massiccio e più lungo. Inoltre risulta anche più difficile allineare le
ottiche quanto più il telescopi è lungo.
Una caratteristica del Gregoriano che è utile per certe applicazioni specifiche è che
ponendo un diaframma nella pupilla d’uscita del telescopio si può sopprimere la luce diffusa
dai supporti della struttura.
  Data
 la preferenza per
           il tipo
   !RC
 " " facciamo
#    %ora
$ & ' il( confronto
) * + , - . - )/* 0 1 tra
0( ) diversi
. * * + 1- ) tipi
) 123di. 4/RC
& 5& 6 che
6 & hanno

Tab. 4.11 Confronto tra telescopi RC con rapporto focale f/10

Parametri RC di riferimento RC-1 RC-2 RC-3


m 4.00 6.00 7.00 8.00
F1 2.50 1.67 1.43 1.25
f1/f1(rif.) 1.00 0.667 0.571 0.500
7
0.25 0.375 0.438 0.500
k 0.25 0.196 0.180 0.167
mkf1/f1(rif.) 1.000 0.786 0.719 0.667
AAS 1.03 1.35 1.49 1.62
kmR1 7.63 9.65 10.53 11.34
L’astigmatismo è dato per un campo di 18 arcmin in unità di arcsec.

49
Si noti innanzitutto che la lunghezza totale del telescopio è tanto più corta quanto più il
rapporto focale del primario è piccolo, cioè quanto più rapido è il primario. Questo implica
anche una maggior facilità di allineamento delle ottiche. Vediamo anche che l’astigmatismo è
maggiore quanto più rapido è il primario. A dispetto di ciò i vantaggi di un telescopio più corto
sono evidenti. Resta da dire che la scelta tra RC e CC non è così marcata come quella tra
Cassegrain e Gregoriano. Alcuni grandi telescopi (come il Keck) hanno ad esempio scelto il
tipo Cassegrain classico, per la maggiore flessibilità di questo design.

50
4.2 Errori di allineamento nei telescopi a due specchi

Consideriamo ora le conseguenze di un errore nella posizione del secondario relativamente al


primario nei telescopi a due specchi. L’errore può consistere in un errato centraggio o in un
“tilt” (inclinazione) del secondario rispetto al primario. In entrambi i casi si tratta di un
disallineamento. Un altro errore può essere dovuto allo spostamento tra i due specchi anche se
perfettamente centrati ed allineati in asse. Le aberrazioni introdotte nei due casi sono
considerate separatamente.

4.2.1 Errori di centraggio e di inclinazione

Una possibile configurazione di un secondario non allineato è mostrata in Fig. 4.2.

Z’
1
4
3 L’
2
Z

Fig. 4.2 Il secondario è decentrato di una quantità


       
                         

Dalla geometria della Fig. 4.2 vediamo che:



L ' = −( + αW ), Ψ = −(θ + α ) (4.6)

dove L’ è la distanza tra il centro dello stop di apertura (che coincide in questo caso con il
  "!   #$&%"' ( ! ) ) %"*% '+) % , #-*!   #/.% 0 è l’angolo tra il chief-ray riflesso e l’asse del secondario.
Sostituendo le (4.6) nelle Tab. del capitolo precedente, si può dimostrare che i nuovi
coefficienti di aberrazione si ottengono dalle relazioni:

B2 s = B2 s (cen) + k 3 B22 (dis)


(4.7)
B1s = B1s (cen) + k 2 B12 (dis)

dove Bis sono i coefficienti per un telescopio perfettamente allineato dati in Tab. (4.5) e

51
1 1   m + 1   m +1 


B22 (dis ) =   K2 −  m − 1  − α  m − 1  
R22  R2     
(4.8)
1  
2
  W   2Wθ 
B12 (dis ) = −  α +  + 2θ  α +  1 −  + K 2  − 
R2  R2   R2  R2  R2  R2 R2  

sono i coefficienti di correzione di Coma e Astigmatismo introdotti dal disallineamento (NB: il


risultato vale per un punto lungo l’asse y).
Oltre all’introduzione di un termine addizionale per Coma e Astigmatismo, il disallineamento
del secondario provoca anche uno spostamento dell’immagine sul piano focale.
Facendo le solite sostituzioni si può giungere ad un’espressione per la nuova Coma tangenziale
angolare (ATC):

3(1 + β )  (m − 1)3   m +1   
ATC=ATC(cen) − 2   K2 −    + α (m − 1)  (4.9)
16 F  f 2(1 + β )   m −1  

  


la cui caratteristica principale è l’indipendenza dall’angolo la costanza su tutto il


campo. Per un telescopio aplanatico ATC(cen)=0 e sostituendo K2 dalla (4.2) si ottiene:

3(1 + β )(m − 1)  m 1 
ATC = − α − 1 +  (4.10)
16 F 2  fk  (m − β )( m − 1) 

      
Mentre per un telescopio classico lo studente provi a ricavarsi, prendendo ATC(cen) dalla Tab.


4.7 e sostituendo K2= -1)]2 la:

3θ y
3(1 + β )(m − 1)  m

   
ATC = 2
− 2 α−  (4.11)
16 F 16 F  fk 

indica che il risultato vale per un punto preso lungo l’asse y. Dalle (4.10) e (4.11) si
y
vede che la Coma può essere annullata da una combinazione di un opportuno tilt e un

 ! " # $ % &'&() *,+.- /0+ 12 +435$,"  $76 859;:=< >?.@ < A <N O5B C PD Q: ?EQSC A R F BT B OU? C ?PLGEV <HW X BQC FY Z,A F [ I J D;?EJ? F KL< @ > ?B C < M A ? < I J D
appropriato decentraggio del secondario.
Per illustrare gli effetti di questi errori sull’immagine finale consideriamo nuovamente i

D=3.6 m, otteniamo i valori di Tab.(4.12) per

Tab. 4.12 La Coma tangenziale angolare per i telescopi disallineati

\] ^ _=` \] ^ _=`


CC CG RC AG
ATC(centraggio) 1.93 1.93 2.10 2.02
ATC(inclinazione) 2.11 2.11

Si vede che la montatura Gregoriana è più sensibile al tilt di quella Cassegrain, mentre per il
decentraggio c’è poca differenza, sebbene gli aplanatici ne siano maggiormente affetti. Si
ricordi che data la maggior lunghezza del Gregoriano, il Cassegrain risulta più adatto a
soddisfare le tolleranze richieste. E’ importante realizzare inoltre che il contributo di Coma
dovuto al disallineamento è più grande quanto più diminuisce il rapporto focale del primario,
cioè quanto più rapido è lo specchio.

52
Rispetto al telescopio RC-3 di Tab. 4.11 notiamo che, per lo stesso tilt e decentraggio,
ATC(tilt) è 2.8 volte maggiore e ATC(decentr) è circa 8 volte maggiore.
Ritornando ai telescopi aplanatici, vediamo che ATC=0 per

m 1 
α= 1 +  (4.12)
fk  (m − β )(m − 1) 

L’importanza della (4.12) è che, anche se il primario ed il secondario non sono perfettamente
allineati, c’è un angolo di tilt che compensa il decentraggio e dà un’immagine libera da Coma.

Per quanto riguarda l’astigmatismo consideriamo solo il caso in cui la Coma dovuta al
disallineamento è zero. Applicando questa condizione si ha che:

  m −1  
α= K2   −1 (4.13)
R2   m + 1  

Sostituendo nella seconda delle (4.8), esprimendo W ed R2 in termini dei parametri


normalizzati, e arrangiando nuovamente i termini si ha:

1   (m − 1)3  m 
B1s = B1s (cen) − 
2f  f
 K2
(1 + β ) θ y + f 2(m − β )(m − 1)  (4.14)
  

Per un dato decentraggio si vede che l’astigmatismo dovuto al disallineamento è lineare


nell’angolo  y sul campo (stiamo sempre considerando come prima il caso di Fig. 4.2). Vi è
inoltre un termine che è costante su tutto il campo, ma in molti casi esso risulta trascurabile
rispetto al termine lineare.
Consideriamo ora solo i tipi aplanatici (per via del fatto che è generalmente la Coma che limita
il campo utile nei telescopi Cassegrain).
La variazione nell’astigmatismo introdotta dal disallineamento degli specchi avrà un
      
         

   
   
    !
 
particolarmente grandi. Per un telescopio RC con i parametri dati prima si ha che:

AAS(arcsec) = −3.16 E − 3 θ x2 + θ y2 − 5.42θ y − 0.276  (4.15)

"$# % &'% &'(*) &*+ (&, ) '% # - . ) (&%/, (0 (*0 1 - , , %2/3 4
x576 8:9;
< = > ?@*A B;CDCE576/F; GIH y576J;H y=5.42
arcmin. Entro 5 arcmin attorno all’asse ottico l’astigmatismo si mantiene inferiore a 0.2 arcsec.
Lo studente può provare a controllare gli spot-diagrams ottenuti con OSLO simulando un
disallineamento degli specchi.

Se l’errore nel posizionamento del secondario è solo nella sua posizione ma non nel suo
allineamento, si introducono ugualmente delle aberrazioni, in particolare l’aberrazione sferica e
la Coma. La prima è maggiore della seconda. Anche l’astigmatismo viene introdotto da questo
errore ma è sempre trascurabile rispetto alle altre due aberrazioni.
Senza dimostrarlo diamo i risultati per l’aberrazione sferica nel caso del telescopio classico e
aplanatico:

53
m(m 2 − 1) ds2
ASA(classico) =
16 F 3 f1
(4.16)
m(m 2 − 1)  2  ds2
ASA(aplan.) = 1+ 
 (m − 1)( m − β )  f1
3
16 F

Un confronto con le relazioni precedenti mostra che i telescopi aplanatici sono più sensibili dei
telescopi classici agli errori di posizionamento del secondario. Si noti la dipendenza da F3 per
cui un primario rapido è più sensibile a questo errore.
Un confronto delle dimensioni relative di ASA e ATC per i telescopi aplanatici con secondario
spostato è riassunto in Tab. 4.13.

Tab. 4.13 Aberrazioni angolari per aplanatici con secondario spostato

RC AG
ASA 0.912 0.846
ATC 0.252 0.174

dove le aberrazioni sono date in arcsec e la Coma è data relativamente ad un angolo di campo
di 18 arcmin. I parametri dei telescopi sono gli stessi considerati precedentemente.

54
5 CAPITOLO 5
5.1 La sovrapposizione delle onde

Nei prossimi capitoli studieremo il fenomeno dell’interferenza e della diffrazione. Il principio


concettuale comune di entrambi i fenomeni si basa sulla concezione ondulatoria della luce e
sulla proprietà di sovrapposizione delle onde. Ci interessa inoltre capire come le proprietà
specifiche di ogni onda (ampiezza, fase, frequenza, etc.) influenzino il risultato della
sovrapposizione che determina l’effetto finale nel punto in cui si studia il campo di radiazione.
Ricordiamo ora che le componenti di un campo elettromagnetico (Ex, Ey, Ez, Bx, By, Bz)
soddisfano l’equazione d’onda differenziale scalare:

∂2 Ψ ∂2 Ψ ∂2 Ψ 1 ∂2 Ψ
+ + 2 = 2 2 (5.1)
∂x 2 ∂y 2 ∂z v ∂t

 
        
   
 
       1(r, t  2(r,
Una significativa proprietà di questa equazione è la sua linearità.
t     n(r, t) sono
r, t) e le sue derivate

soluzioni individuali della (5.1) ogni combinazione lineare di esse sarà anch’essa soluzione.
Pertanto,
! n
!
Ψ (r , t ) = ∑ Ci Ψ i (r , t ) (5.2)
i =1

dove i coefficienti Ci sono costanti arbitrarie. Noto come principio di sovrapposizione, questa
proprietà suggerisce che il risultato di una perturbazione elettromagnetica in un punto dello
spazio è la somma algebrica delle singole onde che la costituiscono. Si tenga a mente che
questo risultato solo nel caso lineare: altri tipi di onde, come quelle sonore, possono in alcuni
casi generare risposte non lineari. Ad esempio un fascio laser collimato ad alta intensità (il
campo elettrico può raggiungere i 1010 V/cm) può produrre effetti non lineari.
In molti casi possiamo trascurare la natura vettoriale della luce. Per esempio se le onde
luminose si propagano tutte lungo una stessa direzione ed hanno un medesimo piano di
vibrazione costante, esse possono essere descritte in termini di una sola componente del
campo, e quindi trattate come quantità scalari. Nel seguito rappresenteremo la perturbazione
elettromagnetica con la quantità scalare E(r, t), soluzione dell’eq. (5.1).

5.2 Somma di onde della stessa frequenza

Ci sono diversi metodi per sommare onde della stessa frequenza; ne esaminiamo alcuni che
possono essere utili in diversi contesti.

5.2.1 Il metodo algebrico

Una soluzione dell’eq. d’onda può essere scritta nella forma:

E ( x, t ) = E0 sin [ω t − (kx + ε )] (5.3)

dove E0 è l’ampiezza del disturbo armonico che si propaga lungo l’asse positivo x. Per separare
la parte spaziale da quella temporale scriviamo:

55
α ( x, ε ) = − (kx + ε )
cosicché:
E ( x, t ) = E0 sin [ω t + α ( x, ε )] (5.4)

Supponiamo ora di avere due onde di questo tipo

E1 = E01 sin(ω t + α1 )
(5.5)
E2 = E02 sin(ω t + α 2 )

con la stessa frequenza e velocità di propagazione nella medesima direzione x. Il risultato di


questa perturbazione è la sovrapposizione algebrica:

E = E1 + E2 (5.6)
che per esteso è:

E = E01 (sin ω t cos α1 + cos ω t sin α1 )


(5.7)
+ E02 (sin ω t cos α 2 + cos ω t sin α 2 )

separando la parte temporale, si ha:

E = ( E01 cos α1 + E02 cos α 2 )sin ω t


(5.8)
+ ( E01 sin α1 + E02 sin α 2 ) cos ω t

Poiché le quantità entro parentesi sono costanti nel tempo si può porre:

E0 cos α = E01 cos α1 + E02 cos α 2


(5.9)
E0 sin α = E01 sin α1 + E02 sin α 2

che non è una sostituzione ovvia, ma sarà legittimata quando risolveremo per E0 
Quadrando e sommando le (5.9) si ottiene:

E02 = E012 + E022 + 2 E01 E02 cos(α 2 − α1 ) (5.10)

mentre dividendole una sull’altra si ha:

E01 sin α1 + E02 sin α 2


tan α = (5.11)
E01 cos α1 + E02 cos α 2

Se la (5.11) e la (5.10) sono entrambe soddisfatte per E0   


        è corretta e si
può scrivere:
E0 = E0 cos α sin ω t + E0 sin α cos ω t
o anche:
E = E0 sin(ω t + α ) (5.12)

Una singola perturbazione risulta dalla sovrapposizione delle onde sinusoidali E1 ed E2. L’onda
risultante è anch’essa armonica e con la stessa frequenza e velocità, ma la sua ampiezza e la

56
sua fase sono differenti. Si noti che quando E01 E02 nella (5.11) α ≈ α1 e quando
E02 E01 è α ≈ α 2 , la risultante è in fase con la componente dominante. Essendo la densità di
flusso proporzionale al quadrato dell’ampiezza, si vede anche che la densità di flusso risultante
dalla sovrapposizione non è semplicemente la somma delle densità di flusso delle singole
componenti, ma c’è un termine addizionale; questo contributo 2 E01 E02 cos(α 2 − α1 ) è detto
termine di interferenza. Il fattore cruciale è la quantità δ = α 2 − α1 . Quando
δ = 0, ±2π , ±4π .... la risultante ampiezza è massima, mentre per δ = ±π , ±3π ... è minima. Nel
primo caso le onde sono in fase e le creste si sovrappongono, nel secondo le creste d’onda sono
fuori fase di 180° . In Fig. 5.1 A e B la linea continua in grassetto rappresenta l’onda risultante.

A.

B.

Fig. 5.1 La sovrapposizione di due onde armoniche in fase A e fuori fase B.

Si osservi che la differenza di fase può essere introdotta da una differenza nel cammino ottico
attraversato dalle due onde, come pure da una differenza di fase iniziale, cioè:

57

δ = (kx1 + ε 1 ) + (kx2 + ε 2 ) = ( x1 − x2 ) + (ε1 − ε 2 ) (5.13)
λ
dove
 x 1 e x2sono
 le   distanze
  !   ! dalle
"$#$ sorgenti
 &delle
% '! due
!  !  onde
 (' ) al p*  % 
 ! +
 

       è la
     , ,
1- 2 e:


δ= ( x1 − x2 ) (5.14)
λ

Questo vale anche nel caso in cui le perturbazioni provenienti da una stessa sorgente viaggiano
lungo strade differenti. Essendo n = c / v =λ0 / λ si ha:


δ= n( x1 − x2 ) (5.15)
λ0

La quantità n(x1-x2) è detta differenza di cammino ottico ed indicata con OPD (optical path
./ 0 0 1 2 1 34 1 578
6 4 63 9;:=<>@?AB >=C DE
Λ / λ0 = ( x1 − x2 ) / λ è il numero di onde nel mezzo
corrispondenti alla differenza di cammino; una strada è diverse lunghezze d’onda più lunga
dell’altra. Poiché ad ogni lunghezza d’onda si può associare una variazione di fase di 2F
radianti, δ = 2π ( x1 − x2 ) / λ o:

δ = k0 Λ (5.16)

dove
JK L L M N L OkP 0NQSèRilTJnumero
KU$K P+L KWdiVX$propagazione
N L Y[Z Z nel vuoto. Una strada è quindi G=H I dianti più lunga
1 \ 2 è costante, indipendentemente dal suo valore, sono dette
coerenti.
Un caso speciale di interesse è quello della sovrapposizione di due onde:

E1 = E01 sin [ω t − k ( x + ∆x) ]


(5.17)
E2 = E02 sin(ω t − kx)

dove E01=E02 e k]_^ ` a 2 b c 1. Lo studente può provare a ricavare quindi il seguente risultato
della sovrapposizione:

 k ∆x    ∆x 
E = 2 E01 cos   sin ω t − k  x +  (5.18)
 2    2  

Questo mette in luce chiaramente il ruolo svolto dalla differenza di cammino d_e , specialmente
fg$h ijkl mWkijmon kikpm q'm n n mr its h n mWu v λ la risultante ha un ampiezza che è
1 wyx 2). Se ∆x z
circa 2E01, mentre se ∆x = λ / 2 è zero. Nel primo caso si parla di interferenza costruttiva, nel
secondo di interferenza distruttiva.
Si può dimostrare che la sovrapposizione di un qualsiasi numero di onde armoniche
coerenti con una medesima frequenza e direzione di propagazione è sempre un’onda armonica
della stessa frequenza, cioè in generale la somma:

n
E = ∑ E0i cos(αi ± ω t ) (5.19)
i =1

58
è data da:
E = E0 cos(α ± ω t ) (5.20)
dove abbiamo usato il coseno al posto del seno e le quantità E0 ed  
 
 
 
  


 

    
delle (5.10) e (5.11).
Consideriamo ora l’emissione di una comune sorgente di luce (quali un bulbo
incandescente, una candela, una lampadina). Possiamo pensare questa sorgente come costituita
di un numero enorme N di atomi che emettono radiazione. Un torrente di fotoni si manifesta
nel suo complesso come un’onda elettromagnetica. E’ utile immaginare il fotone come un
impulso oscillatorio di breve durata. Ogni atomo è una sorgente indipendente di fotoni e quindi
di treni d’onda fatti di brevi impulsi oscillatori. La durata dell’emissione di un singolo fotone
varia da 1 a 10 ns. In altre paralo la fase del treno d’onda è costante al massimo per 10 ns, dopo
di che varia rapidamente e casualmente. Pertanto in ogni evento la fase della luce emessa da un
   (t) rimarrà costante rispetto alla fase della luce di un altro atomo  (t) per al più 10 ns.
i j
Poiché la densità di flusso è proporzionale alla media temporale di E02, presa in un ampio
intervallo di tempo, si avrà in questo caso che:

E02 = NE012 (5.21)

poiché il termine con il coseno in media va a zero. Questo è il medesimo processo che accade
in un orchestra dove diversi strumenti (ad esempio N violini) suonano insieme, ed il risultato
finale dà sempre l’effetto di un violino aumentato di intensità N volte.
Per questo motivo due lampadine, che emettono singolarmente luce che varia rapidamente di
fase, e sarà quindi difficile assistere a fenomeni di interferenza usando questo tipo di sorgenti.
All’estremo opposto se le N sorgenti sono coerenti ed in fase l’intensità totale sarà:

E02 = N 2 E012 (5.22)

5.2.2 Il metodo complesso

Spesso è matematicamente conveniente fare uso della rappresentazione complessa quando si ha


a che fare con la sovrapposizione di onde armoniche. L’onda può scriversi in generale come:

E1 = E01ei (α1  ωt )
(5.22)

Se N di queste onde con la stessa frequenza e direzione di propagazione si sommano l’onda


risultante è data da:

E = E0ei (α +ω t ) (5.23)

che è equivalente alla (5.20) o per esteso:

 N iα 
E =  ∑ E0 j e j  e + iω t (5.24)
 j =1 

La quantità
N
E0eiα = ∑ Eoj e
iα j
(5.25)
j =1

59
è nota come ampiezza complessa dell’onda risultante. Poiché

E02 = ( E0eiα )( E0eiα )* (5.26)

possiamo sempre calcolare l’intensità risultante usando la (5.25) e (5.26). Per esempio se N=2
− −
E02 = ( E01eiα1 + E02eiα 2 )( E01e iα1 + E02e iα 2 ) (5.27)

e quindi svolgendo i calcoli

E02 = E012 + E022 + 2 E01 E02 cos(α1 − α 2 ) (5.28)

che è identica alla (5.10).

5.2.3 I Fasori

La somma descritta dall’eq. (5.25) può essere rappresentata graficamente come un’addizione di
vettori nel piano complesso. L’ampiezza complessa è nota come fasore ed è specificata dalla
sua magnitudine e fase (il fasore si descrive quindi con il simbolo E0∠α1 ). Immaginiamo di
avere una perturbazione descritta dalla

E1 = E01 sin(ω t + α1 )

In Fig. 5.2 A) l’onda è rappresentata da un vettore di lunghezza E01 che ruota in senso
    

antiorario con velocità , e la sua proiezione sull’asse verticale è E01 1). In B) è
mostrata la somma di due fasori.

A) I B) I

E02
E0
E01
E01
E1


R R

Fig. 5.2 L’addizione dei Fasori.

In modo analogo ai vettori la somma E=E1+E2 si esegue costruendo la diagonale del


parallelogramma di lati E01 ed E02. Per la legge del coseno si ha quindi:

E02 = E012 + E022 + 2 E01 E02 cos(α1 − α 2 )

60
come abbiamo visto precedentemente. Gli studenti provino a sommare i fasori
5∠0°,10∠ 45°,1∠ − 15°,10∠120° e 8∠180° .

5.2.4 Onde stazionarie

Abbiamo già detto che la somma di soluzioni dell’eq. D’onda è essa stessa una soluzione.
Perciò in generale,

Ψ ( x, t ) = C1 f ( x − vt ) + C2 g ( x + vt )

soddisfa l’equazione d’onda. Ad esempio esaminiamo due onde armoniche della stessa
frequenza che si propagano in direzioni opposte (un caso pratico si ha quando l’onda incidente
è riflessa da uno specchio). Immaginiamo che l’onda incidente provenga da sinistra e incida
sullo specchio ad x=0 e sia data dalla:

EI = E0 I sin(kx + ω t + ε I ) (5.29)

e sia riflessa a destra come:

ER = E0 R sin(kx + ω t + ε R ) (5.30)

Nella regione in cui si sovrappongono l’onda è E = EI + ER . In altre parole le due onde


esistono
      simultaneamente nella regione tra la sorgente e lo specchio. Fissiamo la condizione
I=0 quando t=0. Le due onde si devono quindi sommare in modo tale da dare risultato
nullo quando
x=0. Assumendo E0I=E0R le condizioni iniziali richiedono che ad x=0 sia E=0 e
poiché I
              R=0. L’onda risultante è quindi del tipo:

E = E0 I [sin(kx + ω t ) + sin(kx − ω t )]

usando la trigonometria si può scrivere la medesima formula nella forma:

E ( x, t ) = 2 E0 I sin kx cos ω t (5.31)

Questa è l’equazione di un’onda stazionaria. Il suo profilo non si muove nello spazio. In ogni
punto x=x’ l’ampiezza è una costante data da 2 E0 I sin kx ' , e E(x’,t) varia armonicamente come
cos   "! # $  %
& '  % ()! % * è ad x=0, + , -.
/ 0)12 3 45 6 6 67 8:9; < = > < ? 8 @ A B C ; è sempre nulla. Questi sono
detti punti nodali. A metà strada tra i punti nodali, cioè a x=D E FG
HI J KL)M N O PQ R R RS T U VXW Y Z [ [ UX\ UXY S
vaolre massimo ±2E0I.
Se la riflessione sullo specchio non è perfetta, l’onda risultante conterrà sia una componente
che si muove sia una componente stazionaria. In quest’ultimo caso si avrà un trasferimento di
energia, cosa che non avveniva nel puro caso stazionario.
Le onde stazionarie esistono anche in due e tre dimensioni. Il fenomeno è assi comune. Si
pensi alle onde prodotte da una chitarra, alla superficie di un tamburo,etc. Con il fenomeno
delle onde stazionarie è associato il ben noto fenomeno della risonanza. L’orecchio umano ad
esempio è una cavità risonante. Il Laser è un altro esempio di sistema che sfrutta la proprietà
della risonanza per costruire la propria potenza emissiva.

61
5.3 La sovrapposizione di onde con diversa frequenza

Fino ad ora abbiamo visto la sovrapposizione di onde con la stessa frequenza. Nella realtà non
esistono le onde puramente monocromatiche, ma solo le onde quasi monocromatiche, per le
quali ci dovrà essere un ristretto intervallo di frequenze. Lo studio di questo tipo di luce ci
porterà agli importanti concetti di lunghezza di banda e di tempo di coerenza.
Vediamo ora come si comportano le onde con diversa frequenza.

5.3.1 I battimenti

Consideriamo due onde

E1 = E01 cos(k1 x − ω1t )


(5.32)
E2 = E01 cos( k2 x − ω 2t )

con stessa ampiezza e zero fase iniziale. L’onda risultante

E = E01 [cos( k1 x − ω1t ) + cos(k2 x − ω 2t )]

può essere riscritta:


1 1
E = 2 E01 cos [(k1 + k2 ) x − (ω1 + ω 2 )t ] cos [(k1 − k2 ) x − (ω1 − ω 2 )t ]
2 2

Ora definiamo le quantità ω e k , che sono la frequenza angolare media e il numero di


propagazione medio, e ω m e km , che sono la frequenza di modulazione e il numero di
propagazione di modulazione:

ω1 + ω 2 ω1 − ω 2
ω≡ ωm ≡
2 2
(5.33)
k +k k −k
k ≡ 1 2 km ≡ 1 2
2 2

per cui,
E = 2 E01 cos(km x − ω m t ) cos(kx − ω t ) (5.34)

L’onda totale può essere pensata come un’onda di frequenza ω ma con un’ampiezza variabile
nel tempo o modulata E0 ( x, t ) = 2 E01 cos(k m x − ω mt ) , tale che:

E ( x, t ) = E0 ( x, t ) cos(kx − ω t ) (5.35)
      
              saranno sempre piuttosto grandi. Inoltre, se sono
        ! "  #!  %$'& 1 ( ) 2, allora m
1 2
ω * ω e E ( x, t ) varierà lentamente, mentre E(x,t)
0
varierà rapidamente. La densità di flusso è proporzionale a:

E02 ( x, t ) = 4 E012 cos 2 (km x − ω mt ) = 2 E012 [1 + cos(2km x − 2ω m t )]

62
Si noti che E02 ( x, t ) oscilla attorno al valore 2E012 con una frequenza angolare 2ω m che è nota
come frequenza di battimento. Quindi E0 varia con la frequenza di modulazione, mentre E02
con la frequenza di battimento. Un esempio è dato in Fig. 5.3.

A.

B.

Fig. 5.3 La sovrapposizione di onde con diversa frequenza. In A si vedono le due onde con diversa frequenza con
due tratteggi diversi. In B la linea continua rappresenta (in modo approssimativo) l’andamento dell’onda
risultante, mentre la linea tratteggiata l’andamento della modulazione.

Con l’avvento del Laser l’osservazione dei battimenti è stata molto facilitata. Frequenze di
battimento da pochi Hz a 1010 Hz possono essere osservate. Il fenomeno dei battimenti è utile
per misurare piccole variazioni di frequenza. L’effetto Doppler è una comune applicazione di
questo fenomeno.

5.4 La velocità di gruppo e di fase

La specifica relazione tra e k determina v, la velocità dell’onda. In un mezzo non dispersivo


come il vuoto v = / k e un grafico di vs. k è una linea retta; la frequenza e la lunghezza
d’onda cambiano in modo da mantenere v costante. Tutte le onde elettromagnetiche viaggiano
con la stessa velocità di fase in un mezzo non dispersivo. Per contrasto, in un mezzo dispersivo
ogni onda si propaga con una velocità che dipende dalla sua frequenza.
Quando un certo numero di onde si combinano per formare la perturbazione composta,
l’inviluppo di modulazione viaggerà con una velocità diversa da quella delle onde costituenti.
Questo introduce il concetto di velocità di gruppo e la sua relazione con la velocità di fase. Il
disturbo esaminato nella precedente sezione,

63
E ( x, t ) = E0 ( x, t ) cos(kx − ω t )

consiste di un’onda di alta frequenza ω , con ampiezza modulata da una funzione coseno.
Supponiamo per un momento che l’onda non sia modulata, cioè che E0=costante. Ogni picco
dell’onda si muoverebbe con la velocità di fase

v =ω /k

Questa è la velocità di fase dell’onda, che sia o non sia modulata. Nel secondo caso i picchi
cambiano ampiezza periodicamente durante il passaggio dell’onda. C’è però un altro moto
importante da considerare, quello della modulazione dell’onda. Supponiamo allora adesso che
le due onde E1(x,t) ed E2(x,t) avanzino con la stessa velocità v1=v2. In questo caso l’onda
risultante, con i battimenti, è stazionaria, e si propagherà con la medesima velocità vg=v=
v1=v2. Con il nome di velocità di gruppo intendiamo la velocità con cui si propaga la
modulazione. Questo avviene nei mezzi non dispersivi in cui la velocità di fase è indipendente
dalla lunghezza d’onda, cosicché le due onde hanno la stessa velocità.
Più in generale essendo E0 ( x, t ) = 2 E01 cos(k m x − ω mt ) possiamo scrivere che la modulazione
viaggia ad una velocità dipendente dalla fase dell’inviluppo, e quindi

ω m ω1 − ω 2 ∆ω
vg = = = (5.36)
km k1 − k2 ∆k

Ma si realizzi che in generale è     (relazione di dispersione). Quando l’intervallo di


frequenze  
          ω , è piccolo, si può anche scrivere:

 dω 
vg =   (5.37)
 dk ω

La modulazione (o segnale) si propaga ad una velocità vg che può essere maggiore, uguale o
minore di v, velocità di fase dell’onda. In un mezzo a dispersione normale vg<v, mentre nel
caso di dispersione anomala vg>v. Essendo  v la (5.37) dà:

dv
vg = v + k (5.38)
dk

Di conseguenza in un mezzo non dispersivo in cui v è indipendente da   !"$#&% g=v. nel
vuoto '() c, v=c, e vg=c. Nei mezzi dispersivi (v1*,+ 2) in cui n(k) è nota, -./ c/n e si può
riscivere la (5.38) nella forma:

c kc dn  k dn 
vg = − 2 = v 1 −  (5.39)
n n dk  n dk 

Per i mezzi ottici (lenti) l’indice di rifrazione cresce con la frequenza (dn/dk>0) e quindi vg<v.
Lo studente si ponga il problema se un segnale possa viaggiare ad una velocità maggiore di c.

5.5 Onde periodiche anarmoniche

64
La sovrapposizione di onde armoniche di diversa ampiezza e lunghezza d’onda può dar luogo
ad un onda risultante periodica, ma anarmonica, cioè non sinusoidale. Nella realtà sono le onde
puramente armoniche che non esistono, e quindi occorre sviluppare un metodo per studiare
questo nuovo tipo di onde.

5.5.1 Le serie di Fourier


   
    
Il teorema di Fourier (1768-1830) dice che una generica funzione f(x)
può

 
essere sintetizzata

   
  
     con una somma di funzione armoniche le cui lunghezze d’onda sono
è 

 
  
! " #$ % $ &(' " ! )*' " + # ' )*! ," !.- +/- # 0 + 1
!
2

 2π   2π 
f ( x ) = C0 + C1 cos  x + ε1  + C2 cos  x + ε 2  + ... (5.40)
 λ  λ/2 

dove le C sono costanti e naturalmente la f(x) può corrispondere ad una f(x-vt). E’ più
conveniente riformulare la (5.40) servendosi dell’identità trigonometrica

Cm cos(mkx + ε m ) = Am cos mkx + Bm sin mkx


3
4
1
!65
798 :
; <
= Am = Cm cos ε m , Bm = −Cm sin ε m . Pertanto,

A0 ∞ ∞
f ( x) = + ∑ Am cos mkx + ∑ Bm sin mkx (5.41)
2 m=1 m =1

dove il primo termine è stato scritto così per convenienza matematica (si veda oltre). Il
processo di determinazione delle costanti Am e Bm prende il nome di analisi di Fourier. Lo
studente può provare a ricavarsi questi coefficienti integrando la (5.41) tra 0 e <
=?>A@ > B C
> D
E
F/@ G
dell’ortogonalità delle funzioni trigonometriche. Si ottiene:

2 λ
λ ∫0
A0 = f ( x)dx

2 λ
λ ∫0
Am = f ( x ) cos mkxdx (5.42)

2 λ
Bm = ∫ f ( x ) sin mkxdx
λ 0

Alcune condizioni di simmetria sono utili da riconoscere, perché portano ad una


semplificazione dei calcoli. Se una funzione è pari, cioè se f(HI J/K LM I J , o equivalentemente
simmetrica rispetto ad x=0, la serie di Fourier conterrà solo i termini in coseno, cioè Bm=0 per
tutti gli m. Analogamente se è dispari, cioè se f(NO P/QRN ST O P , la serie conterrà solo i termini con
il seno, cioè Am=0 per tutti gli m.
Come esempio calcoliamo la serie di Fourier che corrisponde ad un’onda quadra:

 +1 se 0 < x < λ / 2
f ( x) = 
−1 se λ / 2 < x < λ

65
vedi Fig. 5.4. Poiché f(x) è dispari Am=0 e

2 λ/2 2 λ
λ ∫0 λ ∫λ / 2
Bm = ( +1) sin mkxdx + (−1) sin mkxdx =

1 1
= [− cos mkx ]0λ / 2 + [cos mkx ]λλ / 2
mπ mπ

+1

   0   
x

Fig. 5.4 Il profilo di un’onda periodica quadra.

Da qui è facile ricavare i vari coefficienti, che sono:

4 4
B1 = B2 = 0 B3 =
π 3π
4
B4 = 0 B5 = ,...

da cui:
4 1 1
f ( x) = (sin kx + sin 3kx + sin 5kx + ...) (5.43)
π 3 5

La Fig. 5.5 mostra come l’onda sintetizzata si avvicina alla f(x) quanti più termini della serie si considerano.

+1

  0  
x

Fig. 5.5 La sovrapposizione dei primi due termini della serie. Considerando le armoniche successive si riproduce
sempre meglio l’onda quadra.

66
Per passare dal dominio spaziale a quello temporale basta sostituire kx con  . Pertanto
abbiamo visto che ogni onda anarmonica può sempre essere pensata come una sovrapposizione
di onde armoniche di diversa frequenza. Possiamo quindi scrivere:
∞ ∞
A
f ( x ± vt ) = 0 + ∑ Am cos mk ( x ± vt ) + ∑ Bm sin mk ( x ±vt ) (5.44)
2 m=1 m =1

per ogni tipo di onda anarmonica.


Vediamo invece come si comporta l’onda quadra di Fig.5.6 che invece rappresenta una
funzione pari.

+1

    
0  

x

Fig. 5.6 Il profilo di un’onda anarmonica periodica quadra pari.

Tutti i Bm sono zero ed i coefficienti di Fourier divengono:

4 4  sin m 2π / a 
A0 = e Am =  
a a  m2π / a 

L’espressione entro parentesi che riscriviamo come sinc u = (sin u ) / u è molto importante
perché comparirà da ora in poi in diversi contesti. Lo studente è quindi invitato a ripassarsi le
proprietà di questa funzione (vedi ad es. Hecht 1998, pag. 48). Essendo il limite di questa
funzione 1 per x che tende a zero, gli Am possono rappresentare tutti i coefficienti se m=0,1,2,...
Rispetto alla Fig. 5.4 l’origine è ora in x=0, e la serie contiene tutti termini in coseno anziché in
seno, ma le armoniche sono inalterate: le sinusoidi che danno l’onda quadra dispari divengono
cosinusoidi per l’onda pari.
Se la larghezza dell’impulso dell’ onda quadra è 2(    , cioè una qualunque frazione della
lunghezza d’onda, la serie di Fourier si scrive:

2 ∞ 4
f ( x) = + ∑ sinc m2π / a cos mkx (5.45)
a m =1 a

Se ad esempio a=4 la serie diviene:

1 2 1 1
f ( x) = + (cos kx − cos 3kx + cos 5kx − ...) (5.46)
2 π 3 5

67
Si noti che al decrescere delle dimensioni dell’impulso occorrono sempre più coefficienti della
serie (cioè più armoniche) per riprodurre l’onda. Questo può essere capito osservando il
rapporto:

Am sin m 2π / a
= (5.47)
A1 m sin 2π / a

Si vede che per a=4 il nono termine (m=9) è piccolo, A9  1. Mentre per a=400,
A9
  1. Possiamo quindi ipotizzare che non è il numero totale di termini della serie che è
importante, ma piuttosto le dimensioni relative delle più piccole caratteristiche dell’onda che
devono essere riprodotte rispetto alla lunghezza d’onda. Per un’onda di forma complessa
occorrono molte armoniche, o componenti ad alta frequenza per riprodurre l’onda.

5.6 Le onde non periodiche


Si supponga ora che la lunghezza d’onda dell’impulso quadro di Fig. 5.6 tenda all’infinito e la
dimensione dell’impulso resti costante. Ci troviamo quindi di fronte ad una funzione non più
periodica. E’ possibile generalizzare il metodo di Fourier alle onde non periodiche?
Per vedere come ciò può essere fatto scegliamo inizialmente a=4 e         ! "
quindi una larghezza di 0.5 cm centrato in x=0. Poniamo in un grafico (Fig. 5.7a) i coefficienti
Am in funzione di mk, necessari a riprodurre l’onda quadra.

a)
1 A0
A1

A2 A3

mk
0 k 2k 3k 4k 5k .....
0 2# 4# 6# 8# 10# .....
$ %& % ./ 0 1 2 354 0 358 9 1 : 2 3 9 = >
?
@ A
' ( ' )* + ,
- *67 * * ;<
b)
1/2

mk

B C D E FG H I J K L L L L L
0 k 2k 3k 4k 5k .....

Fig M N M O5P Q R
S T UV W X Y Z5[ W \ ] ^ Z5_ ` X a \ Y Z5\ b c5` d efg h
68
c)
1/4

mk
0 2k 4k 6k 8k 10k .....
   

Fig. 5.7 c)                   ! "#%$ &'#( )

Facciamo
;< = = > ? @BAC= D la
EGF stessa
HI? JKBLMK cosa <SAMET< T;* EG
NPOQRponendo +-,/
U V. W X/
0 1S
< 24
Y Z3 57
[G68\ ]_
3 9 : è^ `Ia mantenendo
bcBdMc e/\ f chginalterata
ikj lm iSi m n o lap i q larghezza
a lroS\ so
produciamo con questi cambiamenti è quella di allontanare i picchi. Si vede immediatamente
però che lo spettro delle frequenze necessarie per riprodurre l’onda cambia. In particolare
t uv7w xy tkz tk{ | w }uMw x~ tkw €7 ‚Mw { { €  € w xy € ƒh„7wk ‚x z uM€ t v7‚G …wk}uMt x‚/†/ | w ‡  wkwSz tS{ ux~ € ‚xw
somiglia sempre di più ad un singolo impulso, lo spazio tra ognuno dei coefficienti A(mk)
decresce ˆ ‰‹ŠŠ Œ BŒ Ž hM ‘-’ “ ”PM
• –— ˜ ™ š7–œ›  ˜ ž Ÿ™ ˜ ™ 

1 ∞
∫0 B(k ) sin kxdk 

π  ∫0
f ( x) = A( k ) cos kxdk + (5.48)

Naturalmente in questo contesto non ha più significato parlare di frequenza fondamentale e di


sue armoniche.
La (5.48) vale ovviamente se:

+∞
A(k ) = ∫
−∞
f ( x ) cos kxdx
+∞
(5.49)
B(k ) = ∫
−∞
f ( x) sin kxdx

La somiglianza con le serie è quindi ovvia. Si noti anche come le ampiezze dei contributi alla
sintesi variano con la funzione sinc introdotta prima.

69
70
6 CAPITOLO 6
6.1 Interferenza

Il fenomeno dell’interferenza si presenta spesso sotto i nostri occhi in diversi contesti, si pensi
ad esempio alla configurazione di colori che si vedono in una sottile macchia d’olio su di un
pavimento di asfalto, o all’interazione tra le onde in una piscina d’acqua.
Noi abbiamo già detto nel precedente capitolo che l’origine di questo fenomeno risiede
nella sovrapposizione delle onde. Si ricordi infatti che l’espressione che descrive la
perturbazione ottica è un’equazione differenziale lineare alle derivate parziali omogenea del
secondo ordine. Come abbiamo visto le soluzioni di questa equazione obbediscono al Principio
di Sovrapposizione. Pertanto il risultante campo elettrico E in un punto dello spazio dove due o
più onde si sovrappongono è uguale al vettore somma delle singole perturbazioni.
Nel presente capitolo esamineremo i diversi tipi di interferometro, che dividiamo in due
grandi gruppi: gli interferometri a divisione del fronte d’onda e quelli a divisione di ampiezza.
Nel primo caso porzioni del fronte d’onda primario sono usate sia direttamente come sorgenti
di onde secondarie, sia in congiunzione con altri elementi ottici per produrre sorgenti
secondarie di onde virtuali. Queste onde secondarie sono fatte nuovamente incontrare per
interferire. Nel secondo caso l’onda primaria è divisa in due segmenti che attraversano due
percorsi differenti con diverso cammino ottico prima di ricombinarsi.

6.1.1 Considerazioni generali

Abbiamo già esaminato il problema della sovrapposizione scalare di due onde, e in molti casi i
risultati ottenuti sono applicabili ancora nel presente contesto. Tuttavia la luce è un fenomeno
vettoriale; il campo elettrico e il campo magnetico sono campi vettoriali. Capire questo fatto ci
aiuta molto a comprendere il fenomeno dell’interferenza. E’ vero che in molte situazioni la
natura vettoriale della luce è di poca importanza pratica. Vedremo oltre in quali condizioni è
possibile trascurare la natura vettoriale della luce.
In accordo con il Principio di Sovrapposizione l’intensità del campo elettrico E, in un
punto dello spazio, derivante dai singoli campi E1, E2, ... è dato da:

E = E1 + E2 + ... (6.1)

La perturbazione ottica varia rapidamente nel tempo con una frequenza generalmente compresa
nell’intervallo 4.3×1014 -- 7.5×1014 Hz, cosa che rende impossibile misurare il valore
istantaneo del campo. La densità di flusso irradiata I può invece essere misurata direttamente
con diversi tipi di sensori (fotocellule, bolometri, emulsioni fotografiche, CCD, l’occhio).
Molti dei risultati qui di seguito presentati non fanno particolare riferimento alla forma del
fronte d’onda, perciò i risultati sono abbastanza generali.
Per semplicità consideriamo due sorgenti S1 e S2 che emettono onde monocromatiche delle
stessa frequenza in un mezzo omogeneo. Sia la loro separazione a λ e si scelga un punto di
osservazione P molto lontano (tale che le onde in P possano essere considerate piane, vedi Fig.
6.1). Per il momento si considerino solo delle onde polarizzate linearmente della forma:

E1 (r , t ) = E 01 cos(k1 ⋅ r − ω t + ε1 )
(6.2)
E 2 (r , t ) = E 02 cos(k 2 ⋅ r − ω t + ε 2 )

La densità di flusso di radiazione è data da:

72
S2

S1

Fig. 6.1 Onde sferiche provenienti da due sorgenti S1 e S2 che si incontrano a grande distanza in P.

I=  E2
T
 
è la costante dielettrica del mezzo, v la velocità di propagazione nel mezzo, ed E 2 è
la media temporale del modulo quadro del vettore campo elettrico. Trascurando le costanti
(rimanendo quindi nel medesimo mezzo) possiamo scrivere anche:

I = E2
T

Essendo valida la (6.1) si ha che:

E 2 = E ⋅ E = E12 + E 22 + 2E1 ⋅ E2

e facendo la media temporale di ambo i membri si potrà scrivere che:

I = I1 + I 2 + I12
se:
I1 = E12
T

I2 = E 2
2 T (6.3)
I12 = 2 E1 ⋅ E2 T

L’ultima espressione è nota come termine di interferenza. Per il calcolo specifico si ha:

E1 ⋅ E2 = E01 ⋅ E02 cos(k1 ⋅ r − ω t + ε1 ) cos(k2 ⋅ r − ω t + ε 2 ) (6.4)

Separando il termine dipendente dal tempo e facendo la media temporale (si ricordi che
1 t +T
f (t ) T = ∫ f (t ' dt
) 'e nel nostro caso il periodo delle funzioni armoniche è  

  
T t
si ha:
1
E1 ⋅ E 2 T = E 01 ⋅ E 02 cos(k1 ⋅ r + ε1 − k2 ⋅ r − ε 2 ) (6.5)
2

73
1 1
poiché cos 2 ω t ; sin 2 ω t
= = ; sin ω t cos ω t T
= 0.
T 2 T 2
Il termine di interferenza è quindi:

I12 = E 01 ⋅ E 02 cos δ (6.6)

con δ = (k1 ⋅ r − k2 ⋅ r + ε1 − ε 2 ) differenza di fase che deriva dal diverso cammino ottico e dalla
diversa fase iniziale. Si noti che se E01 e E02 sono perpendicolari I12=0 e I=I1+I2. Il caso più
comune nella discussione che segue è quello in cui i vettori sono paralleli, per cui è possibile
passare alla semplice notazione scalare:

E 201
I1 = E12 =
T 2
E2
I 2 = E 22 = 02 (6.7)
T 2
I12 = 2 I1I 2 cos δ
e la densità di flusso totale diviene:

I = I1 + I 2 + 2 I1I 2 cos δ (6.8)

Nei vari punti dello spazio l’intensità totale può essere maggiore, minore o uguale ad I1+I2 a
   
                  "! # $ %'&  è:

I max = I1 + I 2 + 2 I1 I 2 (6.9)
( )
 *+$ ,.-/ 0#12 /3/ 0#42 / 5 5 56 798 : ; < = >+? @ < 9> A B C 7 = ; D E ; D ; 7 F @G< CIH C ? ;J= >= @ A K; 7 = ;L? >#< = D := = C M@L;JA @
differenza di fase tra le due onde è data H@KN:A = C OA C.C 7 = ; D CPH C.12 Q.R SUTVWSIX TVTZY V3[ \ X S ]_^` \ VWT
a b.c T#X d b'e R SfTVWSfX TVT+[ ` Tg Y3[ \ X ShSGi
1+I2<I<Imax e si parla di interferenza parzialmente
j k#l m n om m p qr s#t.u nv w_xy z {.j k#l v |.}3~N ~€  ~N‚ ~ ƒ „ ƒ …† ‡ ˆ ‰Š ˆP‹ ‰Š‰3Œ  ‰ƒ ˆ_Œ † ‹ ~€ ˆ.}IŽƒ † € ˆ.~N |_ +I . Per
 ‘9’ “#” • ‘ –'—™˜ šœ› 1 2
la condizione di interferenza parzialmente distruttiva con I1+I2>I>Imin. Il
minimo di intensità si ha per onde fuori fase di 180 gradi, in cui i ventri dell’onda si
˜ žŸ    ¡¡ ž¢ £ ž¢žU ¤ ¤ ¥¦   ¥ ˜ § ¥ ¨ ¦ ž#˜ © ª –'—¥«

I min = I1 + I 2 − 2 I1I 2 (6.10)


¬­ ¥ ˜ § žU Ÿ Ÿ š ¥ ¢¥¡ ¥  "© ª_®#¯ ° ° ±_² ³ ° ´ ´ ´ µœ¶ ·¸ ¹ º » ¹¼ ·· ½ ¾ µ º ¿ µ º µ ½ À ¹¾ Á¾ ¹ » µ ½ ¾ µ¼ · ¶ ¾ º þ ¾ · Ĺ ´
Un altro caso molto importante si ha quando le ampiezze delle due onde sono uguali (E01=
E02). Poiché la densità di flusso dalle due sorgenti è uguale, scriviamo I0=I1=I2 e la (6.8) si può
riscrivere:

δ
I = 2 I 0 (1 + cos δ ) = 4 I 0 cos 2 (6.11)
2
da cui si vede che Imin=0 e Imax=4I0.
L’eq. (6.8) vale anche se le onde emesse dalle sorgenti S1 e S2 sono sferiche (purché
Å λ ). In questo caso possiamo scrivere che la fase è
a

δ = k (r1 − r2 ) + (ε1 − ε 2 ) (6.12)

74
La (6.11) sarà valida quando la separazione tra S1 e S2 è piccola rispetto alle distanze r1 ed r2.
Se poi le sorgenti hanno uguale intensità abbiamo:

1
I = 4 I 0 cos 2 [k (r1 − r2 ) + (ε1 − ε 2 )]
2
   
         ! ! ! " ! #%$  
&  $('  $( )
$+* , -  $($
 
 .  / 01 243 5 6738 6739: : : ; :%<>= ?,= @7A(B< C ?+01 2D 0E-5 :F7G @ C @ H H I J K < C I/ LM: 5 D ;N<M= = @ amo anche
riscrivere che il massimo si ha per:

r1 − r2 = [2π m + (ε1 − ε 2 ) ] / k (6.13)


ed il minimo per:
r1 − r2 = [π m '+ (ε1 − ε 2 ) ] / k

O 2 O
Ognuna di queste due equazioni definisce una famiglia di superfici che sono iperboloidi di
rivoluzione con fuochi in S1 e S2. Se le sorgenti sono in fase all’inizio ( 1 2) le (6.13) si
semplificano in:

r1 − r2 = 2mπ / k = mλ
1 (6.14)
r1 − r2 = m 'π / k = m 'λ
2
per il massimo e minimo rispettivamente.
Le frange chiare e scure che si vedono interponendo uno schermo nella regione di interferenza
si dicono frange d’interferenza. I vari ordini di interferenza si susseguono al variare di m. Nella
PQ @ = N? G G <RI K
zona centrale tra S1 e S2 le frange appariranno sottili e parallele (dato infatti il piccolo valore di
a).

6.2 Condizioni per l’interferenza

Se due fasci di luce devono interferire per produrre delle frange d’interferenza stabili, devono
avere approssimativamente la stessa frequenza. Una variazione significativa della frequenza
produrrebbe una differenza di fase fortemente variabile nel tempo, per cui il termine I12 sarebbe
uguale a zero in media.
Le frange più chiaramente visibili si hanno quando le due onde hanno circa la stessa
ampiezza. Le regioni scure e chiare corrispondono allora all’interferenza totalmente distruttiva
e costruttiva rispettivamente.
Le onde non devono essere necessariamente in fase per osservare le frange; basta che la
differenza di fase sia il più possibile costante, cioè che le onde siano coerenti.

6.2.1 Coerenza spaziale e temporale

Si ricordi che data la natura corpuscolare dei processi di emissione, una convenzionale sorgente
quasi monocromatica produrrà luce che è sempre un insieme di treni d’onda di fotoni. Pertanto
in ogni punto dello spazio illuminato il campo elettromagnetico oscillerà rapidamente
rimanendo in fase con se stesso per un tempo dell’ordine di 10 ns. Questo intervallo di tempo
nel quale possiamo rappresentare l’onda come una sinusoide, viene detto intervallo temporale
di coerenza. L’intervallo medio di tempo nel quale la luce oscilla in un modo prevedibile viene
detto tempo di coerenza della radiazione. Maggiore è il tempo di coerenza, maggiore è la
coerenza temporale della sorgente.

75
Osservata da un punto fisso dello spazio l’onda luminosa apparirà circa sinusoidale per un
certo numero di oscillazioni, dopo di che cambierà bruscamente la sua fase. L’intervallo
spaziale nel quale la luce oscilla in modo regolare è detta lunghezza di coerenza. Pertanto sarà
conveniente pensare al fascio di luce come ad una progressione, più o meno sinusoidale, di
gruppi d’onda di lunghezza media lc le cui fasi sono scorrelate l’una con l’altra.
Se la luce fosse puramente monocromatica, l’onda sarebbe una perfetta sinusoide con una
lunghezza di coerenza infinita. Tutte le sorgenti reali non sono così ed emetteranno quindi un
certo intervallo di frequenze, sia pur piccolo. Per esempio una comune lampada ha
generalmente una lunghezza di coerenza di alcuni millimetri, mentre certi tipi di laser hanno
una lunghezza di coerenza di decine di Km.

Fig. 6.2 Onde che presentano coerenza spaziale e temporale

In Fig. 6.2 abbiamo disegnato le onde sferiche provenienti da una sorgente puntiforme
monocromatica. I diversi cerchi rappresentano le creste dell’onda. Scelto un punto P1 dello
spazio data la coerenza illimitata potremo sapere come sarà l’onda in ogni altro punto, essendo
l’onda sempre uguale a se stessa. Per contrasto in Fig. 6.3 mostriamo una sorgente che cambia
frequenza di momento in momento. In questo caso si è persa la coerenza temporale, ma punti
che sono tra loro vicini avranno solamente una parziale coerenza temporale, a cui corrisponde
una lunghezza di coerenza. La distanza più piccola entro cui l’onda rimane sinusoidale, entro
cui cioè la fase è prevedibile, rappresenta la lunghezza di coerenza dell’onda.
Se adesso pensiamo ad una sorgente estesa, ogni singolo punto della sorgente emetterà
simili treni d’onda che interferiranno tra loro in tutto lo spazio ove si propagano le onde. Nella
realtà ognuna di queste sorgenti emetterà onde che rimangono tra loro in fase per al più 10 ns,
per cui nello spazio tutt’intorno la perturbazione risultante darà luogo ad un’onda con un tempo
di coerenza che sarà minore o uguale a 10 ns. Questo accade normalmente per la luce solare o
per la luce di un candela. Lo stesso dicasi per due lampadine che rimarranno in fase per un
tempo simile, non producendo quindi frange di interferenza osservabili e stazionarie. Oggi con
i laser i fenomeni di interferenza si possono studiare invece molto bene.

76
Fig. 6.3 Onde che sono solo parzialmente coerenti

6.3 Le leggi di Fresnel-Arago

Nel paragrafo precedente si è assunto che le due onde interagenti fossero linearmente
polarizzate e con i vettori paralleli. In realtà le stesse relazioni si possono applicare a contesti
più complicati, anche nel caso di nessuna polarizzazione. Per apprezzare ciò si ricordi che ogni
stato di polarizzazione della luce può essere sintetizzato per mezzo di due stati tra loro
ortogonali, e per la luce naturale questi due stati sono tra loro incoerenti.
Supponiamo ora che il campo E di un’onda piana possa essere separato nelle sue
componenti parallela E e perpendicolare E ⊥ . Pertanto, ogni onda piana, polarizzata o no, può
essere scritta nella forma (E + E ⊥ ) . Immaginiamo che due onde (E 1 + E⊥1 ) e


(E 2 + E⊥ 2 ) emesse da due sorgenti coerenti identiche si sovrappongono in una regione dello
spazio. La densità di flusso risultante consisterà di due sistemi di frange indipendenti
(E 1 + E 2 ) 2 e (E⊥1 + E⊥ 2 )2 . Perciò sebbene noi abbiamo ricavato le equazioni precedenti
T T
specificamente per lo stato di polarizzazione lineare, esse sono applicabili ad ogni stato di
polarizzazione, inclusa la luce naturale.
Si noti che E⊥1 ed E ⊥ 2 sono sempre tra loro perpendicolari, mentre E 1 e E 2 possono non
esserlo. Essi saranno paralleli solo quando i due fasci saranno tra loro paralleli (cioè quando
k1=k2). La natura vettoriale del processo di interferenza non può essere ignorata. Ci sono molte
situazioni pratiche in cui i due fasci sono paralleli, e quindi in questi casi la teoria scalare è
sufficiente a spiegare il fenomeno.
Fresnel e Arago hanno condotto uno studio intensivo delle condizioni in cui si realizza
l’interferenza tra fasci di luce polarizzata. I loro risultati possono riassumersi come segue:

1. Due fasci di luce coerente con stati di polarizzazione tra loro ortogonali, non possono
mai interferire, nel senso che I12=0 e le frange non si formano;

77
2. Due fasci di luce coerente con stati di polarizzazione tra loro paralleli interferiranno
sempre, anche nel caso di luce naturale;
3. I due stati di polarizzazione perpendicolari che costituiscono la luce naturale non
possono tra loro interferire e formare frange osservabili, anche se uno dei due è ruotato
artificialmente e allineato all’altro. Questo perché sono tra loro incoerenti.

6.4 Interferometri a divisione del fronte d’onda

Il principale problema nel produrre il fenomeno dell’interferenza è che le due sorgenti devono
essere coerenti. Il laser è l’unico apparecchio in grado di produrre un fascio sufficientemente
coerente. Come è stato possibile allora studiare il fenomeno prima della costruzione stessa del
Laser? Thomas Young risolse brillantemente questo problema dividendo in due porzioni (tra
loro coerenti) uno stesso fronte d’onda.

6.4.1 L’esperimento di Young

Consideriamo un’ipotetica onda piana che illumini una sottile e lunga fenditura (Fig. 6.4).

P
r2
S2 ym
r1
S a
!
m

B
S1

 s 
a o

Fig. 6.4 Geometria dell’esperimento di Young.

Dalla prima fenditura la luce viene diffratta (vedi Cap. 7) ed emerge un fronte d’onda
cilindrico. Questa nuova onda viene ora fatta incidere su due fenditure parallele, sottili e molto
vicine S1 e S2. Con questa geometria il fronte d’onda primario che arriva sulle due fenditure
sarà esattamente in fase, e le due fenditure si comporteranno come due sorgenti coerenti.
Pertanto dove la luce proveniente da queste due sorgenti si incontrerà si avrà il fenomeno
dell’interferenza (se la differenza di cammino ottico è ovviamente inferiore alla lunghezza di
coerenza c tc). Oggi si può fare a meno della prima fenditura se si ha a disposizione una
   
                       
  
   
       deve
a o
essere molto grande in rapporto alla distanza a delle due fenditure.
La differenza di cammino ottico tra i due raggi nei cammini S1P e S 2 P può essere
determinata, con buona approssimazione, tracciando la perpendicolare da S2 a S1P . Si ha
quindi:

(S B ) = (S P ) − (S P ) = r − r
1 1 2 1 2 (6.15)

Continuando con questa approssimazione,

78
r1 − r2 = a sin θ ≈ aθ (6.16)
    

Essendo
a
r1 − r2 ≈ y (6.17)
s

In accordo con quanto detto nel paragrafo precedente si ha interferenza costruttiva quando

r1 − r2 = mλ (6.18)

per cui dalle due ultime relazioni si ha:

s
ym ≈ mλ (6.19)
a

Questa dà la posizione dell’m-esima frangia brillante sullo schermo. L’angolo formato da


questa con l’asse del sistema è facilmente:


θm = (6.20)
a

Lo spazio tra le frange sullo schermo si può ottenere usando la (6.19):

s s s
∆y ≡ ym +1 − ym ≈ (m + 1)λ − mλ = λ (6.21)
a a a

Evidentemente le frange rosse sono più larghe di quelle blu.


Poiché questo sistema di frange è equivalente a quello ottenuto con due onde sferiche che
si sovrappongono (almeno nella regione r1 ≈ r2 ), possiamo usare l’eq. (6.11) scrivendo la
differenza di fase come δ = k (r1 − r2 ) :

k (r1 − r2 )
I = 4 I 0 cos 2 (6.22)
2

se naturalmente i due fasci incidenti in P sono coerenti ed hanno stessa intensità I0.
Con r1 − r2 ≈ ya / s la densità di flusso totale diviene:

yaπ
I = 4 I 0 cos 2 (6.23)

Si ricordi anche che l’approssimazione di avere fenditure infinitamente sottili è una


idealizzazione, per cui nella realtà non si potrà trovare un andamento della densità di flusso
come quello dato dalle (6.22) e (6.23). Questo a causa del fenomeno della diffrazione.

Se la sorgente primaria ha una corta lunghezza di coerenza al crescere della differenza di


cammino ottico, i gruppi d’onda identici non arriveranno in P esattamente insieme e vi sarà un
aumento della regione in cui si sovrappongono onde tra loro scorrelate, con il conseguente

79
degrado nella qualità (contrasto) delle frange. Se poi la lunghezza di coerenza diviene più
piccola della differenza di cammino ottico, le frange spariscono.
Se la sorgente primaria è di luce bianca, tutti i colori che la costituiscono arriveranno in
y=0 in fase, per cui l’ordine zero di interferenza sarà bianco, mentre tutti gli altri massimi
mostreranno le varie lunghezze d’onda, essendo ym    
 
In conclusione l’esperimento di Young consiste di due fenditure in fase poste ad una
distanza s>>a. In generale s è così grande che il sistema di frange osservate corrisponde alla
configurazione di frange osservate nella diffrazione di Fraunhoffer (vedi Cap. 7).
Lo studente provi a pensare alle due fenditure come ad una funzione costituita da due delta
di Dirac e provi a riflettere sulla trasformata di Fourier di una funzione di questo tipo. Si
accorgerà che la trasformata di una funzione di questo tipo consiste in una funzione coseno.

6.4.2 Altri tipi di interferometro a divisione del fronte d’onda

I più comuni tra questi tipi di interferometro sono il doppio specchio di Fresnel, il doppio
prisma di Fresnel, e lo specchio di Lloyd.
Il doppio specchio di Fresnel è mostrato in Fig. 6.5. Un fronte d’onda cilindrico esce dalla
fenditura S ed è riflesso dai due specchi. Le frange di interferenza si formano nella regione di
spazio dove i due fronti d’onda riflessi si sovrappongono (punto P). Uno schermo impedisce al
fascio primario di giungere in P senza essere riflesso dagli specchi.

schermo

S P

r1
r2

A B

S1

S2

Fig. 6.5 Il doppio specchio di Fresnel. Le linee tratteggiate sono tutte pari ad R. La geometria è esagerata.

80
Le immagini S1 e S2 della sorgente S nei due specchi possono essere considerate come sorgenti
separate e coerenti, distanti a l’una dall’altra. Dalla legge della riflessione si ha che SA = S1 A e
SB = S 2 B , ed è anche SA + AP = r1 e SB + BP = r2 . La differenza di cammino ottico tra i due
raggi è allora r1 r2. I vari massimi si hanno quindi per r1 − r2 = mλ , come per l’interferometro
di Young. La separazione tra le frange è data da:

s
λ ∆y ≈
a
   
    
 è molto piccolo se si
dove s è la distanza tra il paino delle due sorgenti virtuali e lo schermo P.
La geometria è esagerata per chiarire la figura; l’angolo

        ! ! "   # #
 %$  &  &   '( " & &   !    '
! %  "      ) '+*-,./0
decresce a decresce e le frange si allargano.

Il doppio prisma di Fresnel è mostrato in Fig. 6.6. Un singolo fronte d’onda cilindrico incide su
entrambi i prismi. Nella regione di sovrapposizione dei due fasci si formano le frange.

S1

a S >

S2

Fig. 6.6 Il doppio prisma di Fresnel. Consiste di due prismi sottili attaccati per la loro base.

Per un punto sullo schermo è come se ci fossero due sorgenti S1 e S2 distanti a da cui proviene
luce coerente. L’espressione per la separazione delle frange è la stessa usata precedentemente.

Lo specchio di Lloyd, di cui non mostriamo la figura, funziona con lo stesso principio. Un
fronte d’onda cilindrico si sovrappone con il fronte d’onda riflesso da uno specchio di
materiale o dielettrico o metallico. Rispetto ai casi precedenti c’è da notare che per effetto della
riflessione la differenza di fase subisce una variazione di 1 243
576 895 : ; < = à di flusso diviene:

yaπ
I = 4 I 0 sin 2

81
Le frange dello specchio di Lloyd sono complementari a quelle dell’interferometro di Young;
ai massimi dell’uno corrispondono i minimi dell’altro. Ad y=0 si avrà una frangia scura
anziché chiara.

6.5 Interferometri a divisione di ampiezza

Supponiamo che un fascio di luce incida su di uno specchio semi-argentato o semplicemente


attraversi un foglio di vetro. Parte della luce è trasmessa e parte è riflessa. Sia l’onda trasmessa
che quella riflessa avranno un’ampiezza minore dell’onda originaria. Figurativamente si dice
che l’onda è stata divisa (in inglese “splitted”, da cui la parola Beam Splitter (BS) per riferirsi a
quella componente ottica che divide in due un fronte d’onda).
Se le due onde separate vengono sovrapposte nuovamente si ha il fenomeno
dell’interferenza (se la coerenza originaria delle due onde non si è nel frattempo distrutta).
Consideriamo pertanto il caso in cui la differenza di cammino ottico è minore della lunghezza
di coerenza.

6.5.1 Frange osservabili da una pellicola di materiale dielettrico

Effetti di interferenza si possono osservare guardando un foglio sottile di materiale trasparente.


Lo spessore del foglio può variare da alcuni nm a diversi centimetri. Un esempio di questo
fenomeno si ha guardando lo spettro di colori prodotti da un sottile strato d’olio o di sapone.

6.5.2 Frange di uguale inclinazione

Consideriamo il semplice caso di uno strato di vetro trasparente di spessore d investito da un


fascio di luce inclinato di un ang  i. Supponiamo per il momento che non vi sia
assorbimento della luce e che solo i primi due raggi riflessi E1r e E2r (che sono le ampiezze
della prima onda riflessa e della seconda onda che subisce la sola riflessione interna al vetro)
possano essere considerati (Fig. 6.7) ai fini della nostra analisi.

S
E1r
E2r

n1 D
A C
nf d
B

Fig. 6.7 Un film di materiale semitrasparente investito da un fascio di luce.

In pratica questa situazione è abbastanza realistica in quanto le riflessioni multiple vanno


rapidamente decrescendo di intensità. Sia S una sorgente di onde monocromatiche.
La pellicola trasparente lavora come un BS, cosicché E1r e E2r possono essere considerati
come provenienti da due sorgenti virtuali che si trovino dietro al vetro. I raggi riflessi sono

82
paralleli quando lasciano la pellicola e possono essere fatti incontrare usando una lente
convergente o semplicemente possono essere focalizzati sulla retina dall’occhio accomodato
per la visione all’infinito.
Dalla Fig. 6.7 si vede che la differenza di cammino ottico tra i due fasci è:

 ( ) ( )
Λ = n f  AB + BC  − n1 AD
 ( ) (6.24)

( ) ( )
ed essendo AB = BC = d / cosθ t si ha:

( )
2n f d
Λ= − n1 AD
cosθ t

( AD ) = ( AC )sin θ = ( AC ) n ( AC ) = 2d tan θ   


nf
Ora osserviamo che i sin θ t , dove t
1
diviene:
2n f d
Λ= (1 − sin 2 θ t ) = 2n f d cos θ t (6.25)
cos θ t

La corrispondente differenza di fase associata con questa differenza di cammino ottico è k0 Λ .


Se il mezzo in cui è immersa la pellicola è omogeneo si può scrivere n1 = n2 = n . Si osservi che
n può essere minore di nf , ad esempio in un film di sapone in aria, o maggiore di nf , come nel
caso dello strato di vetro. In ogni caso bisogna tenere conto di una differenza di

radianti che è dovuta alla riflessione stessa (lo studente che vuole approfondire questo punto
consulti il Cap. 4.6 di Hecht 1998). Pertanto:

δ = k0 Λ ± π
o più esplicitamente
4π n f 4π d 2
δ= d cos θ t ± π = (n f − n 2 sin 2 θ i )1/ 2 ± π (6.26)
λ0 λ0

Il segno della differenza di fase non è importante per cui scegliamo il segno        
di
 !semplificare
#" $% & ' un po’i conti. In luce riflessa si avrà un massimo di interferenza in P quando
è per multipli pari di ( ) * +,-. / 0 12 3 / 14 365 78) 97:<;- ò riscriversi:

λf
d cos θ t = (2m + 1) (6.27)
4

dove abbiamo posto λ f = λ0 / n f . In luce trasmessa questo corrisponde invece ad un minimo di


interferenza.
= >@? AB#CED F GHI Al
J K contrario i minimi inGluce
L M N#O P riflessa
QI P R KSR J(massimi
TPU in trasmessa) si ottengono per
è per multipli dispari di

λf
d cos θ t = 2m (6.28)
4

83
Si noti la presenza di multipli pari e dispari di λ f / 4 . Si ricordi che queste equazioni vanno
modificate nel caso in cui n1 > n f > n2 o se n1 < n f < n2
   
              
non è presente in questo caso.
Se la lente usata per mettere a fuoco i raggi riflessi dalla pellicola ha una piccola apertura, si
vedranno le frange solo su una piccola porzione di questa (solo i raggi che lasciando la
sorgente vengono riflessi nella lente saranno visibili). Per una sorgente estesa la luce
raggiungerà la lente da varie direzioni, e le frange si distribuiranno su una più vasta area di

pellicola. L’angolo i di incidenza, relativo alla posizione di P, controllerà di fatto    !"
che appaiono nel punto P1 (Fig. 6.8) vengono dette frange di uguale inclinazione.

sorgente estesa

lente

schermo

film

P1

Fig. 6.8 Frange di uguale inclinazione.

Tutti i raggi inclinati di uno stesso angolo arrivano nello stesso punto. Si ricordi però che un
punto di una sorgente estesa è incoerente rispetto ad un altro punto. E’ ogni singolo raggio che
diviso in due dal film produce l’interferenza. La medesima inclinazione garantisce l’arrivo
nello stesso punto. L’immagine della sorgente estesa riflessa nella superficie sarà attraversata
da frange chiare e scure. Ognuna di queste è un arco di circonferenza il cui centro è nel punto
di intersezione tra il film e la perpendicolare tracciata da P1 al film.
Quando lo spessore della pellicola cresce la separazione AC tra E1r e E2r cresce fino a che
uno dei due raggi non è più in grado di entrare nella lente (o nella pupilla dell’occhio) e le
frange spariscono. La separazione può anche essere ridotta cambiando i, guardando ad #
esempio il film con un angolo di incidenza prossimo alla normale. Si vedono in questo caso le
frange circolari (dette anche frange di Haidinger).

84
6.5.3 Frange di uguale spessore
  

Esiste
un’intera classe di frange di interferenza in cui il parametro dominante è n fd i
t) nella (6.26) e sono note come frange di uguale spessore. Esse derivano quindi da una
variazione di spessore del film. Le bande di interferenza di questo tipo sono simili alle isoipse
di una mappa topografica. Ogni frangia è il luogo di tutti i punti del film che hanno lo stesso
spessore (questo se nf non varia). Pertanto esse sono molto utili per testare la qualità delle
ottiche (lenti, prismi, etc.). Per esempio la superficie da esaminare può essere posta in contatto
con una superficie otticamente piatta (cioè che non devia più di             !
L’aria nello spazio tra le due superfici si comporta come una sottile pellicola generando le
frange di interferenza. Se la superficie da analizzare è anch’essa piatta, appariranno delle
frange rettilinee egualmente spaziate, come accade osservando uno strato d’aria a forma di
cuneo (il cuneo si forma perché microgranuli di polvere di diverse dimensioni sono disposti tra
le due superfici sovrapposte). Due vetri separati da una parte da un foglio di carta sottile
possono dare la medesima configurazione di frange (Fig.6.9).

occhio

E1r
E2r
sorgente
estesa

BS

foglio di
carta
=

Fig. 6.9 Frange che originano da uno strato sottile d’aria a forma di cuneo.

Osservate ad inclinazione quasi normale le frange originate da un film non uniforme vengono
d" # # "%$ & ' ()"+*,.-/, 0 " ' 132
4
" &51(76 1(" 8 9 8# # , : "+6 ;"%$ 8& <'%1(' ()8: 8 =>@? A%BC D D E F E GH A%BC.I A JKJKC GL
ottico tra i due raggi riflessi è approssimativamente data dalla (6.25), dove d è lo spessore in un
punto particolare, tale che:

d = xα

Per pC I I L? CMA ? LF CBCN i la condizione per avere massimi di interferenza diviene:

1
(m + )λ0 = 2n f d m = 2α xm n f (6.29)
2
Poiché n f = λ0 / λ f , xm si scriverà:

85
 m + 1/ 2 
xm =  λf (6.30)
 2α 

I massimi si hanno a distanze dal vertice del cuneo d’aria pari a λ f / 4α , 3λ f / 4α , ...e le frange

consecutive sono separate da una distanza , data da:

∆x = λ f / 2α (6.31)

Si noti che la differenza di spessore nel film d’aria tra due massimi consecutivi è λ f / 2 . Poiché
il raggio riflesso dalla superficie più bassa attraversa il film due volte ( i   t  
     
adiacenti differiscono in cammino ottico di λ f . Si noti inoltre che lo spessore del film nei vari
massimi è dato da:

 m + 1/ 2 
dm =  λf (6.32)
 2 

che è un multiplo dispari di un quarto di lunghezza d’onda. Si provi ad esempio a sovrapporre


due lastrine di vetro da microscopio, premendole l’una contro l’altra con una matita. Una serie
di bande colorate irregolari diverrà chiaramente visibile attraverso la superficie.
Se due vetri vengono pressati insieme in un unico punto, si formano i cosiddetti anelli di
Newton. Un modo per esaminare gli anelli di Newton è mostrato in Fig. 6.10.

occhio

BS
E2r E1r

Fig. 6.10 Un modo per osservare gli anelli di Newton.

Una lente è piazzata su una superficie otticamente piatta ed illuminata con luce quasi
monocromatica ad incidenza normale. L’uniformità degli anelli concentrici che si formano è
una misura del grado di perfezione della lente. Sia R il raggio di curvatura della lente. La
relazione tra la distanza x e lo spessore del film d’aria d è data da:

x 2 = R 2 − ( R − d )2 = 2 Rd − d 2

86
Essendo R>>d si ha che:
x 2 = 2 Rd

Assumiamo di poter esaminare solo i primi due raggi riflessi E1r e E2r . Il massimo di
interferenza di ordine m si avrà come per la pellicola sottile quando lo spessore è in accordo
con la relazione:
1
(m + )λ0 = 2n f d m f
2
Il raggio dell’m-esimo anello brillante sarà quindi:
1/ 2
 1 
xm =  m +  λ f R  (6.33)
 2 
e quello dell’m-esimo anello scuro:
xm = (mλ f R)1/ 2 (6.34)

Se i due vetri sono perfettamente a contatto nel punto centrale (x0=0) vi sarà lì un minimo di
interferenza (d tende a zero). In luce trasmessa avremo invece un massimo.
Gli anelli di Newton (che sono frange di Fizeau) si possono distinguere dalle frange
circolari di Haidinger per il modo in cui il diametro dell’anello varia con l’ordine m. Nel
centro degli anelli di Haidinger si ha ad esempio un massimo. Un altro modo per testare la
qualità delle ottiche fa uso delle tecniche interferometriche (vedi prossimi paragrafi).

6.6 L’interferometro di Michelson

Un certo numero di interferometri a divisione di ampiezza fa uso di specchi e di BS. Per


ragioni storiche il più importante di questi è l’interferometro di Michelson. La sua
configurazione è mostrata in Fig. 6.11.

M2

BE BS

S M1

detector

Fig. 6.11 L’interferometro di Michelson. M1 ed M2 sono specchi; BS=Beam Splitter; BE=Beam Expander

87
Una sorgente S emette luce che viene collimata da una lente BE su di un BS. Il fascio è diviso
in due parti; entrambi i fasci vengono riflessi dai due specchi M1 ed M2, e ripassando per il BS,
si rifondono dando luogo alle frange di interferenza. Eventualmente queste possono essere fatte
convergere da una lente su di un detector.
Poiché il BS ha la parte semi-argentata riflettente su di una faccia (la parte scura in figura)
il raggio che va verso M2 passa tre volte per il BS, mentre quello per M1, una sola volta.
Conseguentemente i due raggi percorrono un diverso cammino ottico e quando si incontrano
nuovamente danno luogo alle frange di interferenza (se il cammino ottico è minore della
lunghezza di coerenza della sorgente). Se si usa luce non laser occorre inserire una lastra di
vetro compensatrice nel ramo OM1 per poter vedere le frange. Con luce laser invece i due
specchi possono essere anche a distanze diverse dal BS, che le frange continuano a vedersi.
Una delle esperienze del corso consiste nella misura del contrasto delle frange in funzione della
mutua distanza degli specchi. Tramite queste misure è possibile ricavare la lunghezza di
coerenza della sorgente laser (vedi dispense di laboratorio).
  Si
rifletta
 che
  data
  la dispersione
       della
  
luce
  nel BS il cammino ottico sarà una funzione di
ù possibile monocromatiche.
Per comprendere come le frange si formino si osservi la Fig. 6.12.

M2 M’1 S2 S1
S
X
MQ WY Z
O’ Z
detector

2d
[ [ [
d 2 1

Fig. 6.12 Schema concettuale dell’interferometro di Michelson in cui non consideriamo la lente collimatrice.

Un osservatore nella posizione del detector vedrà simultaneamente entrambi gli specchi M1 ed
M2 insieme alla sorgente   !"$#%'& (
& )  *+ (,.- ,/0& 21& *$#43# 5 62 7 & 
8  9 :  9 ,/ 8 9 ,2; (
& + /,
che M’1 corrisponde all’immagine dello specchio M1 nel BS. La posizione di questi elementi
nel diagramma dipende dalla loro posizione relativa rispetto al BS (ad esempio M’1 può essere
davanti, dietro o coincidente con M2< #=>) ?@  9 : & - &'A 1 BA 2 sono le immagini della sorgente
negli specchi M1 ed M2 rispettivamente.
Consideriamo ora un singolo punto di una sorgente estesa che emette luce in tutte le
direzioni, e seguiamo un singolo raggio che in un punto O incontra il BS e si separa in due. I
due raggi vengono riflessi quindi da M1 ed M2. Per un osservatore posto nel detector i due
raggi riflessi sembrano provenire da due sorgenti separate S1 ed S2, che si comportano come
due sorgenti coerenti.
Come mostra la figura la differenza di cammino è 2dcosC , che rappresenta una differenza
di fase di k0DEF GH I . C’è inoltre un’ulteriore differenza di fase di JBK L M
N L O
P N4Q RSMS K N TLML UV L P P W
che il raggio che passa per il ramo OM2 subisce una riflessione interna nel BS.
Per questo motivo risulta un’interferenza distruttiva quando:

2d cosθ m = mλ0 (6.35)

88
dove m è un intero. Se questa condizione è soddisfatta per il punto S, allora sarà
  
     

  
           olo di raggio O’S, dove O’ è
localizzato sull’asse del detector. Un osservatore vedrà con il proprio occhio un sistema di
frange circolari concentriche. A causa della piccola apertura dell’occhio l’osservatore non potrà
però vedere le frange a meno di non utilizzare una lente convergente, come in Fig.6.12.
Se usiamo come sorgente una lampada che contiene un gran numero di frequenze (ad
esempio una lampada al mercurio), la dipendenza di  m  0 richiede che ogni componente
formi il proprio sistema di frange.
In generale se si vuole utilizzare una sorgente che non sia un laser, la differenza di
cammino ottico deve essere prossima a zero se si vuole osservare le frange.
In luce laser quasi monocromatica le frange appaiono come un sistema di anelli chiari e
scuri. Ogni anello corrisponde ad un dato ordine m. Movendo M2 verso M’1, d decresce e per
la (6.35) cos ! m cresce (mentre ! m decresce). Gli anelli si addensano verso il centro e gli ordini
più alti spariscono via via ogni qualvolta d "# $ % # & $ # " ')( 0/2. Gli anelli rimanenti si allargano
man mano fino a riempire l’intero schermo. Quando si raggiunge d=0 la frangia centrale
* + , -/.+ ,/0 10 0 23 24 5 6, * -2879:4 4 , ;<25 +83 =< + > > , * , ; ? =< +8> = 4 ,< +A@+ ; 0 * 2< otta dalla riflessione interna
al BS, l’intero schermo apparirà scuro (ma la mancanza di perfezione negli elementi ottici può
rendere questa situazione inosservabile). Movendo ancora M2 le frange riappaiono e sembrano
allontanarsi dal centro dello schermo.
La costruzione di Fig. 6.12 rappresenta una sola delle possibili configurazioni, quella in cui
i raggi emergenti sono coppie parallele. Poiché questi raggi non si incontrano, essi non possono
formare un’immagine senza l’ausilio di una lente (che molto spesso è proprio il nostro occhio
accomodato per la visione all’infinito). Le frange risultanti sono quelle di uguale inclinazione.
Oltre a queste frange virtuali all’infinito vi sono anche frange reali formate da raggi
convergenti. Si pensi infatti alla Fig. 6.1. A tutti gli effetti S1 e S2 sono due sorgenti coerenti
separate nello spazio. Queste frange appaiono nello spazio davanti all’interferometro, dove si
pone generalmente il detector.
Quando gli specchi dell’interferometro sono inclinati l’uno rispetto all’altro, facendo un
piccolo angolo (cioè quando M1 e M2 non sono perpendicolari), si formano le frange di uguale
spessore o di Fizeau. Tra M2 ed M’1 si forma un sottile strato d’aria a forma di cuneo che crea
il sistema di frange parallele e rettilinee. I raggi che interferiscono appaiono divergere da un
punto dietro agli specchi e l’occhio deve mettersi a fuoco su questo punto per rendere le frange
localizzate osservabili. Movendo opportunamente l’orientazione dei due specchi si possono
realizzare frange rettilinee, circolari, ellittiche, paraboliche o iperboliche, e questo vale sia per
le frange reali che virtuali.
L’interferometro di Michelson può essere usato per fare misure molto precise di
spostamento (o di lunghezza d’onda della luce). Infatti quand23 2B4 ., 5 5 6 + 2B4 +C-/12D,< +CE 0/2,
ogni frangia si muove nella posizione precedentemente occupata dall’altra. Potendo contare il
numero di frange che si spostano si risale allo spostamento tramite l’equazione:

∆d = N (λ0 / 2 )

L’interferometro di Michelson può essere usato insieme a dei filtri polarizzatori per verifica le
leggi di Fresnel-Arago. Inserendo i polarizzatori nei due rami si possono infatti vedere i
cambiamenti prodotti nelle frange dalla variazione dell’angolo di polarizzazione.

89
6.7 Altri interferometri

L’interferometro di Mach-Zender è un altro tipo di interferometro a divisione di ampiezza.


Esso consiste di due specchi e di due BS (fig. 6.13).

detector

BE

S
specchio
BS

Fig. 6.13 L’interferometro di Mach-Zender

Le due onde all’interno dell’apparato viaggiano su due percorsi separati. Una differenza di
cammino ottico può essere introdotta da un leggero “tilt” di uno dei BS. Essendo separati i due
percorsi, l’interferometro è un po’ difficile da allineare. Le sue applicazioni sono comunque
innumerevoli. Generalmente lungo uno dei due percorsi viene interposto un oggetto (che può
essere un vetro, un’ampolla con del gas, un tubo con del plasma, etc.) che produce una
differenza di cammino ottico.
Un altro tipo di interferometro molto usato è quello di Sagnac (Fig. 6.14). Esso è molto
facile da allineare ed è piuttosto stabile. Tra le sue applicazioni abbiamo anche l’uso come
giroscopio. Ne esistono versioni a tre specchi, come in figura, o anche a due soli specchi.
La principale caratteristica è che ci sono due percorsi identici ma opposti per i due rami
dell’interferometro. Un leggero spostamento nell’orientazione dei due specchi produce le
frange di interferenza. Poiché i due rami sono sovrapposti e quindi inseparabili,
l’interferometro non può essere utilizzato in modo convenzionale.

6.7.1 Frange reali

Prima di parlare più in dettaglio delle frange reali e virtuali, consideriamo un altro tipo di
interferometro, detto interferometro di Pohl. Si tratta semplicemente di uno strato di materiale
trasparente illuminato da una sorgente puntiforme. In questo caso le frange sono reali e
possono quindi essere intercettate da uno schermo posto nelle vicinanze del detector, senza
bisogno di una lente convergente.

90
BE

S
specchio
BS

detector

Fig. 6.14 L’interferometro di Sagnac

Il principio fisico che soggiace a tutti i tipi di interferometro considerati per sorgenti
puntiformi, può essere facilmente apprezzato per mezzo della Fig. 6.15 a) e b).

a) b)
P
P

S2

S2
S1 S S1 S
2d d

Fig. 6.15 Illuminazione da parte di una sorgente puntiforme di due superfici parallele a) e di due superfici
inclinate b).

Le due superfici parallele o inclinate rappresentano le configurazioni in cui possono trovarsi gli
specchi o anche il materiale trasparente dell’interferometro di Pohl.
Assumiamo che P sia un punto dove si ha interferenza costruttiva. Uno schermo piazzato
in questo punto intercetterà un massimo di interferenza, insieme al resto del sistema delle
frange, senza bisogno di una lente che converga i raggi. S1 ed S2 sono le due sorgenti virtuali
coerenti che danno luogo all’interferenza (e sono le immagine sugli specchi della sorgente S).
Sia l’interferometro di Michelson e di Sagnac hanno questo tipo di frange.

91
6.7.2 Tipo e localizzazione delle frange

Spesso è importante sapere dove si localizzano le frange prodotte da un dato interferometro,


poiché è in quella regione che occorre focalizzare il nostro detector (l’occhio, la telecamera, il
CCD). In generale il problema di localizzare le frange è caratteristico di ogni interferometro e
deve essere risolto caso per caso.
Le frange possono essere classificate in primo luogo come reali o virtuali, e
secondariamente come localizzate o non localizzate. Le frange reali sono quelle che possono
essere viste su uno schermo senza bisogno di una lente (o di altro apparecchio che faccia
convergere i raggi). I raggi convergono da soli nel punto di osservazione. Le frange virtuali
non possono essere proiettate su uno schermo senza un sistema di focalizzazione, e quindi i
raggi non convergono.
Le frange non localizzate sono reali ed esistono in ogni punto dello spazio tridimensionale.
Ad esempio nell’esperimento di Young le frange sono ovunque nello spazio dopo le due
fenditure. Generalmente sono prodotte da sorgenti quasi puntiformi siano esse reali o virtuali.
Al contrario le frange localizzate sono osservabili sono in una data regione di spazio, su di
una particolare superficie. Esse sono fisicamente localizzate su uno schermo o all’infinito.
Questo tipo di frange origina sempre da sorgenti estese, ma può essere prodotto anche da
sorgenti puntiformi.
L’interferometro di Pohl è utile per illustrare i suddetti principi, poiché con una sorgente
puntiforme esso produce sia frange reali non localizzate che frange virtuali localizzate. Queste
sono localizzate all’infinito e possono essere viste dall’occhio accomodato per la visione
appunto all’infinito, e sono frange di uguale inclinazione. Allo stesso modo se gli specchi M1
ed M2 dell’interferometro di Michelson sono paralleli si vedranno le frange virtuali di uguale
inclinazione localizzate all’infinito. Possiamo immaginare un ipotetico strato sottile d’aria tra
le superfici degli specchi M2 ed M’1 che producano queste frange. Ma come per
l’interferometro di Pohl si produrranno anche frange non localizzate reali.
La geometria del tipo ti frange osservabili in funzione della direzione della luce incidente
per uno strato sottile a forma di cuneo è mostrata in Fig. 6.16.

Regione di
localizzazione delle
frange reali
S

Regione di
localizzazione delle
P frange virtuali

Fig. 6.16 Frange formate da un sottile cuneo d’aria

92
6.8 Interferenza multipla

Fino ad ora abbiamo esaminato le situazioni in cui due soli raggi coerenti si combinano per dar
luogo all’interferenza. Esistono comunque circostanze in cui un numero molto maggiore di
onde mutuamente coerenti si combinano per interferire. Occorre cioè considerare le altre onde
riflesse E3r , E 4r ,... Una lastra di vetro leggermente argentata da entrambe le parti per renderla
altamente riflettente, genererà un gran numero di riflessioni interne. Consideriamo ora solo il
caso in cui la pellicola ed il substrato siano di materiale dielettrico, in modo da evitare
variazione di fase più complicate dovute alle superfici metalliche.
Indichiamo con r e t rispettivamente i coefficienti di riflessione e trasmissione quando il
raggio passa dall’aria al vetro e con r’ e t’ quando il raggio passa dal vetro all’aria. In Fig. 6.17
vediamo come si comportano le ampiezze dei vari raggi riflessi e trasmessi.

E0

E0t

E0tr’
E0tr’ 2 E0r
E0tr’ 3

E0tt’ E0tr’ 4 E0tr’t’

E0tr’ 5 E0tr’ 3t’


E0tt’r’ 2

E0tt’r’ 4 E0tr’ 5t’

Fig. 6.17 Interferenza multipla da una pellicola sottile trasparente a piani paralleli

Le ampiezze scalari delle onde riflesse e trasmesse sono indicate in figura. Consideriamo prima
l’insieme dei raggi paralleli riflessi. Le differenze di fase derivano da una combinazione di
differenti cammini ottici e variazioni di fase introdotte dalle varie riflessioni. Tuttavia le onde
sono mutuamente coerenti e se sono focalizzate da una lente produrranno interferenza. La
densità di flusso risultante ha una forma semplice in due casi particolari. In primo luogo
ricordiamo che la differenza di cammino ottico tra due raggi adiacenti è:

Λ = 2n f d cosθ t (6.36)

Si noti allora che tutte le onde, eccetto la prima (E1r), hanno un numero dispari di riflessioni
    

   

interne alla pellicola. Ne segue che ad ogni riflessione interna la componente del campo
elettrico parallela al piano di incidenza cambia fase (di 0 o

93
incidenza), mentre la componente perpendicolare non ha variazioni. Chiaramente allora tutte le
onde dopo la prima avranno la stessa fase essendoci un numero dispari di riflessioni interne.
Come primo caso particolare consideriamo allora il caso in cui Λ = mλ . La seconda, la terza,
la quarta e le successive onde saranno tutte in fase in P (punto di convergenza della lente che
focalizza i raggi paralleli uscenti dalla pellicola). L’onda E1r invece è fuori fase di      

tutte le altre onde. L’ampiezza totale risultante nel punto P sarà allora:

E0 r = E0 r − ( E0trt '+ E0tr 3t '+ E0tr 5t + ' =...)


E0 r − E0trt + r' 2(1+ r 4 + ...)


dove poiché Λ = mλ abbiamo rimpiazzato r’ con r. La serie geometrica in parentesi converge
a 1/(1 − r 2 ) per r2<1, per cui:

E0trt '
E0 r = E0 r − (6.37)
(1 − r 2 )

essendo tt ' = − 1 r 2 (vedi leggi di Stokes), ne segue che E0r = 0. Pertanto quando Λ = mλ le onde
riflesse n. 2, 3, 4 e successive cancellano esattamente la prima onda riflessa dando come
risultato un minimo di interferenza.
1
Il secondo caso speciale si ha per Λ = (m + )λ . Adesso il primo e il secondo raggio sono
in fase e tutti gli altri sono fu  
     
2
è il secondo è fuori fase con il terzo, il terzo con
il quarto, e così via. L’ampiezza scalare risultante è allora:

E0 r = E0 r + E0trt '− E0tr 3t +' E0tr 5t − ' = E


...0 r + E0trt − r' 2(1
+ r4 − ...)

La serie in parentesi converge a 1/(1 + r 2 ) , pertanto:

 tt '  r2
E0 r = E0 r 1 + 2 
= E0 (6.38)
 (1 + r )  (1 + r )
2

Essendo la densità di flusso proporzionale a E0r2/2 si ha che:

4r 2  E02 
Ir =   (6.39)
(1 + r 2 )2  2 

che, si può dimostrare, è anche il massimo Ir(max).


Facendo una trattazione più generale, per cui si rimanda alla bibliografia, la densità di
flusso riflessa e trasmessa sono:

2r 2 (1 − cos δ )
I r = Ii
(1 + r 4 ) − 2r 2 cos δ
(6.40)
(tt ' 2)
=
It Ii
(1 + r 4 ) − 2r 2 cos δ

Usando l’identità trigonometrica cos δ = 1 − 2sin 2 (δ / 2) la (6.40) diviene:

94
[2r /(1 − r 2 )]2 sin 2 (δ / 2)
I r = Ii
1 + [2r /(1 − r 2 )]2 sin 2 (δ / 2)
(6.41)
1
It = Ii
1 + [2r /(1 − r )] sin 2 (δ / 2)
2 2

dove l’energia non è assorbita, cioè tt’+ r2 = 1 e Ii = It + Ir. Questo non sarà vero se lo strato
che copre la pellicola è di materiale non dielettrico, come nel caso di un metallo semi-
trasparente.  

Consideriamo ora l’onda trasmessa. Un massimo per It si ha quando è (It)max=Ii.


Sotto questa condizione si ha che (I ) =0. Al contrario un minimo per la densità di flusso
            ! " ) r=Imin[(1# 2)/(1+r2)]2, (I ) =I [4r2/(1+r2)2].
t min i r & ' ' ( 
r max i
& ,-    
Si noti che le frange di uguale inclinazione hanno il l$% $ $ )+* $ . $

4π n f
d cos θ t = (2m + 1)π
λ0

che è lo stesso risultato raggiunto prima. Introducendo il coefficiente di finezza F dato da

2
 2r 
F ≡ 2 
(6.42)
 1− r 

le (6.41) si possono riscrivere:

Ir F sin 2 (δ / 2)
=
Ii 1 + F sin 2 (δ / 2)
(6.43)
It 1
=
Ii 1 + F sin 2 (δ / 2)

Il termine al denominatore delle (6.43) è noto come funzione di Airy; esso rappresenta la
densità di flusso trasmessa.

95
7 CAPITOLO 7
7.1 La diffrazione

La diffrazione è un fenomeno caratteristico della propagazione ondulatoria di una


perturbazione che si manifesta ogni qual volta un fronte d’onda, sia sonoro che luminoso o
anche di un’onda materiale, incontra nel suo percorso un ostacolo. In conseguenza di
quest’incontro con un ostacolo, sia esso trasparente od opaco, una regione del fronte d’onda è
alterata nella sua ampiezza o fase. Il nuovo fronte d’onda che si propaga oltre l’ostacolo può
essere pensato in termini di onde sferiche secondarie che interferiscono tra loro. Pertanto non
c’è una distinzione fisica tra interferenza e diffrazione. E’ uso comune parlare di interferenza
quando si considera la sovrapposizione di solo poche onde, mentre di diffrazione quando si
considera un gran numero di onde. Anche con questa distinzione, si parla di interferenza
multipla in certi contesti e di diffrazione da un reticolo in altri.

7.1.1 Il principio di Huygens-Fresnel

Il principio di Huygens consiste appunto nel pensare ogni punto di un fronte d’onda come
sorgente secondaria di onde sferiche. L’inviluppo dei fronti d’onda sferici ad un dato tempo t
costituisce il nuovo fronte d’onda. La tecnica escogitata considera però soltanto alcuni fronti
d’onda secondari, e per questo motivo non è in grado di dar spiegazione a tutte le


caratteristiche
 
   dell’immagine
   ! " " ottenuta
# $% per
"   diffrazione.
& ' )(* & +( Ad
  ,-esempio
 & $( &" ( le& ( . onde
,(sonore
" / ,)( ("  (& &  (
non passa e si forma l’ombra. Poiché il principio di Huygens risulta indipendente da ogni
considerazione sulla lunghezza d’onda, con esso si può prevedere un fronte d’onda uguale per
le due perturbazioni, sia sonora che luminosa.
La difficoltà di questa impostazione fu risolta da Fresnel aggiungendo il concetto di
interferenza. Il principio di Huygens-Fresnel afferma quindi che ogni punto non oscurato di un
fronte d’onda, ad un dato istante, è una sorgente di onde sferiche secondarie (con la stessa
frequenza dell’onda primaria). L’ampiezza della nuova perturbazione in ogni punto è quindi
data dalla sovrapposizione di tutte le onde secondarie (tenendo conto della loro ampiezza e
della01*
fase
2 3*2 relativa).
45671 8 8 3!9%: ;593 <#=> ? ? @*A> B C DB E@ F G HI>
è grande rispetto all’apertura h, si avrà che
l’effetto della perturbazione sarà avvertito anche a grandi angoli rispetto alla direzione
originaria (vedi Fig. 7.1).

a) b)

raggio
luminoso

J K L M N M OQP RS%P T UWV X Y Y Z U [ [ K \ P]L X U ^_X [ ` K \ P a bb h. Il raggio luminoso prosegue indisturbato il suo cammino; b) Caso
c d e e f'c g h h i f j g k l dm n h. Il raggio viene sparpagliato a vari angoli rispetto alla direzione rettilinea.

97
Il caso limite dell’ottica geometrica si ha quindi per λ → 0 .
Il principio di Huygens-Fresnel ha alcuni problemi, che esamineremo più avanti, oltre ad
essere fino a questo punto piuttosto ipotetico, per cui anticipiamo che una trattazione più
rigorosa di questo problema è stata sviluppata da Kirchhoff, che è anch’essa 
un’approssimazione valida quando le dimensione della fenditura sono grandi rispetto a
difficoltà vengono dal fatto che si cercano le soluzioni di un’equazione differenziale alle
derivate parziali le cui condizioni al contorno sono imposte dal tipo di ostacolo. La soluzione
rigorosa si ottiene perciò solo in alcuni casi speciali. E’ bene sottolineare che il problema di
determinare la soluzione esatta di un particolare fenomeno di diffrazione è tra i problemi più
difficili dell’ottica fisica. Soluzioni rigorose non esistono a tutt’oggi in molte situazioni anche
di interesse pratico. In ogni caso il semplice metodo di Huygens-Fresnel ci sarà utile per
risolvere molte situazioni di carattere sperimentale.

7.1.2 Ostacoli opachi

La diffrazione può essere pensata come dovuta all’interazione delle onde elettromagnetiche
con un ostacolo fisico. E’ utile a questo proposito riesaminare cosa realmente accade quando
ad esempio l’ostacolo è un oggetto opaco.
Una possibile descrizione è quella di uno schermo considerato come un continuo, cioè in
cui la sua struttura microscopica può essere trascurata. Per un metallo non assorbente (con
conduttività infinita) possiamo scrivere le equazioni di Maxwell per il metallo ed il mezzo
circostante e far combaciare i due al confine tra i due mezzi. Soluzioni precise si possono
ricavare per configurazioni molto semplici.
Esaminando lo schermo su scala microscopica immaginiamo la nuvola elettronica intorno
ad ogni atomo messa in vibrazione dal campo elettrico della radiazione incidente. Il modello
classico degli oscillatori armonici va abbastanza bene per ciò che concerne il nostro problema,
cosicché possiamo trascurare la descrizione quanto-meccanica. L’ampiezza e la fase di un dato
oscillatore all’interno dello schermo sono determinate dal campo elettrico totale attorno ad
esso. Questo è dovuto alla sovrapposizione della radiazione incidente e al campo prodotto da
tutti gli altri oscillatori in vibrazione.
Un grande schermo opaco senza aperture, sia esso un foglio di carta nero o uno strato di
alluminio, ha un immediato effetto sulla radiazione incidente: dopo di esso il campo
elettromagnetico è nullo. Gli elettroni vicini alla superficie illuminata sono posti in
oscillazione dalla radiazione incidente. Essi a loro volta riemettono radiazione (della stessa
frequenza), che in ultima analisi è riflessa indietro, assorbita o entrambe le cose. Se l’onda
incidente si propaga anche all’interno del materiale si eccitano via via strati sempre maggiori di
oscillatori, e se lo schermo è spesso abbastanza l’onda si affievolisce fino a scomparire. Ma
anche un materiale ordinario se è sufficientemente sottile diviene trasparente alla radiazione.
Adesso rimuoviamo un piccolo dischetto di materiale dallo schermo, cosicché la luce passi
attraverso l’apertura. Gli oscillatori che uniformemente ricoprono il dischetto sono rimossi con
esso, così i rimanenti elettroni dello schermo non sono più affetti da quest’ultimi. In prima
approssimazione possiamo assumere che la mutua interazione degli oscillatori è
completamente trascurabile, per cui gli elettroni dello schermo sono completamente
indifferenti alla rimozione degli elettroni del dischetto. Il campo nella regione oltre l’apertura
sarà allora quello che esisteva prima della rimozione del dischetto, cioè zero, meno il
contributo del dischetto stesso. A parte il segno, è come se la sorgente e lo schermo fossero
stati rimossi lasciando solo gli oscillatori del dischetto, piuttosto che viceversa. In altre parole
il campo di diffrazione può essere pensato come dovuto esclusivamente da un insieme di

98
ipotetici oscillatori armonici distribuiti sulla regione dell’apertura. Da qui naturalmente
l’analogia con il principio di Huygens-Fresnel.
Possiamo aspettarci comunque, che l’interazione tra gli oscillatori non sia del tutto nulla,
ma che vada via via scemando con la distanza. In questa visione più realistica gli oscillatori in
prossimità dell’apertura saranno affetti dalla rimozione del dischetto. Per aperture grandi, il
numero di oscillatori rimossi è molto più grande del numero di oscillatori ai confini
dell’apertura. In questo caso, se il punto di osservazione è abbastanza lontano dall’apertura, il
principio di Huygens-Fresnel è in grado di predire un corretto andamento del campo. Se invece
l’apertura è piccola, o il punto di osservazione è prossimo all’apertura stessa, gli effetti al
bordo diverranno importanti e possiamo aspettarci delle deviazioni dall’andamento previsto
dalla semplice applicazione del principio di Huygens-Fresnel.

7.2 Diffrazione di Fresnel e di Fraunhofer


     
    
    

 
  !   "  # $ % $ ! " " &!  % '
( )+*,-. /0 12 , 3 2 465/7 3 /6( ) . 3 - , 3 2 8:9 0 2 ,( ) - 5/ *,/;. < =2 0 5/6( )+/:. . 2 0 >- ? ) /,2 @6AB C B DaD E onde
D F6EGpiane
FD H F
I J K J L FMBON PRQ S;T UV W X VY ZS[ \ ] \ ZS \_^ ` \ aab c\ SV[V ^ ^ ` b dV e X Ue b è chiaramente visibile sullo schermo
sebbene leggermente circondata da delle deboli sottili frange. Se il piano di osservazione viene
allontanato un po’, l’immagine dell’apertura si vede ancora ma diviene via via più strutturata e
le frange divengono prominenti. Questo fenomeno è noto come diffrazione di Fresnel. Se il
f g hi j g hk l m npok q q kOr s g l tk uRvwts g loko j x m g l y gogOz{q kOr s g l tk x j|x nln;lnm k }nq hk l m kg q q g s tg m kk
piano di osservazione viene mosso lentamente ancora più lontano si osserva un continuo

non si vede più l’immagine dell’apertura. Muovendo ancora più lontano cambia solo la
dimensione della figura di diffrazione ma non la sua forma. Questo fenomeno è noto come
diffrazione di Fraunhofer. Se a questo punto potessimo cambiare la lunghezza d’onda della
radiazione e farla tendere progressivamente a zero, si rivedrebbe la configurazione di Fresnel,
le frange andrebbero via via sparendo e si tornerebbe a vedere l’immagine della fenditura così
|~  € ‚ ƒ„ ƒ…„ † † „ˆ‡ ƒ ‰  Š‹‚ „ Œ  ƒŽ ƒ  Œ  „ †  Ž† „ ‚ Š ƒ € Ž   ƒˆ„    ‡  ƒ„ € „ˆ„Ž‘ ’“ ”:• – — – ˜ ˜™š› œ œ ›
come predetto dall’ottica geometrica.
™˜š›•  › — ” ž Ÿ›ˆž Ÿ›ˆ– — — ” “– ˜™O•  œ œ ™O• ž Ÿ› — ¡™¢ £¤¥ ¦§ ¨© ª¤ © ¤ « «¤Ž¬ ­ˆ® ¦ § § © ­ ¯ ¦ ¨°¤ˆ® ¦±:© ¤ ¥ °¤ ¬­ °² ³¤ˆ­
´ © ­ °®¤ˆ® ¦ ¥ µ ­ ° ¯ ­ˆ® ¦¶R·¸¤¸¤Ž¦ ¬¹º° µ ¨® ¦¨:¥ ¥ ¤ © »­ ¯ ¦ ¨°¤Ž¼6¥ ¨°¨¤ ° µ © ­ ª« ¦¬ ¨° µ ­ ° ¦®­Ž½+£:¥ ¦³­¥ ¤ ª¹© ¤
la diffrazione di Fraunhofer. In sostanza se le onde che arrivano sullo schermo sono piane e
quelle che arrivano in P sono pure piane, si ha sempre la diffrazione di Fraunhofer. Se invece la
curvatura di entrambi i fronti d’onda è significativa prevale la diffrazione di Fresnel.
Ogni punto dell’apertura deve essere pensato come sorgente secondaria di onde sferiche.
Pertanto quando S è vicina all’apertura su di essa arrivano onde sferiche e quindi su ogni punto
l’onda incidente avrà intensità leggermente diversa, mentre se il fronte d’onda è piano, su ogni
punto arrivano onde con la stessa intensità. Più o meno la stessa cosa accade per le onde che
vanno dall’apertura al punto P. Anche se ogni punto dell’apertura emette onde della stessa
ampiezza, se P è vicino le onde che convergeranno su di esso sono sferiche e varieranno
pertanto in ampiezza per la diversa distanza di ogni punto dell’apertura da P. Si comprende
quindi la maggior semplicità della diffrazione di Fraunhofer. Come regola pratica, si ha
diffrazione di Fraunhofer su di un apertura a, quando

R > a2 / λ

dove R è la più picc¾¿ ÀˆÁ ¿ ¿ ˆÁ Ã Ä Å À Æ Ç ÂŽÅ È ÀÉŽÊ+ËÂŽÅ È ÀŽÊ ̎Í_Î ÏÐ Ñ ÒÓ Ð Ô ÕÌ Ö Ñ Ìˆ× ÒÐ ÖØÙ R=ÚÜÛ Ý
dimensioni finite dell’apertura è di poca importanza. Inoltre una crescita di Þß à áâã ä å æ çŽä è
fenomeno della diffrazione di Fraunhofer.

99
Una
   
realizzazione
   pratica
  
 della
  diffrazione
   !"di#!Fraunhofer
$&%(' )  * sipuò
+ realizzare ponendo una
è localizzata nel fuoco della
lente L1, e il piano di osservazione è collocato nel fuoco della lente L2.

L1 L2
8 7

Fig. 7.2 Un modo pratico per realizzare la diffrazione di Fraunhofer.


,  - - %*  )  -  % . - - / * *   %   * )   %(' .    0 -1 % 2. - - %(' )  *   34' 2  5% * 

7.2.1 Diversi oscillatori coerenti

Come ponte logico tra lo studio dell’interferenza e della diffrazione consideriamo un insieme
di N oscillatori armonici disposti lungo una retta come in Fig. 7.3 (si pensi ad un sistema di
antenne).
r1

r2

r3
6

r...

rN

Fig. 7.3 Un insieme allineato di N oscillatori coerenti in fase.

100
Gli oscillatori sono tutti identici anche nella loro polarizzazione. Per il momento assumiamo
che gli oscillatori non abbiano una differenza intrinseca di fase, cioè i fasori hanno tutti lo
stesso angolo di fase iniziale. I raggi mostrati in figura sono tutti tra loro quasi paralleli e si
incontrano in un punto P molto distante. Se la dimensione dell’insieme di oscillatori è piccola,
l’ampiezza delle onde che arrivano separatamente in P sarà essenzialmente uguale, avendo
percorso circa la medesima distanza, cioè,

E0 (r1 ) = E0 (r2 ) = ... = E0 (rN ) = E0 (r )

La somma delle onde sferiche che interferiscono per dare il campo elettrico risultante in P, è
dato dalla parte reale della:

E = E0 (r )ei ( kr1 −ωt ) + E0 (r )ei ( kr2 −ωt ) + ... + E0 (r )ei ( krN −ω t ) (7.1)

dove abbiamo usato la notazione esponenziale anziché quella trigonometrica per comodità di
calcolo. E’ chiaro che in questo caso non dobbiamo preoccuparci della natura vettoriale della
luce per cui possiamo scrivere la (7.1) nella forma:

E = E0 (r )e −iωt eikr1 [1 + eik ( r2 − r1 ) + eik ( r3 −r1 ) + ... + eik ( rN − r1 ) ] (7.2)

La differenza di fase tra sorgenti adiacenti è ottenuta dall’espressione δ = k0 Λ dove


Λ = nd sin θ e n=1 è l’indice di rifrazione dell’aria. Osservando la Fig.7.3 si vede che
δ = k (r2 − r1 ), 2δ = k (r3 − r1 )... e così via. Perciò il campo in P può essere scritto:

E = E0 (r )e −iωt eikr1 [1 + (eiδ ) + (eiδ )2 + ... + (eiδ ) N −1 ] (7.3)

La serie geometrica in parentesi quadra ha il valore

(eiδ N − 1) /(eiδ − 1)

che può essere riscritto nella forma

eiNδ / 2 [eiNδ / 2 − e − iNδ / 2 ] i ( N −1)δ / 2  sin N δ / 2 


=e  sin / 2  (7.4)
eiδ / 2 [eiδ / 2 − e −iδ / 2 ]  δ 

per cui il campo diviene:

 sin N δ / 2 
E = E0 (r )e −iωt ei[ kr1 + ( N −1)δ / 2]   (7.5)
 sin δ / 2 

Si noti che se definiamo R come la distanza dal centro dell’insieme lineare di oscillatori ed il
punto P, cioè

1
R = ( N − 1)d sin θ + r1
2

101
l’eq. (7.5) diviene:
−ω t )  sin N δ / 2 
E = E0 (r )ei ( kR   (7.6)
 sin δ / 2 

Infine allora, la densità di flusso all’interno della figura di diffrazione di N sorgenti identiche
coerenti è data da EE * / 2 per E complessa, da cui:

sin 2 ( N δ / 2)
I = I0 (7.7)
sin 2 (δ / 2)

dove I0 è la densità di flusso  di ogni singola sorgente che arriva in P. Per N=0, I=0, per N=1,
2   
 

I=I0, e per N=2, I=4I0cos  à visto precedentemente.
La dipendenza funzionale di I  è più chiara mettendo la (7.7) nella forma:

sin 2 [ N (kd / 2) sin θ ]


I = I0 (7.8)
sin 2 [(kd / 2) sin θ ]

Il termine al numeratore varia rapidamente, mentre il termine al denominatore modula perché


varia

lentamente.
  
      L’espressione
 
  
  combinata
      dà
luogo
 ad
! una
   serie
 di  massimi
  # $&%piccati
' ( )*+separati
,-/.021)da
 0 4 56 7 8 9  m"
±1, ±2, .... Poiché 3 si ha:
d sin θ m = mλ (7.9)

e nel massimo si ha I = N 2 I 0 . Il sistema ha il massimo irraggiamento nella direzione


:; < :; =>? @ AB C < ;C DB ?AE @ ? B B C F A< ?G HI2JK L
0M2N O P Q R STU V W X U W V W YZ[\ ] ^_ ` a _ b ` __ ^cdee/f _ a g h_ a
Ni j k–l&—m ˜n™ oš/p› œqs˜r  t› ž už v/› š t wŸ x˜¡
y t z
  ¢—/£— ¤¥ › ¥  — Ÿ š/{¦o›~ ¥ t› š/u§qs£r šq ¨d› © € © — ™ ‚— £ƒ ž„ „ š

o 
z t 
{ t
z &
o 
| 
} 
t …¨† ‡›ˆ © ‰š ŠŒ¥ —/
‹ › £„ 
 ™ „› £Ž ¥  —   ‘ š
‚ƒ/
  ˜’¥  “2š ”
£ ƒ — ‹ ‘ ¬
ª ‹ • « ƒ­ ® ˆ
oscillatori adiacenti, in questo caso:
δ = kd sin θ + ε

I vari massimi principali in questo caso si hanno per i nuovi angoli:

d sin θ m = mλ − ε / k (7.10)

Concentrandoci
® ¯°± ® ±²³´ ³¡µ sul massimo ´º» ±« centrale
® ­ º ® ±¯m=0,
³¡ª ½ vediamo che possiamo spostare la sua orientazione
0 ¶ · ¸¹ · ¸ · ·/¼
Per il principio di reversibilità, che asserisce che in assenza di assorbimento il mot
dell’onda è reversibile, porta a concludere che il campo di un antenna trasmittente o ricevente è
lo stesso. Un insieme di antenne, come ad esempio un radiotelescopio può quindi essere
¾¿ÀÁ  Á Ã Ä ÀÁ Å ÃÆ¿Ç È ÀÆà ¿À þ¾ÃÅ Á ¿ÀÂÆÄ É É È Å È ÀÊ ÂÆÄÉ Â Ë È/Á Å ÂÃÌÀÄË Ä ÀÌÃÍ Â ÀÁ È ÀÀÂÎ Ï2È Å¿À Æ Á áÐ
l’output del sistema corrisponde al segnale che arriva sulle antenne da una specifica direzione
dello spazio.
Esaminiamo ora il caso di una sorgente lineare di oscillatori (ad esempio una fenditura con
 Ñ&Ò Ó ÔÕÖ×ØÙÚ×Û Ü¡ÝØÞÚß à Û ásà Üâ Öß ×Û ß/ã á Û Û áÝá/Ú××Úä ß â Ü¡ß ×Üâ ä ßÝØÜà å Ø æ æ á Û Üâ ØçØ å Ø ×Ø à à Ø äØæ è Ú×Ü
all’altro è sorgente di onde sferiche secondarie, per cui emette secondo la legge:

ε 
E =  0  sin(ω t − kr )
 r 

102
dove abbiamo indicato esplicitamente la dipendenza da 1/r dell’ampiezza e la quantità ε 0 è
detta forza dell’oscillatore. Un segmento ∆yi di questa fenditura conterrà un numero di
oscillatori ∆yi ( N / D) , dove D è la lunghezza della fenditura. Immaginiamo di dividere la
fenditura in M segmenti per cui il contributo al campo elettrico dell’i-esimo segmento è:

ε   N ∆yi 
Ei =  0  sin(ω t − kri )  
 ri   D 

se ∆yi è così piccolo che gli oscillatori contenuti in esso hanno una differenza di fase relativa
trascurabile e il loro campi si possono sommare scalarmente. Per N → ∞ la forza di ogni
singolo oscillatore deve tendere a zero, se vogliamo che il campo in P sia un numero finito.
Definiamo pertanto una costante ε L come una forza degli oscillatori per unità di lunghezza,
cioè:
1
ε L ≡ lim (ε 0 N ) (7.11)
D N →∞

Con questa posizione possiamo scrivere il campo totale in P per M segmenti come:

M
εL
E =∑ sin(ω t − kri )∆yi (7.12)
i =1 ri

Passando al continuo quindi,

D/2 sin(ω t − kr )
E = εL ∫ dy (7.13)
−D /2 r

dove r=r(y). L’approssimazione usata per valutare la (7.13) deve dipendere dalla posizione di
P dalla fenditura e farà quindi la distinzione tra diffrazione di Fresnel e di Fraunhofer.
La sorgente lineare coerente non esiste ovviamente come entità fisica, ma è utile come
strumento matematico.

7.3 Diffrazione di Fraunhofer

Nel seguito considereremo solo la diffrazione nel caso di Fraunhofer.

7.3.1 La fenditura ideale singola

Sia ora il punto di osservazione P molto lontano dalla sorgente lineare coerente e sia R D .
In queste circostante r(y) non devia mai apprezzabilmente da R cosicché il contributo al campo
in P dall’elemento dy si scrive:

εL
dE = sin(ω t − kr )dy (7.14)
R

103
εL
dove dy è l’ampiezza dell’onda. Si noti che non abbiamo scritto R al posto di r nella fase in
R
quanto, al contrario dell’ampiezza, la fase è molto sensibile all’approssimazione che
utilizziamo. Espandiamo allora r(y) nel modo seguente:

r = R − y sin θ + ( y 2 / 2 R) cos 2 θ + ... (7.15)

dove è misurato nel piano xz. Il terzo termine può essere ignorato quando il suo contributo
alla fase è insignificante anche per y=±D/2; cioè (π D 2 / 4λ R) cos 2 θ deve essere trascurabile.
Questo è vero per tutti i valori di
  
R è molto grande. In questa situazione, detta
condizione di Fraunhofer, la distanza r è lineare in y.
Pertanto si ha:

εL D/2
E=
R ∫ −D /2
sin[ω t − k ( R − y sin θ )]dy (7.16)

e finalmente,
ε L D sin[(kD / 2) sin θ ]
E= sin(ω t − kR) (7.17)
R (kD / 2) sin θ

Per semplificare la (7.17) poniamo β ≡ ~ (kD / 2) sin θ cosicché si ha:

ε L D  sin β 
E=   sin(ω t − kR) (7.18)
R  β 

La densità di flusso (lasciando perdere le costanti) è I (θ ) = E 2 , per cui è:


T

1  ε D   sin β 
2 2

I (θ ) =  L    (71.9)
2 R   β 

dove sin 2 (ω t − kR) = 1/ 2              "!"# $ % & '# $ (& )* + !* , - - . / 0, 1 2 !3 4 563 / / . 56,
T
principale. Nell’approssimazione di Fraunhofer pertanto si ha che la densità di flusso irradiata
da una fenditura singola idealizzata come una sorgente lineare coerente è:

2
 sin β 
I (θ ) = I (0)   = I (0) sinc β
2
(7.20)
 β 
7 8 8 9 : ; <= >8 > ??69 @ A > BB @ @ < A : <B C C D B 8 8 9"EFG9 8 @ B9 8 H A 9 8 8 > < : 9"I B C 9"H9 AKJL?> 8 G A B @ <6> :6< M :> H > B : <
N
Ocontenente
C G8 8 <6I B"A B H questo
> ; B ?69 :asse.
@ 9B"P Si9 A noti
<6H9 che RS TKU"V U βW X=YZ (π[ \ DUL/W λ] )^ _sinX \θ` X",a Zquando
AKJ Q'poiché \ X U ^ Xb ]DX ^ X \` λX laè quindi
densità di

equivalente per la (7.18) a quella di una sorgente puntiforme localizzata al centro del sistema.
Al contrario quando λ c D de è piccolo, sine f'g6h"i j k l m'i j nl op q r è la densità di flusso è costante
s h tvu w u u q x y qz {xr y qkoh"y z"| h { }q u w t z"t z ~ ~ r q x y q zz }w { zL~ r t xh {u h s w {u q | r t 6hp € hh 6h u u hr { } h
sferiche.

104
7.3.2 La fenditura rettangolare reale

La procedura usuale per


  l’analisi

 della
      fenditura reale
          è quella
    di
 dividere
  !   la fenditura
"  !  "  #in
tante

striscioline (dz×
strisciolina è una sorgente lineare coerente, nel modo in cui è stata definita prima. La fenditura
è lunga e stretta.

P F

dz

Fig. 7.4 La fenditura reale fatta da tante striscioline dz×$ %

Pertanto ogni strisciolina può essere rimpiazzata da un’emissione puntiforme lungo l’asse z. In
effetti ognuno di questi emettitori irradia un’onda circolare nel piano xz (y=0). Il problema è
stato ridotto a trovare il campo nel piano xz dovuto ad un infinito numero di sorgenti
puntiformi coerenti che attraversano tutta la fenditura lungo l’asse z. Dobbiamo quindi
calcolare l’integrale dei contributi dE provenienti da ogni elemento dz nell’approssimazione di
Fraunhofer. Ma questa è a sua volta ancora una sorgente lineare coerente, cosicché la soluzione
è proprio la (7.20), con β = (kb / 2) sin θ , dove b è la dimensione lungo z della fenditura. In
&'( ) * +-, . ) +/) 01+ ) ) +2+-+ ) ) ( 3 4. 3 (5( 06!. ) ) 0 6 0 ) ( , +25. 3 02( 7 7 .50 ) * 3 0 8'9 0 +2(50: ; < =>?@ A B é C DED
è grande. I minimi si ottengono risolvendo l’equazione:

dI 2sin β ( β cos β − sin β )


= I (0) =0 (7.21)
dβ β3

105
 
L’intensità minima, uguale a zero si ha per sin è per
           ! " 
quindi i minimi si ottengono dall’equazione:

b sin θ m = mλ . (7.22)

I massimi si ottengono invece risolvendo l’equazione trascendente:

tan β = β (7.23)

0ottenuta
2 1 3 4567 8ponendo
9: ; <=>? @uguale
A BC DEFaG zero MNON P IQI R S I entro parentesi nella (7.21). Essi # $%& ''(*)+ ,.-/
H I I IJ ilKL numeratore
TU V V UXDobbiamo
WY Z [ Y \ [ ]^[aT Uquesto
V V _ Y `a[punto
U \ \ Ycb rimarcare
]^V _ Y ^d]V che
] e f ilg hprincipio
ij k jXhj l l di
mcnHuygens-Fresnel
o p p q m r o shjcnotq j u non
hj lu tiene conto
ov o j hjck shv s
di questo problema introducendo un termine detto fattore di obliquità. Nella diffrazione di
Fraunhofer
m v v sxk yjcz{l’apertura
hshxu o mXv q s e los*schermo
|q m hnjf sono così lontani che si può trascurare questo problema, a
w ww
f
In Fig. 7.5 è disegnata la distribuzione della densità di flusso in funzione di }

‡ˆ‰ Š‹Œ
0)
1

~…„ € † ƒ „ € †ƒ


~  € ‚ ƒ 0.047  € ‚ƒ

  ‘  ‘ ‘ Ž
‘

Fig. 7.5 Andamento approssimato della densità di flusso nella diffrazione di Fraunhofer da una fenditura singola.
Si presti attenzione al fatto che i massimi secondari non riproducono esattamente la curva reale, non essendo
simmetrici.

Si noti innanzitutto che i massimi secondari sono molto deboli. I minimi di luce sono di
difficile localizzazione sperimentalmente, per cui la (7.22) non può essere usata per ricavare la
lunghezza d’onda della luce.

106
Se la sorgente emette luce bianca i vari massimi mostrano una successione di colori che va
dal blu al rosso. Ogni tipo di sorgente puntiforme è in grado di produrre il fenomeno osservato;
dalla luce del sole che passa attraverso un buco alla luce di un lampione notturno lontano.
Può sembrare a prima vista che il massimo principale sia sempre allineato con il centro
della fenditura. Questo non è sempre vero. La figura di diffrazione è in realtà centrata sull’asse
della lente L2, ed ha esattamente la stessa forma e localizzazione indipendentemente dalla
posizione della fenditura, se la sua orientazione non è cambiata e sono valide le
approssimazioni considerate.

7.3.3 La fenditura doppia

aperture può generare la medesima figura di diffrazione sullo schermo    


   
Supponiamo ora di avere due fenditure larghe b e separate da una distanza a. Ognuna delle due

contributi delle due fenditure si sovrappongono, e sebbene siano uguale come ampiezza,
possono essere significativamente diversi come fase. Poiché l’onda primaria eccita le sorgenti
secondarie nello stesso modo, avremo tutte sorgenti coerenti e quindi interferenza tra le varie
onde secondarie. Se la luce incidente incide normalmente alle fenditure, le sorgenti secondarie
sono tutte in fase e le frange di interferenza osservate dipenderanno dal diverso cammino ottico
       i, ci sarà una differenza di fase costante tra tutte le onde secondarie di cui tenere
attraversato dalle onde secondarie delle due fenditure. Se la luce incidente arriva sulle fenditure

conto.
Il risultato è che sullo schermo si vedranno delle frange di interferenza modulate dalla
         ! "  ! ! # %$ &' ( )"*+! & & ,! ' -  ). /012 2 3 4 516 3 7 16 589 4 6 : l’analisi
figura di diffrazione mostrata prima.

/= >:@? 3= 15A16 B 4 C149 16 1D19 B 4%= 15:8CC 85: 6 13 C 7 3 C 3 B 10 3 ? 16 E: C B 3A8C B 3 7 16 534 9 9 3 C: 4 B :
fatta per la singola fenditura. Adesso ognuna delle due aperture è divisa in tante striscioline
(dz× ; <
lungo l’asse z. Il contributo totale, nell’approssimazione di Fraunhofer sarà allora:

b/2 a +b / 2
E = C∫ F ( z )dz + C ∫ F ( z )dz (7.24)
−b / 2 a −b / 2

dove F ( z ) = sin[ω t − k ( R − z sin θ )] . La costante C include, come nella (7.16) la forza


dell’oscillatore per unità di lunghezza e la distanza R dall’origine al punto P (che è assunta
come costante). L’integrazione della (7.24) dà:

 sin β 
E = bC   [sin(ω t − kR) + sin(ω t − kR + 2α )] (7.25)
 β 

dove α ≡ (ka / 2) sin θ e, come prima β ≡ ~ (kb / 2)sin θ . Questa è proprio la somma dei due
campi nel punto P, da ognuna delle due fenditure. Semplificando la (7.25):

 sin β 
E = 2bC   cosα sin(ω t − kR + α ) (7.26)
 β 

e facendo la media temporale su un sufficientemente lungo intervallo di tempo, si ha:

 sin 2 β  2
I (θ ) = 4 I 0   cos α (7.27)
 β
2

107
    
             !"# %$%"   $& 
Se nella (7.27) b diviene molto piccolo (kb à
  %!"*  + ! , " %! -  +&. + ./" + $  .  $  0 1)2/34 5
vista nell’esperimento di Young. Se invece a')(
(7.27) diviene I (θ ) = 4 I 0 (sin 2 β / β 2 ) che è equivalente a quella per una singola fenditura, a
0
parte il fattore 4. Graficando la (7.27) in Fig.(7.6) vediamo che il termine di interferenza cos2
è modulato dal termine di diffrazione sin 2 β / β 2 .

jkl m
4I0

op q o q p q n
f gh i gh i q

Fig. 7.6 Andamento approssimato della densità di flusso nella diffrazione di Fraunhofer da una fenditura doppia.
687:9 ;9 7:9 < = 9 ; > 9 < 5 4 9? 9 @ 5 ;; A/< 3 =CB 1DEF DG EF DHEFI I I F 7 3 ;J = 3 9 7:9 ;9 7:9? 3 > A ; K 5 = 9 < 3 = 0/1LDE M GF
DHE M GF D)N E M GFI I I
0 1)H B O PQ R S T U T%V W TR X
La curva di Fig. 7.6 è ottenuta nel caso particolare che a=3b (cioè
terzo massimoO8secondario
[/\ ] ] R [:R] T V cade
^ _ U \ `sul
RT _primo
a ` ^/R X b minimo
R V V ^cV T _dia ` diffrazione.
\ X T%URUR d d ` \ e Se
R ^ _ fosse
TP a=mb ci sarebbero
invece 2(mYZ

7.3.4 Il reticolo

La procedura per ottenere la densità di flusso per un’onda che incide su N fenditure (reticolo di
diffrazione) è la stessa di quella usata per due sole fenditure. Consideriamo allora il caso di N
fenditure larghe b e separate da una distanza a. Il contributo dovuto alla j-esima fenditura si
scrive:

 sin β 
E j = bC   sin(ω t − kR + 2α j ) (7.28)
 β 

108
dove è sempre α ≡ (ka / 2) sin θ e, come prima β ≡ ~ (kb / 2)sin θ . Si noti che questa è
equivalente all’espressione per una singola sorgente lineare coerente. Sommando tutti i
contributi si ottiene:

N −1
 sin β 
E = ∑ bC   sin(ω t − kR + 2α j ) (7.29)
j=0  β 

che può essere riscritta nella forma:

 sin β   sin Nα 
E = bC    sin[ω t − kR + ( N − 1)α ] (7.30)
 β  α 

La densità di flusso totale diviene allora:

2
 sin β   sin Nα 
2

I (θ ) = I 0     (7.31)
 β   α 


Si noti che la densità di flusso emessa nella direzione è I (0) = N 2 I 0 , dove I0 è la densità di
flusso emessa da ogni singola sorgente. Come prima la figura di interferenza è modulata dalla
figura di diffrazione. Se le aperture delle fenditure potessero essere portate a zero, la (7.31)
diverrebbe uguale alla (7.8), cioè il sistema si comporterebbe come un insieme di oscillatori
armonici coerenti. 
   
  ! "$# %
& '( ) # 
* #,+# - .
I massimi principali  
  

a sin θ m = mλ (7.32)

con m=0, ±1, ±2, ±3, .... I minimi con densità di flusso uguale a zero si hanno per:

π 2π 3π ( N − 1)π ( N + 1)π
α =± ,± , ± ,..., ± ,± ,... (7.33)
N N N N N
! 
 !  23( * &- ( ) # 
* #,*
Tra due consecutivi massimi principali ci sono perciò N/10 ra ogni
coppia di minimi ci deve essere un massimo secondario che sarà localizzato a:

3π 5π
α =± ,± ,... (7.34)
2N 2N

+Lo
-  studente
4  +( ) ( )'provi
( -  ( - #5a "
calcolarsi
67'# "
l’intensità
- relativa dei massimi
6 + 4 4 secondari
)  )+-   rispetto ai 8 massimi
( 8 8  9 # 4 "( -  
à che per grandi N ed
ha una densità di flusso:

2
 sin β   2 
2

I ≈ I (0)     (7.35)
 β   3π 

che è circa 1/22 di quella del massimo principale.

109
Al crescere di N le righe si fanno via via più sottili, mantenendo però la stessa distanza relativa
a.

Esistono diversi tipi di reticoli di diffrazione. I primi tipi ad apparire agli inizi
dell’ottocento consistevano in una sottile griglia di fili (metallici o di tessuto) paralleli
sottilmente ed equamente spaziati. Il fronte d’onda nel passaggio attraverso questo sistema
incontrando zone trasparenti e zone opache, diventa modulato in ampiezza. Questo tipo di
configurazione è detta infatti reticolo di trasmissione a modulazione di ampiezza.
Un altro tipo di reticolo di trasmissione si ottiene strisciando con una punta di diamante un
vetro trasparente, producendo zone rettilinea ove la luce viene diffusa. Quando il reticolo è
totalmente trasparente, cosicché la modulazione in ampiezza è trascurabile, le variazioni
regolari di spessore inducono una modulazione di fase. Si parla allora di reticolo di
trasmissione a modulazione di fase. Il fronte d’onda emergente conterrà variazioni periodiche
nella sua forma piuttosto che nella sua ampiezza.
In riflessione quest’ultimo tipo di reticolo lavora altrettanto bene e si parla quindi di
reticolo di riflessione a modulazione di fase. Generalmente sono costruiti facendo evaporare
dell’alluminio su una lastrina di vetro su cui viene fatto strisciare una punta di diamante.
Al giorno d’oggi molti reticoli sono fatti con tecniche olografiche.
L’equazione del reticolo, guardando ad esso in direzione normale è dunque:

a sin θ m = mλ

I valori di m specificano i vari massimi principali. Per una sorgente a spettro continuo, come
una lampada a tungsteno, l’ordine
  m=0

 è una riga bianca, mentre per gli ordini superiori poiché
l’eq. del reticolo dipende da à una continua distribuzione di colori. Più piccolo è a più
piccolo sarà il numero degli ordini visibile. Nel caso di incidenza obliqua l’eq. del reticolo
diviene:
a(sin θ m − sin θ i ) = mλ (7.36)

sia per la riflessione che per la trasmissione. Questa espressione si applica indipendentemente
dall’indice di rifrazione del reticolo di trasmissione stesso.
Il principale difetto di questo tipo di reticoli è che essi distribuiscono la luce incidente su un
numero di ordini spettrali a bassa densità di flusso. La maggior parte dell’energia cade nel
massimo principale (ordine zero), che è nella direzione speculare, come se si avesse  uno

specchio piano. L’ordine zero è di poca utilità per la spettroscopia perché tutte le
sovrappongono. Per questo motivo i reticoli moderni hanno una forma particolare (reticoli detti
“ blazed”) che consente di orientare l’ordine zero in una direzione diversa dall’angolo di
riflessione speculare (Fig.
 7.7).
   
 
Le posizioni degli m sono determinate dai valori di a    i.
 
i  m sono misurate dalla normale al piano del reticolo (la linea a punti e trattini in figura
7.7), mentre la direzione del picco di diffrazione è determinata dalla direzione normale al piano
delle scanalature (linea tratteggiata in figura 7.7).
  ((  ( + +  (  (3+ 
! "# !$ %# $ & %'  $ )  %*   %'   ' $ # * * , i-/.0 12 -/. 4 $5 0=0. Per
riflessione speculare invece è i 6 r -87 9 :;<= > ? @ A @B B C > D@EF= B à ad un particolare ordine non
nullo G <H EF@ I m= JLK M N A C @ è a sin(−2γ ) = mλ D= B3CF= > C F= B H ? CO= FPQ:

110
7.3.5 Spettroscopia con i reticoli

Le informazioni astronomiche che possono essere ricavate dall’uso della spettroscopia con i
reticoli sono tantissime e vanno dalla misura della temperatura di una stella, alle misure di
velocità di stelle e galassie, al redshift dei quasar. Oggi si fa spettroscopia dalla banda X
all’infrarosso, e questo fa capire quanto sia raffinata la tecnica di costruzione di questi reticoli.
Il passo dei reticoli è oggi guidato con tecniche interferometriche, che consentono precisioni
altissime nella costruzione di reticoli ad elevata risoluzione.
Esaminiamo ora alcune delle principali caratteristiche degli spettri ottenuti con i reticoli.
La larghezza di una riga spettrale è definita dalla distanza angolare tra i minimi adiacenti ogni
massimo principale (quindi per la 7.33 ∆α = 2π / N ). Per un incidenza obliqua possiamo
ridefinire come (ka / 2)(sin θ − sin θ i ) , cosicché una piccola variazione in è data da:

∆α = (ka / 2)cosθ (∆θ ) = 2π / N (7.37)

   "!#$  % &


a
'
i
direzione speculare. Picco di diffrazione

'
0

direzione
dell’ordine zero

Fig. 7.7 Sezione di un reticolo di diffrazione blazed.

dove l’angolo di incidenza è costante. Perciò anche quando la luce incidente è monocromatica
è:
∆θ = 2λ /( Na cos θ m ) (7.38)

che è l’allargamento strumentale delle righe. Si noti la dipendenza da Na, cioè dalla larghezza
del reticolo.
Un’altra quantità importante è la differenza   
  

    

   
Come nel caso del prisma la dispersione angolare è definita dalla relazione:

≡ dθ / d λ (7.39)

Differenziando l’eq. del reticolo si ha:



= m /(a cos θ m ) (7.40)

111
Questo significa che la separazione angolare tra due righe successive cresce al crescere
dell’ordine. La differenza angolare tra due righe può divenire piccola al punto che esse in parte
si sovrappongono; è necessario quindi definire il potere risolutivo cromatico del reticolo:

≡ λ /(∆λ )min (7.41)

dove (∆λ )min è la più piccola differenza di lunghezza d’onda risolvibile, o limite di risoluzione.
Il criterio di Lord Rayleigh per la risoluzione di due righe con uguale densità di flusso richiede
che il massimo principale di una coincida con il primo minimo dell’altra. Si ha in questa
situazione che la separazione angolare è metà dell’allargamento strumentale. Combinando la
(7.38) e la (7.40) si ha pertanto:

λ /(∆λ )min = mN (7.42)

o anche:

 Na(sin θ m − sin θ i )


(7.43)
λ

Ilpotere
 
risolutivo
     è quindi
     funzione
  

 della
 ò superare
larghezza del reticolo, dell’angolo di incidenza e di
la quantità 2 Na / λ , e il più grande valore si
ha quando il reticolo è montato in auto-collimazione, cioè quando γ ≈ θ i ≈ −θ m , per cui è:

 Na sin θ i
(7.44)
λ

      "! ! # %$ & # $ & ' ( ) (& #'+*(, ) '+& #+&


Dobbiamo infine considerare il problema degli ordini sovrapposti. E’ evidente dall’eq. del
reticolo che due righe di lunghezza d’onda
successivi (m+1) ed m se:

a(sin θ m − sin θ i ) = ( m + 1)λ = m(λ + ∆λ )

La precisa differenza in lunghezza d’onda per cui ciò accade è detta intervallo spettrale libero,

(∆λ )fsr = λ / m (7.45)

(fsr = “free spectral range”). Un reticolo ad alta risoluzione blazed per il primo ordine in modo
da avere il più grande intervallo spettrale libero, avrà quindi un alto numero di scanalature (fino
anche a 1200 tratti per mm), per mantenere il suo potere risolutivo R. L’eq. (7.43) mostra che R
può essere mantenuto costante diminuendo il numero di tratti e aumentando lo spazio tra essi.
Questo però richiede un aumento dell’ordine m e quindi una diminuzione dell’intervallo
spettrale libero, con la conseguenza che gli ordini si sovrappongono. Se invece si tiene costante
N e si fa crescere a, R ed m crescono e quindi (∆λ )fsr diminuisce ugualmente. Aumentando a,
l’allargamento strumentale diminuisce (le righe diventano più sottili), ma anche la dispersione
diminuisce, con l’effetto che le righe dello spettro si avvicinano l’una all’altra.

112
7.3.6 Apertura rettangolare e circolare

Consideriamo      ancora


  

il
caso di
un’onda

        
piana
   monocromatica
 
      
   incidente
  
    su! di  uno
#"
schermo

  !#
 
opaco
l’apertura non è lunga e stretta, ma semplicemente piccola (dell’ordine di $ % &!' &( ) * +-,
'. '
direzioni). Vogliamo come prima trovare la distribuzione della densità di flusso in un punto P
. /
&( * &
/10
*2 3 465 798 :
;
7 8 <
= 8 ;
8 >1?8
@A
B C5 <D -Fresnel un elemento differenziale d’area dS entro
l’apertura può essere pensato come una sorgente puntiforme coerente di onde sferiche
E F G H
I
J
K L M FN OPE E F I
J
H1JQ
RSRST-U V
U U FW F#H
I
J
F#G X
F#G H
IU L M YV
M E G H
I
H1K W
Z [\ ] ^ _ ] ^ Z ^ ` [[
a1b ac \ ^ d
\ \ Z e
` f!] [\ ]gh#d] c \ a!Z [
iZ j] [
i
] [\ ] f!] [\ ]#i
` k campo lm n n m o
p
inq!Pr s q
rimarranno
o
p
t#m u!m n n t in fase e

un’onda sferica. Se v A è la forza degli oscillatori per unità di area, assunta costante su tutta
l’apertura, il singolo contributo in P sarà:
v
 A  i (ωt − kr )
dE =   e dS
 r 

Osserviamo ora la Fig.7.8.

Y
P
z
y

r dS
Z
R
w

P0

Fig. 7.8 L’apertura rettangolare di dimensioni a×b.

La distanza r tra dS e P è:

r = [ X 2 + (Y − y )2 + ( Z − z )2 ]1/ 2 (7.46)

113
quando questa distanza tende ad infinito si hanno le condizioni di Fraunhofer, per cui possiamo
rimpiazzare r con la distanza OP, cioè R, nel termine di ampiezza, se l’apertura è piccola. Il
termine di fase deve essere trattato con più attenzione. Espandiamo quindi r nel seguente
modo:

r = R[1 + ( y 2 + z 2 ) / R 2 − 2(Yy + Zz ) / R2 ]1/ 2 (7.47)

Nel caso R sia molto grande rispetto alle dimensioni dell’apertura il secondo termine della
(7.47) è trascurabile. Poiché P è molto lontano, è sempre piccolo anche se Z e Y sono
abbastanza grandi, per cui possiamo stare tranquilli circa la direzionalità dell’emissione (fattore
di obliquità). Possiamo quindi scrivere:

r = R[1 − 2(Yy + Zz ) / R 2 ]1/ 2 (7.48)

e, prendendo solo i primi due termini dell’espansione binomiale della (7.48), si ha:

r = R[1 − (Yy + Zz ) / R 2 ]

Il campo totale in P è quindi data dalla:

ei (ωt −kR )
∫∫


E= eik (Yy + Zz ) / R dS


A
(7.49)
R Apertura

Considerando la specifica configurazione rettangolare che stiamo trattando, si ha allora:

ei (ω t − kR ) b/2 a /2
∫ eikYy / R dy ∫−


E=


A
−b / 2
e ikZz / R dz (7.50)
R a /2

Posto β ' ≡ ~ kbY / 2 R e α ' ≡ kaZ / 2 R abbiamo:

b/2  ei β ' − e − i β '   sin β ' 


∫−b / 2 =  = b
ikYy / R
e dy b  
 2i β '   β' 
a/2  eiα ' − e− iα '   sin α ' 
∫− a / 2 =  = a
ikZz / R
e dz a  
 2iα '   α' 

da cui:

A A ei (ω t − kR )  sin α '   sin β ' 




E=


   (7.51)
R  α '  β ' 

dove A è l’area dell’apertura. Poiché I = (Re E )2




, la densità di flusso varia secondo la:


T

2
 sin α '   sin β ' 
2

I (Y , Z ) = I (0)     (7.52)
 α'   β' 

114
dove I(0) è la densità di flusso in P0. La forma tridimensionale della (7.52) è simile alla Fig. 7.5
pensata in tre dimensioni. Quando    

 
   
 
    


 
       

 !
" #
$ %  &' (!$ &
)
* +,.-0/ *
&
* 1!
% ' " 2
% "
" &'  3 ")" 4 576 a 8.9 576 b rispettivamente, si ha I(Y,Z)=0.
Si noti che la dimensione della figura di diffrazione nella direzione Y e Z varia inversamente
con la dimensione dell’apertura y, z. Una fenditura con un’apertura rettangolare orizzontale
produce una figura con un rettangolo verticale al centro.

Per quanto riguarda l’apertura circolare, diciamo soltanto che il calcolo del campo prodotto
in un punto P molto lontano, parte dall’eq. (7.49). Diamo qui solo il risultato finale del
processo di integrazione, per cui chi vuole approfondire veda direttamente il calcolo dai testi
citati in bibliografia. La densità di flusso I(: ;=< > ? @
A B C(D ? ? D < D
E

 2 J (ka sin θ ) 
2

I (θ ) = I (0)  1  (7.53)
 ka sin θ 

dove J1(x) è la funzione di Bessel del primo tipo di ordine 1 (che si trova sotto forma di tabella
in molti testi). A causa della simmetria assiale, il massimo centrale molto piccato corrisponde
ad un dischetto luminoso noto come disco di Airy. Il disco è circondato da un primo anello
scuro che si ha quando si annulla la funzione J1(x). Questo avviene quando x=kaq/R=3.83,
dove a è il raggio dell’apertura circolare, e q è la distanza P0P. Il raggio del primo anello scuro
è pertanto:


q1 = 1.22 (7.54)
2a

Se pensiamo all’apertura come ad una lente, l’immagine di una stella sul piano focale f ≈ R ,
sarà un dischetto di Airy di dimensioni:


q1 ≈ 1.22
D

dove D è il diametro della lente. La figura di diffrazione di un’apertura circolare è anch’essa


simile alla figura 7.5, ma cambiano le posizioni dei minimi e l’intensità dei massimi secondari.

Consideriamo ora il caso di una matrice bidimensionale di aperture rettangolari illuminate


da un’onda piana incidente perpendicolarmente. Ogni elemento si comporta come una sorgente
coerente, e a causa della periodicità regolare della matrice di elementi emittenti, ogni onda
secondaria avrà una relazione fissa di fase con tutte le altre. Ci saranno allora delle direzioni in
cui prevarrà l’interferenza costruttiva e altre in cui sarà distruttiva. Il fenomeno può essere
osservato guardando ad una sorgente puntiforme lontana attraverso un pezzo di tessuto o un
passino da tè. L’immagine diffratta è effettivamente la sovrapposizione delle figure di
diffrazione prodotte da due reticoli tra loro perpendicolari.

115
8 CAPITOLO 8
8.1 Elementi di ottica di Fourier

Abbiamo già introdotto nel Capitolo 5 alcuni concetti sulle trasformate di Fourier e sul loro
utilizzo in ottica. Vogliamo ora cercare di vedere come l’analisi di Fourier permette di trattare i
processi ottici in termini di frequenze spaziali. La motivazione principale è quella di cercare di
capire come i sistemi ottici processano la luce per formare le immagini, e sapere l’ampiezza e
la fase del fronte d’onda che le formano.
Per prima cosa ricordiamo che una funzione generica f(x) può essere espressa come
combinazione lineare di un numero infinito di armoniche:

1 
∞ ∞

f ( x ) =  ∫ A(k ) cos k xd k + ∫ B(k ) sin k xd k  (8.1)


π 0 0 

I fattori che determinano l’importanza dei contributi delle diverse frequenze spaziali k, sono
A(k) e B(k), che sono dati dalla:

+∞
A(k ) = ∫
−∞
f ( x ' ) cosk x dx
' '
+∞
(8.2)
B (k ) = ∫
−∞
f ( x ' ) sink x dx
' '

Passando alla notazione complessa esponenziale si può arrivare a scrivere (lo studente provi a
fare i vari passaggi o li cerchi nei libri citati in bibliografia):
+∞
1
∫ F (k )e
−ik x
f ( x) = dk (8.3)
2π −∞

se si ha che:
+∞
F (k ) = ∫
−∞
f ( x )eik x dx (8.4)

La funzione F(k) è la trasformata di Fourier della f(x), che simbolicamente si scrive:

F (k ) = { f ( x)} (8.5)

In letteratura si trovano diversi modi di definire la trasformata di Fourier, per cui bisogna stare
attenti alla notazione utilizzata.
Si noti che A(k) e B(k) sono rispettivamente la parte reale e la parte immaginaria della
F(k), cioè:

F (k ) = A(k ) + iB(k ) (8.6)

La F(k) essendo una quantità complessa può essere scritta in termini di un’ampiezza reale
F (k ) , detta spettro di ampiezza, e di un termine reale di fase k), detto spettro di fase:
 

117
F (k ) = F (k ) eiΦ (k ) (8.7)

   
La f(x) è detta trasformata inversa di F(k), o simbolicamente:

f ( x) = {F (k )} = { { f ( x )}} (8.8)

   
     
 
  
Ovviamente se f fosse una funzione del tempo t anziché dello spazio x, sarebbe sufficiente
sostituire t ad x k (frequenza angolare spaziale).

8.1.1 Trasformata di una funzione gaussiana

Come esempio del metodo esaminiamo la funzione di Gauss:

f ( x ) = Ce− ax
2
(8.9)

dove C ≡ a / π e a è una costante. La sua trasformata di Fourier si ottiene dalla:

+∞

∫ (Ce
− ax 2
F (k ) = )eik x dx (8.10)
−∞

L’esponente −ax 2 + ik x si può riscrivere come −( x a − ik / 2 a )2 − k 2 / 4a , e assumendo


x a − ik / 2 a = β si ha:

+∞
C − k 2 / 4a
F (k ) = ∫ e − β dx
2
e (8.11)
a −∞

L’integrale definito è uguale a π , per cui è

F (k ) = e − k
2
/ 4a
(8.12)

che è ancora una gaussiana, questa volta con k come variabile. Le deviazioni standard sono nei
due casi σ x = 1/ 2a e σ k = 1/ 2a per cui è σ xσ k = 1 .

8.1.2 La trasformata bidimensionale

L’ottica coinvolge generalmente segnali bidimensionali, come ad esempio il campo


elettromagnetico attraverso un’apertura o la distribuzione della densità di flusso sul piano delle
immagini. Per questo motivo dobbiamo generalizzare la trasformata di Fourier al caso
bidimensionale. Questa si esprime attraverso la seguente equazione:
+∞ +∞
1
∫ ∫ F (k , k
− i ( k x x +k y y )
f ( x, y ) = )e d kxd k y (8.13)
(2π )2
x y
−∞ −∞
e
+∞ +∞

∫∫
i (k x x +k y y )
F (k x , k y ) = f ( x, y )e dxdy (8.14)
−∞ −∞

118
Le quantità kx e ky sono le frequenze angolari spaziali lungo i due assi. L’estensione al caso
tridimensionale è quindi evidente. In generale una perturbazione può essere sintetizzata da una
combinazione lineare di onde piane aventi diverso numero di propagazione e diverse direzioni
−[ i ( k x + k y + k z )]
di propagazione. Infatti nel caso 3D le funzioni elementari sono del tipo e x y z , cioè
e −ik ⋅r che sono onde piane. Pertanto anche in 2D le funzioni elementari sono “orientate” in
direzioni diverse. Questo significa che per un dato insieme di valori di kx e ky , gli esponenti o
la fase delle funzioni elementari saranno costanti lungo delle linee:

k x x + k y y = costante = A

L’orientazione delle linee di fase costante è quindi

ky
α = tan −1 = tan −1 x

kx y

dove k x = 2π / x (e analoga per ky). La lunghezza d’onda, o periodo spaziale α , misurata


lungo kα è data dalla

α =  −2
x
1
+ −2
y
e quindi kα = k x2 + k y2

Tutto questo significa che per costruire una funzione 2D oltre ai termini armonici kx e ky, si
dovranno includere termini che sono orientati in direzioni diverse dalle direzioni x e y. Un
modo per visualizzare la cosa, ad esempio il fronte emergente da una fenditura, è quello di
pensare al nuovo fronte come ad una sovrapposizione di onde piane che emergono dalla
fenditura in tutte le direzioni. Queste sono le componenti di Fourier che vanno in tutte le
direzioni con specifici valori della frequenza angolare. Il termine con frequenza angolare nulla
corrisponde all’onda non deviata, mentre le frequenze angolari più alte formano un angolo
maggiore con l’asse ottico.

8.1.3 Proprietà della Delta di Dirac

  
   
Molti fenomeni fisici sono di tipo impulsivo (sia spaziale che temporale), ed è utile sapere
come risponde un sistema a questo tipo di stimolo. L’idealizzazione matematica di questo tipo
di stimolo si realizza tramite l’uso della funzione è definita dalla:

0 x ≠ 0
δ ( x) = 
∞ x = 0
e dalla:
+∞

∫ δ ( x)dx = 1
        !   "  # $%  & (' ! ) *+! #, !.-  $ -   ! ,
−∞

/ $ & ,  - &    , 0-+! & 21 3 45 6+7 8 9 :.7 8 ; 8 <


Le applicazioni più importanti per l’uso della à,
detta proprietà di “sifting” (letteralmente setacciatura); l’integrale di una funzione generica f(x)

119
+∞

∫ δ ( x) f ( x)dx = f (0)
−∞
(8.15)

è uguale al valore della funzione f nel punto x 




         -x0)
tramite la:

 0 x ≠ x0
δ ( x − x0 ) = 
∞ x = x0

si può vedere che


+∞

∫ δ ( x − x ) f ( x)dx = f ( x )
−∞
0 0

estrae proprio il valore della f per x=x0. Ricordando la (8.3) una generica funzione f(x) può
scriversi:

+∞  1 +∞  +∞
f ( x) = ∫  2π ∫ e
− ik ( x − x ')
d k  f ( x ')dx ' = ∫ δ ( x − x ') f ( x ')dx '
−∞ −∞
 −∞

da cui:

1 +∞
δ ( x − x ') =
2π ∫
−∞
e − ik ( x − x ') d k (8.16)

Evidentemente per x’=0

1 +∞ 1 +∞
δ ( x) =
2π ∫ −∞
e −ik x d k =
2π ∫ −∞
eik x d k

Questo implica che la funzione   "!# $  %'& ò essere vista come la trasformata di Fourier
inversa di 1, cioè δ ( x ) = ( −1{1} e quindi ( {δ ( x )} = 1 . Possiamo immaginare un impulso
quadrato che via via diviene più stretto ed alto; per una larghezza infinitesima la sua
trasformata sarà di estensione infinita, o in altre parole, una costante. Se l’impulso si trova in
una posizione x=x0, la sua trasformata cambia fase ma non ampiezza, e si ha:

( {δ ( x − x0 )} = eik x 0
(8.17)

In generale si può dimostrare che la trasformata di Fourier di una funzione che viene spostata
nello spazio (o nel tempo) è la trasformata della funzione non spostata per un termine
esponenziale che è lineare nella fase. Questa proprietà è particolarmente utile quando andiamo
a prendere in considerazione l’immagine di diverse sorgenti puntiformi identiche ma separate.
Vediamo ad esempio una f(x) data dalla somma di tanti impulsi separati:

f ( x) = ∑ δ ( x − x j )
j

la sua trasformata sarà data da:

120
{ f ( x )} = ∑ e
ik x j

In particolare se ci sono solo due funzioni 


0=d/2 e l’altra a x0=       
f ( x ) = δ [ x − (+ d / 2)] + δ [ x − (− d / 2)]

e quindi

{ f ( x )} = eik d / 2 + e − ik d / 2 = 2 cos(k d / 2)
 ! " # $% & $" # $ ! ' # $ " $%()*(+' +,- ) ,)*. / 0 12314 235 0 637%8 
6 /7 
3 697;:0 8 7 
: 7 </1 27 / ? 6
=>

2

7 4
dovrebbe
@ 
2 
3 5 0 
6 
3
far
0 A ricordare l’esperimento di Young, e in particolare la (6.22). Se la fase di una delle
è spostata si ha invece:
B
{ f ( x )} = eik d / 2 + e − ik d / 2 = 2i sin(k d / 2)

Si ricordi che ci sono due modi alternativi per considerare la trasformata complessa, sia come
somma di parte reale e immaginaria (eq. 8.6), sia come prodotto di un termine di ampiezza e
uno di fase (eq. 8.7). Si capisce dal risultato precedentemente ottenuto che le funzioni coseno e
seno sono funzioni speciali: il primo è associato ai contributi puramente reali, il secondo a
quelli puramente immaginari. Molte funzioni, anche armoniche, sono la combinazione di parte
reale e immaginaria. Per esempio, una funzione coseno spostata in ascissa, non è più né pari né
/ C6/ ? 1 ? 1 e@ 0haD E quindi
dispari, FHG IJK Luna
MKNK LO JLPRreale
parte Q JLS K TeLUW V U LTX YNZ P9MK Q Si
immaginaria. Q U [ noti
U LS P9che
MKNQ P quando
V UR\ [ PRZ la
U9Mfunzione
JURQ JLS K Tcoseno
LK
] è
è^
radianti.

8.1.4 I sistemi lineari

Un concetto importante nell’ottica di Fourier è quello di sistema lineare. Supponiamo che un


segnale in ingresso in un sistema sia rappresentato da una funzione f(y,z), e in uscita sia dato da
una funzione g(Y,Z). Il sistema è lineare se:

1. moltiplicando la f(y,z) per una costante a si ha un output ag(Y,Z);


2. quando l’input è del tipo af1+bf2 l’output è ag1+bg2.

Inoltre il sistema lineare sarà invariante spazialmente se è stazionario, cioè cambiando la


posizione dell’input cambia la posizione dell’output, ma non muta la sua forma.
L’idea dietro a queste considerazioni è che l’output prodotto da un sistema ottico può essere
trattato come la sovrapposizione lineare degli output di ogni singolo punto dell’oggetto.
Simbolicamente possiamo scrivere:

g (Y , Z ) = L{ f ( y, z )} (8.18)

e, usando la proprietà di “sifting”,

_ +∞ +∞ 
g (Y , Z ) =  ∫ ∫ f ( y ' z, δ' )y (− y' δ z)− (z 'dy dz)  ' '
−∞ −∞ 

Ne segue che per la seconda condizione di linearità può anche scriversi:

121
+∞ +∞
g (Y , Z ) = ∫∫
−∞ −∞
f ( y ', z ') {δ ( y '− y )δ ( z '− z )}dy ' dz ' (8.19)

La quantità L{δ ( y '− y )δ ( z '− z )} è la risposta del sistema ad una funzione      
  
punto (y’,z’) nello spazio oggetto, ed è detta risposta all’impulso.
Apparentemente, se la risposta all’impulso di un sistema è nota, l’output può essere calcolato
direttamente dalla (8.19). Se le sorgenti elementari sono coerenti, i segnali di input e di output
saranno campi elettrici, se incoerenti saranno densità di flusso.
Si consideri ad esempio la Fig. 8.1.
Y

y piano oggetto
Z

piano immagine

Fig. 8.1 Una lente forma un’immagine.

Una sorgente luminosa incoerente nel piano oggetto (y,z) può essere pensata come la somma di
un numero enorme di sorgenti infinitesime (il quadratino nero in figura). Ognuna di esse
produce uno spot luminoso sul piano focale della lente. Assumiamo che l’ingrandimento sia
unitario. Si noti che se l’ingrandimento fosse maggiore di 1, l’immagine apparirebbe più
grande dell’oggetto e di conseguenza tutti i dettagli spaziali sarebbero più grandi, e le
frequenze che compongono l’immagine meno elevate.
Se I0(y,z) è la densità di flusso sul piano oggetto di un elemento dydz localizzato in (y,z),
esso emetterà un flusso I0(y,z) dydz. A causa della diffrazione (e delle aberrazioni) la luce è
sbrodolata su di uno spot luminoso, piuttosto che focalizzata in un punto. La densità di flusso
che arriva nell’elemento i-esimo (Y,Z) sarà:

dIi (Y , Z ) = S ( y, z; Y , Z ) I0 ( y , z )dydz

La funzione S prende il nome di Point Spread Function (PSF). A causa dell’incoerenza della
sorgente il contributo di ogni sorgente infinitesima sarà additivo e quindi

122
+∞ +∞
I i (Y , Z ) = ∫ ∫ I 0 ( y, z ) S ( y , z; Y , Z )dydz (8.20)
−∞ −∞

Se la lente fosse perfetta, cioè non avesse aberrazioni, e fossimo limitati solo dalla diffrazione,
la funzione S corrisponderebbe alla figura di diffrazione di un punto localizzato in (y,z).
Evidentemente se diciamo che l’input è    
         0, z0), allora
I 0 ( y, z ) = Aδ ( y − y0 )δ ( z − z0 ) , dove A è una costante che porta con se le unità di misura.
Pertanto si ha:

+∞ +∞
I i (Y , Z ) = A∫ ∫ δ ( y − y0 )δ ( z − z0 ) S ( y, z; Y , Z )dydz (8.21)
−∞ −∞

e per la proprietà di “sifting”

I i (Y , Z ) = AS ( y0 , z0 ; Y , Z )
  ! "#$% &' (% #$) * &$  +* ,+ $- * . //0#1+   /,*2#$43 * (5( 6* $+61+ $+ '  - /,#$7* (58# 9 &: ;4< =
un sistema corretto dalle aberrazioni, la PSF coincide con il disco di Airy. Se il sistema è
invariante spazialmente il punto oggetto in input può essere mosso a piacere senza alcuna
variazione nella sua immagine, se non nella posizione. Si può dire anche che la PSF è la stessa
per ogni punto (y,z). In pratica questo non accade mai completamente e la PSF varia anche se
di poco.
Se abbiamo a che fare con luce coerente, invece che incoerente, dobbiamo di nuovo
> ? =1@ A BC D E D CGF=5A =1@ A C HCIBAA H5JFK @ A1LMHEINF1C @ O EGP ? K O E ?Q =F= ? BA1C @ @ AD E JJD C @ C =O EGK R E H5JA C S S EIBC K
campo elettrico. Di nuovo il sistema sarà descritto da una PSF, sebbene questa volta sia una
PSF d’ampiezza. Per un’apertura circolare limitata dalla diffrazione, la PSF sarà la figura di
diffrazione medesima. Infine occorre considerare l’interferenza che si ha sul piano immagine
tra le varie sorgenti coerenti che interagiscono. Al contrario per sorgenti incoerenti, l’unico
processo che avviene sul piano immagine è la somma dei vari contributi di flusso.

8.1.5 L’integrale di convoluzione

L’integrale 2D dell’eq. (8.21) è un integrale che va sotto il nome di convoluzione. In una


dimensione la convoluzione di una generica funzione f con una funzione di impulso h, si
scrive:

+∞
g( X ) = ∫ f ( x )h( X − x)dx
−∞

Non trattiamo qui l’aspetto matematico di questa operazione, ma citiamo solo alcune proprietà
utili per la nostra trattazione. Lo studente che vuole approfondire consulti i libri citati nella
bibliografia.
Supponiamo di avere due funzioni f(x) e h(x) le cui trasformate di Fourier siano
rispettivamente F (k ) = T { f ( x)} e H (k ) = T {h( x )} . Per il teorema di convoluzione si ha:
U U UVU
{g} = { f ⊗ h} = { f }⋅ (h} (8.22)
o anche

G (k ) = F (k ) H (k )

123
dove G (k ) = { g} .
Come esempio consideriamo la convoluzione di due impulsi rettangolari il cui risultato è un
impulso triangolare (vedi Fig. 8.2). Si vede che il semplice prodotto delle trasformate è la
trasformata della funzione g.
Nello spazio k l’analoga della (8.22) è il teorema di convoluzione in frequenza, dato dalla:

1
{ f ⋅ h} =
{ f } ⊗ {h}
  

(8.23)

cioè la trasformata del prodotto è la convoluzione delle trasformate.

f x h g
1 1 1

d d 2d

d sinc(u) d sinc(u) d2 sinc2(u)


×

 

Fig. 8.2 Esempio di uso del teorema di convoluzione. u=(kd/2)

Consideriamo ora la trasformazione di un pacchetto d’onda gaussiano. In generale, essendo


un’onda armonica mono-dimensionale del tipo:
− i ( k0 x −ω t )
E ( x, t ) = E0e


è sufficiente modulare in qualche modo l’ampiezza per ottenere l’impulso che si desidera.
Assumendo ad esempio un profilo d’onda indipendente dal tempo,

E ( x, 0) = f ( x )e −ik0x


{ f ( x )e−ik0x } . A tale scopo calcoliamo l’integrale




il problema è quello di determinare la

+∞

∫ −∞
f ( x)e−ik0x eikx dx (8.24)
Ponendo k ' = k − k0 si ha:
+∞
) ∫
F (k ' = f x( e)ik ' x dx = F k( − k0 ) (8.25)
−∞

In altre parole, se F (k ) = { f ( x )} allora F (k − k0 ) = { f ( x)e − ik0 x } . Per il caso specifico di un


 

inviluppo gaussiano del tipo f ( x ) = a / π e − ax si ha quindi:


2

124
− ik0 x
E ( x, 0) = a / π e − ax e
2

e dalla discussione precedente e dalla (8.12) si ha quindi:



{E ( x, 0)} = e − ( k −k0 )
2
/ 4a
(8.26)

Il risultato è quindi ancora una gaussiana centrata in k0.

8.2 Le lenti realizzano le trasformate di Fourier

La Fig. 8.3 mostra un fronte d’onda piano parallelo che incide su di una fenditura, e una lente
localizzata a distanza f da essa, che produce un fascio parallelo di raggi che a due a due
convergono
     

 nel
 piano
  focale
    della

 lente
 medesima, per poi proseguire e formare l’immagine
0      t è detto piano delle trasformate, ed in esso
vediamo la figura di diffrazione (alla Fraunhofer) prodotta dalla fenditura. In altre parole si
dice che la funzione di apertura, cioè la distribuzione del campo elettrico sul piano della
fenditura (che in questo caso coincide con il piano focale oggetto della lente), è trasformata
dalla lente nella figura di diffrazione. In realtà questo è vero solo in parte, poiché la lente non
forma l’immagine su di un piano (si ricordino le aberrazioni).
E’importante notare che il campo di diffrazione di Fraunhofer corrisponde esattamente alla
trasformata della funzione di apertura. Nel caso esaminato la fenditura è nel piano focale
oggetto della lente e tutti i raggi diffratti mantengono la stessa fase durante il percorso
(cammino ottico) fino al piano delle trasformate. Questo non accade quando l’oggetto non è nel
piano focale oggetto della lente. Ci sarà allora una deviazione di fase, ma con nessuna
conseguenza, perché noi andiamo ad osservare la densità di flusso, in cui l’informazione sulla
fase è mediata, e le distorsioni di fase sono quindi inosservabili.
Nelle nostre esperienze di laboratorio andremo a vedere tramite nell’esperienza di “Abbe”
come si comportano le lenti come trasformatori di Fourier per vari tipi di oggetto.

R R
0 t R
i

f f
! " # $ # %&')( * + ,- ! . . / ' 0 0 '- 
' * 1 '. , 1 - ! 0 * / '1 , ( 2 ! ' 1 3). 3 + ' ( ,43 " " , 0 0 3 5
0 di una lente converge a formare la figura di
6 7 8 8 9 : ; 7 < = >?= > @BA 7 : = <C8 < D : @ ?> E
t della lente (o paino delle trasformate), per poi proseguire e formare l’immagine
F G H H I J K K G L L J)M G H N O P M J)Q
i.

125
   

 
i è il piano dell’immagine, cioè il piano coniugato al piano oggetto. Si vede che
l’immagine è capovolta e ingrandita.
La lente forma quindi due configurazioni di interesse: la prima è la trasformata di Fourier sul
piano focale della lente, l’altra è l’immagine dell’oggetto sul piano coniugato al piano oggetto.
Possiamo pensare al piano focale della lente come ad un insieme di sorgenti secondarie,
secondo il principio di Huygens-Fresnel. Si capisce quindi come l’immagine della fenditura sia
il risultato di un doppio processo di diffrazione; la prima produce la ben nota configurazione di
diffrazione, mentre la seconda ricostruisce l’immagine. Se non ci fosse la lente non si potrebbe
vedere l’immagine della fenditura, e si vedrebbe solo la configurazione di diffrazione. Questo
modo di vedere il processo di formazione dell’immagine è stato per la prima volta proposto da
Abbe nel 1873. Naturalmente al posto della fenditura singola si può usare un reticolo. Si
osservi inoltre che se la lente non è grande abbastanza da prendere tutta la luce diffratta dalla
fenditura, l’immagine che si forma non è più corrispondente perfettamente all’originale. Poiché
sono le alte frequenze ad essere lontane dall’asse ottico, la perdita di queste provoca una
mancanza di definizione e di risoluzione dell’immagine. Si può dire che, a meno che la lente
non abbia un’apertura infinita, essa si comporta come un filtro che lascia passare
             "! si vedrà la trasformata di Fourier del reticolo, ed essendo
preferibilmente le basse frequenze.
t
di dimensioni finite e quindi non periodico, la trasformata sarà dominata da alcune componenti
discrete (le armoniche principali), mentre le armoniche secondarie saranno via via più deboli.
La trasformata avrà quindi una ben precisa configurazione. Se invece l’oggetto è più
complicato, al limite continuo, occorreranno infinite armoniche per riprodurlo, e quindi
l’immagine della trasformata sarà molto più complessa.
Si consideri allora la costruzione di Fig. 8.4. #$&%' ( $)*)++ , - - )/. 0 è posto ora ad una distanza
0qualsiasi
1 2 3541 1 6da
7 48una
09 : ;lente
2< i l’immagine
Lt, e una seconda lente Li è posta ad una distanza opportuna in modo da
dell’oggetto.

I Lt
I Li I
0 t
i

Fig. 8.4 Le lenti e i piani oggetto, trasformata ed immagine.

= >@?A B CD/E
è il piano della trasformata della prima lente. Si vede come la lente Li
? DF G BH DC&E
t t

E si cambia la distribuzione di fase e di ampiezza, ma non cambia sostanzialmente il


alla distanza focale f, produca l’immagine, cioè esegua l’anti-trasformata di Fourier. Muovendo
0
fenomeno.

126
Se una mascherina o un filtro è posto nel piano t, oscurando alcune frequenze spaziali, si
impedisce loro di raggiungere il piano immagine, realizzando quindi un filtraggio spaziale. In
generale si vede che le frequenze spaziali elevate contribuiscono a definire i bordi netti delle
immagini, dove si passa rapidamente da una zona illuminata al buio. Rimovendo queste
frequenze, ad esempio con un filtraggio, la nuova immagine risulta più arrotondata e perde di
definizione e di risoluzione.

8.3 La diffrazione di Fraunhofer

La teoria delle trasformate di Fourier porta ad una interessante interpretazione del fenomeno
della diffrazione alla Fraunhofer. Nel capitolo precedente abbiamo visto che per effetto della
diffrazione da un’apertura generica, su cui incide un’onda piana monocromatica, il campo nel
piano immagine (Y,Z) è dato da una eq. del tipo:


ei (ωt − kR )
E (Y , Z ) = A

R ∫∫
apertura
eik (Yy − Zz ) / R dydz (8.27)

dove la quantità R è la distanza dal centro dell’apertura al punto (Y,Z) ed  A è la forza


dell’oscillatore per unità di area. Il termine esponenziale che include il tempo t è invece legato
alla fase della perturbazione nel punto (Y,Z). Si vede che l’ampiezza varia con l’inverso della
distanza. Il termine di fase non ha molta importanza in questo contesto poiché noi siamo
interessati alla distribuzione relativa di ampiezza. Pertanto se ci limitiamo ad una piccola
porzione di spazio in cui R è praticamente costante, il termine davanti all’integrale può essere
pensato in prima approssimazione come una costante. L’unico termine che non è corretto dire
sia una costante è  A, se ad esempio l’apertura non è perfetta ma vi si posano sopra granelli di
polvere
 
o altre
  imperfezioni,
    
ilcampo
     che
siemana
 da ogni singolo elemento d’area può essere
A possono essere conglobate in un unico termine
del tipo:

A( y , z ) = A0 ( y, z )eiΦ ( y , z ) (8.28)

che chiamiamo funzione di apertura. Con questa variazione la (8.27) può scriversi:

+∞ +∞
E (Y , Z ) = ∫ ∫ A( y , z )e ik Yy+ Zz R dydz
( )/
(8.29)
−∞ −∞

I limiti di integrazione possono essere estesi all’infinito perché la funzione di apertura è zero al
di fuori dell’apertura.
Può essere utile a questo punto pensare al contributo infinitesimo dE(Y,Z) nel punto P
come ad un’onda piana che si propaga nella direzione k, ed avente ampiezza A( y , z )dydz . Per
rafforzare ora la somiglianza tra la (8.14) e la (8.29), definiamo le frequenze spaziali:

kY ≡ kY / R = k sin φ = k cos β
(8.30)
k Z ≡ kZ / R = k sin θ = k cos γ

Per ogni punto nel piano immagine c’è quindi una corrispondente frequenza spaziale. Il campo
di diffrazione può quindi essere scritto:

127
+∞ +∞
E (kY , k Z ) = ∫ ∫ A( y , z )ei ( kY y + kZ z ) dydz (8.31)
−∞ −∞

siamo quindi al punto cruciale: la distribuzione del campo nella diffrazione di Fraunhofer è la
trasformata di Fourier della funzione di apertura, simbolicamente scriveremo:

E (kY , k Z ) = { A( y , z )} (8.32)

La distribuzione del campo elettrico nel piano immagine è lo spettro di frequenze spaziali della
funzione di apertura. La trasformata inversa è quindi la funzione di apertura medesima, cioè:

1 +∞ +∞
A( y , z ) =
2π ∫ ∫
−∞ −∞
E (kY , k Z )e −i (kY y +kZ z )d kY d k Z (8.33)
o simbolicamente:

A( y , z ) =


{E (kY , k Z )} (8.34)
 

Come abbiamo già detto più è localizzato il segnale, più è distribuito su di un’area vasta la sua
trasformata. Più piccola è l’apertura più larga è la figura di diffrazione.

8.4 Le funzioni di trasferimento

Fino a tempi recenti il modo tradizionale di determinare la qualità di un sistema ottico è stato
quello di valutare i suoi limiti di risoluzione. Migliore la risoluzione, migliore si pensava fosse
il sistema nel suo complesso. Supponiamo allora di osservare con un sistema ottico un insieme
di linee di spessore via via decrescente. Come abbiamo visto prima, anche per un sistema ottico
perfetto, vi è un limite imposto dalla diffrazione, oltre il quale non sarà più possibile
distinguere una linea. Possiamo pensare a questo limite come ad un taglio nel campo delle
frequenze che producono l’immagine. Un analogia che mette in risalto il limite di questo
approccio al problema, è per esempio quello di pensare di valutare l’alta fedeltà di un sistema
sonoro sulla base di un suo limite nel campo delle frequenze. La limitazione di questo schema
diviene evidente quando si introduce un detector dopo il sistema ottico (o sonoro). Avendo
questi in generale una loro sensibilità e risoluzione, sembra ragionevole pensare che il sistema
ottico da associare ad esso non debba avere necessariamente avere prestazioni eccezionali, se
poi il detector che usiamo non è in grado di rilevarle. Il nostro orecchio ad esempio è sensibile
in un certo intervallo di frequenze, per cui non è necessario possedere un impianto sonoro in
grado di emettere onde di altissima frequenza, dato che noi non le sentiremmo.
Fino ad ora abbiamo già rappresentato un oggetto come un insieme di punti sorgente,
ognuno dei quali è trasformato dal sistema ottico in una PSF, e quindi per convoluzione
nell’immagine completa. Adesso affrontiamo il problema dell’analisi dell’immagine da un
punto di vista diverso. Consideriamo l’oggetto come la sorgente di un impulso luminoso che è
esso stesso fatto di onde piane, che viaggiano lungo le direzioni date dalla (8.30), e quindi
corrispondenti a determinate frequenze spaziali. La domanda che ci si pone è quindi: come il
sistema modifica l’ampiezza e la fase di ogni onda piana nell’attraversamento del sistema
dall’oggetto all’immagine?
Un parametro utile a questo proposito è il contrasto o modulazione, definito dalla:

I max − I min
Modulazione ≡ (8.35)
I max + I min

128
Definiamo quindi il rapporto tra il contrasto dell’oggetto e il contrasto dell’immagine a tutte le
frequenze spaziali come “Modulation Transfer Function” (MTF).
In Fig. 8.5 sono graficate le MTF di due ipotetiche lenti in funzione della frequenza spaziale di
un ipotetico detector. Entrambe valgono 1 in corrispondenza di una frequenza nulla e diventano
nulle ad una data frequenza, ove non sono più in grado di risolvere l’oggetto. Se fossimo
limitati solo dalla diffrazione queste frequenze di taglio dipenderebbero solo dall’apertura delle
lenti. Supponiamo ora di dover accoppiare una delle due lenti ad un detector che non è in grado
di percepire frequenze oltre una certa soglia (linea tratteggiata in figura).

MTF
2

limite del detector

frequenza spaziale

Fig. 8.5 Il contrasto di due lenti in ordinata e la frequenza di un ipotetico detector in ascissa.

A dispetto del fatto che la lente N. 1 ha una frequenza di taglio maggiore della N. 2 si vede che
la lente N. 2 è in grado di fornire migliori prestazioni della N. 1, fino al limite di frequenza del
detector.
Se l’input di un sistema è fatto ad esempio da una rete, cioè da una serie di impulsi
quadrati, il contrasto nell’immagine è dovuto alla sovrapposizione del contrasto delle singole
componenti di Fourier che compongono l’oggetto. Un punto importante da sottolineare è che
gli elementi di un sistema ottico funzionano come operatori lineari che trasformano i vari
impulsi sinusoidali in input in altrettanti impulsi sinusoidali in output. Tuttavia la distribuzione
della densità di flusso non sarà identica in input e in output. Ad esempio l’ingrandimento altera
le frequenze spaziali di output, la diffrazione e le aberrazioni riducono l’ampiezza delle
sinusoidi (contrasto), e infine, le aberrazioni fuori asse ed il non perfetto centraggio delle
ottiche, producono uno spostamento (shift) nella posizione della sinusoide di output
corrispondente all’introduzione di una variazione di fase. Indipendentemente dalla simmetria
della PSF se l’oggetto è armonico l’immagine è armonica. Pertanto se pensiamo ad un oggetto
come composto da una serie di armoniche di Fourier, ognuna di esse è trasformata dal sistema
ottico in un output armonico, e l’immagine è data dalla serie di queste armoniche, che come
abbiamo detto cambiano rispetto all’input in ampiezza e fase. La funzione che descrive come la
singola armonica cambia nell’attraversare il sistema si chiama “Optical Transfer Function”
(OTF). Essa è una quantità complessa dipendente dalla frequenza spaziale il cui modulo è la
MTF e la cui fase è la “Phase Transfer Function” (PTF). La prima è una misura della riduzione
in contrasto tra l’oggetto e l’immagine su tutto lo spettro, la seconda rappresenta la fase
relativa. Differenze di fase nei sistemi ottici si hanno però solo fuori asse, e quindi la PTF è
spesso meno importante della MTF. Tuttavia ci sono casi in cui la PTF ha un ruolo cruciale.
In generale possiamo dire che la MTF è oggi molto usata per specificare le proprietà di tutti
i tipi di sistemi ottici (e non), dalle lenti, ai nastri magnetici, alle pellicole, ai telescopi,
129
all’atmosfera, all’occhio, e così via. Essa ha il vantaggio che se tutte le singole MTF delle
componenti di un sistema sono note, la MTF del sistema nel suo complesso è semplicemente il
prodotto di tutte le singole MTF. Le lenti però fanno eccezione, poiché le aberrazioni di una
lente possono essere corrette da quelle di un altra, esse non sono indipendenti, e non si può
applicare quanto detto prima.

8.4.1 OTF non normalizzata e normalizzata

Abbiamo visto che un’immagine, nelle condizioni di invarianza spaziale ed incoerenza, può
essere espressa come la convoluzione della densità di flusso dell’oggetto e della PSF del
sistema, cioè dalla relazione:

I i (Y , Z ) = I 0 ( y , z ) ⊗ S ( y, z ) (8.36)

Nel dominio delle frequenze questa relazione si traduce nella:

{Ii (Y , Z )} = {I0 ( y , z )} ⋅ {S ( y , z )} (8.37)

dove si è fatto uso del teorema di convoluzione. Si vede che è l’operazione di moltiplicazione
che produce l’alterazione delle frequenze dell’oggetto e le converte in quelle dell’immagine. In
altre parole è la {S(y,z)} che trasforma lo spettro dell’oggetto in quello dell’immagine. Questo
è proprio ciò che abbiamo definito essere il ruolo dell’OTF, e pertanto chiamiamo OTF non
normalizzata la funzione:

(kY , k Z ) ≡ {S ( y , z )}


Verifichiamo ora quanto detto precedentemente riguardo al fatto che un impulso armonico si
conserva tale dopo la trasformazione. A questo proposito supponiamo di avere un’onda mono
dimensionale con

I 0 ( z ) = 1 + a cos(k Z z + ε )

con questa scelta l’integrale di convoluzione si esprime:

+∞
I i ( Z ) = ∫−∞ {1 + a cos[k Z ( Z − z ) + ε ]}S ( z )dz (8.38)

espandendo il coseno abbiamo:

+∞ +∞ +∞
I i ( Z ) = ∫−∞ S ( z )dz + a cos(k Z Z + ε ) ∫−∞ cos k Z zS ( z ) dz + a sin(k Z Z + ε ) ∫−∞ sin k Z zS ( z )dz

il secondo e terzo integrale sono rispettivamente le componenti in coseno e seno della


 

trasformata della S(z), cioè c {S ( z )} e s {S ( z )} . Quindi,

+∞
I i ( Z ) = ∫−∞ S ( z )dz + c {S ( z )}a cos(k Z Z + ε ) + s {S ( z )}a sin(k Z Z + ε )
 

Ricordando la definizione di trasformata complessa,

130
{ f ( z )} = c { f ( z )} + s { f ( z )}
o
F (k Z ) = A(k Z ) + iB(k Z )

e le seguenti relazioni:

{ f ( z )} = F (k Z ) eiϕ ( kZ ) = F (k Z ) [cos ϕ + i sin ϕ ]

dove
1/ 2
F (k Z ) =  A2 (k Z ) + B 2 (k Z ) 
B (k Z )
ϕ (k ) = tan −1
A(k Z )

Possiamo quindi scrivere

{ f ( z )} ≡ (k Z ) = (k Z )eiΦ ( kZ )
 

(8.39)

(k Z ) e Φ (k Z ) sono rispettivamente la MTF non normalizzata e la PTF rispettivamente.




dove
La (8.38) può quindi riscriversi

+∞
I i ( Z ) = ∫−∞ S ( z )dz + a (k Z ) cos[k Z Z + ε − Φ(k Z )]


(8.40)

Si noti che questa è una funzione della stessa forma della funzione di ingresso. Se la PSF è
simmetrica (cioè pari) s {S ( z )} = 0, (k Z ) = c {S ( z )} e Φ (k Z ) = 0 ; non c’è quindi variazione
  

di fase, come visto prima.




E’ uso comune definire una funzione di trasferimento normalizzata dividendo la (k Z ) per


+∞
(0) = ∫


il valore che assume a frequenza zero, cioè S ( z )dz . La PSF normalizzata diviene
−∞
quindi:

S ( z)
Sn ( z) = +∞
(8.41)
∫−∞
S ( z ) dz
e la OTF normalizzata,


{S ( z )}
T (k Z ) ≡ = {S n ( z )}


+∞
(8.42)

−∞
S ( z ) dz

o in due dimensioni
Φ ( kY , kZ )
T (kY , k Z ) = M (kY , k Z )ei (8.43)

dove M (kY , k Z ) ≡
 

(kY , k Z ) / (0, 0) è la MTF normalizzata. In questo modo la (8.40) si


riscrive:

131
I i ( Z ) = 1 + aM (k Z ) cos[k Z Z + ε − Φ(k Z )]

dove la modulazione dell’immagine è aM (k Z ) , la modulazione dell’oggetto è a, e il loro


rapporto è la MTF normalizzata M( Z).
Questa è solo una discussione introduttiva a questo modo di trattare i problemi dell’ottica,
per cui chi volesse approfondire consulti i libri citati nella bibliografia.

132
9 CAPITOLO 9
9.1 Cenni sul funzionamento del LASER

Durante il decennio 1950-1960 sono nati due strumenti molto importanti per la scienza
moderna, e per l’ottica in particolare; essi sono il MASER il cui acronimo sta per Microwave
Amplification by Stimulated Emission of Radiation, ed il LASER (Light Amplification by
Stimulated Emission of Radiation). Alla base di questi strumenti ci sono gli studi di molte
persone, ma in particolare di C.H. Townes, A.M. Prokhorov e N.G. Basov, A.L. Schawlow,
T.H. Maiman.
Il laser è uno strumento quanto-meccanico, nel senso che si basa sulle proprietà con cui gli
atomi interagiscono con la radiazione elettromagnetica. Per capire in modo approssimativo il
meccanismo di funzionamento, facciamo una breve panoramica sui meccanismi di emissione
delle lampade ordinarie e delle stelle. A questo fine sarà necessario richiamare alcune nozioni
di teoria dell’assorbimento e dell’emissione della radiazione elettromagnetica da parte degli
atomi della materia.

9.1.1 Energia e materia in equilibrio

La teoria quantistica ha le sue origini negli studi sulla radiazione di corpo nero degli anni
intorno al 1859. In quegli anni C. Darwin pubblicava L’origine della Specie e G.R. Kirchhoff
studiava la radiazione termica emessa dai corpi in equilibrio con la radiazione. Egli caratterizzò
le proprietà di emissione e di assorbimento della radiazione tramite i coefficienti    
   
       è l’energia emessa per unità di area e di tempo in un intervallo piccolo di
      !"$# % !& !'" ( ) * +-,+* .
à ad es. W/m2/ 0-1 2
3 4 è la frazione di energia incidente
assorbita per unità di area e di tempo nel medesimo interva5 5 6'789: ;6;-<=$>;8 ? à di misura
@essendo
ABCDE F F una
GH I Jfrazione).
BHG KABL Entrambi
JM N
J'L DEE i O
coefficienti
E P P EJ'G Q Q Jdipendono dalla
M RE$RE BEG H- ABGnatura
L E M P G$S-del
NA corpo e dalla
N
J
L J'G H-ABG @ P M G$S T ò emettere o assorbire

P E O-N
Kirchhoff
J'G HJCBUsiS V
accorse
WX Y XWX Zche
Z X[ la densità di flusso spettrale, cioè l’energia per unità di area e di

ελ
Iλ = (9.1)
αλ

è la stessa per ogni materiale, indipendentemente dal colore, dalle dimensioni, dalla forma, etc,
\^]_ `
\ a]\cb de df]g e e gih \ j-`
\ k g h lk g^\^]g e e gim n-oqi
p rst u à di Iv sono W/m3 o J/m3s. Sebbene
Kirchhoff non fu in grado di fornire un’espressione generale per Iv , egli notò che per un corpo
sp w xzy {
p w}| rtq~ v =1) è Iv € ‚ , e che la radiazione che emerge da un piccolo buco di una cavità
isolata è a tutti gli effetti equivalente a quella di un corpo nero perfetto alla medesima
temperatura. La comunità scientifica si mise al lavoro, e dopo diverse difficoltà, si arrivò ad
una determinazione sperimentale della I‚ alle varie temperature (vedi Fig. 9.1).
Un altro risultato importante in questo settore fu ottenuto J. Stephan e L. Boltzmann
separatamente. Essi derivarono la seguente relazione valida per un corpo nero:

P = σ AT 4 (9.2)

134
Questa relazione ci dice che la potenza totale irradiata a tutte le lunghezze d’onda per un corpo
nero la cui superficie radiante è A, dipende solo dalla temperatura (assoluta) alla sua quarta
   
è un               !"#$$ ×10-8 W/m2K4.

Il (W/m3)

T alta

T bassa

iFj
bX/k

Fig. 9.1 L’andamento alle varie temperature della funzione I%

Si noti come il massimo di intensità si sposta verso le piccole & ' (*) + , - ) , + ,/., ( ( '10 , 2/3, + ' 0 4+ '56 (
modo in cui si sposta il massimo prende il nome di legge di Wien, la quale ci dice che:

λmaxT = costante (9.3)

La costante fu trovata sperimentalmente essere 0.2898 cm K.


E’ opportuno anche notare che i corpi reali non sono corpi neri e quindi il loro
assorbimento della radiazione non è mai 1. Tuttavia a certe temperature e lunghezze d’onda
alcuni corpi si avvicinano al corpo nero ideale, il carbone nero ad esempio, o il nostro stesso
corpo per le lunghezze d’onda infrarosse. Per i corpi reali si ha quindi una relazione un po’
diversa dalla (9.2) dovendo introdurre un coefficiente moltiplicativo che esprime l’emissività
0 70 ' ( ,8 93, + ) 4: ;

P = ε σ AT 4

La temperatura a cui ci si riferisce è la temperatura assoluta definita da Lord Kelvin, per cui gli
0° C corrispondono a 273 K.
Fu a questo punto che tutti i tentativi teorici di riprodurre le curve di Fig. 9.1 fallirono e si
aprì la strada alla meccanica quantistica. Wien produsse una relazione che funzionava per le
3: ) ) 7( ,< =>? @ A B C DEFBG B ? HIKJH?LB MKA BDM ? HNCO P Q RST UVR W XFYZ [FT \ ] UR ^ U`_Ya*R Y bc dFbW RKe fggP h Y
sua formula

 
2π hc 2  1 
Iλ = (9.4)
λ 5  λkhcBT 
 e − 1 

135
riproduceva bene i dati sperimentali, sebbene Planck non aveva idea precisa del motivo per cui
funzionava. Nella (9.4) h è la costante di Planck, c è la velocità della luce, e kB è la costante di
Boltzmann. Planck assunse che gli atomi delle pareti della cavità di corpo nero, si
comportassero come degli oscillatori che assorbono e riemettono radiazione indipendentemente
dal materiale. Non essendo isolati gli atomi che compongono le pareti non si comportano come
oscillat       

                    
continuo. Tuttavia con i modelli tradizionali le cose non funzionavano e così Planck decise di
servirsi dei metodi probabilistici sviluppati da Boltzmann in quegli stessi anni. Egli assunse
che il pacchetto di energia minimo che poteva essere emesso e assorbito fosse dato dalla
quantità   !#" $ % &% ' () *,+% &) +*- .!/ ì per la prima volta quantizzata. Oggi sappiamo che ogni
oscillatore può emettere o assorbire solo multipli interi di questa quantità.

9.1.2 Emissione stimolata

Per introdurre il fenomeno dell’emissione stimolata è opportuno prima parlare della


popolazione dei livelli energetici di un atomo. Il problema in questione fa parte integrante degli
studi di meccanica statistica. In particolare ci riferiremo alla distribuzione di Maxwell-
Boltzmann.
Immaginiamo una cavità contenente un gas in equilibrio ad una certa temperatura T. Se T è
relativamente bassa la maggior parte degli atomi si troveranno nel loro stato fondamentale, e
solo alcuni si ecciteranno per alcuni istanti in un qualche stato eccitato. Per la legge di
Maxwell-Boltzmann il numero medio di atomi per unità di volume Ni che si trova in uno stato
eccitato Ei è tale che:

N i = N 0 e− Ei / k BT

dove N0 è una costante per una data temperatura. Maggiore è il valore di E, l’energia dello stato
eccitato, più piccolo è il numero degli atomi che si troveranno in quello stato. Poiché noi siamo
interessati alle transizioni tra i vari stati eccitati scriveremo che il rapporto delle popolazioni di
atomi che occupano due livelli energetici i e j è:

−E /k T
Nj e j B
= − Ei / k BT (9.5)
Ni e

e quindi anche:

− ( E j − Ei ) / k B T − hν ji / k B T
N j = Ni e = Ni e (9.6)

dove si è fatto uso del fatto che il passaggio dallo stato energetico Ej ad Ei è accompagnato
dall’emissione di un fotone di frequenza  ji.
Nel 1916 Einstein ideò una teoria semplice ed elegante per trattare il problema
dell’assorbimento e dell’emissione di fotoni da parte di un mezzo materiale immerso in un
campo di radiazione elettromagnetica.
Supponiamo che un atomo si trovi nel suo stato fondamentale. Un fotone con una data
quantità di energia interagisce con esso, facendo si che l’atomo passi in uno stato eccitato. In
questo nuovo stato l’atomo rimane per circa 10 ns, dopo di che riemette un fotone ritornando al
suo stato fondamentale. Questo processo è noto come emissione spontanea. Se il mezzo è
abbastanza denso l’atomo può scambiare l’energia in eccesso posseduta con il mezzo tramite
gli urti. C’è però una terza alternativa, quella apprezzata per la prima volta da Einstein, ed è
136
che l’atomo ancora nel suo stato eccitato interagisca nuovamente con un altro fotone. L’atomo
emette quindi un secondo fotone in fase, con la stessa frequenza e la stessa polarizzazione, e
avente la stessa direzione del fotone incidente. Questo processo è noto come emissione
stimolata. La velocità con cui avviene il processo di assorbimento stimolato è dato dalla:
 dN i 
  = − Bij N i uν (9.7)
 dt ass.

cioè dipende proporzionalmente (tramite il coefficiente Bji) dalla densità di energia del campo
di radiazione incidente u , e dal numero di atomi che si trovano nello stato Ni. Nel caso
dell’emissione stimolata si ha invece:

 dN j 
  = − B ji N j uν (9.8)
 dt em.

E per l’emissione spontanea, dove il processo è indipendente dal campo di radiazione


incidente, si ha:

 dN j 
  = − Aji N j (9.9)
 dt  sp .

Si ricordi che la velocità di transizione (cioè il numero di atomi che subiscono la transizione

per secondo) divisa per il numero di atomi, è la probabilità di transizione per secondo .

Pertanto la probabilità per secondo dell’emissione spontanea è =Aji. L’inverso della
probabilità di transizione per secondo è la vita media    
     
Le tre costanti Aji, Bji, e Bij sono dette coefficienti di Einstein. Seguendo il suo
ragionamento, assumiamo che 1) ci sia equilibrio termodinamico tra la radiazione e il gas di
atomi ad ogni T; 2) che la densità di energia ha le caratteristiche di un corpo nero; 3) che la
popolazione dei livelli energetici segua la legge di Maxwell-Boltzmann. In un sistema di
questo tipo, il numero di transizioni (i → j ) deve essere uguale al numero di transizioni
( j → i ) , e quindi deve essere:
Bij N i uν = B ji N j uν + Aji N j

dividendo per Ni e riarrangiando,


Nj Bij uν
=
Ni Aji + B ji uν

e facendo uso della (9.6) si ha quindi:

− hν ji / kB T Bij uν
e =
Aji + B ji uν

da cui risolvendo per u ,

Aji / B ji
uν = hν ji / kB T
(9.10)
( Bij / B ji )e −1

137
Einstein mise in evidenza che per T → ∞ , anche uν → ∞ se Bij = B ji = B per T grandi. Tuttavia
essendo i coefficienti indipendenti dalla temperatura, devono risultare uguali a tutte le T.
Pertanto la probabilità di emissione stimolata e uguale alla probabilità di assorbimento
stimolato. Posto quindi Aji=A si può riscrivere:

A 1 
uν =  (9.11)
− 1 
hν ji / kB T
B e

e, confrontando la (9.11) con la (9.4) trasformata in I , deve essere:

A 8π hν 3
= (9.12)
B c3

La probabilità dell’emissione spontanea è proporzionale alla probabilità di emissione stimolata.


 Immaginiamo
   
   un

 sistema

   
 di

atomi
in
 equilibrio
    termico
 
 con
   due
  soli
  possibili
   stati,
!lo
stato

 "
trascurare l’emissione spontanea. Quando il sistema è inondato dai fotoni dell’energia
opportuna, l’assorbimento stimolato spopola il livello i, mentre l’emissione stimolata spopola il
livello j. Il numero di fotoni che spariscono dal sistema per secondo per assorbimento stimolato
è proporzionale a # assNi, mentre il numero che entra nel sistema per emissione stimolata è # stNj,
ma dall’eguaglianza dei coefficienti segue che # ass= # st. Pertanto # assNj = # stNj. Se il sistema è
in equilibrio termico Ni > Nj, il che significa che il numero di fotoni che spariscono per
secondo è maggiore di quelli che entrano; c’è quindi un assorbimento netto di fotoni perché
generalmente lo stato fondamentale è maggiormente popolato dello stato eccitato. Se è
possibile realizzare la situazione inversa si avrà quindi un eccesso di fotoni, e l’emissione
stimolata prevarrebbe sull’assorbimento stimolato.

9.2 Il LASER

E’evidente da quanto discusso prima che il Laser funziona con il meccanismo dell’inversione
di popolazione. Un fotone incidente della frequenza opportuna può in questo caso stimolare
una vera e propria valanga di fotoni tutti uguali tra loro, tutti in fase. L’onda incidente
continuerà a crescere fintanto che altri processi, come la diffusione, non interverranno a frenare
il processo, e fino a quando il meccanismo che realizza l’inversione di popolazione è in grado
di funzionare. In effetti energia elettrica, chimica o ottica deve essere spesa per sostenere
l’inversione di popolazione.
Il primo tipo di Laser, quello ideato da Maiman (Fig. 9.2), era costituito da un cristallo di
Al2O3 contenente un 0.05% di Cr2O3, quindi un rubino sintetico rosa pallido le cui facce
vengono lavorate piatte e tra loro parallele, e argentate (una solo parzialmente) a formare una
cavità risonante.
Il mezzo attivo è inserito all’interno di una lampada a scarica contenente del gas a forma di
elica, che fornisce l’energia di pompaggio per instaurare l’inversione. Il rubino appare rosso
perché gli atomi di Cromo hanno bande di assorbimento nella regione blu e verde dello spettro.
Accendendo il tubo si genera una scarica di luce intensa che dura pochi millisecondi. Molta
dell’energia viene dissipata in calore, ma molti degli ioni Cr3+ sono eccitati nelle bande di
assorbimento. Gli atomi eccitati si diseccitano in circa 100 ns, restituendo energia al lattice del
cristallo e facendo transizioni non radiative. Preferenzialmente però essi rimangono per circa 3
ms in uno stato metastabile prima di decadere, in molti casi spontaneamente, nello stato
fondamentale. Quest’ultimo salto emette la radiazione caratteristica rossa tipica del Laser. In

138
questa fase dominano le transizioni al livello fondamentale e si ha un’emissione a banda larga
centrata attorno a 694.3 nm con luce incoerente emessa in tutte le direzioni.
Aumentando la velocità di pompaggio si assiste al fenomeno dell’inversione di
popolazione, e i primi fotoni emessi per stimolazione cominciano la reazione a catena. Un
fotone emesso innesca a sua volta l’emissione di un altro fotone identico, togliendo energia
dagli atomi nello stato metastabile e trasformandola in luce coerente.

lampada a scarica rubino sintetico

raggio laser

Fig. 9.2 Il primo tipo di Laser costruito da Maiman nel 1960.

L’onda continua a crescere in quanto passa avanti e indietro all’interno del mezzo attivo (il
rubino). Poiché una delle superfici di questo è solo parzialmente riflettente un intenso impulso
di luce laser rossa (che dura circa 0.5 ms ed ha una larghezza di banda di 0.1 nm) emerge da
una faccia del rubino.
Si noti quanto il tutto sia semplice. La banda larga di assorbimento facilita l’eccitazione,
mentre la lunga vita media degli stati metastabili innescano l’inversione di popolazione.
Il grado di coerenza di questo tipo di Laser va da 0.1 m ai 10 m (vedi oltre).
Come un oscillatore il Laser a rubino genera impulsi luminosi dell’ordine dei millisecondi
nell’intervallo di energia tra 50 J e 100 J, ma esistono tecniche per superare quest’energia. Il
Laser a rubino commerciale opera ad un’efficienza minore dell’1%, producendo un raggio con
un diametro che va da 1 mm a circa 25 mm, con una divergenza tra 0.25 mrad a circa 7 mrad.

9.2.1 Il Laser ad He-Ne

Dopo che Maiman annunciò il primo tipo di Laser si ebbe una crescente attività in questo
settore, e già nel febbraio del 1961 fu prodotto il primo tipo di Laser He-Ne ad onda continua
(c-w). Esso permette una potenza continua di pochi milliwatt, spesso per una lunghezza d’onda
del visibile (632.8 nm). E’un strumento abbastanza facile da costruire e di poco costo e
semplice da usare. Per questo è molto usato nei laboratori come il nostro.
Il meccanismo di pompaggio è generalmente fornito da una scarica elettrica. Gli elettroni
liberi e gli ioni del gas sono accelerati dalla presenza di un campo elettrico, e per collisione si
determina un’ulteriore eccitazione e ionizzazione del gas. Molti atomi di He dopo essersi
diseccitati dai livelli di eccitazione più elevati, si concentrano nei livelli eccitati a lunga vita
media 21S e 23S che sono metastabili e dai quali non ci sono transizioni radiative permesse. Gli
atomi eccitati di He collidono in modo non elastico e trasferiscono energia agli atomi di Ne nel
loro stato fondamentale, portandoli agli stati di eccitazione 5s e 4s, che decadono negli stati 4p
e 3p realizzando l’inversione di popolazione. Le transizioni tra gli stati 5s e 4s sono proibite.

139
L’emissione spontaneadi
  fotoni inizia

   quindi
  la  reazione
         a 
catena.
 
 Le transizioni
  !   "  dominanti
$#%  &  & 
corrispondono alla
p decadono a loro volta nello stato 3s, sostenendo quindi il meccanismo di inversione.

9.2.2 Le cavità ottiche risonanti

La cavità risonante ha un ruolo significativo nella costruzione di un Laser. Come abbiamo


detto il processo di emissione è nelle prime fasi un’emissione spontanea in tutte le direzioni, e
così è anche per i primi fotoni stimolati. Tuttavia solo i fotoni che si muovono lungo l’asse del
rubino sono riflessi avanti e indietro, e con il tempo costruiscono la cascata di fotoni altamente
direzionale del Laser. I fotoni emessi fuori asse vengono persi e riscaldano semplicemente
l’apparato.
La perturbazione ondulatoria che si propaga in asse nella cavità risonante assume la forma
di un’onda stazionaria determinata dalla separazione L delle due superfici riflettenti. La cavità
risuona quando vi è un numero intero m di ' ( )+*, - - .0/ 1$2 3 4 .+5 6 27498:$,;/ 1$, < < =4 >@?A 4 8, 2 è che
occorre che ci sia un nodo dell’onda stazionaria ad ogni specchio, e questo accade quando

L
m=
λ/2

e quindi per una frequenza

mv
νm = (9.13)
2L

dove v è la velocità dell’onda nel mezzo. Esiste pertanto un numero infinito di possibili
oscillazioni stazionarie, detti modi longitudinali della cavità, ognuno dei quali con una
frequenza ben precisa B m. Due modi consecutivi sono perciò separati da una differenza di
frequenza costante,

v
ν m+1 − ν m = ∆ν = (9.14)
2L

o c/2L se la velocità della luce è c. Per un Laser a gas lungo un metro è C D EF GHJILKNMOP modi
risonanti sono considerevolmente più stretti in frequenza delle normali transizioni atomiche
spontanee. Questi modi, se l’apparecchio è costruito in modo che ve ne siano uno o più,
saranno i soli che la cavità sostiene, e quindi il raggio emergente è ristretto attorno a questa
frequenza. In altre parole è la cavità che permette di sostenere uno o più modi stazionari, ed è
per questo motivo che la luce Laser è altamente monocromatica rispetto a tutte le altre sorgenti
luminose. Perciò sebbene le transizioni degli atomi del rubino allo stato fondamentale sono
piuttosto larghe in termini di banda (0.53 nm corrispondenti a 330 GHz), e questo a causa delle
interazioni degli ioni del Cromo con il lattice del cristallo, la larghezza di banda determinata
dalla cavità per un singolo modo risonante è molto più stretta, dell’ordine di 0.00005 nm (30
MHz).
Un possibile modo per generare solo un singolo modo risonante nella cavità è quello in cui
la separazione tra i modi data dalla (9.14) sia maggiore della larghezza di banda delle
transizioni del mezzo attivo (in questo caso il rubino). Per un Laser a rubino una cavità di pochi
cm è sufficiente per generare un solo modo risonante. Lo svantaggio di questo modo di operare

140
è che si diminuisce la regione attiva che contribuisce alla costruzione del raggio e quindi si
diminuisce la potenza del Laser.
Oltre ai modi longitudinali si possono avere però anche dei modi trasversali sostenuti dalla
cavità. Poiché essi sono perpendicolari all’asse di propagazione z, essi sono noti con il termine
di modi TEMmn. Gli indici m ed n sono il numero intero di linee nodali trasversali nelle
direzioni x ed y attraverso il raggio emergente. Questo significa che visto in sezione il raggio
Laser apparirà diviso in una o più regioni. Il TEM00 è l’ordine trasversale più basso ed è il più
usato. La sua densità di flusso è circa una gaussiana, non vi sono variazioni di fase nel campo
elettrico su tutto il raggio in sezione, ed è quindi completamente coerente spazialmente; la sua
divergenza angolare è la più piccola possibile. Si noti però che l’ampiezza non è costante su
tutto il fronte d’onda, per cui è leggermente disomogeneo.
Anche la forma degli specchi non deve essere necessariamente piana. Diverse
configurazioni con specchi piani accoppiati a specchi concavi, o con due specchi concavi, sono
state realizzate, ed ognuna ha i suoi propri vantaggi e svantaggi, in termini ad esempio di
stabilità della luce Laser. In un Laser instabile il raggio all’interno della cavità si allontana
progressivamente dall’asse ottico e si perde. In una configurazione stabile, con specchi che
sono rispettivamente 100% e 98% riflettenti, il raggio può viaggiare avanti e indietro anche 50
volte o più. I Laser instabili sono i più usati quando si ha bisogno di potenza, in quanto il
raggio deviando progressivamente dall’asse investe altre regioni del rubino, aumentando il
potere di estrazione di fotoni. A seconda quindi dell’utilizzo che si deve fare della luce Laser si
scelgono i tipi di cavità risonanti che meglio si adattano agli scopi che ci si prefigge.

D0

I/I0=1/e2

Fig. 9.3 Cavità risonante con specchi concavi. A seconda delle dimensioni dei raggi di curvatura degli specchi
rispetto alla distanza L, il Laser risulta più o meno stabile. Si veda la Fig. 13.12 di Hecht 1998.

Quando gli specchi che formano la cavità sono curvi c’è la tendenza a focalizzare il raggio
Laser, producendo una sezione minima del raggio D0 (Beam Waist=cintura del fascio) . In Fig.
9.3 è rappresentata una situazione ipotetica in cui il raggio Laser ha un minimo diametro D0 al
centro della cavità (il luogo ove cade il minimo dipende dalla curvatura degli specchi usati). Il
fascio laser in figura è rappresentato come limitato da due linee curve. Esse rappresentano il
raggio gaussiano ove l’intensità del fascio è I/I0 =1/e2 , con I0 intensità del fascio per r = 0.
L’angolo sotteso dal diametro del fascio in cui I/I0 =1/e2 si dice convergenza o divergenza del
fascio.
Per l’ottica geometrica il fascio dovrebbe convergere in un punto, ma per effetto della
diffrazione questo non succede. Per un Laser TEM00, come quello da noi utilizzato, vale la
relazione:


D0 = (9.15)
πθ

141

è la lunghezza d’onda della radiazio
        D0 = cost.
Perciò per un fascio fortemente collimato il diametro D0 deve essere grande. La variazione
delle dimensioni del fascio in prossimità del Beam Waist è data dalla:

D = D0 1 + (θ z / D0 )2 (9.16)

dove z è la distanza lungo il raggio dal Beam Waist. Definiamo come intervallo di Rayleigh la
distanza dal Beam Waist in cui il diametro del fascio diviene D0 2 . Questo accade quando il
secondo termine nella (9.16) è uguale ad 1, cioè per z = z R = D0 / θ . Se si grafica il raggio di
curvatura del fronte d’onda del Laser in funzione di z, si può vedere che esso ha un minimo
proprio per z = ±zR. L’estensione 2zR può essere presa come la regione di collimazione del
fascio gaussiano.
L’intervallo di Rayleigh può scriversi in vari modi:

D0 4λ π D02
zR = = =
θ πθ 2 4λ

Le quantità D0!
!"$# R descrivono completamente le caratteristiche di un fascio Laser e sono tra
loro mutuamente correlate. Ad esempio per un Laser He-%'&)( * +-,..0/
12436587 00 con un
diametro D0 9
:6; 11'<!= :>?$@ +-A!B CD1E ? 9'FHG R=1.25 m.

9.2.3 Collimazione di un fascio Laser

Per mezzo di lenti la divergenza, il Beam Waist e l’intervallo di Rayleigh di un fascio


gaussiano possono essere modificate, ma la relazione tra i tre parametri non può essere
modificata. Pertanto per aumentare la collimazione del fascio riducendo la divergenza, il
diametro del fascio deve aumentare. Consideriamo la Fig. 9.4.

A.

B.

Fig. 9.4 Il Beam Expander Galileiano (A.) e Kepleriano (B.).

142
Sono due modi diversi di espandere un fascio  Laser
  (Beam

Expander).
 Nel caso A. si può
dimostrare che la nuova divergenza del fascio è è l’ingrandimento del sistema
di lenti dato dal rapporto delle focali delle due lenti. Nel caso B. la densità di potenza nel fuoco
della Ia lente è così alta che in taluni casi si possono verificare delle scariche elettriche. Il
principale vantaggio del caso B. rispetto al caso A. è che si possono piazzare dei diaframmi
(molto piccoli) nel punto di convergenza in modo da realizzare un filtraggio spaziale e ripulire
il fascio dalle alte frequenze spurie.

9.2.4 Coerenza

Nel caso di un Laser, l’interferenza di un fascio con se stesso ci può dare informazioni sulla sua
coerenza. Se infatti l’ampiezza o la fase o la lunghezza d’onda cambiano tra due punti,
l’interferenza mostrerà di quanto e ci darà un’idea della variazione spaziale e temporale di
coerenza. Un sistema di frange ben visibile diverrà via via meno visibile man mano che la
coerenza del fascio diminuisce. Questa perdita di visibilità delle frange è usata per misurare la
coerenza della luce Laser.
La visibilità delle frange può essere misurata dal contrasto tra le frange di interferenza:

I max − I min
C= (9.17)
I max + I min

dove Imax è l’intensità delle frange luminose e Imin quella delle frange scure. Questo contrasto si
può misurare per mezzo di un interferometro di Michelson al variare delle lunghezza di uno dei
bracci dell’interferometro. La visibilità delle frange può essere misurata prendendo diverse
immagini CCD per diverse distanze di uno dei due specchi, cioè per diversi cammini ottici. Se
la sorgente fosse monocromatica pura non si avrebbe ovviamente nessuna variazione di
contrasto tra le frange.
La misura della distanza  c a cui si raggiunge il primo minimo di contrasto è detta
lunghezza di coerenza del Laser. Essa è legata alla larghezza di banda dalla relazione:

∆ν = c /  c

Prendiamo allora in considerazione un tipo di Laser che usiamo in laboratorio. Consideriamo il


caso in cui ci sono 3 modi assiali, uno centrale più intenso e due tra loro simmetrici e con
polarizzazione ortogonale. La condizione per un massimo di interferenza è

λ
x1 − x2 = m
2

con m intero e dove x1  2 è la differenza di cammino tra i due bracci dell’interferometro. Per
un minimo invece si ha:

λ
x1 − x2 = m
4

con m disperi intero. Se vogliamo che il contrasto vada a zero dobbiamo avere un massimo per
il primo modo e un minimo per il secondo e terzo. Quindi essendo simmetrico il secondo e
terzo modo si ha:

143
λ1
x1 − x2 = m
2
λ λ
x1 − x2 = m 2 + 2
2 4

uguagliando le due espressioni è quindi:

λ1 λ (λ − λ ) λ
m −m 2 = m 1 2 = 2
2 2 2 4
o anche
λ2
m∆λ = (9.18)
2
∆λ ∆ν
Essendo = e lasciando perdere l’indice 2 che non serve più, si ha allora
λ ν
ν
∆ν = (9.19)
2m
λ
Poiché ∆x = x1 − x2 = m , risolvendo per m e sostituendo si ottiene:
2

ν λν c
∆ν = = = (9.20)
2m 4∆x 4∆x
  
     
         
       
Quindi dalla misura della separazione
bracci dell’interferometro ove si realizza il primo minimo di contrasto, si può ottenere la
misura della differenza di frequenza tra i due modi assiali del Laser. Si può vedere e si può
dimostrare che esistono altri minimi separati da altrettanti massimi di interferenza anche oltre
la distanza ! ! "#! "$% & &')(* + ∆ν = 3c / 4∆x, 5c / 4∆x , etc. Infine si realizzi che la
trasformata di Fourier della funzione di visibilità ci dà lo spettro di frequenza della sorgente.

144
10 BIBLIOGRAFIA

• Born, M. and Wolf, E. 1970, Principles of Optics, Pergamon, Oxford


• Hecht, E. 1998, Optics, III ed., Addison Wesley Longman, ISBN 0-201-83887-7
• Jenkins, F.A. and White, H.E. 1957, Fundamental of Optics, McGrow-Hill, New York
• Schroeder, D.J. 2000, Astronomical Optics, II ed., Academic Press, ISBN 0-12-629810-6
• Wilson, R. 1996, Reflecting Telescope Optics I, Berlin: Springer

146