Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
1 Definizione e proprietà
Nel seguito si denota con Pn lo spazio vettoriale di dimensione n + 1 costituito
dai polinomi a coefficienti reali di grado al più n e con P lo spazio vettoriale di
tutti i polinomi a coefficienti reali.
1
La seguente banale osservazione ha una serie di conseguenze meno immediate
e di particolare rilevanza.
Osservazione 3 I polinomi ortogonali p0 (x), p1 (x), . . . , pn (x) sono linearmente
indipendenti e quindi costituiscono una base dello spazio vettoriale Pn dei poli-
nomi di grado minore o uguale ad n.
Vogliamo ora definire un diverso prodotto scalare, che sarà utile nello sviluppo
della teoria dell’approssimazione di funzioni.
Siano a, b due costanti della retta reale estesa R = R ∪ {+∞, −∞} con a < b.
In questo modo l’intervallo [a, b] può essere anche del tipo [−∞, β], [α, +∞], con
α, β ∈ R, e [−∞, +∞]. Sia ω(x) : [a, b] → R una funzione a valori nella retta
reale estesa tale che per a < x < b valga ω(x) ∈ R, ω(x) > 0 ed esista finito
Rb
a
f (x)ω(x)dx per ogni polinomio f (x) ∈ P. La funzione ω(x) è detta funzione
peso.
L’applicazione che a una coppia di polinomi (f (x), g(x)), f (x), g(x) ∈ P
associa il numero reale
Z b
hf, gi := f (x)g(x)ω(x)dx (2)
a
2
è una norma su P che viene denotata con kf (x)k.
Esempi classici di funzioni peso che definiscono
√ il prodotto scalare√di tipo
integrale sono ω(x) = 1 su [−1, 1], ω(x) = 1 − x2 su [−1, 1], ω(x) = 1/ 1 − x2
2
su [−1, 1], ω(x) = e−x su [0, +∞], e−x su [−∞, +∞].
Teorema 8 Gli zeri dei polinomi ortogonali rispetto al prodotto scalare (2), di
grado almeno 1, sono reali e semplici e stanno in (a, b).
Allora gli zeri reali in (a, b) di pn (x)q(x) hanno molteplicità pari e quindi questo
prodotto non cambia segno in (a, b). Conseguentemente
Z b
hpn , qi = pn (x)q(x)ω(x)dx 6= 0
a
3
che è assurdo per il teorema 4 poiché il grado di q(x) è k ≤ j < n.
4
Osservazione 10 Poiché i polinomi del teorema 9 sono definiti a meno di una
costante moltiplicativa, possiamo scegliere i polinomi monici in modo che ai = 1
per ogni i ≥ 1 per cui Ai = 1 per i ≥ 1. In questo modo risulta
hxpi , pi i hpi , pi i
Ai+1 = 1, Bi+1 = − , Ci = > 0.
hpi , pi i hpi−1 , pi−1 i
an 1
dove γn = an+1 hn = hn An+1 , hi = hpi , pi i. Se normalizziamo i polinomi in modo
che siano monici, e quindi scegliamo a0 = a1 = 1, √ Ai = 1, i ≥ 1, si ottiene
γn = 1/hn . Se inoltre denotiamo con pbn (x) = pn (x)/ hn il generico polinomio
normalizzato in modo che hbpn (x), pbn (x)i = 1, la formula di Christoffel-Darboux
diventa
n
X an
(x − y) pn (y) − pbn+1 (y)b
b
pbi (x)b
pi (y) = (b
pn+1 (x)b pn (x)),
i=0
an+1
b
dove b
ai indica il coefficiente principale di pbi (x).
5
Dim. Procediamo per induzione. Se n = 0 la relazione diventa
a20
(x − y) = γ0 ((a1 x + b1 )a0 − (a1 y + b1 )a0 )
h0
da cui γ0 = aa1 h0 0 che è verificata per ipotesi.
Per l’implicazione n − 1 → n, consideriamo l’espressione pn+1 (x)pn (y) −
pn+1 (y)pn (x) al secondo membro di (4), e sostituiamo al posto di pn+1 (x) e di
pn+1 (y) l’espressione ottenuta con la relazione a tre termini. Si ottiene quindi
pn+1 (x)pn (y) − pn+1 (y)pn (x) = ((xAn+1 + Bn+1 )pn (x) − Cn pn−1 (x))pn (y)
− ((yAn+1 + Bn+1 )pn (y) − Cn pn−1 (y))pn (x).
Semplificando si arriva a
(x − y)An+1 pn (x)pn (y) + Cn (pn (x)pn−1 (y) − pn (y)pn−1 (x))
Per l’ipotesi induttiva il secondo addendo coincide con
n−1
Cn X 1
(x − y) pi (x)pi (y)
γn−1 h
i=0 i
6
dove Ci = (hi /hi−1 )(Ai+1 /Ai ). Si ottiene allora
1 1
[x − y]pi (x)pi (y) = [pi+1 (x)pi (y) − pi+1 (y)pi (x)]
hi hi Ai+1
1
+ [pi−1 (x)pi (y) − pi−1 (y)pi (x)]
hi−1 Ai
7
Osservazione 16 Dati due polinomi u(x) e v(y) il bezoutiano B(x, y) di u(x) e
v(x) è il polinomio in due variabili (u(x)v(y)−u(y)v(x))/(x−y). Il bezoutiano ha
diverse particolarità interessanti che sono utili in computer algebra. La formula
di Cristoffel-Darboux aggiunge una ulteriore proprietà: se u e v sono polinomi
ortogonali di grado n + 1 e n il loro bezoutiano è somma di prodotti di polinomi
ortogonali. Si associa al bezoutiano B(x, y) la matrice Bn = (bi,j ) tale che
Pn+1 Pn+1
B(x, y) = i=1 j=1 bi,j xi−1 y j−1 chiamata matrice bezoutiana. È immediato
verificare che Bn è simmetrica e che B(x, y) = xT Bn y dove x = (xi )i=0,n−1 ,
y = (y i )i=0,n−1 . Poiché pk (x)pk (y) = xT p(k) p(k)T y, dove p(k) è il vettore dei
coefficienti del polinomio pk (x), la formula di Christoffel Darboux permette di
scrivere la matrice bezoutiana Bn di pn (x) e pn+1 (x) come somma delle n diadi
simmetriche γn1hk p(k) p(k)T . La stessa somma di diadi simmetriche permette
di scrivere la matrice bezoutiana come γn Bn = LT L, dove L è una matrice
triangolare inferiore√che sulla riga i-esima ha i coefficienti dell’i-esimo polinomio
ortonormale pi (x)/ hi per i = 0, . . . , n.
Una proprietà interessante della matrice bezoutiana di due polinomi qualsiasi
u(x) e v(x)è che la sua fattorizzazione UL a blocchi fornisce quozienti e resti
generati dall’algoritmo euclideo applicato a u(x) e v(x). Inoltre la matrice
bezoutiana è non singolare se e solo se i polinomi u(x) e v(x) sono primi tra loro.
Maggiori informazioni sul bezoutiano, per chi volesse approfondire, si trovano
sui lavori:
H.K. Wimmer, “On the History of the Bezoutian and the Resultant Matrix”,
Linear Algebra Appl. 128:27-34(1990),
U. Helmke, P.A. Fuhrmann, “Bezoutians”, Linear Algebra Appl. 122–124:1039-
1097(1989),
G. Heinig, K. Rost, Bezoutians, https://www.tu-chemnitz.de/mathematik/
preprint/.../PREPRINT_09.pdf
Onorato Nicoletti, “Sulla caratteristica delle matrici di Sylvester e di Be-
zout”, Da una lettera al Prof. Alfredo Capelli, 27 Dicembre 1908 http:
//link.springer.com/article/10.1007%2FBF03018209#page-1
8
scopre che
det Tn (x) = (An x + Bn ) det Tn−1 (x) − Cn−1 det Tn−2 (x)
per cui il vettore di componenti (pi (x))i=0:n−1 sta nel nucleo di Tn (x) se e solo
se x è uno zero di pn (x).
Gli autovettori v (j) tali che D−1 Tn (xj )Dv (j) = 0 sono v (j) = D−1 u(j) con u(j) =
(p0 (xj ), . . . , pn−1 (xj ))T . Cioè l’i-esimo autovettore della matrice simmetrizzata
9
D−1 Tn D, corrispondente all’autovalore xi , è
v (i) = (b
p0 (xi ), pb1 (xi ), . . . , pbn−1 (xi ))T ,
Questa proprietà era stata ottenuta anche dalla formula di Christoffel Darboux.
10
Teorema 20 Siano λ1 ≥ · · · ≥ λn gli autovalori della matrice simmetrica
A ∈ Rn×n . Vale
xT Ax xT Ax
max T = λ1 , min T = λn .
x6=0 x x x6=0 x x
Si può dimostrare molto di più:
xT Ax
max min = λk , k = 1, 2, . . . , n.
Vk ⊂ Rn x ∈ Vk xT x
dim Vk = k x 6= 0
α1 ≥ β1 ≥ α2 ≥ β2 ≥ · · · ≥ βn−1 ≥ αn .
11
Dim. Indichiamo con Wk un generico sottospazione di Rn−1 di dimensione k.
Vale
y T By y T By y T U T AU y
βk = max min = min = min
Wk y ∈Wk \{0} y T y ck \{0} y T y
y ∈W y ∈W
ck \{0} yT y
dove W
ck è il sottospazio dove viene preso il massimo. Sia
Vbk = {x ∈ Rn : x = U y, y ∈ W
ck }.
Vale dim(Vbk ) = k e
y T U T AU y xT Ax
=
yT y xT x
per cui
y T U T AU y xT Ax xT Ax
βk = min = min ≤ max min = αk .
y ∈W
ck \0 yT y x∈Vbk \0 xT x Vk x∈Vk \0 xT x
Si riportano a titolo di curiosità due altri corollari di cui non si dà dimostra-
zione.
Corollario 25 Se A, B, C sono matrici reali simmetriche tali che A = B + C
allora per gli autovalori αi , βi , γi ordinati in modo non crescente vale
βi + γn ≤ αi ≤ βi + γ1 .
Corollario 26 Se A, B, C sono matrici reali simmetriche tali che A = B + C e
C = uuT per un vettore nonnullo u, allora per gli autovalori αi , βi di A e B
ordinati in modo non crescente vale
βi ≤ αi ≤ βi−1 , i = 1, . . . , n,
dove β0 = β1 + uT u.
12
3 Rappresentazione di polinomi ortogonali
Oltre alla rappresentazione data mediante la relazione ricorrente a tre termini
esistono altri modi per rappresentare i polinomi ortogonali. In questo paragrafo
esaminiamo due rappresentazioni diverse, quella basata sulla matrice dei momenti
e quella data dalla formula di Rodrigues.
13
Osservazione 30 Si ricorda che se A è una matrice reale simmetrica defi-
nita positiva allora l’applicazione (u, v) → uT Av da Rn × Rn in R è un
prodotto scalare.
Pn PSi osserva che, se uP= (ui )i=1,...,nP, nv = (vj−1
i )i=1,...,n , allora
n n
u T Hn v = i=1 u µ
j=1 i i+j−2 j v = h u
i=1 i x i−1
, v
j=1 j x i non è altro
che il prodotto scalare tra il polinomio di coefficienti u1 , . . . , un e il polinomio
di coefficienti v1 , . . . , vn . Dunque Hn è definita positiva e descrive il prodotto
scalare di tipo integrale tra polinomi in termini dei loro coefficienti.
Si osserva ancora che se Hn = LLT è la fattorizzazione di Cholesky di Hn ,
dove L è triangolare inferiore n × n, allora dalla condizione L−1 Hn (L−1 )T = I
segue che le righe di L−1 sono i coefficienti dei polinomi ortogonali normalizzati in
modo da avere norma 1 (polinomi ortonormali). Avevamo inoltre puntualizzato
nell’Osservazione 16, come conseguenza della formula di Christoffel Darboux, che
la matrice di Bezout Bn di pn (x) e pn−1 (x) si fattorizza nel prodotto γn Bn = L bT Lb
dove Lb è triangolare inferiore e le colonne di L b hanno per elementi i coefficienti
del generico polinomio ortonormale per cui vale L b = L−1 . Allora, confrontan-
do la relazione γn B = L T
b L b e H = (L ) L si deduce che Hn = γn−1 Bn−1 .
−1 −1 T −1
Teorema 32 Sia s(x) ∈ C n [a, b], tale che s(k) (a) = s(k) (b) = 0, per k =
0, 1, . . . , n − 1. Allora la funzione t(x) = s(n) (x)/ω(x) è ortogonale a ogni
Rb
polinomio di grado al più n − 1 col prodotto scalare hf, gi = a f (x)g(x)ω(x)dx.
Dim. Sia q(x) polinomio di grado al più n − 1. Allora q(x), s(n) (x)/ω(x) =
Rb (n) Rb
a
ω(x)q(x) s ω(x) (x)
dx = a q(x)s(n) (x)dx. Integrando per parti si ha
b
s(n) (x)
Z
q(x), = [q(x)s(n−1) (x)]ba − q 0 (x)s(n−1) (x)dx
ω(x) a
Z b Z b
=− q 0 (x)s(n−1) (x)dx = · · · = (−1)n q (n) (x)s(x)dx = 0
a a
14
[a, b] ω(x) sn (x) Nome
[−1, 1] 1 (1 − x2 )n Legendre
[−1, 1] (1 − x2 )−1/2 (1 − x2 )n−1/2 Chebyshev di prima specie
[−1, 1] (1 − x2 )1/2 (1 − x2 )n+1/2 Chebyshev di seconda specie
[0, +∞] e−x e−x xn Laguerre
2 2
[−∞, +∞] e−x e−x Hermite
βn dn
pn (x) = sn (x), n = 0, 1, . . . ,
ω(x) dxn
dove
Non solo, ma è possibile dare una forma esplicita alla funzione s(x) nella formula
di Rodrigues, infatti vale s(x) = (x2 − 1)n+α .
15
Osservazione 34 La Funzione Gamma di Eulero gode di molte proprietà
interessanti tra cui
Γ(x + 1) = xΓ(x), x ∈ R, x 6= 0, −1, −2, . . .
Γ(1) = 1
Γ(n + 1) = n!, se n è intero
Vale inoltre
dn xα Γ(α + 1)
= α(α − 1) · · · (α − n + 1)xα−n = xα−n
dxn Γ(α − m + 1)
s(n)
n (x)
Teorema 35 Se ω(x) = (1 − x2 )α , α > −1, sn (x) = (1 − x2 )α+n , allora ω(x)
(k) (k)
è polinomio di grado n e vale sn (1) = sn (−1) = 0, k = 0, 1, . . . , n − 1. Vale
inoltre
(n) n
Γ(α + n + 1)2
sn (x) X n
= (−1)j (1 − x)n−j (1 + x)j .
ω(x) j=0
j Γ(α + j + 1)Γ(α + n − j + 1)
(0)
s0 (1−x2 )α
Dim. Se n = 0 è ω(x) = (1−x2 )α = 1. Se n > 0 pongo z = α + n e ho
dk dk
k
(1 − x2 )z = k [(1 − x)z (1 + x)z ]
dx dx
k j k−j
X k d z d
= j
(1 − x) k−j
(1 + x)z
j=0
j dx dx
16
Per i polinomi ultrasferici pn,α (x) vale allora la formula
1 dn
pn,α (x) = βn,α (1 − x2 )α+n
(1 − x ) dxn
2 α
1 1
p0 (x) = 1, p1 (x) = x, p2 (x) = (3x2 − 1), p3 (x) = (5x3 − 3x).
2 2
La matrice tridiagonale associata è
x −1
− 21 32 x −1
− 23 35 x −1
− 43 74 x
−1
.
.. .. ..
. . .
i 2i+1
− i+1 i+1 x −1
.. .. ..
. . .
Qn
Osserviamo che il coefficiente principale di pn (x) per n ≥ 2 è an = i=2 2i+1
i+1 .
Denotando con pen (x) = pn (x)/an il polinomio ortogonale di grado n normalizzato
a essere monico, la relazione a tre termini diventa
2n + 1 an n an−1
pen+1 (x) = xe
pn (x) − pen−1 (x),
n + 1 an+1 n + 1 an+1
p0 (x) = 1, p1 (x) = x,
da cui si ottiene la relazione a tre termini per i polinomi monici
n2
pn (x) −
pen+1 (x) = xe pen−1 (x),
4n2 − 1
p0 (x) = 1, p1 (x) = x,
17
e la matrice tridiagonale associata è
x −1
− 13 x −1
4
− 15 −1
x
9
− 35 −1
x
.
.. .. ..
. . .
2
− 4i2i −1 x −1
.. .. ..
. . .
La sua simmetrizzazione è data dalla
q matrice tridiagonale che ha come elementi
2
sopra/sotto diagonali i valori di 4i2i −1 per i = 1, . . . , n − 1, cioè
− √13
x
− √1 x − √215
3
2 3
− √15 x − √35
3 4
− √
35
x − √
63
.
.. .. ..
. . .
. .. i
x − √4i2 −1
.. ..
i . .
−√ 2 4i −1
Gli zeri del polinomio di Legendre di grado n sono gli autovalori della matrice
tridn ( √ i−1 2 , 0, √4ii2 −1 ), dove in generale si indica con tridn (ai , bi , ci ) la
4(i−1) −1
matrice tridiagonale n × n con elementi diagonali b1 , . . . , bn , elementi sotto
diagonali e sopra diagonali rispettivamente a2 , . . . , an e c1 , . . . , cn−1 .
Il seguente codice Octave calcola tali zeri come autovalori di questa matrice
per n = 50:
n = 50;
d=[1:n-1]./sqrt( (2*[1:n-1]-1).*(2*[1:n-1]+1));
T=diag(d,1)+diag(d,-1);
zeri=eig(T);
plot(zeri,zeros(n,1),’*’)
La figura 1 riporta gli zeri del polinomio di Legendre di grado 50.
18
1
0.8
0.6
0.4
0.2
−0.2
−0.4
−0.6
−0.8
−1
−1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1
Da cui si ottiene
Tn+1 (cos θ) =2 cos θ cos nθ − cos nθ cos θ − sin nθ sin θ
= cos θ cos nθ − sin nθ sin θ = cos(n + 1)θ.
Questo fatto permette di dimostrare che i polinomi Tn (x) sono ortogonali rispetto
al prodotto scalare sull’intervallo [−1, 1] con peso ω(x) = (1 − x2 )−1/2 . Infatti
19
mediante la sostituzione x = cos θ, si ottiene
Z 1
1
hTn (x), Tm (x)i = √ Tn (x)Tm (x)dx
−1 1 − x2
Z π Z π
1
= cos(nθ) cos(mθ) sin θdθ = cos(nθ) cos(mθ)dθ.
0 sin θ 0
Un’altra proprietà molto intressante dei polinomi Tn (x), che li lega al pro-
blema della approssimazione di funzioni in norma infinito, è descritta dal
seguente
Dim. Si è già osservato che Tn (x) assume il valore massimo 1 e il valore minimo
−1 per n + 1 volte consecutive. Quindi kTn (x)k∞ = 1 e kTn (x)/2n k∞ = 1/2n−1 .
Supponiamo per assurdo che esista un polinomio pn monico di grado n tale che
kpn (x)k∞ < 1/2n−1 . Il polinomio pn (x) ha massimo minore di 1/2n−1 e minimo
20
maggiore di −1/2n−1 . Quindi il polinomio differenza q(x) = pn (x) − Tn (x)/2n−1
di grado al più n − 1 è negativo dove Tn ha massimo e positivo dove Tn ha
minimo. Ciò accade in n + 1 punti distinti e consecutivi di [−1, 1]. Quindi q(x)
ha n zeri. Il che è assurdo.
21
(n)
dove xi = xi = cos (2i−1)π
2n , per i = 1, . . . , n, sono gli zeri di Tn (x), assume una
forma più semplice. Infatti per i coefficienti σk si può dimostrare che
π
σk2 = , k = 1, . . . , n.
n
Per cui la (5) diventa
n
( n
X 2 δi,j se i 6= 0
Ti (xk )Tj (xk ) =
k=1
nδi,j se i = 0
per i, j = 0, . . . , n − 1.
La matrice C = (ci,j ) di elementi ci,j = Tj (xi−1 ) definisce la trasformata
discreta dei coseni di secondo tipo http://en.wikipedia.org/wiki/Discrete_
cosine_transform e gode della proprietà che C T C = n diag(1, 1/2, . . . , 1/2).
Inoltre il prodotto scalare nella forma discreta assume la forma
n
πX
hp(x), q(x)i = p(xk )q(xk ). (9)
n
k=1
La somma infinita
∞
X
f (x) = ak Tk (x)
k=0
22
t = cheby1(100,6);
x = t(:,2);
plot(x,t(:,1),x,t(:,2),x,t(:,3),x,t(:,4),x,t(:,5),x,t(:,6))
o, più semplicemente plot(x,t), si tracciano i grafici dei primi 6 polinomi di
Chebyshev di prima specie riportati nella figura 2. Mentre scrivendo
t=chebyshev1(6);
t’*t
si ottiene la matrice numericamente diagonale
ans =
T=t*sqrt(2/pi);
T(:,1)=T(:,1)/sqrt(2);
T*T’
23
Listing 1: Function cheby1
function t=cheby1(m,n)
% function t=cheby1(m,n)
% output: t e’ la matrice mxn la cui colonna j-esima contiene i valori
% del polinomio di Chebyshev di prima specie grado j-1 campionato nei
% punti x_i=(-1+ i*2/(m-1)) per i=0,1,...,m-1
t = ones(m,n);
x = [-1:2/(m-1):1]’;
t(:,2) = x;
for j=3:n
t(:,j) = 2*x.*t(:,j-1) - t(:,j-2);
end
0.5
-0.5
-1
-1 -0.5 0 0.5 1
24
Listing 2: Function chebyshev1
function t=chebyshev1(n)
% function t=chebyshev1(n)
% output: t e’ la matrice nxn la cui colonna j-esima contiene i valori
% del polinomio di Chebyshev di prima specie grado j-1 campionato negli
% zeri del polinomio di Chebyshev di grado n: x_k=cos((2k-1)pi/(2n))
% per k=1,...,n
t = ones(n);
x = cos([pi/(2*n): pi/n : (2*n-1)*pi/(2*n)]’);
t(:,2) = x;
for j=3:n
t(:,j) = 2*x.*t(:,j-1) - t(:,j-2);
end
25
Listing 3: Function cheby2
function t=cheby2(m,n)
% function t=cheby1(m,n)
% output: t e’ la matrice mxn la cui colonna j-esima contiene i valori
% del polinomio di Chebyshev di seconda specie grado j-1 campionato nei
% punti x_i=(-1+ i*2/(m-1)) per i=0,1,...,m-1
t = ones(m,n);
x = [-1:2/(m-1):1]’;
t(:,2) = 2*x;
for j=3:n
t(:,j) = 2*x.*t(:,j-1) - t(:,j-2);
end
Da cui hk = π2 .
La function Octave riportata nel listing 3 crea una matrice u di dimensioni
m × n che ha nella colonna j-esima i valori di Uj−1 (x) calcolati in m punti
equispaziati tra −1 e 1. Mentre la function riportata nel listing 4 crea una
matrice u di dimensioni n × n che ha nella colonna j-esima i valori di Uj−1 (x)
calcolati negli n zeri del polinomio di Chebyshev Un (x) di seconda specie di
grado n.
In questo modo, con i seguenti comandi
u = cheby2(100,6);
x = [-1:2/99:1];
plot(x,u(:,1),x,u(:,2),x,u(:,3),x,u(:,4),x,u(:,5),x,u(:,6))
o più semplicemente con plot(x,u), si tracciano i grafici dei primi 6 polinomi
di Chebyshev di seconda specie riportati nella figura 3. Mentre scrivendo
u = chebyshev2(6);
u*u’
si ottiene la matrice numericamente diagonale
ans =
26
6
-2
-4
-6
-1 -0.5 0 0.5 1
27
4.4 Polinomi di Laguerre
Peso ω(x) = e−x , intervallo [0, +∞]. Coefficienti della ricorrenza a tre termini:
1
An+1 = − n+1 , Bn+1 = 2n+1 n
n+1 , Cn = n+1 .
1
Ln+1 (x) = ((2n + 1 − x)Ln (x) − nLn−1 (x))
n+1
L0 (x) = 1, L1 (x) = 1 − x
5 Esercizi
Esercizio 1 Sia N intero positivo e ai < bi ≤ ai+1 < bi+1 , per i = 1, . . . , N − 1
numeri reali, ω(x) funzione definita su ∪N i=1 [ai , bi ] a valori positivi tale che
R bi
ai
f (x)ω(x)dx sia finito per i = 1, . . . , N e per ogni polinomio f (x). Si verifichi
PN R bi
che hp(x), q(x)i = i=1 ai p(x)q(x)ω(x)dx è un prodotto scalare, e si definiscano
pi (x), i = 0, 1, . . ., i polinomi ortogonali (normalizzati secondo un qualsiasi
criterio) rispetto a questo prodotto scalare. Dimostrare che
28
c) vale la formula di Christoffel-Darboux e la proprietà di ortogonalità discreta
Pn+1
k=1 pi (xk )pj (xk )wk = 0 per i 6= j dove xk sono gli zeri di pn+1 (x), e wk
delle opportune costanti positive;
d) il grado di precisione della formula di integrazione approssimata di Gauss
sull’insieme ∪N
i=1 [ai , bi ] è 2n + 1.
e) Dire se è vero che per n ≥ N ogni intervallo contiene almeno uno zero di pn .
per lo spazio V.
29
Esercizio 5 Vogliamo estendere la teoria dei polinomi ortogonali a polinomi che
n
xi Ai , Ai ∈ Rm×m }.
P
hanno coefficienti matriciali e definiamo Pn = {P (x) =
i=0
In questo modo, P (x) è una combinazione lineare con coefficienti Ai dei polinomi
elementari xi Im . P (x) ha grado n se An 6= 0, è monico se An = Im .
Per fare questo introduciamo inoltre un “prodotto scalare” a valori matriciali
mediante l’applicazione h·, ·i : Pn × Pn → Rm×m definita da
Z b
hP, Qi = P (x)W (x)Q(x)T dx,
a
m×m
dove W (x) : [a, b] → R è tale che W (x) è continua, simmetrica e definita
positiva per ogni x ∈ [a, b], dove l’integrale di una matrice di elementi ai,j (x) è
Rb
la matrice i cui elementi sono a ai,j (x)dx.
Si dimostri preliminarmente che per ogni P, Q, R ∈ Pn e A ∈ Rm×m vale
a) hP, Qi = hQ, P iT ;
b) V = hP, P i è matrice simmetrica semidefinita positiva, inoltre V è definita
positiva se det P (x) 6≡ 0, infine V = 0 se e solo se P = 0;
c) hAP, Qi = AhP, Qi, hP, AQi = hP, QiAT , hxP, Qi = hP, xQi;
d) hP + R, Qi = hP, Qi + hR, Qi, hP, Q + Ri = hP, Qi + hP, Ri.
Definiamo P0 , P1 , . . . , Pn ∈ Pn una sequenza di polinomi ortogonali se Pi ha
grado i, è monico, e vale hPi , Pj i = 0 per ogni i 6= j. Si dimostri che
e) Se esiste una sequenza di polinomi ortogonali Pj , j = 0, . . . , n allora hPj , Pj i
è definita positiva;
f ) in Pn esiste ed è unica una sequenza Pi , i = 0, . . . , n di polinomi ortogonali
n
P
e ogni altro polinomio Q ∈ Pn può essere scritto come Ai Pi per Ai ∈
i=0
Rm×m ;
g) Pi è ortogonale ad ogni polinomio di grado minore di i;
h) i polinomi Pi (x) soddisfano una relazione a tre termini del tipo
Pj+1 (x) = (x Im − Bj )Pj (x) − Cj Pj−1 (x), j = 0, 1, . . . , n − 1
Rb R −1
b
P0 = I, P1 = x Im − a xW (x) dx a
W (x) dx
con Bj , Cj ∈ Rm×m .
Im
x Im
i) Pk (x) = xk Im − [µk , . . . µ2k−1 ]A−1 ,
k−1 ..
.
xk−1 Im
b
dove i momenti µk ∈ Rm×m sono definiti da µk = a xk W (x)dx ed Ak−1 è
R
30
j) Vale un analogo della formula di Christoffel-Darboux?
è un prodotto scalare.
b) Si descriva un procedimento per generare basi ortogonali di V0 , V1 , . . . , Vn
e si dimostri che dim Vk = k + 1.
c) Si verifichi che l’unione delle basi ortogonali di Vk , k = 0, . . . , n, costituisce
una base di polinomi ortogonali di Πn , e che, diversamente dal caso dei
polinomi nella sola x, tale base non è unica (a meno di multipli scalari).
Gli spazi Vk , k = 0, . . . , n sono univocamente determinati?
(n)
d) Si verifichi che se vi per i = 1, . . . , n + 1 è una base ortogonale di Vn tale
(n) (n) (n)
che hvi , vi i è indipendente da i, allora u(n) = (ui )i=1,...,n+1 := Qv (n)
(n)
è tale che ui , i = 1, . . . , n + 1 è base ortogonale di Vn per ogni matrice
ortogonale Q di dimensione n + 1.
e) Si dimostri che se p(x, y) ∈ Vn allora i polinomi xp(x, y) e yp(x, y) sono
ortogonali a tutti i polinomi di grado al più n − 2 e a tutti i polinomi
ortogonali di grado almeno n + 2.
f) Si deduca che vale un analogo della relazione ricorrente a tre termini nel
senso che per ogni p(x, y) ∈ Vn , sia xp(x, y) che yp(x, y) si scrivono come
combinazioni lineare di tre polinomi in Vn−1 , Vn e Vn+1 .
(k)
g) Denotando con v (k) un vettore di k + 1 componenti tale che vi , i =
1, . . . , k + 1 è una base di Vk , si dimostri che esistono e sono uniche matrici
An , (n + 1) × (n + 2), Bn (n + 1) × (n + 1) e Cn (n + 1) × n tali che
con v (−1) = 0, C−1 = 0. Similmente vale una proprietà analoga per yv (n) .
31
h) Si dimostri che se ϕn (x) sono polinomi ortogonali rispetto al prodotto
Rb
scalare < f (x), g(x) >= a f (x)g(x)ω(x)dx dato dal peso ω(x) : (a.b) →
R+ , allora qm,n (x, y) = ϕm (x)ϕn (y) è un insieme di polinomi in due
variabili ortogonali rispetto al peso W (x, y) = ω(x)ω(y) e qn,k−n (x, y) per
k = 0, . . . , n costituisce una base ortogonale di Vn .
a) Si dimostri che la successione soddisfa una relazione a tre termini del tipo
pi+1 (x) = (ai x + bi )pi (x) − ci pi−1 (x), ci > 0, se e solo se il prodotto scalare
è tale che hxp(x), q(x)i = hp(x), xq(x)i per ogni coppia di polinomi in Pn
di grado al più n − 1.
b) Si dimostri che per ogni prodotto scalare h·, ·i su Pn esiste una matrice sim-
metrica definita positiva H di dimensione n+1 tale che hp(x), q(x)i = pT Hq
dove p e q sono i vettori (n + 1)-dimensionali dei coefficienti dei polinomi
p(x) e q(x) nella base dei monomi. Inoltre, data una matrice simmetrica
definita positiva H di dimensione n + 1 si dimostri che l’applicazione che
associa alla coppia (p(x), q(x)) il numero reale pT Hq è un prodotto scalare.
c) Si dica come è fatta la matrice nel caso in cui i polinomi ortogonali relativi
al prodotto scalare h·, ·i soddisfano una relazione ricorrente a tre termini.
Siano ξi , i = 0, . . . , n numeri reali distinti. Si verifichi che hp(x), q(x)i =
d) P
n
i=0 p(ξi )q(ξi ) è un prodotto scalare e che i polinomi ortogonali relativi a
tale prodotto verificano una relazione a tre termini.
32
Se an = 1 diciamo che il polinomio di Laurent è monico, Denotiamo inoltre L
lo spazio vettoriale su R dei polinomi di Laurent. Dati a, b ∈ R tali che 1 <
a < b, definiamo un prodotto scalare su L mediante l’espressione hp(x), q(x)i =
Rb
a
p(x)q(x)w(x)dx dove w(x) è una funzione positiva e integrabile su [a, b].
Infine definiamo l’insieme {pn (x) ∈ L, n = 0, 1, 2, . . .} dei polinomi di Laurent
ortogonali tali che il grado di pn (x) è n, pn (x) è monico e hpn (x), pm (x)i = 0
per n 6= m.
Dimostrare che l’insieme dei polinomi di Laurent ortogonali non è vuoto e
poi esaminare quali delle proprietà dei polinomi ortogonali classici rimangono
valide, e in quale forma, per i polinomi ortogonali di Laurent. In particolare,
esaminare le proprietà degli zeri, la relazione ricorrente a tre termini, la proprietà
di ortogonalità discreta.
Cosa si può dire nel caso in cui 0 < a < 1 < b?
Si verifichi che h·, ·i0 è un prodotto scalare tale che hx2 f (x), g(x)i =
hf (x), x2 g(x)i ed esistono polinomi p(x), q(x) tali che hxp(x), q(x)i 6=
hp(x), xq(x)i.
33
e) Si possono esprimere i polinomi ortogonali di cui al punto a) come determi-
nanti di opportune matrici a banda? Come è fatta la matrice dei momenti
del prodotto scalare del punto c)? Si analizzino le proprietà dei polinomi
pn (x) ottenuti col prodotto scalare dato nel punto c).
3. Esistono polinomi ϕi (x) e ψi (x) di grado i tali che p2i (x) = ϕi (x2 ),
p2i+1 (x) = xψi (x2 ).
Sotto le condizioni dei punti precedenti dimostrare che ab < 0 e che i polinomi
ϕi (x) sono ortogonali rispetto ad un opportuno prodotto scalare sull’intervallo
[â, b̂] con peso ω̂. Si determinino â, b̂, ω̂. Dimostrare analoga proprietà per ψi (x).
Mettere in relazione i coefficienti della relazione a tre termini dei polinomi
ϕi (x), ψi (x) con quelli dei polinomi pi (x).
Dire come è fatta la matrice dei momenti per il prodotto scalare per cui
valgono le proprietà 1,2,3.
È possibile che con il prodotto scalare che rende ortogonali i polinomi ϕi (x)
i sottospazi P + e P − siano ortogonali? È possibile che ciò valga per il prodotto
scalare che rende ortogonali i ψi (x)?
Dire se la condizione
4. b = −a e ω(x) = ω(−x) per ogni x ∈ [a, b].
è equivalente alle condizioni 1-3.
34
b) Dimostrare che Tm (Tn (x)) = Tmn (x), che vale la seguente generalizzazione
della ricorrenza a tre termini
35
Esercizio 15 Sia ω(x) : (a, b) → R funzione continua a valori positivi tale che
Rb Rb
a
ω(x)xk dx è finito per ogni k ≥ 0 intero; sia hf, gi = a f (x)g(x)ω(x)dx il
prodotto scalare associato a ω(x). Siano pi (x), i = 0, 1, . . . , n + 1 polinomi
ortonormali rispetto a questo prodotto scalare con coefficiente principale ai > 0.
Siano infine x1 < x2 <P · · · < xn+1 gli zeri di pn+1 (x).
n
a) Dimostrare che i=0 pi (x)2 = aan+1 n
(p0n+1 (x)pn (x) − p0n (x)pn+1 (x)) e che
0 0
pn+1 (x)pn (x) − pn+1 (x)pn (x) > 0.
b) Dedurre dal punto a) che pn (x) e pn+1 (x) non possono avere zeri in comune
e che l’intervallo [xi , xi+1 ] contiene un solo zero di pn (x) per i = 1, . . . , n.
c) Dimostrare che per ogni c ∈ R il polinomio pn+1 (x) − cpn (x) ha n + 1
zeri reali distinti. Se c > 0 (risp. c < 0) essi giacciono in (a, b) ad eccezione
del maggiore (risp. minore) che sta in [a, b] solo se c ≤ pn+1 (b)/pn (b) (risp.
c ≥ pn+1 (a)/pn (a)).
d) Siano λ1 , . . . , λn i pesi delle formule di integrazione Gaussiane relative ai
nodi x1 , . . . , xn , zeri di pn (x) e al peso ω(x). Sia Ω(x) una primitiva di ω(x).
Dimostrare che esistono y0 = a < y1 < y2 < · · · < yn−1 < yn = b tali che
λi = Ω(yi ) − Ω(yi−1 ).
36
tali che per il vettore vn = [pn (x), pn−1 (x)]T vale
vn+1 = Fn+1 vn , n = 1, 2, . . . .
h i
2x −1
Dimostrare che, posto F = 1 0
, per i polinomi di Chebyshev di prima
specie Tn (x) e di seconda specie Un (x) vale
Tn+1 (x) n x Un+1 (x) n+1 1 n+2 0
=F , =F = −F
Tn (x) 1 Un (x) 0 1
√ √
b) Posto λ1 (x) = x + x2 − 1, λ2 (x) = x − x2 − 1, dimostrare che Un (x) =
√1 (λ1 (x)n+1 − λ2 (x)n+1 ), Tn (x) = 12 (λ1 (x)n + λ2 (x)n ). Ricavare da queste
2 x2 −1
espressioni un metodo a basso costo computazionale per il calcolo del valore di
Tn (x) e di Un (x) in un punto assegnato x ∈ [−1, 1] e valutarne il costo.
c) Dati due parametri a ∈ R \ 0, b ∈ R, si consideri la classe S dei polinomi
definita da s0 = 1, s1 = ax + b, sn+1 = 2xsn − sn−1 , per n ≥ 1. Dimostrare che
1. sn+1 (x) = (ax + b)Un (x) − Un−1 (x);
2. sn+1 (x) = µ(x)λ1 (x)n + ν(x)λ2 (x)n per opportuni µ(x) e ν(x), e indivi-
duare un algoritmo per il calcolo di s(x) in un punto x assegnato;
3. dire se esiste un intervallo [α, β] tale che per ogni valore di a e b il valore di
|sn (x)| per x ∈ [α, β] è limitato superiormente da una costante indipendente
da n.
d) Sia qn (x) definito da qn+1 (x) = (Ax + B)qn (x) − qn−1 (x), q0 (x) = 1,
q1 (x) = ax + b, dove A 6= 0 e B sono valori reali. Dire se esistono costanti d,
e tali che qn (dx + e) ∈ S. Dire se esiste un intervallo [a, b] su cui |qn (x)| sia
limitato superiormente da una costante per ogni n.
37
grado 0, 1, . . . , n, sono linearmente indipendenti quindi costituiscono una base
di Pn . PQuindi se q(x) è un polinomio di grado m < n si può scrivere come
m
q(x) = i=0 αi pi (x) per αi ∈ R, per cui hpn , qi = 0. Questo ci permette di
dimostrare la relazione a 3 termini. Infatti essendo p0 , . . . , pn base di Pn si può
scrivere
n
X
pn+1 = βn xpn + αi pi .
i=0
38
la proprietà di ortogonalità discreta si ottiene direttamente dalla formula di
Christoffel-Darboux;
d) Siano x1 , . . . , xn+1 gli zeri di pn+1 (x), per cui per la formula di ortogonalità
discreta possiamo scrivere
n+1
X
hq(x), s(x)i = q(xk )s(xk )σk
k=1
39
e si ha
per un’opportuna funzione peso ω(x) e un opportuno intervallo [a, b], si nota che
facendo il cambiamento di variabile 2 y = x − 10 e ponendo pk (2y + 10) =: uk (y),
la relazione a tre termini diventa
Risoluzione dell’esercizio 3.
a) I ϕi (x) sono i polinomi ultrasferici relativi alla costante α = 2. Per il
teorema 21, posto si (x) = (x2 − 1)i+2 , si ha
i
di si (x) X i Γ(i + 3)2
= (1 − x)i−j (1 + x)j
dxi ω(x) j=0
j Γ(j + 3)Γ(i − j + 3)
i
X i (i + 2)!2
= (1 − x)i−j (1 + x)j . (11)
j=0
j (j + 2)!(i − j + 2)!
di si (x)
ϕi (x) = βi ,
dxi ω(x)
dove le βi sono costanti. Per fissare dei valori convenienti delle βi si impone la
condizione che ϕi (1) = 1. Per x = 1 nella sommatoria (11) tutti i termini si
annullano eccetto quello per j = i, quindi
i (i + 2)!2 i
1
ϕi (1) = βi 2 = βi (i + 2)! 2i−1 , e βi = i−1 .
i (i + 2)! 2! 2 (i + 2)!
b) I primi due polinomi di calcolano direttamente
ϕ0 (x) = 1, ϕ1 (x) = x.
40
in quanto Bi+1 = 0 per i polinomi ultrasferici. Imponendo la condizione che
ϕi (1) = 1 per ogni i si ha
Ai+1 − Ci = 1.
Inoltre è
Z 1
ai−1 hi
Ci = Ai+1 , dove hi = (−1)i ai βi i! si (x) dx.
ai hi−1 −1
Quindi Z 1
si (x) dx
i −1
Ci = −Ai+1 1 .
2(i + 2)
Z
si−1 (x) dx
−1
Dalla relazione
d
(x2 − 1)i+2 x = (2i + 4)(x2 − 1)i+1 + (2i + 5)(x2 − 1)i+2
dx
si ricava
h i1 Z 1 Z 1
2 i+2 2 i+1
(x − 1) x = (2i + 4) (x − 1) dx + (2i + 5) (x2 − 1)i+2 dx,
−1 −1 −1
cioè Z 1 Z 1
(2i + 4) si−1 (x) dx + (2i + 5) si (x) dx = 0,
−1 −1
quindi
i 2i + 4 i
Ci = Ai+1 = Ai+1 .
2(i + 2) 2i + 5 2i + 5
Allora
2i + 5 i
Ai+1 = e Ci = .
i+5 i+5
La relazione a tre termini risulta
7x2 − 1 3x3 − x
ϕ0 (x) = 1, ϕ1 (x) = x, ϕ2 (x) = , ϕ3 (x) = .
6 2
c) I polinomi di grado minore o uguale a i + 2 che si annullano in 1 e in −1
possono essere scritti nella forma
41
dove qi (x) è un opportuno polinomio di grado i. Quindi il prodotto scalare
definito su V risulta
Z 1 Z 1
< pi (x), pj (x) >= pi (x) pj (x) dx = (x2 − 1)2 qi−2 (x) qj−2 (x) dx.
−1 −1
Ne segue che i ϕi (x) visti sopra costituiscono una base ortogonale per V.
Risoluzione dell’esercizio 4.
a) È ϕ0 (x) ≡ 1, quindi f1 (x) = ϕ1 (x). Dalla relazione a tre termini per i
polinomi monici ϕi (x)
in cui Ci =< ϕi (x), ϕi (x) > / < ϕi−1 (x), ϕi−1 (x) > è strettamente maggiore di
0, si ricava che
fi+1 (x) = (x + Bi ) − Ci /fi (x), i ≥ 1,
quindi le costanti richieste sono proprio quelle che valgono per la ricorrenza dei
ϕi (x).
b) Da questa relazione risulta evidente che se fi+1 (x) si annulla in xj , non
è possibile che anche fi (x) si annulli nello stesso punto. Poiché
0
fi+1 (x) = 1 + Ci fi0 (x)/fi2 (x), con f10 (x) = 1,
0
risulta che per i ≥ 1 è fi+1 (x) > 0 in ogni intervallo (αj , βj ) in cui fi+1 (x) è
definita. La fi+1 (x) ha gli stessi zeri della ϕi+1 (x), cioè ne ha esattamente i + 1.
Siano x1 , . . . , xi gli zeri di ϕi (x), che dalla teoria sappiamo essere tutti reali e
distinti. Quindi nei sottointervalli (−∞, x1 ), (x1 , x2 ), . . . , (xi−1 ), (xi , +∞) la
fi+1 (x) è crescente, quindi si annulla in ciascuno dei sottointervalli. Ne segue
che gli zeri della ϕi (x) separano gli zeri della fi+1 (x) e quindi della ϕi+1 (x).
Risoluzione dell’esercizio 5.
a) Poiché W (x) è simmetrica si ha
Z b Z b T
hP, Qi = P (x)W (x)Q(x)T dx = Q(x)W (x)P (x)T dx = hQ, P iT .
a a
dove y(x) = P (x)T v. Per ogni x ∈ [a, b] la matrice W (x) è definita positiva,
quindi y(x)T W (x) y(x) ≥ 0. Ne segue che v T V v ≥ 0. Inoltre, se det P (x) 6≡ 0
b ∈ [a, b] tale che det P (b
esiste x x) 6= 0. Per continuità esiste un intorno U ⊂ [a, b]
b tale che det P (x) 6= 0 per ogni x ∈ U. Per cui y(x) 6= 0 per ogni x ∈ U
di x
e quindi y(x)T W (x)y(x) > 0 per ogni x ∈ U. Da cui v T V v > 0 essendo la
funzione integranda continua, nonnegativa su [a, b][ e positiva su tutto U.
42
Rb
Inoltre, se P (x) = O per ogni x ∈ [a, b] è V = a 0 dx = O. Viceversa, se
Rb
V = O allora a P (x)W (x)P (x)T dx = O. Se per assurdo esistesse x b tale che
x) 6= 0 allora esisterebbe un y ∈ Rm tale che P (x)T y =
P (b 6 0. Quindi, essendo
W (bx) definita positiva si avrebbe yP (b
x)W (b x)T y > 0 e per continuità questa
x)P (b
funzione rimane positiva in un intorno di x b contenuto in [a, b] quindi y T V y 6= 0
che contraddice la condizione V = 0.
c) Per A ∈ Rm×m è
Z b Z b
hAP, Qi = AP (x)W (x)Q(x)T dx = A P (x)W (x)Q(x)T dx = AhP, Qi.
a a
43
Pn−1
l’ipotesi induttiva si può scrivere in modo univoco pn−1 (x) = i=0 Ai Pi (x) da
Pn−1
cui Q(x) = Qn xn I + i=0 Ai Pi (x). La dimostrazione è completa con An = Qn .
g) Pj (x) è ortogonale ad ogni polinomio pk (x) di grado k < j. Infatti pk (x)
può essere scritto come combinazione lineare dei polinomi ortogonali Pi (x). Poi
si sfrutta la linearità del prodotto scalare e l’ortogonalità.
h) Per la (12) è
j
P
e per k ≤ j si ha hQ, Pk i = Hi hPi , Pk i = Hk hPk , Pk i. Ma
i=0
hQ, Pk i = hPj+1 , Pk i − hx Pj , Pk i,
e per k ≤ j − 2 si ha
Hk hPk , Pk i = hPj+1 , Pk i − hx Pj , Pk i = O,
cioè
Pj+1 (x) = x Im + Hj Pj (x) + Hj−1 Pj−1 (x). (13)
Si ha
e
Hj−1 hPj−1 , Pj−1 i = hQ, Pj−1 i = hPj+1 , Pj−1 i − hx Pj , Pj−1 i
= −hx Pj , Pj−1 i = −hPj , x Pj−1 i.
Esprimendo il polinomio x Pj−1 di grado j come combinazione lineare dei
polinomi ortogonali fino al grado j si ha hPj , x Pj−1 i = hPj , Pj i. Quindi
44
k−1
Posto Pk = xk Im + xi Hi per k > 0, è
P
i)
i=0
k−1
X
O = hPk , P0 i = hxk Im , Im i + xi hHi , Im i
i=0
k−1
X k−1
X
= hxk Im , Im i + Hi hxi Im , Im i = µk + Hi µi ,
i=0 i=0
Rb
dove µi = hxi Im , Im i = a
xi W (x) dx. Moltiplicando per xj , con j = 1, . . . , k −1
si ha
k−1
X k−1
X
O = hxk+j Im , Im i + Hi hxi+j Im , Im i = µk+j + Hi µi+j ,
i=0 i=0
cioè
k−1
X
Hi µi+j = −µk+j , j = 0, . . . , k − 1.
i=0
In forma matriciale è
H0 , H1 , . . . , Hk−1 Ak−1 = − µk , µk+1 . . . , µ2k−1
dove
µ0 µ1 ··· µk−1
µ1 µ2 ··· µk
Ak−1 = ,
.. .. ..
. . .
µk−1 µk ··· µ2k−4
quindi
H0 , H1 , . . . , Hk−1 = − µk , µk+1 , . . . , µ2k−1 A−1
k−1
e
Im
k−1
X x Im
P k = xk Im + xi Hi = xk Im − µk , µk+1 , . . . , µ2k−1 A−1
.
k−1 ..
i=0
.
xk−1 Im
e analogamente
Pj (x)T hPj , Pj i−1 Pj+1 (ξ) = Pj (x)T hPj , Pj i−1 ξ Im +Hj Pj (ξ)+Pj (x)T hPj , Pj i−1 Hj−1 Pj−1 (ξ).
45
Sottraendo dalla prima la seconda trasposta si ottiene
Pj (ξ)T hPj , Pj i−1 Pj+1 (x) − Pj+1 (ξ)T hPj , Pj i−1 Pj (x)
= Pj (ξ)T hPj , Pj i−1 x − ξ Pj (x) + Pj (ξ)T hPj , Pj i−1 Hj − HjT hPj , Pj i−1 Pj (x)
+Pj (ξ)T hPj , Pj i−1 Hj−1 Pj−1 (x) − Pj−1 (ξ)T Hj−1
T
hPj , Pj i−1 Pj (x).
Ma per la (14) è hPj , Pj i−1 Hj = HjT hPj , Pj i−1 e hPj , Pj i−1 Hj−1 = Hj−1
T
hPj , Pj i−1 =
−1
−hPj−1 , Pj−1 i , quindi resta
= Pj (ξ)T hPj , Pj i−1 Pj+1 (x) − Pj+1 (ξ)T hPj , Pj i−1 Pj (x)
+Pj (ξ)T hPj−1 , Pj−1 i−1 Pj−1 (x) − Pj−1 (ξ)T hPj−1 , Pj−1 i−1 Pj (x).
Risoluzione dell’esercizio 6.
a) Verifico che le quattro relazioni che definiscono il prodotto scalare valgono
Z bZ b
(1) simmetria hp, qi = p(x, y) q(x, y) W (x, y) dx dy
a a
Z bZ b
= q(x, y) p(x, y) W (x, y) dx dy = hq, pi
a a
Z b Z b
(2) linearità hp1 + p2 , qi = p1 (x, y) + p2 (x, y) q(x, y) W (x, y) dx dy
a a
Z bZ b Z b Z b
= p1 (x, y) q(x, y) W (x, y) dx dy + p2 (x, y) q(x, y) W (x, y) dx dy
a a a a
= hp1 , qi + hp2 , qi
Z b Z b
(3) prodotto per scalare hα p, qi = α p(x, y) q(x, y) W (x, y) dx dy
a a
Z b Z b
=α p(x, y) q(x, y) W (x, y) dx dy = α hp, qi
a a
Z b Z b
(4) positività hp, pi = p2 (x, y) W (x, y) dx dy ≥ 0 e hp, pi = 0 se e solo
a a
se p(x, y) ≡ 0.
46
b), c) Una base di Πk è quella dei monomi xi y j−i , per i = 0, . . . , j e
j = 0, . . . , k. Quindi la dimensione di Πk è (k + 1)(k + 2)/2.
RbRb
Sia α = a a W (x, y) dx dy > 0 per ipotesi. Per semplicità suppongo che i
polinomi di Vk siano normalizzati e dimostro per induzione che l’insieme Vk è uno
spazio vettoriale di dimensione k + 1 formato, oltre che dallo 0, solo da polinomi
(0) (0)
di grado k. Per k = 0 si definisce v1 (x, y) ≡ 1/α e V0 = span (v1 ). Per k > 0
(k)
sia vi (x, y), i = 1, . . . , k + 1, una base di Vk e si considera l’insieme dei k + 2
(k+1) (k+1) (k)
polinomi wi (x, y), con wi (x, y) = x vi (x, y), per i = 1, . . . , k + 1 e
(k+1) (k)
wk+2 (x, y) = y vk+1 (x, y). A questo insieme, formato da polinomi linearmente
indipendenti di grado k + 1, si applica un procedimento di ortogonalizzazione di
(k+1)
Gram-Schmidt, ottenendo i polinomi vi (x, y), dove
(k+1) (k+1)
v1 (x, y) = w1 (x, y),
e per i = 2, . . . , k + 2
i−1
(k+1) (k+1) (k+1) (k+1) (k+1)
X
t = wi (x, y) − hwi , vj i vj (x, y), vi = t/ht, ti
j=1
47
perché x q(x, y) ha grado minore di quello di p(x, y). Se q(x, y) è un polinomio
ortogonale di grado maggiore di n + 1, si ha
Z bZ b
hx p, qi = x p(x, y) q(x, y) W (x, y) dx dy = 0
a a
Quindi
n−1 n n+1
(n−1) (n) (n+1)
X X X
x p(x, y) = αn−1,j vj + αn,j vj + αn+1,j vj ,
j=0 j=0 j=0
(i)
e considero la matrice An , il cui elemento (i, j)-esimo è αn+1,j , per i = 0, . . . , n,
(i)
j = 0, . . . , n+1, la matrice Bn , il cui elemento (i, j)-esimo è αn,j , per i = 0, . . . , n,
(i)
j = 0, . . . , n, e la matrice Cn il cui elemento (i, j)-esimo è αn−1,j , per i = 0, . . . , n,
j = 0, . . . , n − 1. In forma vettoriale si pone v (k) il vettore le cui componenti
(k)
sono vj , per j = 0, . . . , k e si ha per n ≥ 1
48
dove pk−i (y) è un polinomio di grado al più k − i, per cui
k
X
hqm , pi = hϕm (x) ϕn−m (y), xi pk−i (y)i
i=0
k Z b
X Z b
= ϕm (x) ϕn−m (y) xi pk−i (y) ω(x) ω(y) dx dy
i=0 a a
m−1
XZ b Z b
i
= ϕm (x) x ω(x) dx ϕn−m (y) pk−i (y) ω(y) dy
i=0 a a
k Z
X b Z b
i
+ ϕm (x) x ω(x) dx ϕn−m (y) pk−i (y) ω(y) dy,
i=m a a
dove sono nulle le sommatorie il cui primo indice è maggiore del secondo. I
termini della prima sommatoria sono nulli perché ϕm (x) è ortogonale ai polinomi
xi con i < m, i termini della seconda sommatoria sono nulli perché ϕn−m (y) è
ortogonale ai polinomi pk−i (y) con i ≥ m.
Dimostro infine che i qm sono ortogonali rispetto al peso ω(x) ω(y) per
m = 0, . . . n
Z bZ b
hqm , qr i = ϕm (x) ϕn−m (y) ϕr (x) ϕn−r (y) ω(x) ω(y) dx dy
a a
Z b Z b
= ϕm (x) ϕr (x) ω(x) dx ϕn−m (y) ϕn−r (y) ω(y) dy = δm,r .
a a
Quindi qm per m = 0, . . . n costituisce una base ortogonale di Vn .
Risoluzione dell’esercizio 7.
a) A = V S segue da
j
X j
X
ai,j = pj (xi ) = pk,j xki = sk,j vi,k .
k=0 k=0
49
Quindi il vettore ui = [p0 (xi ), . . . , pn (xi )]T è autovettore di T corrispondente
all’autovalore x = xi . Si indica con U la matrice la cui i-esima colonna è ui .
Quindi U = AT .
Poiché i Cj sono positivi, la matrice diagonale D, i cui elementi principali
sono di = hpj , pj i1/2 , è tale che la matrice M = D−1 T D è simmetrica. Gli
autovettori di M , normalizzati nella norma indotta dal prodotto scalare, sono
i vettori ortonormali wj = D−1 uj /γj , con γj = kD−1 uj k. Quindi la matrice
W , la cui j-esima colonna è il vettore wj , verifica la relazione W T W = I.
Si chiama Γ la matrice diagonale i cui elementi principali sono γj . Allora
W Γ = D−1 U = D−1 AT . Si pone Q = Γ−1 W T D−1 , con D1 = Γ−1 e D2 = D−1 .
c) Sostituendo A = V S si ha D1 V = QD2−1 S −1 . Poichè S è triangolare
inferiore, la matrice R = D2−1 S −1 è triangolare inferiore, quindi QR rappresenta
la fattorizzazione QR di D1 V . Questo suggerisce un algoritmo per il calcolo
dei coefficienti dei polinomi pj (x) nella base dei monomi a partire dai valori
che i pj (x) assumono negli zeri xi , i = 0, . . . , xn di pn+1 (x) e dai fattori di
normalizzazione hj = hpj , pj i:
(1) si costruisce la matrice di Vandermonde V ;
(2) con i fattori hj si costruisce la diagonale di D;
(3) si costruiscono i γj e la diagonale di D1 ;
(4) si costruisce D1 V e se ne calcola la fattorizzazione QR;
(5) la matrice S cercata è R−1 D.
Risoluzione dell’esercizio 8.
a) Per semplicità si suppongono i polinomi monici, ma ciò che segue può
essere esteso senza alterarne le conclusioni anche al caso che i polinomi non siano
monici. La successione pi (x), i = 0, . . . , n, costituisce una base dello spazio Pn e
vale hpi (x), q(x)i = 0 per ogni polinomio q(x) di grado minore di i.
Dimostriamo dapprima che se hxp(x), q(x)i = hp(x), xq(x)i per ogni coppia
di polinomi in Pn di grado al più n − 1, allora la successione soddisfa una
relazione a tre termini. Infatti pi+1 (x) per i ≥ 1 può essere espresso nella base
p0 (x), . . . , pi (x), xpi (x) nel modo seguente
e vale
hpj (x), pi+1 (x)i = α0 hpj (x), p0 (x)i + . . . + αi hpj (x), pi (x)i + hpj (x), xpi (x)i
= αj hpj (x), pj (x)i + hpj (x), xpi (x)i.
Se j ≤ i − 2 è hpj (x), xpi (x)i = hxpj (x), pi (x)i = 0 e hpj (x), pi+1 (x)i = 0, per
cui αj = 0. Resta
50
Viceversa, dimostriamo che se la successione soddisfa una relazione a tre
termini, allora hxp(x), q(x)i = hp(x), xq(x)i per ogni coppia di polinomi in Pn
di grado al più n − 1. Per linearità basta dimostrare che la proprietà vale per i
polinomi pi (x), cioè che hxpi (x), pj (x)i = hpi (x), xpj (x)i. Se i = j la proprietà
vale per la commutatività del prodotto scalare, inoltre per la simmetria, basta
dimostrarla per i ≤ j. Quindi ciò che basta dimostrare è la relazione
Per fare questo si osserva che per la relazione a tre termini vale
hpi+1 (x)−Bi+1 pi (x)+Ci pi−1 (x), pj (x)i = hpi (x), pj+1 (x)−Bj+1 pj (x)+Cj pj−1 (x)i
che è verificata essendo Cj = hpj , pj i/hpj−1 , pj−1 i, per l’ortogonalità dei pi (x) e
per la relazione a tre termini.
b) Posto
Xn X n
p(x) = pi xi , q(x) = qi xi ,
i=0 i=0
è
n X
X n
hp(x), q(x)i = pi qj hxi , xj i = pT Hq, dove hi,j = hxi , xj i.
i=0 j=0
La dimostrazione che l’applicazione che associa alla coppia (p(x), q(x)) il numero
reale pT Hq, in cui H è una matrice simmetrica definita positiva, è un prodotto
scalare, è una verifica diretta delle proprietà di positività, di simmetria e di
bilinearità.
c) Si è visto al punto (a) che se i polinomi ortogonali verificano la relazione
a tre termini, allora hxp(x), q(x)i = hp(x), xq(x)i. Quindi per ogni i e j è
per cui la H ha uguali gli elementi sulle parallele alla diagonale secondaria, cioè
è di Hankel.
51
d) Si ha
n
X n
X
p(ξi ) = pj ξij , q(ξi ) = qj ξij ,
j=0 j=0
per cui
n X
X n n
X n X
X n n
X
hp(x), q(x)i = pj ξij qk ξik = pj qk ξij ξik .
i=0 j=0 k=0 j=0 k=0 i=0
Per questa matrice H valgono le stesse proprietà che per quella definita al punto
(b), in particolare che in questo modo si è definito un prodotto scalare. Inoltre
si ha
n
X n
X
hxp(x), q(x)i = ξi p(ξi )q(ξi ) = p(ξi )ξi q(ξi ) = hp(x), xq(x)i,
i=0 i=0
e questo, per quanto dimostrato al punto (a), è sufficiente per dire che i polinomi
ortogonali relativi al prodotto scalare cosı̀ definito verificano una relazione a tre
termini.
Risoluzione dell’esercizio 9
Si dà un cenno di due risoluzioni diverse.
Prima risoluzione. Si ponga t = x + x−1 e si osservi che xn+1 + x−n−1 =
(x + x−n )t − xn−1 − x−n+1 . Procedendo per induzione su n si deduca che
n
con b a = a√ + a−1 , bb = b + b−1 e w(t) b = w(t + t−1 )/(1 − x(t)−2 √ ) > 0 con
x(t) = (t + t − 4)/2 che è invertibile su [a, b] e vale x(t) = (t + t2 − 4)/2.
2
Segue allora che pbn (t) sono polinomi ortogonali classici e le loro proprietà si
estendono quindi a pn (x) = pbn (x + x−1 ). In particolare, poiché pbn (t) ha n zeri
(n)
reali distinti τi ∈ (b a, bb), i = 1, . . . , n, allora pn (x) ha n zeri reali distinti in (a, b)
52
q
(n) (n) (n)2
che sono ξi = τi + τi − 4 /2, oltre ai loro reciproci in (1/bb, 1/b
a); La
relazione a tre termini soddisfatta dai pbn (t) implica che i pn (x) soddisfano ad
una relazione del tipo
con An+1 = 1. Vale quindi la separazione degli zeri (per la proprietà di monotonia
di t(x) nell’intervallo [a, b]), la proprietà di ortogonalità discreta, la formula di
Christoffel-Darboux, ecc.
Se 0 < a < 1 < b, la funzione t(x) = x + 1/x non è invertibile, e le proprietà dei
polinomi ortogonali classici in generale non valgono. Ad esempio, con w(x) = 1,
a = 1/2 e b = 2, vale p0 (x) = 1, p1 (x) = x + x−1 − α con α > 0. Poiché p1 (x)
ha due zeri ξ > 1 e 1/ξ, non può avere un solo zero nell’intervallo (1/2, 2).
Possiamo comunque scrivere il prodotto scalare nel modo seguente
Z b Z 1 Z b
p(x)q(x)w(x)dx = p(x)q(x)w(x)dx + p(x)q(x)w(x)dx
a a 1
Inoltre vale hpk , (x + x−1 )pn i = h(x + x−1 )pk , pn i, e, poiché (x + x−1 )(xi + x−i ) =
xi+1 + x−i−1 + xi−1 + x−i+1 , il prodotto (x + x−1 )pk è un polinomio di Laurent
di grado k + 1. Allora per la proprietà di ortogonalità risulta αk = 0 per
k = 0, . . . , n − 2. Da cui la relazione a 3 termini.
Per la proprietà degli zeri si ragiona come nel caso standard. Occorre
premettere che gli zeri di pn (x) sono in coppie ξ, 1/ξ. Supponiamo per assurdo
che in (a, b) ci siano meno di n zeri di pn (x). Denotiamo con η1 , . . . , ηk quelli di
53
Qk
molteplicità dispari. Costruisco q(x) = i=1 (x − ηk )(x−1 − ηk ) che è prodotto
di polinomi di Laurent quindi è polinomio di Laurent di grado k < n. Per
l’ortogonalità deve essere hq, pn i = 0. Però sull’intervallo [a, b] il prodotto
pn (x)q(x) non cambia segno e non è identicamente nullo. Questo conduce ad un
assurdo.
In modo analogo si procede con le altre proprietà.
Risoluzione dell’esercizio 10
a) I polinomi p0 (x), p1 (x), . . . , pn−1 (x), x2 pn−2 (x) sono linearmente indipen-
denti avendo grado 0, 1, 2, . . . , n. Quindi costituiscono una base per Pn e si può
scrivere:
pn (x) = an x2 pn−2 (x) + an−1 pn−1 (x) + an−2 pn−2 (x) + · · · + a0 p0 (x).
pn (x) = an−1 pn−1 (x) + (an x2 + an−2 )pn−2 (x) + an−3 pn−3 (x) + an−4 pn−4 (x).
In particolare si ottiene
hx2 pn−2 , pn−i i
an−i = −an , i = 1, 2, 3, 4.
hpn−i , pn−i i
b) No, la struttura di Hankel non è mantenuta. Infatti se la proprietà
hxi+1 , xj i = hxi , xj+1 iP fosse verificata
Pn per ogni i, j P − 1, allora per
= 0, . . . , nP
n n n
bilinearità varrebbe h i=0 ai xi+1 , j=0 bj xj i = h i=0 ai xi , j=0 bj xj+1 i e
quindi varrebbe per ogni f (x), g(x) ∈ Pn . Deve quindi esistere (i, j) tale che
hxi+1 , xj i =
6 hxi , xj+1 i quindi hi+1,j 6= hi,j+1 e la matrice perde la struttura di
Hankel.
La condizione hx2 xi , xj i = hxi , x2 xj i implica che hi+2,j = hi,j+2 . Questa è
l’unica struttura che si conserva oltra alla simmetria. In particolare, le sotto-
matrici H1,1 = (h2i−1,2j−1 ), H2,2 = (h2i,2j ), H1,2 = (h2i−1,2j ), H2,1 = (h2i,2j−1 )
sono di Hankel. Quindi, permutando righe e colonne di H con una permutazio-
ne dispari/pari oppure pari/dispari si ottiene una matrice formata da quattro
blocchi di Hankel del tipo
H11 H12
T .
H12 H22
Poichè se f sono i vettori dei coefficienti dei polinomi f (x) e g(x) vale
hf (x), g(x)i = f T Hg, basta considerare una matrice H con la struttura descritta
sopra che sia definita positiva e definire il prodotto scalare come sopra.
Una matrice H definita positiva con le proprietà descritte si può costruire
considerando una qualsiasi matrice derivante da un prodotto scalare di tipo
54
integrale, ad esempio la matrice di Hilbert, e per un k fissato perturbando
gli elementi hk−2i,k+2i per tutti i valori di i consentiti. Se la perturbazione è
sufficientemente piccola in valore assoluto, si ottiene ancora una matrice definita
positiva per la continuità del determinante.
Alternativamente, per n pari si può definire H1,1 = H2,2 uguali alla matrice
T
di Hilbert, H1,2 = H2,1 = 0. In questo caso vale la proprietà hx2 p(x), q(x)i =
R1 R1
hp(x), x2 q(x)i, inoltre h1, x2 i = 0 xdx mentre hx, xi = 0 1dx quindi h1, x2 i = 6
hx, xi.
c) Calcolando il determinante diPHn (x) con la regola di Laplace sull’ultima
n i n−i
riga di Hn (x) si ha det Hn (x) = i=0 x (−1) di , dove di sono i determi-
nanti delle sottomatrici ottenute cancellando l’ultima Pnriga e la colonna i + 1-
esima, per i = 0, . . . , n. Per cui hxk , det Hn (x)i = i=0 hxk , xi i det Hn (x) =
det H(x)
e dove H(x)e è la matrice ottenuta da H(x) sostituendo l’ultima riga
con [hxk , x0 i, . . . , hxk , xn i]. Ma questo è nullo per k = 1, . . . , n − 1 poiché l’ul-
tima riga coinciderebbe con la k-esima. Per cui risulta hxk , det Hn (x)i per
k = 0, 1, . . . , n − 1 e quindi det Hn (x) = pn (x).
d) h·, ·, i0 è prodotto scalare poiché è forma bilineare ed è definito positivo
essendo hp, pi0 = hp+ (x), p+ (x)i + hp− (x), p− (x)i ≥ 0 come somma di quantità
non negative, ed è nullo solo se i due addendi sono nulli, cioè solo se p(x) ≡ 0.
Vale
hx2 p(x), q(x)i0 =hx2 p+ (x2 ) + x(x2 p− (x2 )), q+ (x2 ) + xq− (x2 )i0
=hxp+ (x), q+ (x)i + hxp− (x), q− (x)i
=hp+ (x), xq+ (x)i + hp− (x), xq− (x)i
=hp(x), x2 q(x)i0
Posto p(x) = 1 e q(x) = x vale hxp(x), q(x)i0 = hx, xi0 = h1, 1i, mentre
hp(x), xq(x)i0 = h1, x2 i0 = h1, xi I due prodotti scalari sono diversi se h1, 1i = 6
h1, xi, ciò accade ad esempio con [a, b] = [0, 1] e w(x) = 1.
e) Sı̀ basta considerare la matrice A di Hessenberg inferiore pentadiagonale
con elementi sopradiagonali uguali a −1, diagonali uguali a ci , sottodiagonali
uguali a ai x2 + bi e nelle due sottodiagonali successive uguali rispettivamente a
di ed ei . Posto v = [p0 (x), . . . , pn−1 (x)]T , vale Av = pn (x)en . In particolare gli
zeri di pn (x) sono gli zeri di det A.
Risoluzione dell’esercizio 11
1 ⇒ 2 L’ortogonalità di p1 (x) = A1 x + B1 e p0 (x) = A0 implica che
hB1 , A0 i = 0 da cui B1 = 0. Induttivamente, supponiamo che Bi = 0 per
i = 0, 1, . . . , n. Dimostriamo che Bn+1 = 0. La proprietà Bi = 0 implica che per
i = 0, . . . , n vale pi (x) ∈ P + se i è pari, pi (x) ∈ P − se i è dispari (si veda anche
l’implicazione 2⇒ 3). Per cui per l’ortogonalità di P + e P − , dall’espressione
Bn+1 = −An+1 hxpn , pn i/hpn , pn i segue Bn+1 = 0.
2 ⇒ 3 Si procede induttivamente. La proprietà vale per p0 e p1 . Assumendo
valida la proprietà per pi per i = 0, 1, . . . , n si dimostra per n + 1. Dalla relazione
a tre termini
pn+1 (x) = xAn+1 pn (x) − Cn pn−1 (x)
55
se n è pari allora per ipotesi induttiva pn (x) ha monomi con potenze pari quindi
xAn+1 pn (x) ha monomi con sole potenze dispari cosı̀ come pn−1 per cui pn+1
ha monomi con sole potenze dispari. Si procede in modo analogo se n è dispari.
3 ⇒ 1 Siano r(x) ∈ P + e s(x) ∈ P − . Rappresentando r(x) e s(x) nella
base dei polinomi ortogonali si ha che r(x) è combinazione lineare dei p2i (x)
mentre s(x) è combinazione lineare dei p2i+1 (x). Dall’ortogonalità dei pi (x)
segue hr(x), s(x)i = 0.
da cui
ψm (t) = ϕm (t) − C2m ψm−1 (t)
ϕm (t) = tψm−1 (t) − C2m−1 ϕm−1 (t)
Sostituendo ϕm (t) = ψm (t) + C2m ψm−1 (t) nella seconda equazione si ottiene
ψm (t) + C2m ψm−1 (t) = tψm−1 (t) − C2m−1 (ψm−1 (t) + C2m−2 ψm−2 (t)
da cui
Analogamente,
ϕm+1 (t) = (t − C2m+1 − C2m )ϕm (t) − C2m C2m−1 ϕm−1 (t)
56
Essendo x2i+1 ortogonale a x2j , la matrice dei momenti H = (µi+j ) ha
elementi nulli se i + j è dispari. Per cui mediante una permutazione di righe e
colonne che porta in testa gli indici 0, 2, 4, 6, . . . e in coda gli indici 1, 3, 5, 7, . . .
la matrice si trasforma in una matrice diagonale a blocchi con blocchi diagonali
di Hankel. I due blocchi diagonali definiscono il prodotto scalare dei polinomi
ϕi (t) e ψi (t).
57
la cui dimostrazione si ottiene trascrivendo e adattando la dimostrazione vista a
lezione.
Le proprietà degli zeri richiedono un’analisi più approfondita. Dimostriamo
ora che se s(x) è iniettiva su [a, b] allora pk (x) ha almeno k zeri semplici nell’in-
tervallo (a, b). Se gli zeri semplici in (a, b) fossero h < k, siano essi x1 , . . . , xh ,
Qh
allora il polinomio i=1 (s(x) − s(xi )) ∈ V ha grado mh < mk = grado(pk (x)),
per cui hpk , qi = 0. Però il polinomio pk (x)q(x) non cambia segno su [a, b] purchè
s(xi ) 6= s(xj ) per i 6= j che è vero se s(x) è iniettiva. Questa proprietà implica
che hpk , qi =
6 0. Assurdo.
Si può dimostrare che se s(x) è iniettivia su [a, b] allora gli zeri sono esat-
tamente k. Sotto questa ipotesi di iniettività si può dire sostanzialmente di
più. Definiamo uk (z) tale che pk (x) = uk (s(x)), per semplicità assumiamo che
s0 (x) > 0 per x ∈ (a, b) e poniamo α = s(a), β = s(b), t = s(x), x = s−1 (t), dove
α < β. Risulta
b β β
w(s−1 (t))
Z Z Z
pk (x)ph (x)w(x) = uk (t)uh (t) 0 −1 dt = uk (t)uh (t)w̃(t)dt
a α s (s (t)) α
dove w̃(t) > 0 su [α, β]. Quindi i polinomi uk (t) sono polinomi ortogonali
standard rispetto a un prodotto scalare di tipo integrale con opportuno peso.
Vale quindi
uk+1 (z) = (Ak+1 z + Bk+1 )uk (z) − Ck uk−1 (z).
Situazione analoga si ha se s0 (x) < 0 poichè α R> β e cambiando segno al peso e
α
scambiando gli estremi di integrazione si ottiene β uk (t)uh (t)w̃(t)dt dove β < α
e w̃(t) > 0, quindi ancora un prodotto scalare. Per cui i polinomi uk (y) sono
polinomi ortogonali su [min(α, β), max(α, β)] col prodotto scalare con peso w̃(y).
Quindi gli zeri di uk (t) sono reali e semplici compresi tra (min(α, β), max(α, β))
e godono dell proprietà di interlacing. Se s(x) è iniettiva su [a, b], gli zeri reali di
pk (x) in (a, b) sono esattamente k e godono della proprietà di interlacing. Inoltre
tutte le proprietà dei polinomi ortogonali valide per gli uk (y) si estendono a
pk (x) avendo cura di sostituire la variabile y con s(x). Si riottengono quindi la
relazione a 3 termini, la formula di Christoffel-Darboux ecc.
Se s(x) non è monotona l’integrale tra a e b può essere spezzato in una somma
di integrali su intervalli che hanno per estremi a, b e i punti in cui si annulla la
derivata prima di s(x). Trattando ogni singolo intervallo come sopra si deduce
che gli zeri di pk (x) sono compresi tra minx∈[a,b] s(x) e maxx∈[a,b] s(x). Non è
detto che siano k o che siano distinti. Infatti se τ è zero di uk (t) allora i valori
di ξ tali che s(ξ) = τ sono zeri di pk (x). Poiché s(x) non è iniettiva ci possono
essere al più m valori di ξ per cui s(ξ) = τ .
Un tipo di analisi similare può essere condotta come segue. Si osserva ancora
che dalla relazione a tre termini segue che per il polinomio pk (x) = uk (s(x)) vale
pk (x) = det(Tk − s(x)I) dove Tk è una matrice reale simmetrica k × k. Per cui,
avendo Tk autovalori λ1 , . . . , λk reali distinti che coincidono con gli zeri di uk (x).
Allora il polinomio pk (x) si annullerà in quei valori di x per cui s(x) = λi ,
per i = 1, . . . , k. Se s(x) è iniettivo su [a, b] allora dalla proprietà di interlacing
58
dei λi segue la proprietà di interlacing degli zeri di pk (x). Se s(x) non è iniettivo
possono esserci più soluzioni dell’equazione s(x) = λi .
e sostituendo x con Tm (x), dalla proprietà Tn (Tm (x)) = Tmn (x) si ottiene
per cui 2Tn (x)Tm (x) − Tm−n (x) = cos nθ cos mθ − sin nθ sin mθ = cos(m + n)θ =
Tm+n (x).
Per la formula di Christoffel-Darboux generalizzata si parte dalla formula
standard
n
X 1
γn (Tn+1 (x)Tn (y) − Tn (x)Tn+1 (y)) = (x − y)( Ti (x)Ti (y)),
h
i=0 i
an 1 n−1
dove γn = an+1 hn = π essendo per i polinomi di Chebyshev an = 2 e h0 = π,
hi = π/2 per i > 0. Per cui si può scrivere
n
X
Tn+1 (x)Tn (y) − Tn (x)Tn+1 (y) = (x − y)(1 + 2 Ti (x)Ti (y)).
i=1
Ora, ponendo x = Tm (u) e y = Tm (v), poiché Tn+1 (x) = Tn+1 (Tm (u)), per il
punto a) si ottiene Tn+1 (x) = T(n+1)m (u). Analogamente si ha Tn (y) = Tmn (v)
da cui
n
X
Tnm+m (u)Tnm (v)−Tnm (u)Tnm+m (v) = (Tm (u)−Tm (v))(1+2 Tmi (u)Tmi (v)).
i=1
59
da cui la tesi.
c2) Segue dalla relazione T(2k+1)n = T2k+1 (Tn (x)) essendo T2k+1 (0) = 0
poiché il grado di T2k+1 (x) è dispari.
c3) Dalla relazione a tre termini generalizzata segue
Risoluzione esercizio 14
a) Ci sono vari modi per dimostrare queste proprietà. Ne diamo un cenno.
Soluzione 1. La relazione Tn+1 = xUn − Un−1 si può dimostrare sfruttando
l’interpretazione matriciale. Infatti sappiamo che Tn+1 è uguale al determinante
della matrice tridiagonale An+1 = (ai,j ) con a1,1 = x, ai,i = 2x per i =
60
2, . . . , n + 1, ai,i+1 = ai+1,i = −1. Mentre Un+1 è il determinante della matrice
tridiagonale Bn+1 = tridn+1 (−1, 2x, −1). Calcolando det An+1 con lo sviluppo
per righe sulla prima riga si ha det An+1 = x det Bn − det Bn−1 = xUn − Un−1 .
La relazione Um+n = Um Un −Um−1 Un−1 si ottiene calcolando il determinante
di Um+1 sviluppando lungo la riga m-esima. Analogamente per Tm+n .
Soluzione 2. Si possono dimostrare le proprietà del punto a) usando la
relazione del punto b) sulla matrice An+1 . Ad esempio, per la terza proprietà
Um+n = Um Un − Um−1 Un−1 basta infatti scrivere l’identità An+m =An Am,
Um−2 U
ricordare che le colonne di Am sono date rispettivamente da − , m−1
Um−1 Um
e leggere l’identità sulle colonne.
Soluzione 3. Si procede per induzione. Ad esempio, per dimostrare la
relazione Tn+1 = xUn − Un−1 , si verifica come passo iniziale che la relazione vale
per n = 1 e per n = 2 (questo discende dalla definizione di T2 , T3 , U0 , U1 , U2 ). Si
dimostra poi il passo induttivo, cioè supponendo valida la Tn+1 = xUn − Un−1 ,
si dimostra Tn+2 = xUn+1 − Un . Per questo si scrive Tn+2 = 2x ∗ Tn+1 − Tn
si applica l’ipotesi induttiva su Tn+1 e su Tn (è per questo che il passo iniziale
richiede la verifica per n = 1, 2) e si ha
−a b
basta calcolare k quadrati di matrici del tipo H = . Vale
−b c
a2 − b2
b(c − a)
H2 =
−b(c − a) c2 − b2
Basta quindi eseguire 3 quadrati, 3 addizioni e una moltiplicazione per un
totale di 7k operazioni. Portando A in forma diagonale A = SDS −1 , si ha
k k
A2 = SD2 S −1 per cui la parte di calcolo che dipende da k si √
limita a valutare
k
2
D . Gli elementi diagonali di D sono λ e 1/λ, dove λ = x ± x2 − 1, per cui
61
k
basta calcolare λ2 . Ciò richiede k moltiplicazioni. Il numero delle operazioni
restanti non dipende da k
Risoluzione esercizio 15
a) Dalla formula di Christoffel-Darboux,
n
X 1 an
pi (x)pi (y) = (pn+1 (x)pn (y) − pn+1 (y)pn (x))
i=0
(x − y) an+1
b) Dalla precedente espressione segue che pn (x) e pn+1 (x) non possono avere
zeri comuni. Infatti, se ξ fosse uno zero comune, cioè pn (ξ) = pn+1 (ξ) = 0,
allora l’espressione in (17) sarebbe nulla in ξ. Inoltre se ξ < η sono due zeri
consecutivi di pn+1 (x) allora necessariamente p0n+1 (ξ)p0n+1 (η) < 0, inoltre dalla
(1) si ha p0n+1 (ξ)pn (ξ) > 0 e p0n+1 (η)pn (η) > 0, e quindi pn (ξ) e pn (η) hanno
segno opposto. Quindi pn (x) ha un numero dispari di zeri in ogni intervallo [ξ, η].
Poiché pn (x) ha n zeri, nessun intervallo [ξ, η] può contenere più di uno zero.
c) Si considera la funzione razionale r(x) = pn+1 (x)/pn (x) che ha asintoti
verticali nei punti x1 , . . . , xn . La derivata prima di r(x) è r0 (x) = (p0n+1 (x)pn (x)−
pn+1 (x)p0n (x))/pn (x)2 che è positiva in virtù della (1). Quindi r(x) è crescente
in ogni intervallo [xi , xi+1 ] per i = 0, . . . , n con x0 := a, xn+1 := b. La tesi segue
dal fatto che gli zeri di pn+1 (x) − cpn (x) sono le ascisse dei punti di intersezione
del grafico di r(x) con la retta di equazione y = c.
d) Essendo Ω0 (x) = ω(x) > 0, la funzione Ω(x) è crescente. Poiché Ω(x)
è definita a meno di una costante additiva, può essere scelta in modo che
Pn Rb
Ω(a) = 0. Poiché λi > 0 e i=1 λi = a ω(x)dx = Ω(b) − Ω(a) = Ω(b), i valori
zi = λ1 + · · · + λi stanno nel codominio di Ω(x) per i = 1, 2, . . . , n e per la
crescenza di Ω(x) e poiché zi+1 > zi , esistono punti yi ∈ [a, b] tali che Ω(yi ) = zi
e yi < yi+1 . Vale quindi Ω(yi ) − Ω(yi−1 ) = λi .
Risoluzione esercizio 16
62
a) Vale Ln (x) = det(xI − Rn ) dove Rn è la sottomatrice principale di testa di
0 2
−1 0 1
0 −1 0 1
.
−1 0 1
.. .. ..
. . .
b) I polinomi ortogonali soddisfano una relazione a tre termini del tipo Pn+1 (x) =
(An x + Bn )Pn (x) − Cn Pn−1 (x), dove assumendo An = 1 risulta Cn > 0. Nel caso dei polinomi
Ln (x) il segno di Cn è negativo. Quindi i polinomi Ln (x) non possono essere ortogonali con
nessun prodotto scalare di tipo integrale con peso ≥ 0 su [a, b].
0 2
1 0 1
Sn =
.. .. .. .
. . .
1 0 1
1 0
Confrontando Rn e Sn si osserva che differiscono per i segni sulla sottodiagonale. Per
cui, se definiamo D = diag(1, i, i2 , . . . , in−1 ), dove i2 = −1, si ha D−1 Sn D = iRn . Quin-
di D−1 (2xI − Sn )D = 2xI − iRn = i( 2 xI − Rn ). Prendendo il determinante ne segue
i
det(2xI − Sn ) = (i)n det( 2 xI − Rn ) da cui Tn (x) = 12 (i)n det( 2 xI − Rn ) = 12 (i)n Ln ( 2 x).
i i i
quindi Ln (x) = 2i−n Tn ( 21 ix).
d) Gli zeri di Ln (x) si ottengono da quelli di Tn (x) essendo Ln (x) = 2i−n Tn ( 12 ix).
e) Dimostriamo prima che Tm+n (x) = 2Tm (x)Tn (x) − Tm−n (x). Ponendo x = cos t,
essendo Tn (cos t) = cos(nt), l’identità si riscrive come cos((m + n)t) = 2 cos(mt) cos(nt) −
cos((m − n)t) che è verificata. Applicando il punto c) a questa identità dei polinomi di
Chebyshev si ottiene
1 1 1 1
Ln+m (x) =2i−n−m Tm+n ( ix) = 2i−n−m (2Tm ( ix)Tn ( ix) − Tm−n ( ix))
2 2 2 2
−n−m 1 m+n 1 m−n
=2i ( i Ln (x)Lm (x) − i Lm−n (x))
2 2
−2n
=Lm (x)Ln (x) − i Lm−n (x) = Lm (x)Ln (x) − (−1)n Lm−n (x)
f) Si cercano soluzioni speciali della ricorrenza a tre termini del tipo pn = λn . Imponendo
la relazione a tre termini si ottiene λn+1 = xλn + λn−1 da cui λ2 − xλ − 1 = 0 che dà
√
λ = 12 (x ± x2 + 4). Una generica combinazione lineare delle due soluzioni speciali, cioè
√ √
sn = α 12 (x + x2 + 4)n + β 21 (x − x2 + 4)n verifica ancora la ricorrenza a tre termini.
63
Scegliendo α = β = 1 si ha che sono verificate anche le due condizioni iniziali s0 = 2, s1 = x
per cui sn = Ln .
Risoluzione esercizio 17
a) Essendo pn (x) polinomi ortogonali su un intervallo rispetto ad un prodotto
scalare integrale essi verificano la relazione a tre termini
64
Un modo diverso per dimostrare le relazioni per x ∈ [−1, 1] consiste nel porre
x = cos θ per cui λ1 = cos θ + i sin θ, λ2 = λ̄1 . In questo modo la relazione
Tn (x) = 12 (λ1 (x)n + λ2 (x)n ) diventa Tn (cos θ) = cos(nθ). Analogamente per
Un (x).
Un altro modo consiste nel procedere per induzione su n.
Un algoritmo per il calcolo di Tn (x) consiste nei seguenti passi
√
1. λ1 = x + i 1 − x2
2. s1 = λn1
3. s2 = 1/s1
4. Tn (x) = (s1 + s2 )/2
Il costo computazionale è dato da 3 operazioni aritmetiche e il calcolo di una
radice quadrata per il punto 1; una esponenziazione al passo 2 che può essere
calcolata mediante quadrati successivi avendo decomposto n in base 2, per
un costo di O(log n) operazioni. Oppure mediante logaritmo ed esponenziale
attraverso il calcolo di due funzioni elementari. I punti 3 e 4 richiedono il calcolo
di un numero finito di operazioni aritmetiche.
Analogamente si procede per Un (x).
c1) Dalla analisi del punto a) segue
sn+1 (x) n s1 (x) n ax + b n 1 n 0
=F =F = (ax + b)F +F
sn (x) s0 (x) 1 0 1
da cui sn+1 (x) = (ax + b)Un (x) − Un−1 (x).
Un’altra possibilità consiste nel procedere per induzione su n.
c2) Dalla forma diagonale di F n e dal punto precedente si ottiene inoltre
sn+1 (x) n n −1 ax + b
= V diag(λ1 (x) , λ2 (x) )V
sn (x) 1
65
Riferimenti bibliografici
[1] D. Bini, M. Capovani, O. Menchi, Metodi Numerici per l’Algebra Lineare.
Zanichelli, Bologna, 1987.
[2] R. Bevilacqua, D. Bini, M. Capovani e O. Menchi, Metodi numerici,
Zanichelli, Bologna 1992.
[3] J. Stoer, R. Burlisch, Introduction to Numerical Analysis, Third Edition,
Springer, 2002.
66