Sei sulla pagina 1di 55

Mat3M

b
O b
P b
A
L’idea di redigere personalmente gli appunti dei corsi più belli (o per i quali questa pratica si fosse rivelata più
utile) è nata quasi per gioco, come molte altre abitudini, e per dare una forma più precisa a quel processo, delicato
e lento, chiamato “apprendimento”. Gradualmente questa pratica ha avuto due piacevoli conseguenze.
La prima è una discreta (almeno in prima approssimazione) padronanza di quello che è lo standard tipografi-
co per un libro che tratta di argomenti “scientifici”: un libro di Matematica, per quanto breve, deve possedere
quella stessa struttura che è intrinseca al ragionamento che in esso compare, e parallelamente chi lo compone
deve possedere la necessaria sensibilità per apprezzare la differenza tra una arida enumerazione di definizione-
proposizione-teorema-lemma e invece una sorta di “cammino educativo” che prende per mano il lettore e lo conduce
a capire quelle quattro, cinque idee fondamentali che sono sottese all’argomento che il libro tratta. E’ irrinuncia-
bile dunque rivolgere la propria attenzione ad un metodo di scrittura, quale è il linguaggio TEX, che permetta di
organizzare e subordinare logicamente, prima che graficamente, gli argomenti che si vogliono affrontare. Ovvia-
mente, non penso di aver raggiunto nemmeno un pezzetto di questo obiettivo: è però nato in me un modo nuovo
di guardare al “libro di matematica”, comprendendo la sua diversità da un qualunque altro prodotto di editoria.
La metafora migliore che ora mi viene in mente per apprezzare e far apprezzare ad un estraneo la differenza tra
i due tipi di volume è quella urbanistica: gli Elementi di Bourbaki (tanto per non fare nomi) sono assimilabile
ad una metropoli densa di vita e di eventi, che per essere vissuta agli innumerevoli livelli che la sua struttura
(frattale?) offre deve essere digerita con calma, affrontata pezzo per pezzo per impedire che la sua grandezza ci
sovrasti. Solo le opere di Borges hanno avuto in me questo stesso effetto, pur non contenendo una sola equazione.
Altre opere dell’intelletto (e in tal caso, davvero, è più prudente non fare nomi) si possono invece pensare come
comunità molto più tranquille, poco dedite a stupire il lettore/abitante e anzi, desiderose di evitargli ogni forma
di meditazione. Dire chi stia meglio dove, non compete mai all’autore: certo è che da lettore/scrittore amatoriale
auspico una sintesi tra i due mondi, un “inurbamento” di certe letture talmente scialbe da diluire nel nulla le poche
idee interessanti che in esse sono soffuse, e la perdita, da parte di certi autori di libri di Matematica, di un certo
amore per le costruzioni che si innalzano a perdita d’occhio come grattacieli, e impediscono a chi soffre una leggera
vertigine algebrica di apprezzare quel punto di vista che è permesso all’equilibrista.
Il secondo risultato è stato l’invito da parte di alcuni dei miei quattro lettori1 a mostrare al docente che in quel
periodo ci istruiva il risultato finale di tre mesi di fatiche. Fino a ieri questo consiglio ha incontrato sempre un
netto rifiuto. Ora i più fidati di loro (e la constatazione che l’oggetto da me prodotto aveva raggiunto dimensioni
apprezzabili) mi hanno forse convinto: prima di poterlo fare però preciso una volta per tutte ciò che in altri contesti
meno “professionali” ho comunque messo in chiaro con forza: nulla di quanto seguirà è “mio” in un modo che
mi permetta di vantarmene, o peggio, di lucrarne. Come in una sorta di strano setaccio infatti, tutto quello che
nelle successive pagine è degno di nota non è merito mio, potendo essere sempre ricondotto alla capacità e alla
pertinenza delle fonti che ho consultato, e invece ogni errore, refuso, omissione, confusione o travisamento è mia
colpa e mia proprietà.
Per coerenza dunque, e come ultimo paragrafo di questa presentazione, mi sembra logico nominare persone e
cose che hanno partecipato al mio processo di apprendimento:
ˆ Lezioni di Geometria Analitica e Proiettiva, G. Beltrametti et al.
ˆ The real Projective Plane, H.S.M. Coxeter
ˆ Geometric Algebra, Emil Artin
ˆ Cours D’Arithmetique, Jean Pierre Serre
ˆ Projective Geometry, L.N.G. Filon
ˆ Projective Geometry, O. Veblen e J.W. Young
ˆ Elements of Projective Geometry, L. Cremona
ˆ Un numero imprecisato (per fortuna non infinito) di dialoghi con i docenti M. Candilera, titolare del corso, F.
Esposito, assistente del corso, e M. Cailotto, persona dalla disponibilità e dalla chiarezza (non solo didattica)
fuori del comune.
ˆ Un numero indefinito, forse infinito, di conversazioni (telefoniche e non) con tanti compagni di corso, cui
dovrò a breve farmi pagare in birra tutti i teoremi e i corollari spiegati a notte alta in vista dell’esame.
A tutte queste persone e alla loro fatica (nel sopportare domande noiose, nell’aver prodotto il materiale su cui ho
studiato) va il merito di queste poche e caotiche pagine.

1 . . . ove qui “lettori” è inteso nell’accezione di “compagni di corso gentilmente invitati –chi ha orecchie per intendere. . . –

a leggere quel che man mano producevo”

Mat3M 2007/2008 1
GEOMETRIA PROIETTIVA

Due rette parallele non si


incontrano mai... e se si
incontrano non si salutano.

Corrado Guzzanti

Intro: Come dare significato matematico alla frase “Queste due figure si somigliano”? La risposta più
naturale è che esse si somigliano, se, a meno di certe operazioni che su di esse possiamo compiere, una è
identica all’altra. Tutto si riduce allora a fissare quante e quali sono le trasformazioni che su una figura
possiamo applicare: è lecito operarle una qualunque tipo di deformazione? Oppure dobbiamo limitarci
solamente a quelle continue (quelle che non “bucano il foglio”)? O ancora, possiamo o meno “invertirne”
l’orientazione come se la volessimo riflettere in uno specchio? Analogamente a quanto capitato in tutte
le branche della Matematica moderna, l’intero edificio della Geometria si è costruito sui concetti chiave
di insieme e di funzione: sacrificando un certo amore per l’immediatezza, ma guadagnando il potente
strumento della generalità, l’opera di Felix Klein e il suo Erlangenprogramme ci hanno insegnato che
una “Geometria” è per noi null’altro che la definizione precisa dell’azione di un gruppo di trasformazioni
(funzioni invertibili) su un insieme di oggetti (che per dirla con Hilbert, possono assumere la foggia che
più ci piace, diventando tanto punti e rette quanto boccali di birra e stecche da biliardo). Detta C la classe
degli oggetti che vogliamo trasformare, e G il gruppo che agisce su C, due di tali oggetti (T e T ′ ) si diranno
equivalenti nel momento in cui esiste una g ∈ G tale che T ′ = g(T ). Una Geometria è essenzialmente
determinata dalle caratteristiche del quoziente C/G, e le sue caratteristiche dipendono solo da quelle di G:
la conquista intellettuale maggiore di questo nuovo punto di vista è pensare in modo nuovo lo “spazio”,
come determinato unicamente dalle trasformazioni che su di esso sono permesse: la geometria è ora lo
studio di quelle “figure” che sono invarianti rispetto all’azione di G: l’equivalenza di cui prima smembra
l’insieme C in classi che sono le “figure geometriche” che si vogliono studiare. E’ allora con questo spirito
che partiamo a definire il problema (estendere il gruppo di trasformazioni a noi note, in modo costruttivo
e coerente) e la sua soluzione (definire lo spazio proiettivo su uno spazio vettoriale). Dunque, riassumendo
brevemente il percorso fatto finora, abbiamo parlato di
ˆ Spazi Vettoriali, il cui gruppo di trasformazioni è quello delle applicazioni lineari invertibili
(Aut(V ) ≃ GLn (K ));
ˆ Spazi Affini, estensione della nozione  di spazi vettoriali, il cui gruppo di trasformazioni è quello
t
delle affinità (Aff(A ) ≃ · · · ≃ v1 0a );
ˆ Spazi Metrici (Euclidei), il cui gruppo di trasformazioni è quello delle isometrie (Sim(E) ≃
On (R ))2
Partiamo da una osservazione che mette in luce una caratteristica delle affinità: esse rispettano un
invariante molto semplice da “visualizzare”, quale è la proporzione tra tre punti.
2 Nessuno di questi isomorfismi è canonico.

2
Osservazione. Le affinità rispettano una quantità detta proporzione. Dati cioè O, P, Q ∈ A n ed f :
A n → A n affinità associata a φ ∈ End(V ) (ricordiamolo, f (P + v) = f (P ) + φ(v)) allora si ha
Q−O f (Q) − f (O)
=
P −O f (P ) − f (O)
Dimostrazione. Si vede subito dalla definizione di affinità: se (Q − O) = α(P − O) si ha

f (Q) − f (O) := φ(Q − O) = φ(α(P − O)) = αφ(P − O) =: α(f (P ) − f (O)) Q.E.D.

Partiamo proprio da questa osservazione per notare come non tutte le trasformazioni che è possibile
definire su A siano riconducibili ad affinità: per essere tali esse dovrebbero tutte rispettare questa propri-
età, ma basta poca inventiva per trovare una trasformazione geometrica “innocua” che però non ha alcun
modo di essere assimilata ad una affinità. Definiamo all’uopo la mappa che, fissati P e π (risp. un punto
e un piano), manda X ∈ A in (P ∨ X) ∩ π 3 : cerchiamo ora di scrivere tale f in maniera leggermente più
“analitica”.
Innanzitutto π si può scrivere4 {Y ∈ A | n · (Y − Q) = 0}. Poi un punto
generico della retta P ∨ X si scriverà P + t(X − P ) con t ∈ R . Tale punto
è nel piano quando è verificata
bc
f (S) n · ((P − Q) + t(X − P )) = 0 = n · (P − Q) + tn · (X − P )
π
S bc

Ora, se X − P non è parallelo a π la soluzione è unica in t = n·(Q−P )


ed
n·(X−P )
f si scrive
n · (Q − P )
bc
f (X) f (X) = P + (X − P )
n · (X − P )
X E’ questione di conti convincersi che punti allineati vanno ancora in punti
bc
allineati mediante f , ma è facile convincersi pure del fatto che il rispetto
delle proporzioni è perduto: già questo basta a dire che f non è una affinità.
b
P Notiamo poi che
1. Tale f non è biiettiva (cosa succede se π k (P ∨ X)?)
X 
1
2. Le relazioni lineari con le coordinate non sono rispettate (notare che le incognite . compaiono
Xn
a denominatore)
Vi sono molte ragioni (storiche, artistiche, fisiologiche: prima delle quali la nozione di prospettiva in
campo artistico, non ultima la nascita della fotografia oppure la comprensione che la visione si basa
essenzialmente sulla percezione prospettiva dello spazio) a proposito del perché si senta il bisogno di
esprimere trasformazioni come questa in un modo che sia naturale. E’ proprio con lo spirito di aprire la
strada a nuove scoperte che definiamo lo
Definizione 1 (Spazio Proiettivo). Sia V spazio vettoriale di dimensione finita sul corpo K . Diremo
spazio proiettivo associato a V l’insieme di tutti i sottospazi vettoriali di V . Scriveremo σW per indicare
l’elemento di P (V ) corrispondente al sottospazio W  V (e tale W si dirà sostegno di σW ).
Notiamo fin da subito alcune cose:
1. La nozione di dimensione di un elemento di P (V ) è conservata e vale

dimK σW := dimK W − 1

L’unico elemento di dimensione −1 è il vuoto proiettivo σh0i.


Gli elementi di dimensione 0 sono i punti proiettivi σhvi
3 Essa è detta proiezione centrale di dentro P , per ovvi motivi grafici.
4 Non c’è in realtà bisogno di ricorrere alla definizione di un prodotto scalare su A , ma per semplicità supponiamo di farlo.

Mat3M 2007/2008 3
Gli elementi di dimensione 1 sono le rette proiettive, σhv, wi con v, w indipendenti.
Si definisce poi
dim P (V ) := dim σV = dim V − 1

2. Vi è la possibilità di estendere per trasporto la relazione di inclusione tra sottospazi ad una relazione
d’ordine. Tra elementi di P (V ) vale che
def
σU ≤ σW ⇐=
=⇒ U ≤W

Si conservano inoltre le due operazioni di somma e intersezione:

σU ∩ σW = σ(U ∩ W )
σU ∨ σW = σ(U + W )

e torniamo a usufruire della formula di Grassmann, dopo averla dovuta abbandonare entrando nello
spazio affine:
dim(σU + σW ) + dim(σU ∩ σW ) = dim σU + dim σW

(dim(U ∩ W ) + dim(U + W ) − 2 = dim U + dim W − 2)

3. Proprio questo fatto ha per conseguenza immediata che


ˆ Per due punti passa sempre una sola retta;
ˆ Due rette in P 2 (K )(= P (K 3 )) si intersecano sempre in un punto, viene cioè abbattuta la
nozione di parallelismo5.
Si ha, come è possibile immaginare,
 x0  un modo di “mettere delle coordinate” agli elementi dello spazio.
Preso un punto P = σv = σh x. i, ove v 6= 0 (altrimenti si cade nel vuoto), tale (n + 1)-upla è sempre
n
 x0   αx0 
determinata a meno di proporzionalità: questo vuol dire che, preso α 6= 0, le coordinate x. e αx.
n n
esprimono lo stesso punto.
Dualmente 6 , preso un iperpiano di P (K n+1 ) ⊃ σH, H ≤ K n+1 , esso è determinato da una equazione
omogenea non nulla
 x0 
H = { x. | a0 x0 + . . . an xn = 0} = {X ∈ H | a∗ ◦ X = 0}
n

sarà infatti proprio la (n + 1) − upla di coordinate a∗ = ( a0 ... an ) a fornire le coordinate dell’iperpiano,


ancora una volta a meno di proporzionalità. Tali coordinate si dicono coordinate plückeriane dell’iperpiano
H.

Applicazioni proiettive
Abbiamo ora la possibilità di parlare di trasformazioni sullo spazio introdotto:
Definizione 2 (Applicazione proiettiva). f : P (V ) → P (W ) si dice applicazione proiettiva se esiste una
φ : V → W tale che
f v(σW ) = σhφW i ∀W ∈ P (V )
tale φ prende il nome di applicazione lineare soprastante per f .
5 E’ questa, forse, la nozione chiave: da essa traggono origine molte libertà che d’ora in poi potremo prenderci, e una

fortissima simmetria tra gli oggetti proiettivi, impossibile da non notare.


6 Facendo per ora poco caso a questo avverbio...

Mat3M 2007/2008 4
Proposizione 1. φ, ψ : V → W sono soprastanti di una stessa applicazione proiettiva f sse esse sono
proporzionali mediante un fattore costante α. Esiste cioè α ∈ K × tale che ψ(v) = αφ(v) ∀v ∈ V .
Dimostrazione. Un verso è banale, cioè se ψ = αφ e φ è soprastante di f , ψ(v) ⊆ hφ(v)i per ogni v e
dunque anche ψ è soprastante di f .
Viceversa, dato v ∈ V , σhφ(v)i = f (σhvi) = σhψ(v)i. Chiaro che allora vale la proporzionalità. Resta da
provare che il coefficiente αv non dipende da v.
ˆ Supponiamo v ∈ ker φ: allora σhφ(v)i = σh0i = f (σhvi) = σhψ(v)i cioè ker ψ ≡ ker φ e la costante
può essere scelta tale da verificare la tesi.
ˆ Supponiamo invece che φ(v) = φ(w), cioè φ(v − w) = 0. Si ha dunque ψ(v) = αv φ(v) e ψ(w) =
αw φ(w). Ora, ψ(v − w) = αv − wφ(v − w) porta a concludere che αv = αv−w = αw .

ˆ Se infine φ(v), φ(w) sono linearmente indipendenti la cosa si fa in modo identico. Q.E.D.
Vi è ora una importante definizione, che permette di concludere questo capoverso:
Definizione 3 (Proiettività). Le applicazioni proiettive invertibili formano il gruppo delle proiettività: f
è proiettività sse una sua soprastante (e quindi tutte le altre, definite come proporzionali a quella scelta
mediante α 6= 0) è isomorfismo di spazi vettoriali.
Osservazione. Il gruppo Proj(P (V )) si identifica con PGL(V ) = GL(V )/K (gruppo lineare su K modulo
K , oppure come gruppo di trasformazioni esso si identifica con Aut(V )/∼, ove v, w ∈ V , v ∼ w ⇐⇒
∃α ∈ K v = αw).
1
Un Esempio Troviamo la matrice di una soprastante la proiezione centrale di centro P = 0 sul
2
0
piano π : 3x0 − 2x1 + x3 = 0 (piano di coord. !plückeriane ( 3 −2 0 1 )). La mappa è X 7→ (P ∨ X) ∩ π.
 1   x0  α+βx0
βx1
Ora, si ha X ∨ P = h 02 , xx12 i = 2α+βx 2
. Un punto della retta sta sul piano sse soddisfa la sua
0 x3 βx3
equazione, e risolvendola troviamo 3α = β(3x0 − 2x1 + x3 ). Scelti dunque β = −3, α = 3x0 − 2x1 + x3 si
ha che    0 −2 0 1 
−2x1 +x3
−3x1
f (X) = 6x0 −4x1 −3x2 +2x3 cioè la sua soprastante è A = 60 −4
−3 0 0
−3 2
−3x3 0 0 0 −3

Alcune osservazioni:
ˆ dim im φ = rk A = 3: l’immagine della proiezione è un piano proiettivo, cioè un sottospazio vettoriale
di dimensione 3. Analogamente ker φ ha dimensione 1: qual è il punto che viene mandato in 0 e
quindi quello tale che f (X) = σh0i = ∅?
ˆ f 2 = f , ma per la matrice vale qualcosa di più debole: A2 = λA. Con un calcolo diretto, nell’esempio
di prima A2 = −3A, e dunque mA (x) = x(x + 3): A è diagonalizzabile (e non invertibile).
ˆ Similmente a quanto accadeva nel caso delle proiezioni su spazi vettoriali, anche quelle proiettive
danno luogo a una decomposizione dello spazio.
ˆ I punti uniti di f sono tutti e soli i punti di π, autovettori di −3. Questo ha senso se si pensa a
quale sia la condizione per essere punto unito: cfr. Esercizio 1.97 .
Definizione 4 (Luogo di Degenerazione). Diremo luogo di degenerazione per f proiettiva l’insieme
f −1 (σh0i) = σσhker φi se φ è soprastante di f .
Osservazione. Se f è iniettiva il suo luogo di degenerazione è il vuoto proiettivo.
7 Il sans serif indicherà, ça va sans dire, gli esercizi contenuti nella “vera” dispensa del corso.

Mat3M 2007/2008 5
Osservazione. Se f è proiettività, la sua soprastante è isomorfismo e dunque f rispetta le dimensioni.
Definizione 5 (Posizioni Reciproche). Ricordando la definizione delle due operazioni di join e meet
abbiamo che
ˆ σU e σW si dicono incidenti se σU ∩ σW 6= ∅;

ˆ σU e σW si dicono sghembi in ogni altro caso.

Osservazione. Come già visto nel caso di rette nel piano, in P (V ) viene abbattuta la nozione di
parallelismo.

Dualità Proiettiva
L’insieme V ∗ := Hom(V, K ) è spazio vettoriale della stessa dimensione di V (finchè dim V 6= ∞). Nulla
vieta di definire un P (V ∗ ): lo possiamo considerare come l’insieme dei sottospazi duali di V ∗ . Definiamo
poiuna applicazione insiemistica8 ∆:

∆ : P (V ) −→ P (V ∗ )
σZ 7−→ σ(Z ⊥ )

Dalla definizione di ∆ discendono immediatamente alcune sue proprietà (quelle di Esercizio 1.6, cfr. anche
Esercizio 1.7).
Tale mappa è la ragione per cui si può definire la cosiddetta “dualità proiettiva” (∆ stessa è definita
come dualità proiettiva): essa afferma che, se una proprietà che involve solo la relazione di inclusione e le
operazioni di intersezione e generazione vale per una certa classe C di elementi di P (V ) allora essa vale
anche nel suo duale P (V ∗ ), avendo cura di rovesciare le inclusioni e di scambiare tra loro le operazioni.
A questo riguardo esiste poi la possibilità di caratterizzare la simmetria che esiste tra uno spazio
proiettivo e il suo duale, quando si conosca una qualunque proiettività agente su di esso. Risolviamo in
poche parole l’ Esercizio 1.7: sia allora f una proiettività di soprastante φ, dalla definizione data di ∆
discende che si può definire ∆f ∆−1 = f ∗ : P (V ∗ ) → P (V ∗ ). Mostriamo che tale f ∗ è una proiettività
di soprastante φe = (φ∗ )−1 . Direttamente dalla definizione di ortogonale e di proiettività discende che
∆f ∆−1 (σhvi) = σhφ(hvi⊥ )i⊥ . Cerchiamo di capire cosa sia questo sottospazio:

φ(hvi⊥ ) = {φ(w) ∈ V | w ∈ ker v}

{z ∈ V | φ−1 (z) ∈ ker v} = {z ∈ V | (v ◦ φ−1 )(z) = 0} = {z ∈ V | ((φ−1 )∗ ◦ v)(z) = 0} = ((φ∗ )−1 ◦ v)⊥

l’ortogonale di quest’ultimo sottospazio è ovviamente (φ∗ )−1 ◦ v, e dunque si ha la tesi ∆f ∆−1 (σhvi) =
σh(φ∗ )−1 (v)i.
f∗
P (V ∗ ) −−−→ P (V ∗ )
 x
 
∆ y
−1
∆
P (V ) −−−→ P (V )
f

8 Questa è essenzialmente una notazione algebrica per indicare una nozione nota fin dai primordi della Geometria Proiettiva

(∼ 1648, con Girard Desargues): ogni teorema valido nello spazio proiettivo ammette un “asserto duale” che inverte le
relazioni di inclusione e scambia oggetti di dimensione k con oggetti di dimensione n − k.

Mat3M 2007/2008 6
Rappresentazione dei sottospazi
Sia H = σW ∈ P (V ). Dare per H una rappresentazione parametrica significa prendere un sistema di
generatori w1 , . . . , wr di W e scrivere i punti di H come σhα1 w1 + · · · + αr wr i al variare della r-upla
( α1 ... αr ) di parametri omogenei.

Osservazione. Se hw1 , . . . , wr i è base di W la r-upla è unica a meno di proporzionalità.


Invece, dare ad H una rappresentazione cartesiana significa scegliere delle equazioni omogenee per
rappresentare i punti di H. Preso un sistema di generatori di W ⊥ ⊆ V ∗ , W ⊥ = {τ1 , . . . , τk } si possono
scrivere i punti di H mediante il sistema di k equazioni


 τ ◦v =0
 1
..
. ∀ P = σhvi ∈ H


τ ◦ v = 0
k

Osservazione. Se {τ1 , . . . , τk } è base di W ⊥ il sistema ha rango massimo e le equazioni date sono nel
minimo numero possibile.
Per poter dare un riferimento all’interno dell’intero P (V ) serve qualcosa di più fine:
Definizione 6 (Riferimento Proiettivo). Un riferimento in P (V ) è il dato di n + 2 punti P0 , . . . Pn , U che
soddisfino alle due condizioni
ˆ P0 ∨ · · · ∨ Pn = σV

ˆ U∈
/ P0 ∨ · · · ∨ Pj−1 ∨ Pj+1 ∨ . . . Pn ∀j = 0, . . . , n
Osservazione. Notare il motivo di quella che sembra una ridondanza: non sarebbe bastato il dato di
n + 1 punti a generare P (V ) per definire la posizione dei suoi elementi: le coordinate essendo date a meno
di proporzionalità, c’è bisogno di un (n + 2)-esimo punto U che funga da punto unità nel riferimento9 .

Studio delle proiettività – sottospazi stabili


E’ ora naturale studiare meglio le proiettività (applicazioni che mandano riferimenti in riferimenti), e in
particolare i loro elementi uniti: giungeremo ad un risultato importante, e cioè che le forme canoniche
della matrice di una soprastante ad f ∈ Aut(P (V )). Rimandiamo al risultato di un esercizio (Esercizio
1.9) per poter giustificare la
Proposizione 2. Se f ∈ Aut(P n (V )), il punto P = σhvi è unito per f sse f (P ) = P . Tale condizione
è equivalente all’essere v autovettore per la soprastante di f , relativo ad un autovalore non nullo (ma in
realtà ogni autovalore di φ è non nullo, dato che φ è invertibile).
Un po’ più fine è invece la
Definizione 7 (Elemento Unito). Se H = σW , H ≤ P (V ), W ≤ V , H si dice elemento unito per f se
f (H) = H, nel senso che φ(w) ∈ W per ogni w ∈ W . In altre parole H = σW è unito per f sse W è un
sottospazio φ-stabile.
9 Ci accorgeremo in seguito di come la forma di questa definizione faciliti il lavoro in altri frangenti.

Mat3M 2007/2008 7
Dualità
  tra sottospazi stabili f ∈ Aut(P n (R )) abbia soprastante φ di matrice A ∈ Mn+1 (R ). Siano
x0
x
. le coordinate omogenee del punto P ∈ P n (R ). Sia infine H un iperpiano di coordinate plückeriane
n
a = (a0 , . . . , an ). Come visto in Esercizio 1.8 si ha che l’immagine di H mediante f è l’iperpiano di
coordinate plückeriane aA−1 :

f (H) = {f (P ) | P ∈ H} = {AP | a ◦ P = 0} = {Q | aA−1 Q = 0} = aA−1

Se si vuole, si può pensare che aA−1 (AP ) = 0. dunque le coordinate plückeriane dell’iperpiano (=dell’ele-
mento del duale) che annullano f (P ) sono per forza aA−1 . Ora, notare come H è un’iperpiano unito per f
sse aA−1 = a a meno di proporzionalità, cioè aA−1 = βa. Si tratta in pratica di individuare gli autovettori
della matrice trasposta di A10 rispetto ad autovalori non nulli (tale soprastante ad f ∗ ∈ Aut(P (V ∗ )) è
proprio la famosa (φ−1 )∗ di cui in Esercizio 1.7).
Osservazione. Abbiamo appena notato una prima applicazione del “principio di dualità” a cui abbiamo
accennato all’inizio: punti ed iperpiani sono oggetti duali, nel senso che sono collegati da una relazione che
“scambia le dimensioni” traspone le coordinate.
Nel caso appena citato, la situazione punti uniti è dualmente simmetrica alla situazione iperpiani
uniti. Proprio tale connessione profonda semplifica la classificazione delle proiettività di P n (V ) in base
allo studio dei loro punti uniti.

Classificazione delle Proiettività


L’osservazione base di questa sezione è che la for-
α 
ma canonica di Jordan di una matrice soprastante
β 3 punti uniti: σhv0 i, σhv1 i, σhv2 i
γ ad f ∈ Aut(P (V )) la classifica come proiettività:
3 rette unite: σhvi , vj i conduciamo qui lo studio sistematico del solo caso
α  per i, j = 0, 1, 2, i 6= j n = 2, lasciando per esercizio i casi n = 3, 4. Le
β 1 retta di punti uniti σhv1 , v2 i forme canoniche delle φ ∈ End(K 3 ) sono 6, usiamo
β
e dualmente un fascio di rette unite la notazione per cui vi è l’i-esimo vettore della base
di centro σhv0 i jordanizzante:
α  Le forme canoniche per le φ ∈ End(K 4 ) sono
α è l’identità, tutto P 2 (K ) è unito 14. Per le φ ∈ End(K 5 ) sono 27. La classificazione
α α
1
α 2 punti uniti σhv0 i, σhv2 i procede allo stesso modo.
β
2 rette unite σhv0 , v2 i, σhv0 , v1 i L’obiettivo che ci poniamo da qui in poi e per
α 1
 il resto della sezione è di capire quale relazione in-
α 2 punti uniti σhv0 i, σhv2 i tercorra tra A (spazio affine) e P (spazio proiet-
α
2 rette unite σhv0 , v1 i, σhv0 , v2 i tivo). Giungeremo alla conclusione che lo spazio
di cui una di punti uniti che induce affine risulta piuttosto naturalmente da una sezione
α  un fascio di rette unite di centro σhv0 i di P (V ), che viene privato di un iperpiano. Simmet-
1
α 1 1 punto unito σhv0 i ricamente P (V ) risulta (meno naturalmente) dal-
α
l’“incollamento” di molti spazi affini tra loro, a
1 retta unita σhv0 , v1 i
cui è stato alla fine aggiunto un iperpiano detto
“all’infinito”.
Per poter giungere a questi risultati avremo
bisogno di parlare in modo naturale di certe trasformazioni proiettive: dobbiamo premettere delle altre
definizioni.
Definizione 8 (Omologia). Definiamo una particolare classe di proiettività, le omologie:
Omologia Omologia (duale)
Una omologia è una proiettività che Una omologia è una proiettività tale che
ha un iperpiano di punti uniti: f (P ) = P per ogni P ≤ Z. ∃P ≤ P (V ) con f (Z) = Z per ogni iperpiano Z ≥ P .
Tale iperpiano è lasse di omologia tale punto è il centro di omologia
10 Infatti se αaA−1 = a allora αa = aA

Mat3M 2007/2008 8
Definizione 9 (Omologia speciale). Una omologia f di centro P e asse Z si dice speciale se P ≤ Z, non
speciale altrimenti.
Osservazione. L’identità idP (V ) è una omologia sia speciale che non speciale.
Volendo tradurre quanto appena detto in termini di matrici, la soprastante ad un’omologia ha un
sottospazio di dimensione n di autovettori relativi ad uno stesso autovalore α (= esiste un iperpiano su cui
φ induce un’omotetia, ed f l’identità). Una volta scritta la matrice in una certa base, dato che (x − α)n
deve dividere pA (x) possono presentarsi due casi:
ˆ La soprastante φ è diagonalizzabile e la soprastante ha matrice simile a
 
β
α
 ..  pA (x) = (x − β)(x − α)n
.
α

ˆ La soprastante φ non è diagonalizzabile, e la sua forma di Jordan è


α !
1 α
.. pA (x) = (x − α)n+1
.
α

Proposizione 3. Una omologia è determinata completamente dalla conoscenza di asse H e centro P e


di una coppia (P, f (P )) con P 6≤ Z e P 6= C.
Dimostrazione. Facendo un disegno:

r b
b
f (P ) bc
f (Q) D
P
b
Q
bc

bc
P
bc

C
Notiamo anzitutto che P, C, f (P ) sono allineati (per definizione di centro di omologia). Dato Q si
cerca f (Q): vediamo che P ∨ Q interseca H (asse) in un punto D. f (Q) ≤ (C ∨ Q) per definizione di
centro di omologia. Ora, f (P ∨ D) = f (P ) ∨ D e f (P ∨ Q) = f (P ) ∨ f (Q). Si ha insomma f (Q) ≤ Q ∨ P
e f (Q) ≤ C ∨ Q
f (Q) = (P ∨ Q) ∩ (C ∨ Q)
Un discorso del tutto analogo vale se l’omologia è speciale. Q.E.D.

Immersione di A (V ) in P (V )
Proposizione 4. Sia P (V ) uno spazio proiettivo di dimensione n (i.e. dim V = n + 1). Preso comunque
un iperpiano H = σT , l’insieme dei punti di P (V ) che non appartengono ad H diventa uno spazio affine
sotto l’azione di un’omologia speciale di asse T .
Vorremmo ora capire in che senso ciò sia vero. La faccenda è intricata, perché porta alla luce la
proprietà meno banale dello spazio proiettivo, quella che riguarda la sua topologia (essenzialmente, per
noi si tratta di capire cosa gli succede tagliandolo, deformandolo, o spostandoci lungo di esso). Lo spazio
proiettivo è un primo esempio del concetto di varietà, cioè di un luogo geometrico che si può localmente
fare assomigliare ad una struttura piana e liscia, ma la cui struttura globale può essere parecchio diversa
(e parecchio poco intuitiva). In breve, lo spazio proiettivo nasce dall’“incollamento” di un gran numero di
spazi affini che ne mappano la topologia locale, e che presi tutti insieme danno la vera forma di P n , che
se ne discosta molto e regala anche alcune strane proprietà. L’idea per mostrare questo fatto si basa sulla

Mat3M 2007/2008 9
possibilità di associare ad ogni vettore t dell’iperpiano che si vuole “mandare all’infinito” una omologia
speciale di asse H e centro σhti. Per poterlo fare, definiamo tale omologia dando la matrice di una sua
soprastante. Fissiamo un iperpiano H = σT , un punto P = σhv0 i 6≤ Z e un vettore v0 nel suo sostegno,
assieme a una base di T . Ora, hv0 i ⊕ hv1 , . . . , vn i, e dunque V = {v0 , v1 , . . . , vn } è una base dell’intero V :
possiamo usarla per definire la soprastante ψt nel modo che segue:
ψt (v0 ) = v0 + t ψt (x) = x ∀ x ∈ T
 
1 0t
In tale base la matrice della soprastante è t.1 1 . Per ricondursi alla matrice di una omologia speciale
tn
possiamo operare un cambio di base e ottenere che con V ′ = {v0 , t, v2 , . . . , vn } la matrice è
1 0 ... 0 !
11
.. ..
. .
0 1

(si può fare questo cambio perché t = t1 v1 + . . . tn vn , la componente in v0 non c’è dato che hv0 i ⊕ T .
A questo punto abbiamo un modo univoco di associare ad un vettore t ∈ T una omologia speciale: la
corrispondenza Υ : T → Aut P (V ) è quella che manda il vettore t nella omologia τt definita da
τt (σhαv0 + xi) = σhψt (αv0 + x)i = σhψt (αv0 ) + ψt (x)i = σhα(v0 + t) + xi
Ora, come è noto lo spazio affine è dato da una terna (A , T, +): L’insieme dei punti è dato dai punti
dello spazio proiettivo che non stanno nell’iperpiano che si è tolto. Lo spazio delle traslazioni è costituito
dal sostegno vettoriale dello stesso iperpiano H, e cosa più importante l’azione dei vettori di T sui punti
di A è data dalla applicazione + : A × T → A che manda la coppia (P, t) nell’immagine di P mediante
l’omologia Υ(t) = τt (P ). E’ facile vedere che l’applicazione + soddisfa agli assiomi di azione su uno spazio
affine:
ˆ τt1 +t2 = τt1 ◦ τt2 = τt2 ◦ τt1
ˆ τt (X) = X sse t = 0
ˆ ∀X, Y 6≤ Z ∃! t | τt (X) = Y
La prima asserzione si può mostrare notando che τt1 +t2 (σhαv0 + xi) = σhα(v0 + t1 + t2 ) + xi. A questo
punto è facile sviluppare in due direzione e provare che le due omologie commutano.
Per la seconda, X si scrive come σhv0 + xi per qualche x ∈ T . Ora, τt (σhv0 + xi) = σhv0 + t + xi.
v0 + (x + t) = v0 + x ⇐⇒ x + t = x ⇐⇒ t = 0
Infine, dati X, Y 6≤ Z si ha che X = σhv0 + xi,Y = σhv0 + yi. τt (σhv0 + xi) = σhv0 + t + xi = σhv0 + yi.
v0 + (t + x) = v0 + y ⇐⇒ t + x = y ⇐⇒ t = y − x
Otteniamo cosı̀ che τy−x (X) = Y, τx−y (Y ) = X, per ogni X, Y 6≤ Z. Q.E.D.

Struttura Topologica di P (K ) Vogliamo ora trovare un qualche “modello geometrico” per P (R ) e


P (C ), nei casi di dimensione bassa, e corrispondentemente arrivare per analogia (e con un po’ di fantasia)
ad una formulazione geometrica dell’immersione di A in P . Cominciamo dalla retta proiettiva reale:
P 1 (R ) ha come sostegno l’usuale piano, e l’insieme dei suoi punti è l’insieme di tutte le rette per l’origine.
La scelta di un iperpiano in R 2 corrisponde al “fissare” una retta che poi andrà all’infinito. Scegliamo
ad esempio l’iperpiano x0 = 0: la retta affine è allora una retta parallela all’iperpiano tolto. Fissata
tale retta ad una quota λ ogni punto P del proiettivo, di coordinate (x0 , x1 ) acquista le coordinate
(1, x1 /λ), ove x1 /λ è esattamente la coordinata di P pensato come elemento affine. Di solito, dato che
è indifferente il valore di λ (purché non nullo, si finirebbe altrimenti sull ’iperpiano tolto) si sceglie di
considerare l’iperpiano di eq. affine
 x0 = 1 ottenendo cosı̀ quella che è l’immersione canonica di A in P ,
ove PP = ( xx01 ) ←֓ PA = x1 /x1
0
.

Mat3M 2007/2008 10
Risulta più chiara ora l’“immersione” di uno spazio nell’al-
tro: l’identificazione geometrica tra punti del proiettivo e punti
affini si esplica nell’essere unico il punto di intersezione di una
qualunque retta passante per l’origine con la retta x0 = 1. Im-
b b b b
maginiamo il percorso di una ipotetica retta che ruoti di più di
b b b b

π/2 partendo da un punto arbitrario. Man mano che essa tende


ad essere orizzontale, notiamo che il punto di intersezione si sposta
sempre più lontano: non è illogico supporre che quando la retta
è effettivamente orizzontale, tale punto sia situato “da qualche
parte” molto lontano, luogo dal quale si “esce” non appena la
retta si è spostata ancora un po’, e da cui si ritorna man mano
che la retta continua a ruotare. Ancora, non è illogico pensare
che, se nel momento in cui lo si è toccato da un lato ci si ac-
corge di tornare indietro dall’altro, la struttura dello spazio non sia piatta. E’ infatti possibile trovare
un’altra biiezione (più intuitiva e “naturale”) tra la retta proiettiva ed un oggetto curvo come S1 .
Pensiamo ad una circonferenza “piantata” nell’o-
rigine da cui si dipartono delle rette: esse intersecher-
anno la circonferenza in un solo punto tranne l’orig-
ine. E’ dunque possibile pensare alla retta proietti-
b b b

b b
va come ad una circonferenza, di modo che fissato
b b
un punto all’infinito essa si “apra” e diventi una co-
b mune retta affine (questa tecnica per passare da rette
b
b
a cerchi è detta proiezione stereografica). Il cerchio
b b
in questo modo diviene omeomorfo (e anzi c’è una
b
relazione più stretta tra i due luoghi, che possono es-
b

b
sere facilmente resi diffeomorfi) alla retta proiettiva,
b
b

che quindi può essere pensata come una linea che viene “storta” e i cui due estremi vengono “pinzati” e
identificati l’uno con l’altro, fungendo da elemento all’infinito.

La tecnica della proiezione stereografica è utile anche per determinare un modello di P 1 (C ): la retta
complessa è infatti assimilabile al piano reale, e si può trovare un omeomorfismo che mette in corrispon-
denza S2 privato del Polo con il piano (il Polo funge da punto che “circonda il piano”: è il punto all’infinito
della retta complessa).
Ben più arduo è invece capire come si costruisce P 2 (R ), e indagare meglio la questione mette trasver-
salmente in luce come non sia vero che P (C ) ≡ P 2 (R ), cosa che invece accadeva nell’affine dove A (C ) ≡
A 2 (R ). Vogliamo mettere in corrispondenza i punti del piano proiettivo (=la stella di rette per l’orig-
ine) con i punti di S2 . Cominciamo ponendo il centro della sfera nell’origine, ma è facile accorgersi che
c’è qualche problema di continuità presso l’Equatore, se vogliamo continuare a lavorare modulo mappa
antipodale (in altre parole, la mappa che identifica x con −x non funziona quando si considerano i punti
dell’Equatore: intuitivamente ci si può convincere di questo pensando come non sia possibile “pinzare”
una circonferenza –che è, nel nostro caso, un cerchio massimo– per far coincidere ogni punto con il proprio

Mat3M 2007/2008 11
antipodo. . . piegando la circonferenza ci si troverebbe infatti ad avere due punti che non è possibile far
combaciare).
Lavoriamo dunque in un altro modo, e tagliamo
due calotte ai lati della sfera: quello che si ottiene è
una sorta di “rettangolo curvo” che però ora è facile
rendere omotopo al quadrato canonico [0, 1] × [0, 1]:
applicando ora la mappa (x, 0) ∼ (1 − x, 1) che crea il
nastro di Möbius abbiamo creato una figura che identi-
fica con continuità vertici antipodali. Ora, ricordando
la proprietà del nastro di avere una sola faccia e un solo
bordo, possiamo riprendere in mano una delle calotte
che avevamo tagliato (l’altra coincide con essa, dato
che lavoriamo modulo antipodi) e “incollarla” al nas-
tro: ciò che otteniamo è una superficie liscia, chiusa e
omeomorfa al piano proiettivo.

Birapporti
Tre punti distinti P1 = σhv1 i, P2 = σhv0 i, P3 , su una retta sono un riferimento proiettivo per essa. Si
possono scegliere i primi due in modo che siano base del sottospazio vettoriale della retta proiettiva (basta
che siano distinti) e fare del terzo il punto unità, in modo che P3 = σhv0 + v1 i. Ora ogni altro punto è
univocamente determinato dall’avere coordinate omogenee σhx0 v0 + x1 v1 i. Si può definire allora
Definizione 10 (Birapporto). P1 , P2 , P3 , P4 siano punti allineati in P (V ), P1 6= P2 . Definiamo come
birapporto (cross-ratio) dei quattro punti la quantità
x1
(P1 P2 P3 P4 ) := − ∈ K ∪ {∞}11
x0
Il punto proiettivo sulla retta ha generiche coordinate ( xx01 ). Ora, pensando la retta come retta affine
immersa in P (K ) e scegliendo x0 = 0 come iperpiano all’infinito, le coordinate affini del punto della retta
diventano proprio x1 /x0 12 .
Proposizione 5. Se f è una proiettività e P1 , P2 , P3 sono punti a due a due distinti, allineati con P4 ,
allora
(P1 P2 P3 P4 ) = (f (P1 )f (P2 )f (P3 )f (P4 ))
In altre parole, le proiettività conservano i birapporti.
Dimostrazione. Scriviamo P1 = σhv1 i, P2 = σhv0 i, P3 = σhv0 + v1 i, P4 0σhx0 v0 + x1 v1 i. Ora, se φ è
soprastante di f essa è isomorfismo,e in particolare manda punti distinti in punti distinti. Per linearità
essa conserva anche i coefficienti (x= , x1 ) coordinate di P4 nel riferimento P1 P2 P3 , e dunque possiamo
concludere direttamente che (P1 P2 P3 P4 ) = xx01 = (f (P1 )f (P2 )f (P3 )f (P4 )) Q.E.D.
Osservazione. Il birapporto di un punto con altri 3 si può vedere come la coordinata affine di quel punto,
se visto come elemento di A ֒→ P (retta affine immersa dentro la proiettiva) nel caso in cui l’“iperpiano”
(è un punto) x0 = 0 vada all’infinito (cioè nel caso in cui P1 si allontani a ∞).

b b b b

x1
P1 = ∞ P2 = 0P3 = 1 P4 = x0
11 La convenzione sull’utilizzo del simbolo “∞” è quasi la stessa che si usa nel calcolo di limite: per ogni a ∈ K si ha

a ± ∞ = ∞, ∞ + ∞ = ∞, ∞ − ∞ = 0
12 Vale la pena parlare in modo più approfondito di questo fatto: come abbiamo visto, il modo più fedele di rappresentare

una retta proiettiva è figurandosela “curvata e pinzata” all’infinito, a mo’ di circonferenza: questa sua caratteristica fa sı̀ che
non sia possibile dare una buona definizione di “segmento tra due punti” (essendo infatti due le porzioni di spazio comprese
tra due dati punti). Tutto ciò che possiamo fare è definire un ordine tra i punti, nella forma di una relazione ternaria di
“giacere tra . . . e . . . ” mediante la predetta nozione di birapporto.

Mat3M 2007/2008 12
Azione delle permutazioni sul birapporto E’ un fatto interessante esplicitare l’azione di S4 sul
birapporto di 4 punti. Si mostra facilmente che gli scambi hanno questi effetti: sia (indicando solo i pedici
dei punti interessati) (1234) = x, si ha
(2134) = (1243) = 1/x
(4231) = (1324) = 1 − x
(3214) = (1432) = x/1 − x
ed essendo ogni permutazione è composizione di scambi si riesce a trovare come ad agire sui quattro punti
non è il suddetto S4 ma un suo sottogruppo: notando infatti come ogni scambio equivalente sia involutorio
si trova che esistono solamente 6 valori distinti per (P1 P2 P3 P4 ):

1 1 x x−1
x, , , 1 − x, ,
x 1−x x−1 x
Dare dimostrazione dell’effettivo comportamento degli scambi è questione di conti. Si sceglie la base in
modo che il terzo punto della sequenza volta per volta sia il punto unità, e poi si trovano coefficienti adatti
x0 , x1 per esprimere il quarto punto.
Vogliamo infatti ora concentrarci su un risultato più interessante: consideriamo quattro punti del-
la retta affine immersa nella proiettiva: essi hanno coordinate ( a1 ) , ( 1b ) , ( 1c ) , ( d1 ). Vogliamo trovare il
birapporto di questi quattro punti. Cerchiamo anzitutto α, β tali che
(
α+β =1
α ( a1 ) + β ( 1b ) = ( 1c ) risolvendo il sistema
αa + βb = c
c−b c−a
sistema che ha soluzioni uniche in α = b−a eβ= b−a (si usa Cramer).
Cerchiamo ora x0 , x1 tali che
(
x1 α + x0 β = 1 1 d−a 1 b−d
e li troviamo in x0 = x1 =
x1 αa + x0 βb = d β b−a αb−a

e giungiamo all’espressione del birapporto per i quattro punti affini (cioè il birapporto di quattro numeri
in K )
(c − a)(b − d)
(abcd) =
(c − b)(d − a)
b−d
Osservazione. Notare come se a → ∞, (abcd) → c−b : che è il rapporto semplice (cfr. AGLQ pag. 147
– 148) dei 4 punti.
Osservazione. Conseguentemente notare (=fare il conto di) come (∞01x) = (0∞x1) = (1x∞0) =
(x10∞) = x.
Può essere interessante “scoprire” qual è il senso proiettivo del birapporto di quattro numeri: l’oper-
azione di “prendere una riga di coordinate” è, in fin dei conti, una proiezione (sull’asse che si sceglie di
considerare), e le proiezioni sono prospettività. A quali condizioni (dato che non è sempre vero) vale che
il birapporto di 4 punti è il birapporto di qualnque loro 4 coordinate j–esime?
Dati 4 punti distinti i valori del loro birapporto sono meno di 6 se si verifica una uguaglianza tra essi.
Il solo caso particolare che esamineremo13 è quello in cui (ABCD) = −1.
Definizione 11 (Quaterna armonica). Il caso in cui k = 1/k implica che k = −1 (il caso k = 1 è infatti
escluso nell’ipotesi di punti distinti). In tal frangente si ha (1234) = (2134) = (1243) = (2143) = −1 e i
4 punti si dicono una quaterna o gruppo armonico, o equivalentemente P4 si dice coniugato armonico o
quarto armonico dopo A, B, C o ancora si dice che (AB) separa armonicamente (CD) o viceversa.

13 Limitandoci a far notare di sfuggita che alcune di queste relazioni impongono condizioni quadratiche su k, e quindi la

possibilità di trovare un valore che le soddisfi dipende dal K in cui si lavora

Mat3M 2007/2008 13
Costruzioni con la riga Quello delle costruzioni è un argomento che affonda le radici nell’Algebra
più che nella Geometria (talune prove di incostruibilità mediante strumenti semplici, come la riga non
graduata e il compasso, di segmenti di lunghezza α data fanno uso di argomenti di Algebra parecchio
avanzata). Noi ora enunciamo che, dati 3 punti allineati, è possibile costruire con la sola riga un quarto
punto tale che il suo birapporto con gli altri 3 sia −1 (è cioè possibile costruire il quarto armonico dopo
P1 P2 P3 ).
Dimostrazione. Nella costruzione del disegno consideriamo la proiezione di centro A che porta r in s:

(P1 P3 P2 S) = (Q1 Q3 Q2 S)

Consideriamo ora la proiezione di centro B che porta s in r:

(Q1 Q3 Q2 S) = (P3 P1 P2 S)

La tesi segue dal fatto che 1/x = x quale che sia x, e dal fatto che i punti sono distinti. Q.E.D.

b
A

b
U

Q1 b

Z
b
Q2
b

Q3 b
b

b
b
B

S b
b
P3
b

P2
b
P1
I punti AQ3 BQ1 sono i vertici di quello che si dice quadrangolo piano completo: questa costruzione è
basilare e ricca di proprietà interessanti. Prima delle quali può essere far vedere come il quarto armonico
dopo i tre punti dati P1 P2 P3 sia unico e indipendente dalla costruzione sopra suggerita. Mostreremo
questa cosa più avanti, quando avremo dalla nostra un teorema famoso e molto bello da cui questa tesi
seguirà direttamente. Vedremo però anche che in spazi proiettivi dove quel teorema non valga (e ve ne
sono) anche questo finisce per essere falso.
Può essere interessante provare a contare quante quaterne armoniche sono state disegnate in figura: la
risposta finora è 9. Altrettanto interessante è dualizzare la costruzione. Lo lasciamo come facile esercizio.

Involuzioni Cerchiamo ora di studiare le proprietà di un’altra classe di proiettività.


Definizione 12. f ∈ Aut(P (V )), f 6= id si dice avere periodo k se k ∈ N è il minimo intero tale che
f k = id. In particolare noi studieremo le involuzioni, proiettività di periodo 2.
Definizione 13 (Coppia Involutoria). Una coppia involutoria per f ∈ Aut(P (V )) è una coppia (P, Q) di
punti distinti tali che f (P ) = Q e f (Q) = P .
per caratterizzare le proprietà di tali trasformazioni ci serviamo invece della
Proposizione 6.
1. f ∈ Aut(P (V )) è una involuzione sse essa ha una coppia involutoria;

Mat3M 2007/2008 14
2. Se f è involuzione, o non ha punti fissi o ne ha esattamente due. In particolare la condizione dipende
dalla proprietà di chiusura algebrica del corpo su cui si lavora;
3. Dati X, Y punti uniti per f , allora la coppia X, Y separa armonicamente ogni coppia di punti
corrispondenti.
Dimostrazione. Con ordine:
1. La prima implicazione è banale. Viceversa se (P, Q) è una coppia involutoria e X ∈ P (V )

(P Qf (X)X) = (f (P )f (Q)f 2 (X)f (X)) = (QP f 2 (X)f (X)) = (P Qf (X)f 2 (X)) Q.E.D.

2. Se φ è soprastante per f involuzione, essa ha polinomio caratteristico pφ (x) = x2 − α (coincidente


con mφ (x) per l’ipotesi f 6= id): ora i casi sono due, o tale polinomio si fattorizza perché α è un
quadrato in K , oppure no. Se ciò avviene la φ è diagonalizzabile e gli autovettori sono proprio i
punti uniti cercati. Q.E.D.
3. E’ immediato: (XY P f (P )) = (XY f (P )P ) cosa che accade sse tale birapporto è −1. Q.E.D.

b
V

b
P1

Q1
b

P3
b
P2
b

Q3 b
b

b
b
Q2

b
A b b

B C
Ci concentriamo ora su un risultato classico tra i più famosi, il Teorema di Desargues. La profondità di tale
risultato (e assieme ad esso del Teorema di Pappo, che non affronteremo) non va sottovalutata, anche se in un
approccio algebrico alla teoria degli spazi proiettivi, basato sugli spazi vettoriali, sia l’uno che l’altro Teorema
conseguono abbastanza semplicemente da certe condizioni imposte alle coordinate. Un approccio sintetico alla
teoria non ha invece modo di derivare anche solo uno di questi asserti dai (molti) altri assiomi che si pone, ed
è costretto a postularne la validità (e tale è la ragione per cui viene chiamato spazio proiettivo desarguesiano
uno spazio dove vale il Teorema che ci accingiamo a mostrare). Il lato affascinante della questione è però un
altro: in poche parole si tratta di questo. Le dimostrazioni che noi diamo del Teorema di Desargues e del suo
duale è algebrica, e in tale linguaggio esse non richiedono alcuna nozione profonda. Possiamo però esibire anche
una dimostrazione geometrica, che utilizzi quelli che vengono detti assiomi di appartenenza tra sottoinsiemi del
piano proiettivo reale. Nell’enunciato del Teorema ne intervengono solamente alcuni: desideriamo allora una
dimostrazione che utilizzi quelli e solamente quelli. Tale dimostrazione non può essere trovata: si può in altre
parole costruire un “altro” piano proiettivo che soddisfa tutti gli assiomi di appartenenza, ma in cui Desargues è
falso. Potremmo allora obiettare una certa incongruenza: il teorema dimostrato algebricamente smette di valere
geometricamente. Che ne è allora della solida corrispondenza costruita tra oggetti algebrici e relative coordinate?
Ebbene, risulta che per poter introdurre le coordinate sul piano (per poter cioè mettere in isomorfismo gli elementi
del piano con gli elementi di R 3 , è necessario che agli assiomi di incidenza venga aggiunto come postulato il
teorema di Desargues. Può risultare sconvolgente la profondità di un teorema di cosı̀ semplice enunciazione: il
risultato cardine su cui vorremmo puntare l’attenzione è che di per sé stesso, senza bisogno di altri elementi, la sola
presenza del teorema di Desargues (che dunque credo mantenga la sua nomenclatura di “teorema” più per ragioni
storiche che logiche), può bastare a dimostrare l’esistenza di un corpo commutativo sotteso al piano proiettivo
(gli elementi sono i punti, e somma e prodotto sono definiti in un certo modo abbastanza tecnico, che non vale la

Mat3M 2007/2008 15
pena approfondire ora), che è esattamente il corpo su cui si costruisce lo spazio vettoriale tridimensionale che fa
da sostegno al piano proiettivo.
Per snellire l’enunciato del Teorema diamo a parte qualche definizione:
Definizione 14.
ˆ Un triangolo nello spazio proiettivo è il dato di tre rette non concorrenti o di tre punti non allineati.
Le eventuali rette sono i lati del triangolo, gli eventuali punti sono i suoi vertici.
ˆ Dati due triangoli di vertici ABC, A′ B ′ C ′ essi si dicono prospettivi se le 3 congiungenti vertici
omonimi concorrono a un punto V .
ˆ Dati due triangoli di lati abc e a′ b′ c′ essi si dicono omologici se le 3 intersezioni di lati omonimi sono
allineate su una retta s
Teorema 1 (Desargues). Due triangoli sono omologici se e solo se sono prospettivi. In altre parole,
dati due triangoli P QR e P ′ Q′ R′ i cui vertici omonimi concorrano ad un vertice V , le intersezioni di lati
omonimi sono allineate, e viceversa.
Dimostrazione. (⋆ Il disegno ricorda qualcosa? ⋆) Supponiamo T1 e T2 prospettivi da V : P1 = σhv1 i, P2 =
σhv2 i, P3 = σhv3 i, V = σhvi. Gli altri tre punti si possono scrivere come combinazione di questi: Q1 =
σha1 v1 + vi, Q2 = σha2 v2 + vi, Q3 = σha3 v3 + vi (dato che a meno di riscalare il coefficiente non nullo in
v, ogni vettore si scrive come aj vj + bv ≡ aj /bvj + v ≡ αvj + v. Ora:

(P1 ∨ P2 ) ∩ (Q1 ∨ Q2 ) = σhv1 , v2 i ∩ σha1 v1 + v, a2 v2 + vi = σha1 v1 − a2 v2 i = σhui


(P2 ∨ P3 ) ∩ (Q2 ∨ Q3 ) = σhv2 , v3 i ∩ σha2 v2 + v, a3 v3 + vi = σha2 v2 − a3 v3 i = σhwi
(P1 ∨ P3 ) ∩ (Q1 ∨ Q3 ) = σhv1 , v3 i ∩ σha1 v1 + v, a3 v3 + vi = σha1 v1 − a3 v3 i = σhzi
 a1 0 a1 
Ora, questi punti sono allineati se i tre vettori u, w, z sono linearmente dipendenti det −a2 a2 0 = 0.
0 −a3 −a3
E’ cosı̀, dato che l’ultima colonna è la somma delle prime due.
Viceversa, supponiamo T1 e T2 omologici sulla retta per A, B. A = σhv2 i, Bσ hv3 i, P1 = σhv1 iq1 =
σhw1 i. Gli altri punti si possono scrivere mediante questi: P2 = σha1 v1 + v2 i, Q2 = σhb1 v1 + v3 i, Q2 =
σhc1 w1 + v2 i, Q3 = σhd1 w1 + v3 i. L’ipotesi è che (P2 ∨ P3 ) ∩ (Q2 ∨ Q3 ) ≤ σhv2 , v3 i:

σha1 v1 + v2 , b1 v1 + v3 i ∩ σhc1 w1 + v2 , d1 w1 + v3 i = σhb1 v2 − a1 v3 , ⋆1 i ∩ σhd1 v2 − c1 v3 , ⋆2 i

Per ipotesi le rette P2 P3 e Q2 Q3 si intersecano in un punto di σhv2 , v3 i: si ottiene da qui che a1 = c1 e b1 =


d1 , e riscrivendo i punti si ha P2 = σha1 v1 + v2 i, P3 = σhb1 v1 + v3 i, Q2 = σha1 w1 + v2 i, Q3 = σhb1 w1 + v3 i.
Ora
P2 Q2 = σha1 v1 + v2 , a1 w1 + v2 i = σhv1 − w1 , ⋆1 i
P2 Q2 = σhb1 v1 + v3 , b1 w1 + v3 i = σhv1 − w1 , ⋆2 i
P2 Q2 = σhv1 , w1 i = σhv1 − w1 , w1 i
Dunque tutte e tre le rette passano per il punto V = σhv1 − w1 i e i due triangoli sono prospettivi da
V. Q.E.D.

Collineazioni Consideriamo proietività tra rette: vogliamo mostrare un risultato classico che riguarda
una proprietà di questa classe di trasformazioni e le riduce a composizione di proiezioni14 .
14 Il risultato è più generale che non con proiettività tra rette, si può vedere http://archive.numdam.org/ARCHIVE/RSMUP/

RSMUP_1968__41_/RSMUP_1968__41__1_0/RSMUP_1968__41__1_0.pdf per maggiori informazioni.

Mat3M 2007/2008 16
b

C′ Il procedimento che utilizziamo è grafico, siano


b B′ date una f ∈ Aut(P (V )) che manda il riferimento
b A′ R = {A, B, C} nel riferimento R ′ = {A′ , B ′ , C ′ }.
Mostreremo che definite ad hoc due proiezioni la loro
b
Y b
P b
K composizione coincide con f sul riferimento scelto.
b O Siano r = A ∨ B ∨ C, r′ = A′ ∨ B ′ ∨ C ′ . Siano poi
K = B ′ C ∧BC ′ , Y = A′ B ∧AB ′ , e infine s = K ∨Y .
A
b
Consideriamo πB ′ : r → s: essa manda il riferimento
b
B R = {A, B, C} in S = {Y, P, K}. Consideriamo
b C poi la proiezione πB : s → r′ che manda S in R ′
come voluto. Si ha dunque la tesi, πB ◦ πB ′ = f . La
retta s prende il nome di asse di collineazione. Cosa
succede se le rette r, r′ , s sono concorrenti? Pensare
in termini di Desargues.

Complementi
Queste righe vorrebbero dare una visione d’insieme (che si spera essere abbastanza comprensibile ma non
appesantita da formalismi troppo accentuati) sull’argomento sviluppato nel capitolo. La teoria dello spazio
proiettivo ha una storia piuttosto lunga, che risale ai tempi in cui si cercava di risolvere alcuni problemi
aperti nel campo della matematica e dell’arte: per buona parte del Rinascimento infatti l’artista era uomo
dai molti ingegni, e non ultimo il pittore doveva intendersi di geometria del piano e dello spazio.

Nozione di prospettiva — Costruzione grafica del birapporto Cerchiamo qui di dare brevemente
un’idea di cosa si intenda con “Lo spazio proiettivo è stato introdotto nel XVI secolo per modellizzare
lo spazio visto dall’occhio umano, negli studi sulla prospettiva”. La nozione di prospettiva, intesa come
studio delle leggi ottiche su cui si basa la possibilità di rappresentare in due dimensioni oggetti tridimen-
sionali in un modo che si avvicini alla percezione visiva, nasce nel XVI secolo ad opera di Brunelleschi
e altri pittori del Rinascimento italiano. Le specifiche “tecniche” dei loro risultati hanno qui poco rilie-
vo: basti sapere che il risultato comune ai due approcci (quello artistico e quello matematico, ma sono
davvero due?) è quello secondo il quale ogni trasformazione proiettiva(si tradurrà dopo il termine “proiet-
tività” in termini artistici) è ottenibile mediante composizione di proiezioni successive, una volta immerso
lo spazio (nel caso del pittore tale spazio è la tela) in uno spazio di dimensione “più grande di uno”.
La “proiettività” che interessa all’artista è una trasfor-
mazione dello spazio che riesce a “portare al finito”
punti che sono all’infinito, riuscendo a rappresentare
graficamente l’impressione che l’occhio ha ogni volta che
guarda un paesaggio, che cioè le linee all’orizzonte “con-
vergano” in un punto che sta al di là del campo visivo.
Questa idea, che cioè lo spazio geometrico piatto e “drit-
to” possa essere trasformato in un qualcosa di curvo, è
di una ricchezza intellettuale prima che matematica sen-
za pari: su di essa si è basata la possibilità di parlare
di geometria descrittiva, di prospettiva nel campo del-
l’arte, di geometrie non euclidee e di molte altre cose
che permettono di appoggiarsi ad una struttura dove
“trasformare lo spazio” si può fare in molti più modi che non con le sole affinità. Vorremmo ora eviden-
ziare come sia possibile “disegnare” il punto in prospettiva che è in un certo (bi)rapporto dato con altri
tre punti. Mettiamoci in una precisa situazione data: disegnare in modo realistico una porta il cui mezzo
sta esattamente al centro di una parete, che però è vista “di sbieco”, cioè da un’osservatore il cui piano
visuale non è parallelo al piano della parete. Risulta infatti chiaro come ad essere rispettate in questa
trasformazione non sono le proporzioni (se si vuole, questo può essere visto come chiosa al discorso con

Mat3M 2007/2008 17
cui abbiamo introdotto le trasformazioni proiettive: ad essere conservata, abbiamo visto, non è la pro-
porzione (rapporto semplice) tra i vettori, ma una quantità più complessa, il rapporto tra i rapporti delle
“distanze” di una coppia di punti e di punti corrispondenti (il loro birapporto). Se dunque noi vogliamo
preservare l’armonia (ed è proprio il caso di chiamarla cosı̀) tra gli elementi del quadro generale dobbiamo
rispettare non già i rapporti tra le distanze ma i loro birapporti. Ecco allora come potremmo procedere
al momento del disegno: notiamo che sulla retta inferiore che delimita la parete (che si può vedere nella
figura in (1) cosı̀ com’è “alla Euclide”) sono staccati 4 punti. Saranno proprio quei 4 punti ad essere in
un determinato birapporto λ, che andrà conservato anche dopo la proiezione (nel nostro caso particolare
può essere utile ricordare che dati 4 punti generici il loro birapporto può sempre essere ricondotto15 al
birapporto (01ξ1 ξ2 )). Procedendo in questo modo è possibile conoscere qual è il birapporto che si desidera
conservare. Ma sentiremmo anche il bisogno di un procedimento grafico che ci permetta di disegnare
effettivamente il quarto punto dopo tre, e che abbia il birapporto λ cercato. Per farlo procediamo come
segue:
Abbiamo la retta r dove sono segnati (ordinatamente) i punti P1 , P2 , P3 . Tracciamo una retta arbitraria
s passante per P2 , e una retta parallela ad s (chiamiamola s2 ) passante per P1 . La retta s fungerà da
retta affine che permetterà di trovare il birapporto: segniamo infatti su di essa il punto di coordinata
1 e individuiamo su s2 il punto C che fungerà da centro di proiezione: ora il punto che ha birapporto
λ con i tre punti dati si trova come intersezione r ∩ (C ∨ Qλ , dove Qλ è il punto della retta affine di
coordinata λ. Q.E.D.

b
P4

P1 b
C
b

P2 b
U b

b
P3

Da ultimo, diamo altri due argomenti su cui lavorare: uno è un altro teorema classico, l’altro un
approfondimento sul tema dei birapporti, che ne estende il concetto a rette ed iperpiani.
Teorema 2 (Pascal). Data una sestina di punti ordinati ABCDEF , se vertici opposti appartengono a
una coppia di rette incidenti allora le tre intersezioni P QR dei lati opposti dell’esagono cosı̀ costruito sono
allineate
Teorema 3 (Brianchon (Pascal duale)). Se i lati individuati da una sestina di punti ordinata passano
alternativamente per 3 punti, le rette che congiungono i vertici sono concorrenti.
Teorema 4 (Darboux). Ogni applicazione insiemistica invertibile tra punti della retta proiettiva, tale da
conservare l’armonia (i.e. il valore −1 del birapporto) è una proiettività.

Costruzione della retta armonica Sono date 3 rette complanari r, s, t, di un fascio Θ che ha centro C.
Vogliamo trovare la quarta retta v tale che il birapporto (r, s, t, v) = −1. Innanzitutto cosa significa “retta
armonica a tre date”? Possiamo pensarla in almeno due modi: un punto di vista geometrico ci induce a
cercare quella retta tale che, scelta una quinta retta p ∈/ Θ si abbia (r ∩p, s∩p, t∩p, v ∩p) = −1 (invarianza
del birapporto per proiettività – nel caso particolare, proiezione da un punto–, farsi un disegno).
Da un punto di vista algebrico possiamo invece pensare che sul piano generato da Θ le rette hanno
certe coordinate plückeriane (a, b): per dualità la situazione è del tutto analoga al calcolo del birapporto
tra punti.
15 Per quale motivo? Pensare al fatto che tale valore è ξ1 (ξ2 − 1)/ξ2 (ξ1 − 1). . .

Mat3M 2007/2008 18
Supponiamo che le tre rette siano complanari e abbiano coordinate plückeriane r1 = (a1 , b1 ), r2 =
(a2 , b2 ) e r3 = (a3 , b3 ) in un riferimento sul piano che le contiene. La quarta retta armonica si individua
trovando α, β tali che
a  a  a 
α b11 + β b22 = b33
(si può usare Cramer): si trova che α = aa32 bb21 −a 2 b3 a3 b1 −a1 b3
−a1 b2 e β = a1 b2 −a2 b1 . Ora si cercano x0 , x1 tali che
x0 r1 + x1 r2 = q = (q1 , q2 ), alla condizione x1 /x0 = −1 che permette di trovare q1 , q2 . Risolvendo di nuovo
il sistema si ha il risultato in
(a1 a3 b2 + a2 (a3 b1 − 2a1 b3 ))
q1 = q2
2 a3 b1 b2 − (a2 b1 + a1 b2 ) b3
Questo è dunque un modo naturale di estendere il concetto di birapporto anche al caso di iperpiani: nel
piano proiettivo si parlerà dunque di rette armoniche o in dato birapporto, se le loro coordinate plückeriane
soddisfano alle condizioni algebriche che abbiamo imposto alle coordinate omogenee di punti. Ma come
già detto, questo non è l’unico modo di pensarla. Per chi volesse una raffigurazione visiva della cosa, il
birapporto di 4 rette di un fascio può essere definito come il birapporto dei 4 punti di intersezione tagliati
da esse su una qualunque quinta esterna al fascio: in ogni esposizione per via sintetica si può notare
come la nozione di birapporto sia profondamente legata all’angolo formato dalle 4 rette16 . Tale angolo,
rimanendo uguali le rette, viene conservato, e dunque tanto accade del birapporto dei punti proiettati
sulla quinta retta: in tal senso è ben definito il birapporto tra rette, e in un modo non molto diverso si può
parlare di birapporto tra piani e iperpiani (non farà male pensare, fino ad una dimensione visualizzabile,
a come può funzionare la faccenda).

Composizione di omologie

b
D
b

Q′′ P ′′
b
Q′ b

b
Q

b
P′

b
P

b
C1
b
C
b
C2

Siano f1 , f2 : P(V ) → P(V ) due omologie (non speciali) di asse comune H e centri C1 , C2 : il punto
P viene mandato da f1 in P ′ , e P ′ viene mandato da f2 in P ′′ . f1 ◦ f2 è ancora un’omologia di asse H:
trovare il suo centro.
Il centro giace sicuramente sulla retta P ∨ P ′′ : per individuarlo basta intersecarla con la retta Q ∨ Q′′ ,
ove Q′′ è l’immagine mediante f1 ◦ f2 di un punto arbitrario Q. Sia dunque Q tale punto: la sua immagine
Q′ mediante f1 è il punto (C1 ∨ Q) ∩ (P ′ ∨ D): D è il punto di intersezione tra la retta P ∨ Qe l’asse
di omologia:dato che tale punto è unito per f1 si ha f (P ∨ Q) = f (P ) ∨ f (Q) = f (P ) ∨ D: Q′ giace
16 Tale nozione è metrica, e dunque non ha senso parlarne fino a che non si è posto sullo spazio un modo di misurare

distanze e angoli, ma ha una bellissima formulazione proiettiva: per chi volesse cercare, parliamo del teorema di Laguerre,
che esprime l’ampiezza dell’angolo formato da due rette di un fascio mediante il loro birapporto come elementi corrispondenti
in una certa involuzione.

Mat3M 2007/2008 19
dunque sulla retta f (P ) ∨ D = P ′ ∨ D. Un discorso del tutto analogo (si tratta visibilmente dello stesso
procedimento usato per costruire geometricamente l’immagine di un punto mediante un’omologia di dati
asse, centro e una coppia di punti corrispondenti) permette di trovare f2 (Q′ ) = Q′′ = f2 (f1 (Q)) come
intersezione (P ′′ ∨ D) ∩ (C2 ∨ Q′ )
Osservazione: I triangoli P P ′ P ′′ e QQ′ Q′′ sono prospettivi in D e omologici sulla retta C1 ∨ C2 .
Cosa accade a catene di composizioni del tipo f1 ◦ f2 ◦ f1 e simili? Cosa succede di una tale successione
nello spazio degli operatori lineari? Come dualizzare l’asserzione? cosa accade a f1 ◦ f2 e f2 ◦ f1 se f1 , f2
hanno stesso centro e asse diverso?

Nella costruzione del quarto armonico abbiamo dato per scontato il poter scegliere liberamente quale
quadrangolo completo costruire: mostrare che la costruzione è invariante involve il teorema di Desargues,
dato che si tratta di mostrare che in due quadrangoli ABCD, A′ B ′ C ′ D′ sono contenuti due triangoli ABC
e A′ B ′ C ′ che sono prospettivi dal vertice D e dunque omologici sulla retta in cui si vuole trovare il quarto
armonico. Q.E.D.
Teorema 5 (Hesse). Dato un quadrilatero piano ABCD, tale che due coppie di vertici opposti sono
coniugate (cioè la polare dell’uno secondo una data polarità passa per l’altro), la terza coppia di vertici è
S
anch’essa una coppia coniugata. b

b
P
b
R
Q
b

b
B
b
A b
C
b b b

Dimostrazione. Nel quadrangolo AP BCQR A sia coniugato on P e B con Q: proviamo che C è coniugato
con R. Supponiamo che almeno uno dei lati non sia auto-coniugato (diciamo s = ABC), e supponiamo
pure che il suo polo S non coincida con P, Q, R nè giaccia su uno dei lati P Q, P R, QRAllora le polari di
A e B sono a = P S, b = QS. Siano ora A′ = s ∩ a, B ′ = s ∩ b, C ′ = s ∩ SR: nell’involuzione dei punti
coniugati su s (AA′ ), (BB ′ ) sono due coppie di punti corrispondenti, dunque devono esserlo anche C e C ′ :
la polare di C è cioè SC ′ , retta che contiene R. Q.E.D.
Teorema 6 (Chasles). Dato un triangolo T nel piano proiettivo, il suo triangolo polare ha per vertici i poli
dei lati e per lati le polari dei vertici. Il Teorema di Chasles afferma che un triangolo e il suo polare sono
desarguesiani, cioè prospettivi da un punto e omologici su una retta. L’inverso di tale teorema, dovuto a
von Staudt, dice che ogni coppia di triangoli desarguesiani sono triangoli polari per una certa polarità.
Diamo una dimostrazione analitica e una sintetica: Prenden-
b do come riferimento nel piano i vertici di T , e un certo punto
P unità, i suoi lati hanno coord. plückeriane p1 = ( 1 0 0 ), p2 =
( 0 1 0 ),p3 ( 0 0 1 ). Ora, ad una polarità φ : P (V ) → P (V ∗ ) è as-
sociata una applicazione bilineare simmetrica non-degenere g di
b
R matrice G nel riferimento scelto. Le coordinate dei lati del trian-
golo polare φ(T ) allora sono q1 = ( g11 g12 g13 ), q2 = ( g12 g22 g23 ),
b
Q q3 = ( g13 g23 g33 ). Si vede subito allora che p1 ∩ q1 , p2 ∩ q2 ,p3 ∩ q3
b
P′ sono tre punti allineati. Per dare una prova sintetica di questo
fatto avvaliamoci del disegno: le rette P P ′ e QQ′ si incontrano
R′
b
in un punto S, e P S è coniugata a QR, perchè contiene P ′ (il po-
b Q′
lo di QR). Grazie a(l duale de)l Teorema di Hesse, cosı̀ è anche
di QS, che contiene Q′ e dunque è coniugata a P R. Q.E.D.
b
S

Mat3M 2007/2008 20
Alcuni Esercizi Sintetici
b

b
S
T (1) Sia P QRST un pentagono inscrit-
b
E A
b b
b
to in una conica C di P 2 (R ). Consideriamo i
R
punti di intersezione ABCDE (formano un pen-
tagono, “cuore” di una stella inscritta nel pen-
D b
B b
tagono più grande) delle sue diagonali e la coni-
C b
ca D, unica, che passa per tali punti. Si indichi
b
poi in minuscolo la polare di ogni punto rispet-
b
P Q b
to alla conica in cui giace (cioè la tangente alla
conica in quel punto): a la polare di A, . . . , e la
polare di E fatte rispetto a D, p la polare di P , . . . , t la polare di T rispetto a C .
Mostrare che (riferendosi al disegno) a passa per s ∩ t ed r ∩ q, e che questa condizione di allineamento
vale anche per gli altri punti.
(2) Sia Q una conica di P 2 (R ). Siano A, B, C tre punti sul suo supporto (in modo tale che ABC
sia un troangolo inscritto in Q, e a, b, c le polari dei lati omonimi (in tal modo definiamo A′ = b ∩ c, B ′ =
c ∩ a, C ′ = a ∩ b).
Mostrare che le rette rAA′ , rBB ′ , rCC ′ concorrono. Detto O il loro punto comune, qual è la polare di
O rispetto a Q? Definiti D = CC ′ ∩ Q, E = AA′ ∩ Q, F = BB ′ ∩ Q, mostrare che l’esagono formato
dall’“intersezione” dei due triangoli ABC e DEF è inscritto in una conica (=scelti cinque punti a caso di
quell’esagono, l’unica conica che passa per quelli passa anche per il sesto).

(3) Ogni proiettività di P 2 (R ) risulta dalla composizione di (al più) due omologie.
Dimostrazione. (L’invito è a svolgerla del tutto) f : P 2 (R ) → P 2 (R ) ha almeno un punto unito (perchè?).
Sia esso P . Se si sceglie una retta r ≥ P , f |r è una prospettività di r in f (r), di centro C. Se si considera
l’omologia τ di centro C e asse rP C che manda X ∈ r \ {P } in f (X), si può mostrare che θ = τ −1 ◦ f è
omologia di asse r. Q.E.D.
Si generalizzi al caso di f : P n (R ) → P n (R ): ogni proiettività è prodotto di al più n − k omologie, se
k = dim N , N sottospazio puntualmente unito per f , in particolare ne servono al più n + 1.

Mat3M 2007/2008 21
Mat3M 2007/2008 22
APPLICAZIONI BILINEARI

Manca di mentalità matematica


tanto chi non sa riconoscere
rapidamente ciò che è evidente,
quanto chi si attarda nei calcoli
con una precisione superiore alla
necessità.

Carl Friedrich Gauß

Intro: La nozione di applicazione bilineare nasce per rendere intrinseca la teoria dei già noti prodotti
scalari. Il prodotto scalare è stato anche un primo esempio di metrica su uno spazio, un modo di misurare
le distanze: ci accorgeremo presto di come le proprietà di uno spazio possano modificarsi sensibilmente a
seconda della applicazione bilineare che vi si vuole introdurre.
Durante quasi tutta la trattazione supporremo tacitamente, ogni volta che tratteremo di spazi vetto-
riali, che la caratteristica del loro corpo di base sia diversa da 2: la trattazione di questo caso particolare
è più complessa, e soprattutto “esula dagli scopi del corso”.
Definizione 15 (Applicazione Bilineare). V, W siano spazi vettoriali di dimensione finita su K . Una
applicazione bilineare è una funzione
g: V × W → K
(v, w) 7−→ g(v, w)
che sia lineare rispetto ad entrambe le variabili. Si deve avere cioè

g(a1 v1 + a2 v2 , w) = a1 g(v1 , w) + a2 g(v2 , w)


g(v, a1 w1 + a2 w2 ) = a1 g(v, w1 ) + a2 g(v, w2 )

A questa proprietà si può poi aggiungere la non degenerazione:

g(v, w) = 0 ∀ w ∈ W =⇒ v = 0
g(v, w) = 0 ∀ v ∈ V =⇒ w = 0

Un immediato esempio di applicazione bilineare non degenere è la dualità canonica (più avanti ci
accorgeremo che essa è legata molto profondamente al dato di ogni altra applicazione bilineare):

◦: V × V ∗ → K

(v, ζ) 7−→ v ◦ ζ =: ζ(v)


Iniziamo subito a particolareggiare la trattazione: se V ≡ W , i due argomenti della applicazione possono
essere confrontati, e può accadere che il valore assunti da g su (v, w) sia correlato in qualche modo col
valore assunto su (w, v): se ciò è vero, possono presentarsi due casi:
ˆ Simmetria: g(v, w) = g(w, v) per ogni v, w ∈ V ;
ˆ Alternanza: g(v, v) = 0 per ogni v ∈ V .

23
Dall’alternanza discende in particolare che g(v, w) = −g(w, v): se si sostituisce nella definizione v con
u + w si ha

0 = g(u + w, u + w) = g(u, u) + g(u, w) + g(w, u) + g(w, w) = g(w, u) + g(u, w)

Vale in realtà qualcosa di più, e cioè che ogni g bilineare può essere scritta come la somma di una
applicazione simmetrica e di una alternante:

g(v, w) + g(w, v) g(v, w) − g(w, v)


g = gS + gA gS = gA =
2 2
Il fatto interessante è che si può cominciare a lavorare in coordinate: se V = {v1 , . . . vn } è una base di V ,
all’applicazione g : V × V → K si può associare una matrice n × n.
n
X n
X
G = (gij )1≤i,j≤n = (g(vi , vj ))1≤i,j≤n u= ai vi w= bj vj
i=1 j=1

A questo punto il prodotto g(u, w) può essere sviluppato per bilinearità:


   
Xn n
X n
X n
X n
X
g(u, w) = g  ai vi , bj vj  = ai g vi , bj vj  = ai bj g(vi , vj )
i=1 j=1 i=1 j=1 i,j=1

risultato che si nota essere uguale al prodotto ut Gw:


b1
! P
g(v1 ,vj )bj
! n
X
( a1 ... an ) G ... = ( a1 ... an ) ..
. = ai bj g(vi , vj )
P
bn g(vn ,vj )bj i,j=1

Abbiamo cioè mostrato che, introdotta una base (e dunque delle coordinate) si ha

g(v, w) = v t Gw Q.E.D.

Le proprietà di g si possono ora leggere mediante le proprietà della sua matrice: valgono le seguenti
ˆ g è non degenere sse det G 6= 0;

ˆ g è simmetrica sse Gt = G;

ˆ g è alternante sse Gt = −G;

ˆ Se W = {w1 , . . . wn } è un’altra base di V , la matrice H di g nella nuova base è H = P t GP , ove P


è il cambio di base.
(2), (3) sono facili. Mostriamo (1) e (4).
Dimostrazione. (1): Se v è tale che g(v, x) = 0 per ogni x ∈ V si ha v t Gx = 0 per ogni x ∈ V , e dunque
v t G = (0, . . . , 0) (si potrebbe altrimenti trovare un vettore tale per cui v t Gx 6= 0). Ciò significa che
v t G = Gt v = 0, cioè ker Gt non è il sottospazio banale, o in altre parole det Gt = det G = 0. Q.E.D.
t
(4): Siano x′ = P x, y ′ = P y. x′ Gy ′ = (P x)t GP y = xt P t GP y. Q.E.D.
Facciamo ora due esempi di applicazioni bilineari non degeneri, simmetriche:
ˆ Scelta la base canonica E , il prodotto scalare è definito come l’applicazione g che ha in tale base
matrice identica (cioè può non averla in altre basi).

Mat3M 2007/2008 24
ˆ In R 4 si può introdurre l’applicazione lineare g : R 4 × R 4 → R di matrice M in base canonica, che
prende il nome di applicazione di Minkowski (lo spazio (R 4 , M ) analogamente si chiama spazio di
Minkowski).
1 
1
M= 1 c è una costante positiva fissata, la velocità della luce
−c2

Tale spazio funge da modello teorico per la relatività ristretta: notare come vi sono vettori non nulli
tali che v t Gv = 0, ad esempio (c, 0, 0, 1)t . Preso un vettore v generico, di coordinate (x, y, z, t) in
base E si ha che v t Gv può essere positivo, negativo o nullo a seconda che x2 + y 2 + z 2 − c2 t2 sia
positiva negativa o nulla.
Se v è tale che v t Gv > 0, v si dice vettore spazio
Se v è tale che v t Gv < 0, v si dice vettore tempo
Se v è tale che v t Gv = 0, v si dice raggio di luce

DUALITA’ Vogliamo mostrare come esista una relazione più intima tra il dato di una applicazione
bilineare e la dualità canonica: sia g : V × W → K (gli spazi vettoriali siano di dimensione finita); essa
equivale al dato di due omomorfismi (in realtà uno solo, potendosi mostrare che sono l’uno il trasposto
dell’altro)
Φg : V → W ∗ Ψ g : W → V ∗
v 7−→ g(v, ·) w 7−→ g(·, w)
La bilinearità di g sui due argomenti porta a dire che Φ e Ψ sono effettivamente omomorfismi (sono
funzioni lineari), e la non degenerazione dice che i due sono iniettivi: da dim V ≤ dim W , dim W ≤ dim V
si conclude che sono in realtà isomorfismi tra uno spazio e il duale dell’altro. Il dato di un’applicazione
bilineare non degenere è insomma il dato di un isomorfismo (non canonico perché dipendente dalla scelta
di g) tra V e il suo duale V ∗ : se V è base di V , e V ∗ è base di V ∗ , allora G = αVV ∗ (Ψg ). Un esempio
permetterà forse di cogliere la sottigliezza: consideriamo R 4 . Esso si può identificare con R 4∗ sia col
prodotto scalare 1 sia con la matrice di Minkowski, e le proprietà dei suoi elementi cambiano molto a
seconda dell’identificazione che si sceglie.
Indaghiamo meglio questa identificazione, e mostriamo in particolare che Φ∗g ≡ Ψ. Ricordiamo in-
nanzitutto che esiste un isomorfismo canonico tra lo spazio Hom(V ∗ , K ) =: V ∗∗ e V (“valutazione” della
forma ζ nel vettore v definita come evv (ζ) := ζ(v). Ora, la definizione di trasposta di una φ : V → W è
φ∗ : W ∗ → V ∗ tale che φ∗ (w∗ ) := w∗ ◦ φ.
A questo punto applichiamo tale definizione a Φ∗ : W ∗∗ [≃ W ] → V ∗ .

Φ∗g (φw ) := φw ◦ Φg quale forma è questa? calcoliamola in v

(φw ◦ Φg )(v) := φw (Φg (v)) = φw (g(v, ·)) = g(v, w)


Da ciò (riducendo all’osso le informazioni necessarie, la cosa richiede comunque una certa “meditazione”)
segue che Φ∗g manda φw ∈ W ∗∗ (identificato con w ∈ W grazie all’isomorfismo di cui sopra) nella mappa
v 7→ g(v, w) (e ciò è proprio quello che fa Ψ).
La prima nozione che vogliamo vedere in questa nuova ottica è quella di ortogonale a un sottospazio.
Definizione 16 (Ortogonale). Dati ∅ 6= S ⊆ V (notare che è sufficiente che sia un sottoinsieme) e
g : V × V → K applicazione bilineare, definiamo l’ortogonale di S come

S ⊥ := {v ∈ V | g(v, s) = 0 ∀ s ∈ S}

(sono i vettori di V che si annullano sui vettori di S mediante g; notare che ciò generalizza la definizione
di ortogonale mediante la dualità canonica).
Le proprietà di questo ortogonale sono quelle che già conosciamo:

Mat3M 2007/2008 25
1. S ⊥ è un sottospazio (leggasi: anche se S non lo è)
2. Se S1 ≤ S2 allora S1⊥ ≥ S2⊥ .
3. S ⊥ = hSi⊥ .
4. Se W ≤ V , dim W = k, allora dim W ⊥ = n − k.
5. Se W ≤ V , (W ⊥ )⊥ = W
Dimostrazione.

1. S ⊥ 6= ∅, dato che contiene lo zero. Se poi v, w ∈ S ⊥ si ha g(αv + βw, s) = αg(v, s) + βg(w, s) =


0+0=0
2. Facile.
3. S ⊆ hSi, e dunque hSi⊥ ⊆ S, per (2). Se v ∈ hSi, x ∈ S ⊥ , v = a1 s1 + · · · + ar sr . g(v, x) =
a1 g(s1 , x) + . . . ar g(sr , x) = 0 =⇒ x ∈ hSi⊥
4. Scelta una base W = {w1 , . . . , wk }, g ha matrice G. Siano poi (x1 , . . . xn ) le coordinate di v nella
stessa base. Imponendo che v appartenga a W ⊥ si ottiene un sistema di k equazioni indipendenti:
il suo spazio delle soluzioni ha rango n − k.
5. W ⊆ (W ⊥ )⊥ per definizione di ortogonale (=i vettori che si annullano contro i vettori che si annullano
contro i vettori di W , sono almeno tutti i vettori di W ).D’altra parte dim W ⊥ = n − (n − k) = k.
Per ragioni di dimensione, si ha W ≡ W ⊥⊥ . Q.E.D.

Osservazione. La nozione di ortogonale permette ora di definire


Definizione 17 (Isotropia – Degenerazione). Diremo isotropo un vettore w 6= 0 tale che g(w, w) = 0,
ovvero hwi ≤ hwi⊥ .
Diremo W ≤ V degenere se W ∩ W ⊥ 6= h0i
Diremo infine W ≤ V sottospazio isotropo se W ∩ W ⊥ = W .
Risultato importante è che se g |W è non degenere, lo spazio V si spezza in due sottospazi in somma
diretta, uno ortogonale all’altro:
V = W ⊞ W⊥
e se g |W è non degenere, allora anche g |W ⊥ lo è.
Proposizione 7 (Decomposizione Ortogonale). Sia V spazio vett. su K (di caratteristica diversa da 2),
dim V = n < ∞. Sia poi g : V × V → K bilineare (simmetrica o alternante), non degenere. Allora dato
W ≤ V si ha
V = W ⊞ W⊥ =⇒ g |W è non degenere
Possiamo “traslare” un’altra nozione propria del duale mediante g allo spazio vettoriale: tale nozione
è quella di trasposta di un’applicazione lineare.
Definizione 18 (Trasposta di φ). Sia g bilineare non degenere, e sia φ ∈ End(V ) applicazione lineare.
La trasposta di φ è quella applicazione φe tale che
e
g(φv, w) = g(v, φw)

Fissata una base si hanno certe identificazioni:


1. g ha matrice G = αVV (g);

2. φ ha matrice P , φe ha matrice Pe ;

Mat3M 2007/2008 26
 x1   y1 
3. x
. , y. sono le coordinate di v, w nella base scelta.
n n

Note tali identificazioni vorremmo esplicitare Pe. La condizione di cui alla definizione tradotta in questi
termini diviene

(P x)t Gy = xt G(Pe y) ⇒ xt P t Gy = xt GPey ⇒ P t G = GPe

cioè Pe = G−1 P t G.
Possiamo fare alcune osservazioni:
ˆ Se G = 1, o in generale ogni volta che G commuta con P t , Pe = P t
ˆ Valgono le relazioni ker φe = (im φ)⊥ , im φe = (ker φ)⊥ .

Forme Quadratiche
Cambiamo argomento e trattiamo un’altra peculiarità delle forme bilineari, il loro esprimere in modo
lineare proprietà di oggetti quadratici: vogliamo mostrare come lo spazio vettoriale delle applicazioni
bilineari sia (non canonicamente) isomorfo ad un altro spazio vettoriale, quello delle forme quadratiche a
valori su un corpo, isomorfismo che si esplicita nel poter associare in modo (quasi, nel senso “a meno di
un fattore due”17 ) biunivoco una forma quadratica ad una forma bilineare. E’ ovvio cominciare definendo
Definizione 19 (Forma Quadratica). Definiamo forma quadratica una mappa q : V → K che sia omoge-
nea di grado 2 (tale cioè che q(αv) = α2 q(v)
Una forma quadratica può essere pensata come la “restrizione” di una applicazione bilineare g ai
valori che essa assume “sulla diagonale” nel senso che segue: sia g : V × V → K una forma bilineare.
Consideriamo l’applicazione
qg : V → K
v 7−→ g(v, v)
essa è visibilmente omogenea di grado 2, e dunque possiamo affermare che una g bilineare induce natu-
ralmente una forma quadratica una volta ristretta alla “diagonale”.
Fatto più interessante è però che a sua volta una forma quadratica q induce una applicazione bilineare
simmetrica: consideriamo gq definita da
q(v + w) − q(v) − q(w) = g(v, w) + g(w, v)
(notare come questa sia la “parte simmetrica” di g). Ragionando in termini di matrici, quanto detto può
essere spiegato come segue: scelta una base, q(v) è un polinomio omogeneo di 2o grado nelle coordinate
di v: X
v = (x1 , . . . , xn ) g(v, v) = xt Gx = gij xi xj
1≤i,j≤n

Data poi una q quadratica che sia omogenea di grado 2, essa induce naturalmente una g bilineare
simmetrica:
(v, w) 7−→ q(v + w) − q(v) − q(w)

Spendiamo due parole in più sull’isomorfismo che esiste tra i due spazi Q (forme quadratiche) e B
(forme bilineari simmetriche). Mostrato che essi sono spazi vettoriali, definiamo due applicazioni
φ: Q → B ψ: B → Q
q 7−→ gq g 7−→ qg
non è difficile mostrare che (ψ◦φ)(q) = q, (φ◦ψ)(g) = g a meno di un fattore 2. Possiamo dunque affermare
che esiste un isomorfismo Υ che associa ad ogni quadratica una bilineare simmetrica e viceversa. Q.E.D.
17 Ecco che diventa indispensabile poter lavorare su corpi non di caratteristica 2.

Mat3M 2007/2008 27
Classificazione
Esaurito questo discorso generale volto ad introdurre l’argomento, vorremmo occuparci del punto fonda-
mentale, che è un problema di classificazione per certi versi analogo a quello affrontato nello studio delle
classi di equivalenza di Mn (K )/∼ (anello delle matrici modulo simiglianza). Diamo qualche definizione di
partenza e poi presentiamo il problema.
Definizione 20 (Base Ortogonale). Si dice base ortogonale diV rispetto a g (bilineare simmetrica e non
degenere) una base di V fatta di vettori a due a due ortogonali:

g(vi , vj )λi δij

Queste basi sono “più belle” perché se v1 , . . . vn è base ortogonale per V , e v ∈ V , allora le sue
componenti lungo la base V si trovano come “proiezioni ortogonali” sui vettori della suddetta (tutto
quanto detto generalizza un discorso già affrontato nello studio del prodotto scalare canonico su R n ):
n
X g(v, vi )
g(v, v1 ) g(v, vn )
v= v1 + . . . vn = vi
g(v1 , v1 ) g(vn , vn ) i=0
g(vi , vi )
Pn g(v,vi )
Tale osservazione contiene un punto da dimostrare: facciamo vedere che v − i=0 g(v i ,vi )
vi = 0.
Un vettore è nullo (anche) se g(w, V) = 0 (la notazione essendo ovvia, esso si annulla contro tutti i
vettori di una base).
!
Xn
g(v, vi ) g(v, v1 ) −g(v, vj ) g(v, vn )
g v− vi , vj = g(v, vj ) − g(v1 , vj ) − · · · + g(vj , vj ) − · · · −
i=0
g(vi , vi ) g(v1 , v1 ) g(vj , vj ) g(vn , vn )

tutti i termini non riquadrati si annullano (la base è ortogonale), e i due a restare sono opposti. Q.E.D.
Proposizione 8. Sia V spazio vettoriale di dimensione finita su K , charK 6= 2† , g bilineare simmetrica
(quindi non alternante(† )), non degenere. g ammette una base ortogonale.
Dimostrazione. Esiste v1 tale che g(v1 , v1 ) 6= 0. Consideriamo ora hv1 i⊥ . Anche lı̀ g è non degenere,
dunque esiste v2 tale che g(v2 , v2 ) 6= 0. Insomma, V si spezza come

V =hv1 i ⊕ hv1 i⊥
=hv1 i ⊞ hv2 i ⊕ hv1 , v2 i⊥
=hv1 i ⊞ hv2 i ⊞ · · · ⊞ hvj i ⊕ hv1 , . . . vj i⊥

fino ad arrivare ad una base dell’intero V . Q.E.D.


Questo risultato è ben più interessante se visto in termini di forme quadratiche: se g è non degenere
esiste sempre un cambio di base che permette di esprimere qg come somma di quadrati puri.
 x1  n
X
Q .
xn
= aii x2i
i=0

Possiamo ora occuparci del problema originario, studiare Mn (K ) al variare di K e dell’equivalenza


introdotta su di esso. Le classi di equivalenza Mn (K )/≈ definite dalla relazione detta congruenza

G≈H ⇐⇒ esiste P ∈ GLn (K ) tale che P t GP = H

può cambiare sensibilmente a seconda del corpo K su cui si lavora: tale difficoltà è intrinseca alla natura
del problema: stiamo studiando qualcosa che è “quadratico” e che quindi coinvolge la possibilità di estrarre
liberamente radici quadrate agli elementi del corpo. Tale libertà esiste solo in corpi algebricamente chiusi,
di cui C è un esempio, quello che affrontiamo proprio adesso.

Mat3M 2007/2008 28
K ≃ C Sia g : V × V → C bilineare simmetrica non degenere, Prendiamo una base ortogonale W. Con-
siderando che g(wi , wi ) = λi , è possibile “normalizzare” i vettori di base dividendoli per la (una)
radice quadrata di λi . Riscalata la base in questo modo possiamo trovare che
p p
αVV (g) = 1 V = {w1 / g(w1 , w1 ), . . . , wn / g(wn , wn )}

Tale risultato è fondamentale, perché mette in luce la “semplicità” delle applicazioni bilineari che si
possono mettere su uno spazio complesso: esse sono tutte riconducibili all’identità, e quindi essen-
zialmente identiche al prodotto scalare canonico definito su C dalla base E . In altre parole, ogni
forma quadratica complessa può essere scritta come somma di quadrati puri. L’unica classe che
siamo ridotti a studiare è l’identità (nel caso delle applicazioni non degeneri), o in altre parole le
matrici sono classificate esclusivamente dal loro rango.

GLn (C )/≈ = [1]

K ≃ R La situazione qui (si passi il gioco di parole), è meno complessa ma più difficile, potendosi normal-
izzare la base ortogonale solo a meno del segno.
w1
vi = p
|g(w1 , w1 )|

supporremo dunque che g(vi , vi ) = ±δij . Il risultato peculiare è che il numero r ∈ Z + di “+1” in
diagonale è un invariante di congruenza. Per snellire l’enunciato raccolto in un solo teorema, diamo
a parte qualche definizione.
Definizione 21 (Forme definite). g si dice definita positiva se la forma quadratica definita da qg
ammette solo valori positivi. g si dice, specularmente definita negativa se −g è definita positiva. In
ogni altro caso g è non definita.
Osservazione. Se g è non definita ammette vettori isotropi, per una ragione assimilabile ad una
sorta di “teorema degli zeri”: se lo spazio è fatto sia da vettori tale che g(v, v) > 0 sia da vettori tali
che g(v, v) < 0 allora deve esistere una sorta di “margine” tale che g(v, v) = 0.

Andiamo dunque ad enunciare il


Teorema 7 (Sylvester). Sia V spazio vettoriale di dimensione finita, g : V × V → R bilineare
simmetrica non degenere. Allora lo spazio V si decompone come somma ortogonale di W+ e W−
tali che g |W± è definita positiva/negativa. In più [tale parte della tesi è quella che ci interessa
per individuare l’invariante di congruenza] se Z+ , Z− è un’altra decomposizione che soddisfa i punti
precedenti, dim W± = dim Z± .

Dimostrazione. Esiste sicuramente una base ortogonale per g. A meno di permutarne i vettori,
possiamo supporre che i primi r siano tali che g(wi , wi ) > 0, e che gli ultimi n − r siano tali che
g(wj , wj ) < 0.
Per vedere che g |W± è definita ± si procede come segue: sia v = x1 w1 + . . . xr wr ∈ W+ .

g(v, v) = x21 g(w1 , w1 ) + . . . x2r g(wr , wr ) > 0

analogamente si procede per W− .


Resta da mostrare l’ultimo punto. Sia allora V = Z+ ⊞Z− una decomposizione con le stesse proprietà
di prima. Siano infine r = dim W+ , s = dim Z+ Ciò che ci permette di concludere è essenzialmente
un argomento di dimensione. Considerando infatti W+ ∩ Z− = h0i si ha V ≥ W+ ⊕ Z− cioè in
termini di dimensione n ≥ r + n − s, s ≥ r . Analogamente considerando W− ∩ Z+ = h0i, si ha
V ≥ W− ⊕ Z+ , n ≥ n − r + s, r ≥ s . Q.E.D.

Mat3M 2007/2008 29
Esiste dunque una base tale che g abbia matrice
 
1r
 
−1n−r

il numero naturale r viene detto segnatura dell’applicazione, e come visto è un invariante di con-
gruenza. Può essere utilizzato anche il numero r − s, detto indice d’inerzia della g.
Riassumiamo brevemente i risultati ottenuti: la classificazione cui siamo giunti dipende dal corpo di
riferimento, essenzialmente perché condizioni quadratiche sulle incognite presuppongono di poter risolvere
equazioni di secondo grado. Alla condizione che charK 6= 2 abbiamo distinto vari casi.
Se K è algebricamente chiuso, ogni g bilineare non degenere è congruente al prodotto scalare.
Se K è un corpo ordinato (=i quadrati sono numeri positivi) allora esiste un invariante di congruenza
più fine, la segnatura, definita come la dimensione del massimo sottospazio dove g coincide col prodotto
scalare.
⋆ Tradurre quanto detto in termini di matrici significa essenzialmente studiare i quozienti di GLn (K )/ ≈
(gruppo lineare modulo congruenza).
ˆ GLn (C )/ ≈ = [1] (una sola classe)
  h i
ˆ GLn (R )/ ≈ = [1], −1 1n−1 , . . . , −1r 1n−r , . . . , [−1] (n + 2 classi)

ˆ Su corpi in cui ci sono meno libertà “algebriche”, come ad esempio Q , oppure su insiemi di numeri
che non sono corpi, come Z , la classificazione è più ardua. Se ne può trovare un esempio in Jean
Pierre Serre, Cours d’Arithmétique.

Classificazione delle g alternanti


La classificazione stavolta è indipendente da K . Accenniamoci brevemente. Sia g : V × V → K bilineare
alternante non degenere, charK 6= 2. Preso v1 6= 0, esiste w1 tale che  g(v1 , w1 ) = c 6= 0, e wlog si può sup-
0 1
porre g(v1 , w1 ) = 1. Sia ora W2 = hv1 , w1 i. g |W2 ha matrice −1 0 . Se dim V > 2 si procede trovando in
 0 1 
⊥ −1 0
W1 due vettori v2 , w2 tali che g(v2 , w2 ) = 1. Detto W4 = hv1 , w1 , v2 , w2 i, g |W4 ha matrice 0 1 .
−1 0
Da qui si procede in questo modo fino ad esaurire la dimensione di V , che deve per forza essere pari: non
possono esistere forme alternanti non degeneri se dim V è dispari. Riordinando i vettori di base come
{v1 , . . . vk , w1 , . . . , wk } si ottiene quella che è la vera forma canonica delle applicazioni alternanti. Invece
O 1k
di una matrice fatta da k blocchi 2 × 2 si può ottenere la matrice −1 k O
. L’invariante di congruenza è
solamente l’intero k ∈ Z + .

Isometrie
Chiamiamo isometrie le trasformazioni che preservano la struttura geometrica indotta da una g bilineare.
Definizione 22 (Isometria). Dati due moduli quadratici18 (V, g) e (W, g ′ ) si dice isometria ogni appli-
cazione lineare φ : V → W tale che g ′ ◦ φ = g, o in altre parole ogni φ tale che

g(v, w) = g ′ (φv, φw) ∀v, w ∈ V

Spesso noi particolarizzeremo il loro studio al caso in cui g, g ′ sono non degeneri e al caso in cui V ≡ W .
Alcune proprietà delle isometrie posso essere derivate direttamente dalla definizione:
18 Cioè due coppie (V, g) dove V è spazio vettoriale e g applicazione bilineare simmetrica

Mat3M 2007/2008 30
ˆ Ogni isometria è iniettiva;
ˆ Composizione di isometrie è ancora un’isometria;
ˆ Inversa di un’isometria è ancora un’isometria.
La dimostrazione di questi tre fatti è semplice:
ˆ Supponiamo v ∈ ker φ
g(v, w) = g ′ (φv, φw) = g ′ (0, φw) = 0
ma se g ′ è non degenere, g ′ (v, w) = 0 per ogni w implica che v = 0 Q.E.D.
ˆ g(v, w) = g (φv, φw) = g (u, z) = g (ψu, ψz) = g (ψφv, ψφw)
′ ′ ′′ ′′
Q.E.D.
ˆ Se φ−1 : W → V , presi u, z ∈ W si ha
g(φ−1 u, φ−1 z) = g ′ (φφ−1 u, φφ−1 z) = g ′ (u, z) Q.E.D.
(il secondo passaggio si può fare perché φ è isometria per g).
Con tali proprietà l’insieme IG delle isometrie per una data g ha struttura di gruppo. Volendo tradurre
questo in termini di matrici si trova che Ig è isomorfo (non canonico) con un sottogruppo di GLn (K ):
scelta una base di di V V , g ha matrice G e φ (isometria per g) ha matrice P . Secondo la definizione

xt P t GP y = xt Gy ⇐⇒ P t GP = G

Esiste dunque un isomorfismo Ig −−→ {P ∈ GLn (K ) | P t GP = G}: per esempio, se g è il prodotto scalare
canonico, e V è una base ortonormale per g allora
Ig ≃ {P ∈ GLn (K ) | P t P = 1} (gruppo ortogonale On (K ))
Se g bilineare reale ha segnatura r, scelta una base standard il gruppo delle sue isometrie Or (R ) è
n    o
Or,n−r (R ) := P ∈ GLn (R ) | P t 1r −1n−r P = 1r −1n−r

per esempio, il gruppo O3,1 (R ) è detto gruppo di Lorentz (isometrie di R 4 con g = 13 −1 .
Dalla relazione P t GP = G si ottiene che (det P )2 = 1, cioè det P = ±1. Le isometrie con determinante
1 conservano la struttura di gruppo, e vengono dette sottogruppo delle isometrie speciali di g.
SIg := {P ∈ On (K ) | det P = 1}
Per esempio SO2 (R ) è il gruppo delle rotazioni sul piano, ed SO3 (R ) quello delle rotazioni attorno a una
retta hvi,attorno al piano hvi⊥ .
Anche le isometrie di una g alternante sono un gruppo: prendiamo uno spazio di dimensione n = 2k
dotato di una g non degenere alternante: il gruppo delle sue isometrie è detto gruppo 2k-simplettico. La
classificazione del caso generale è ardua, ben più facile è farsi un esempio con Sp2 dato che il conto si può
fare a mano. Ovviamente l’insieme delle trasformazioni è in isomorfismo con un sottogruppo di matrici:
anch’esso viene detto gruppo simplettico.
  
Sp2k := A ∈ GLn (K ) | At −1 O 1k
k O
A = −1O 1k
k O

Definizione 23. Supponiamo φ ∈ On . Possiamo definire l’asse di isometria come il sottospazio lasciato
unito dal φ.
Hφ = {v ∈ K n | φ(v) = v}
Se Hφ è un iperpiano, φ si dice simmetria assiale. Si può mostrare che ogni isometria di On è composizione
di al più n simmetrie assiali:
φ = σ1 ◦ · · · ◦ σr r≤n

Mat3M 2007/2008 31
Forme Hermitiane
Vorremmo a questo punto interessarci al problema di estendere una g reale a coordinate complesse, man-
tenendo cioè le proprietà (almeno quelle più “oneste”) che ci aspettiamo di trovare donando una geometria
allo spazio. Ci siamo già scontrati in passato, con l’impossibilità di definire in maniera ingenua un “prodot-
to scalare” in spazi vettoriali su base complessa. Ora quel problema è generalizzato, ma la soluzione cui
giungiamo è essenzialmente identica. Sfruttiamo le proprietà del coniugio per parlare di applicazioni
emi19 lineari.
Definizione 24 (Forma hermitiana). Sia V spazio vettoriale su C , h : V × V → C . h si dice forma
hermitiana se è lineare in una variabile (convenzionalmente la seconda) e coniuga gli scalari nell’altra.
Valgono insomma le proprietà

h(v, αw1 + βw2 ) = αh(v, w1 ) + βh(v, w2 )


h(αv1 + βv2 , w) = ᾱh(v1 , w) + β̄h(v2 , w)
h(v, w) = h(w, v)

Ora si tratta solo di cambiare “quel tanto che basta” definizioni e proprietà che già conosciamo: iniziamo
notando che la definizione posta è esattamente quel che volevamo. Pensando uno spazio complesso come
spazio R vettoriale di dimensione doppia, ogni h che sia hermitiana è R -bilineare.
Preso poi V = R n , con l’applicazione g simmetrica di matrice G ∈ Mn (R ), possiamo considerare
R ֒→ C n e su C n a sua volta possiamo considerare l’applicazione (z, w) 7−→ z̄ t Gw: a coordinate reali
n

tale applicazione è bilineare, mentre a coordinate complesse è hermitiana.


Fissata poi una base di V si può associare ad h una matrice
H = (h(vi , vj ))1≤i,j≤n
da una delle proprietà della definizione discende direttamente che H t = H (le matrici che hanno questa
proprietà20 si dicono matrici hermitiane. Infine dalla terza delle proprietà discende che h(v, v) = h(v, v),
e dunque ogni hermitiana che scontra un vettore con sé stesso restituisce un numero reale21 .
Con perfetta analogia alle bilineari h si dice degenere se esiste un vettore v non nullo tale che h(v, w) = 0
per ogni altro w. Infine lavorando in coordinate si può associare ad h e ai vettori dello spazio una matrice
e delle colonne, ottenendo la relazione
 
X n n
X X
h(z, w) = h  zi vi , wj vj  = zi wj h(vi , vj ) = z t Hw
i=0 j=0 1≤i,j≤n

Si presenta poi lo stesso problema di classificazione, e la stessa soluzione: è possibile trovare una base
ortogonale, ma i vettori possono essere normalizzati solo a meno del segno. Vale dunque un analogo del
teorema di classificazione di Sylvester:
Teorema 8 (Sylvester complesso). h : V × V → C sia hermitiana non degenere. Allora lo spazio V si
decompone in due sottospazi tra loro ortogonali in modo che h |W+ è definita positiva e h |W− è definita
negativa. Infine se Z+ , z− è un’altra siffatta decomposizione, allora dim W± = dim Z± .
Dimostrazione. Analogo al caso reale: supponiamo i primi r vettori siano tali che h(vi , vi ) > 0 e gli ultimi
n − r tali che h(vj , vj ) < 0. Se poi x ∈ W+ si ha
h(x, x) = z1 z̄1 h(v1 , v1 ) + · · · + zr z̄r h(vr , vr ) > 0
Anche l’ultimo punto si dimostra analogamente al caso reale. Q.E.D.
19 non più “bi”
20 Spesso t
la si scrive come H = H
21 E quindi se tale h è definita positiva ha perfettamente senso una metrica su spazio complesso. Questo era parte di quel

che volevamo ottenere.

Mat3M 2007/2008 32
Anche le forme hermitiane sono quindi classificate dalla segnatura.
Proposizione 9 (Disuguaglianza di Schwartz). Sia h : V × V → C hermitiana definita positiva. Dati
v, w ∈ V si ha
|h(v, w)|2 ≤ h(v, v)h(w, w)
e vale l’uguaglianza sse v, w sono linearmente dipendenti.
 1/2
h(w,v)
Dimostrazione. Poniamo κ = h(v,w) . Si nota facilmente che κ̄ = κ−1 , useremo questo risultato
successivamente. Siccome h è definita positiva si ha h(v + tκw, v + tκw) ≥ 0, su questo basiamo la
dimostrazione:

h(v + tκw, v + tκw) = h(v, v) + (κ̄h(w, v) + κh(v, w))t + h(w, w)t2 = h(v, v) + 2|h(v, w)| + h(w, w)t2 ≥ 0

ora si ha immediatamente che per questo trinomio di secondo grado in t, ∆/4 < 0 cioè esattamente
|h(v, w)| ≤ h(v, v)h(w, w) . Q.E.D.

Osservazione. Notiamo come questo risultato sia parecchio generale: possiamo infatti utilizzarlo in ogni
caso abbiamo una h definita positiva come ad esempio nel caso della applicazione bilineare integrale
Z b
h·, ·i : C([a, b], C ) × C([a, b], C ) → C hf, gi = f (x)g(x)dx
a

La disuguaglianza di Schwartz in questo caso diventa


Z 2 Z Z b
b b

hf, gi ≤ hf, f ihg, gi ⇐⇒ f (x)g(x)dx ≤ |f (x)|2 dx |g(x)|2 dx
a a a

complicata disuguaglianza integrale che invece è di semplicissima dimostrazione.


Definizione 25 (Aggiunta di una h). Siano V, W spazi vettoriali, e h, h′ forme hermitiane, h : V × V → C
e h′ W × W → C . Sia poi φ : V → W : definiamo come aggiunta di φ l’applicazione φ∗ tale che

h′ (φv, w) = h(v, φ∗ w)

Noi particolarizzeremo lo studio a quando V = W .


Ragionando in termini di coordinate, fissata una base si hanno le seguenti relazioni: H, H ′ sono matrici
di h, h′ , P è matrice di φ, P ∗ matrice di φ∗ .
t
(P v) H ′ w = v t HP ∗ w

t
chiaro che quindi si ha la relazione P ∗ = H −1 P H ′ (in maniera molto simile alla relazione tra una φ e
la sua trasposta).
Definizione 26 (Operatore Autoaggiunto – Normale). φ : V → W si dice autoaggiunto se φ ≡ φ∗ (in
t
termini di matrici, P = P ). Si dice invece normale se φ ◦ φ∗ = φ∗ ◦ φ.
Osservazione. Matrici simmetriche reali sono matrici di operatori autoaggiunti, cosı̀ come matrici hermi-
tiane sono matrici di operatori autoaggiunti complessi. Lo studio di queste trasformazioni è fondamentale
in molti ambiti della Matematica Applicata e della Fisica Teorica (in Meccanica Quantistica l’oggetto
osservato viene visto come una trasformazione che si opera sullo spazio, in virtù del principio che l’atto di
osservare modifica lo stato dell’esperimento). Ancora maggiore importanza acquistano se si pensa che per
essi vale un risultato importante (il Teorema Spettrale, una generalizzazione di quello già visto, che ora
andiamo a dimostrare) che mostra che trasformazioni autoaggiunte (o anche solo normali) sono sempre
diagonalizzabili con basi ortogonali.

Mat3M 2007/2008 33
Teorema 9 (Spettrale per Operatori Autoaggiunti). Sia φ : V → V endomorfismo autoaggiunto per
h : V × V → C . Allora esiste una base ON di autovettori per φ.
Dimostrazione. Per induzione su n = dim V : se n = 1 nulla da provare. Sia allora n > 1, ed a un
autovalore per φ di autovettore relativo v. Sappiamo che grazie a g si ha V = hvi ⊕ hvi⊥ . Mostrando che
φ(hvi⊥ ) ⊆ hvi⊥ ci si riduce ad uno spazio di dimensione n − 1 che per ipotesi induttiva ha una base ON
di autovettori. Sia x ∈ hvi⊥ :

h(v, φx) = h(φv, x) = ah(x, v) = 0 Q.E.D.

La tesi è provata, dobbiamo però ancora mostrare che

ˆ Se φ è autoaggiunto per h lo spettro di φ è reale: āh(v, v) = h(φv, v) = h(v, φv) = ah(v, v) e


dunque ā = a, cioè ā − a = 0 2ℑa = 0. Q.E.D.
ˆ Se v, w sono autovettori relativi ad autovalori distinti, allora sono ortogonali: siano φ(v) = av,
φ(w) = bw.
ah(v, w) = h(φv, w) = h(v, φw) = bh(v, w)

cioè (a − b)h(v, w) = 0, a − b = 0. Q.E.D.


Prima di mostrare lo stesso risultato a ipotesi più deboli (cioè assumendo solo che φ sia normale),
parliamo di un corollario interessante di questo risultato.
Proposizione 10. Sia π : V → V una proiezione (cioè sia idempotente, π 2 = π, e lo spazio si divida
in somma diretta in due parti, una che fa da schermo e una che fa da direzione di proiezione). π è
autoaggiunta sse è proiezione ortogonale.
?
Dimostrazione. Sia π proiezione ortogonale, v, w ∈ V . Dobbiamo far vedere che h(πv, w) = h(v, πw).
Con un barbatrucco algebrico si ha

h(π(v), w) − h(w, π(w)) − h(π(v), π(w)) + h(π(v), π(w))


h(π(v), w − π(w)) + h(π(v) − v, π(w)) = 0

(fa zero perché # − π(#) ∈ ker π e π(#) ∈ im π, e per ipotesi ker π = (im π)⊥ . Q.E.D.
Viceversa se π è autoaggiunta mostriamo che h(v − π(v), π(w)) = 0

h(v, πw) − h(πv, πw)


h(v, πw) − h(v, π 2 w)
h(v, πw) − h(v, πw) = 0 Q.E.D.

Mostriamo ora il teorema spettrale per operatori normali: ci serviamo di due lemmi che andiamo a
dimostrare. Siano allora φ, φ∗ una applicazione e la sua aggiunta, tali che φ ◦ φ∗ = φ∗ ◦ φ.
1. v ∈ ker φ ⇐⇒ v ∈ ker φ∗
2. v ∈ ker(φ − α) ⇐⇒ v ∈ ker(φ∗ − ᾱ)
Dimostrazione. Per la prima affermazione abbiamo

v ∈ ker φ ⇐⇒ φ(v) = 0 ⇐⇒ h(φ(v), φ(v)) = 0

perché h è definita positiva. Ora abbiamo anche

0 = h(φv, φv) = h(v, φ∗ φv) = h(v, φφ∗ v) = h(φ∗ v, φ∗ v) Q.E.D.

Mat3M 2007/2008 34
Dimostrazione. Per la seconda abbiamo qualcosa di simile:

h((φ − a)v, (φ − a)v) = h(φv, φv) − āh(v, φv) − ah(φv, v) + aāh(v, v)


= h(φ∗ v, φ∗ v) − āh(φ∗ v, v) − ah(v, φ∗ v) + aāh(v, v)
= h((φ∗ − ā)v, φ∗ v) − h((φ∗ − ā)v, āv)
= h((φ∗ − ā)v, (φ∗ − ā)v) Q.E.D.

Forti di questi risultati, mostriamo il teorema per induzione su n = dim V , in modo analogo a prima.
Sia n > 1 e la tesi vera per ogni j < n. Sia poi a un autovalore di autovettore v. Consideriamo la
decomposizione hvi ⊕ hvi⊥ . E’ sufficiente mostrare che φ(hvi⊥ ) ⊆ hvi⊥ . Sia allora x ∈ hvi⊥ :

h(φx, v) = h(x, φ∗ v) = h(x, āv) = āh(x, v) = 0

(abbiamo usato il secondo lemma dove c’è ⋆)

Complementi
Valori Singolari di una Matrice
Accenniamo a una questione di Matematica Applicata che usa buona parte degli argomenti svolti. Tempo addietro
si è notato come il rango di una matrice A ∈ Mn,m (K ) sia un’invariante di equivalenza, e di come sia possibile,
detto r tale rango, ricondurre ogni matrice ad una della forma
 
1r Or,m−r
On−r,r On−r,m−r

una decomposizione del genere dell’anello Mn,m (K ) è pero “troppo” fine. Vorremmo trovare un modo di “di-
agonalizzare” una matrice rettangolare e trovare dei valori che siano anch’essi invarianti per equivalenza ma che
caratterizzino meglio la matrice. Questo ci si accorge subito essere un problema che somiglia a quello degli auto-
valori, ma la soluzione possibile è prevedibilmente diversa: qui non possiamo parlare di determinanti! Quello che
ora vogliamo mostrare è che data A ∈ Mn,m (K ) esistono due matrici unitarie P, Q (di dimensioni diverse!22 ) tali
che P t AQ = S ove S è una matrice diMn,m (K ) della forma
 
s1
 .. 
 . 0
  gli sj si dicono valori singolari di A
 sr 
0t O

In termini di applicazioni lineari vorremmo che una qualunque applicazione tra spazi vettoriali possa essere “ridot-
ta” ad una matrice come quella prima scritta. Sia allora ϕ : R n → R m una applicazione lineare. La prima cosa che
vorremmo fare è restringerla ad un isomorfismo di spazi vettoriali, la cosa si può fare considerando K = (ker ϕ)⊥
(in tal modo ϕ è iniettiva) e restringendo il dominio alla sola Y = im ϕ. In tal modo ϕ |K =: ϕ e è isomorfismo
di spazi vettoriali, di inversa ϕ e−1 Ora, oltre alla normale restrizione del prodotto scalare ad Y possiamo definire
l’applicazione bilineare ς : Y × Y → R , (x, y) 7→ ϕ∗ (x) · ϕ∗ (y) (prodotto scalare delle controimmagini di ϕ sui
vettori di Y ). Tale applicazione è ovviamente bilineare, e dalla sua definizione discende che è anche simmetrica e
definita positiva. Esiste dunque una base di vettori w1 , . . . wr (r = dim Y = rk φ) tali che ς(wi , wj ) = ki δij . Tali
ki sono tutti positivi, e dunque per comodità stenografica possiamo scriverli come ki = 1/s2i . Otteniamo dunque
che la base v1 = s1 ϕe−1 (w1 ), . . . , vr = sr ϕ
e−1 (wr ) è una base ortonormale per il prodotto scalare su K. In definitiva
e j ) = sj wj e dunque, una volta completata V = {v1 , . . . vr } a base di R n mediante una base di ker φ (ottenendo
ϕ(v
la matrice P ) e completata W = {w1 , . . . , wr } a base di R m (ottenendo la matrice Q) si ha
 s1 
t . .
P AQ = S S= . O  Q.E.D.
sr
O O

22 Se vogliamo essere precisi, ad agire su M


n,m (K ) non è più l’azione degli interi due gruppi GLn (K ) e GLm (K ), bensı̀
solo quella di due loro sottogruppi, quelli di matrici invertibili unitarie.

Mat3M 2007/2008 35
CONICHE E QUADRICHE

Quando lavoro su un problema,


non penso mai all’estetica... ma
quando ho finito, se la soluzione
non è bella, so che è sbagliata.

Richard Buckminsterfuller

Intro: Le coniche sono l’esempio in dimensione più bassa possibile (immediatamente sopra le equazioni
lineari, che però si studiano con altri metodi) di curve algebriche, cioè di luoghi geometrici che sono
definiti da equazioni algebriche di grado arbitrario. Geometricamente una conica può essere definita
come l’intersezione di un piano con un bicono. Su questa definizione e sulla sua formulazione in termini
metrico–affini si basa l’intera trattazione dell’argomento in termini classici, di geometria sintetica: risale
già ad Apollonio un primo trattato sulle sezioni coniche, il κòνικoν appunto. Noi non prenderemo il via
da questa definizione, che pure è quella più nota, perché poco “maneggevole” ai nostri scopi: inizieremo
invece sfruttando l’approccio analitico per parlare di coniche e quadriche mediante gli strumenti algebrici
a noi noti. Essenzialmente ci appoggeremo alla teoria sviluppata al precedente capitolo.
Cominciamo considerando naturale immergere lo spazio affine nello spazio proiettivo, a sua volta natu-
ralmente immerso nello spazio complesso (ciò significa che ci prenderemo una certa libertà nel considerare
soluzioni complesse di equazioni, come vedremo tra poco).
Definizione 27 (Quadrica). Una quadrica nello spazio proiettivo è il dato di una forma quadratica
Q : R n+1 → R , a meno della moltiplicazione per una costante: la quadratica x20 − 2x0 x1 + x0 x2 − x23 è
una quadrica di P 3 , ed è uguale23 a 3x20 − 6x0 x1 + 3x0 x2 − 3x23 .
Della quadrica ci interesserà studiare il luogo dei punti dello spazio proiettivo in cui essa si annulla: ci
interessiamo in pratica alla “forma” del sottoinsieme dei vettori isotropi di Q.
Definiamo come supporto di una quadrica l’insieme Supp Q := {X ∈ P n (C ) | Q(X) = 0}, e chiamer-
emo coniche le quadriche del piano. La domanda che ora sorge è: perché il supporto è definito su C a
prescindere dallo spazio vettoriale considerato? Altrimenti verrebbe ad essere falso questo risultato:
Proposizione 11. Siano Q1 , Q2 due forme quadratiche in C n tali che Supp Q1 ≡ Supp Q2 (le due
quadriche condividono lo stesso supporto): allora esiste λ ∈ C tale che Q1 = λQ2 (cioè le due quadriche
sono uguali a meno di proporzionalità)24.
Dimostrazione. Usiamo una sorta di induzione su n. Per n = 1 esiste solo la forma x0 = 0, dunque non c’è
nulla da dimostrare. Per n = 2 abbiamo invece la forma generica√Q(X) = ax20 + 2bx0 x1 + cx21 . Possiamo
2
supporre a 6= 025 e trovare due soluzioni in t = xx10 : t1,2 = −b± ab −ac . I punti del supporto di Q sono
dunque  √  √ 
σh −b+ ab2 −ac i, σh −b− ab2 −ac i
23 Si tratta in pratica di considerare F (lo spazio delle forme quadratiche) modulo proporzionalità, un po’ come lo spazio

proiettivo nasceva da V × /K . Attenzione però che le classi non restano le stesse cambiando K , e anzi ha poco senso parlarne
al di fuori di C .
24 Non è difficile farsi un esempio del perché questo sarebbe falso su R o su altri corpi: due forme possono avere lo stesso

luogo degli zeri (il vuoto, se otteniamo polinomi di secondo grado irriducibili
 1 in R ) ma essere diverse.
25 Se a = 0, la forma x (2bx + cx ) = 0 ha per soluzioni i punti c 
1 0 1 0 , −2b

36
Ogni altra forma quadratica dotata dello stesso supporto può essere ricondotta a questa a meno di
proporzionalità (ci si può accorgere di questo cercando di risalire alla forma a partire dal supporto:
ax21 (t − t1 )(t − t2 ) porge l’equazione di secondo grado. . . ).
Supponiamo dunque n > 2: prese Q1 , Q2 con lo stesso supporto, si sceglie v 6= 0 che non stia nel
suddetto supporto: il rapporto Q1 (v)/Q2 (v) avrà dunque senso e in particolare sarà diverso da zero,
chiamiamolo λv . Mostriamo ora che in realtà λv non dipende da v. Prendendo un w qualsiasi si ha

Q1 |hv,wi = g1 (t0 v + t1 w, t0 v + t1 w)
Q2 |hv,wi = g2 (t0 v + t1 w, t0 v + t1 w)

cosı̀ ristrette le due forme hanno supporto Supp Q1,2 ∩ hv, wi: si tratta nient’altro che dell’intersezione
della quadrica con la retta hv, wi. D’altra parte si ha pure che v, w sono arbitrari, ma noti: g1,2 (t0 v +
t1 w, t0 v+t1 w) sono due quadriche in due variabili t0 , t1 : per quanto mostrato al punto precedente abbiamo
che
t20 g1 (v, v) + 2t0 t1 g1 (v, w) + t21 g1 (w, w)
t20 g2 (v, v) + 2t0 t1 g2 (v, w) + t21 g2 (w, w)
condividono lo stesso luogo degli zeri e sono dunque proporzionali:

g1 (v, v) g1 (w, w) Q1 (w)


= = =λ Q.E.D.
g2 (v, v) g2 (w, w) Q2 (w)

Osservazione. Vi sono ragioni algebriche (e di coerenza) che ci spingono a creare una nomenclatura
particolare. Nel caso di una conica che risulti dal quadrato di una singola forma lineare, Q(X) = (ax0 +
bx1 )2 , l’“unico” punto del supporto di Q è (−b, a). In tali casi noi diremo che esso è punto del supporto
“con molteplicità 2”, e intenderemo che anche se è un solo punto andrà contato come fossero due. In tal
modo si evitano particolarismi fastidiosi, e ha senso dire che il supporto di una quadrica26 è sempre fatto
almeno da due punti.

Coniche
Nella terminologia appena sviluppata, una conica è un’ equazione di secondo grado della forma

a00 x20 + 2a01 x0 x1 + 2a02 x0 x2 + a11 x21 + 2a12 x1 x2 + a22 x22

ad essa si può naturalmente associare una matrice,  aquella della


 forma quadratica che definisce la conica.
00 a01 a02
A meno di proporzionalità si ha dunque che A = aa01 aa11 aa12 definisce la conica.
02 12 22
Tutte le informazioni sulla forma e le proprietà della conica si possono ricavare da questa matrice:
come imparare a leggerle? Qualchecosa sappiamo già trovarla: prendiamo ad esempio una quadrica sulla
retta proiettiva, di matrice A ab cb . Essa sarà costituita da due punti distinti o coincidenti, a seconda
che sia o meno nullo il “discriminante” ∆ = b2 − ac, quantità che guarda caso è proprio il (l’opposto del)
determinante della matrice. Il segno di tale determinante aiuta poi a capire se la quadrica sia fatta di
punti complessi coniugati oppure reali.
Raccogliamo ora qualche definizione e giungiamo a un risultato: una conica si dirà degenere se si
spezza nel prodotto di due forme lineari (non necessariamente distinte, per pignoleria si potrebbe creare
la terminologia “singolarmente degenere” e “doppiamente degenere”, dall’eloquente significato). Il rango
di una conica è il rango di una, e quindi di tutte, le matrici che la rappresentano.

Proposizione 12. Una conica C di matrice A è degenere sse det A = 0.


26 Si dovrebbe precisare “che viva almeno sulla retta proiettiva”, ma nel caso in cui consideriamo spazi vettoriali

unidimensionali, il loro spazio proiettivo è un punto. . . La cosa perde di interesse.

Mat3M 2007/2008 37
Dimostrazione: Il verso destro si ottiene pensando cosı̀: se le due rette sono distinte, aiutiamoci
con un disegno.

b
σhui
s r
B
b

b σhvi
b C

b σhwi A
b

I punti σhui, σhvi, σhwi sono in posizione


 generale e generano tutto il piano: in questo riferimento la
0 0⋆
matrice di C risulta essere 0 0 0 , che è chiaramente non invertibile. σhu, wi non può essere retta
⋆0 0
isotropa (avremmo una conica generata dalla forma quadratica nulla, e ciò è assurdo) e dunque l’entrata
chiamata ⋆ non può essere nulla. La matrice ha visibilmente rango 2 e determinante nullo. Consideriamo
ora il caso di una retta doppia, scrivendo Supp C = 2r 0 0 0
Siano A = σhui, B = σhvi, C = σhwi. Nella base hu, v, wi la conica ha matrice 0 0 0 , visibilmente
00⋆
di rango 1 e determinante nullo. Sarebbe sufficiente a concludere notare che u, v sono isotropi e tra loro
ortogonali: in realtà c’è di più, e cioè che hu, vi = ker g (ove g è la bilineare simmetrica indotta dalla
conica). Vediamo perché si ha g(v, w) = 0: per assurdo supponiamo g(v, w) 6= 0. Si avrebbe che
g(t0 v + t1 w, t0 v + t1 w) =
= t20 g(v, v) + 2t0 t1 g(v, w) + t21 g(w, w)
= t1 (2t0 g(v, w) + g(w, w))
 
g(w,w)
questa forma quadratica avrebbe soluzione non banale in −2g(v,w) , dovrebbe cioè esistere un punto del
supporto esterno alla retta 2r, assurdo. Dunque si ha g(v, w) = 0, e altrettanto per g(u, w): notiamo
infine che supporre g(v, w) = 0 permette di conservare la coerenza nel risultato raggiunto poco sopra: si
sarebbe ottenuto hg(w, w)v − 2g(v, w)wi = hvi: ma ciò accade appunto se g(v, w) = 0, in modo che si
abbia pure t21 g(w, w) = 0, con unica soluzione t1 = 0. Q.E.D.
Viceversa supponiamo det A = 0 e distinguiamo due casi in base al rango di A. Se rk A = 2 sia
hvi = ker A. Consideriamo una retta r = σhu, wi sghemba con P = σhvi (mutatis mutandis si può guardare
la figura precedente). Restringendo Q ad r si ottiene una forma non degenere: dunque r ∩ Supp C è fatto
da due punti distinti, reali o complessi, Q1 , Q2 . Vogliamo mostrare che Supp C = (P ∨ Q1 ) ∪ (P ∨ Q2 ):
hv, ui e hv, wi sono rette isotrope:
g(av + bu, av + bu) = ag g(v, v) + 2abg(v, u) + b2 g(u, u) = 0
g(av + bw, av + bw) = ag g(v, v) + 2abg(v, w) + b2 g(w, w) = 0

Supponiamo ora che esista σhzi ∈ Supp C diverso dagli altri punti: la retta σhv, zi sarebbe anch’essa
isotropa intersecherebbe r in un punto diverso da Q1 e Q2 . Ciò però è assurdo, perché una retta interseca
una quadrica in al più due punti (Bèzout?)
Se infine rk A = 1 mostriamo che Supp C = ker A: σhker Ai = σhv, wi. Qualunque punto p = σhui
esterno alla retta non può essere isotropo (altrimenti in quel riferimento A avrebbe matrice nulla e rango
0, assurdo).
Definizione 28 (Cono Quadrico). Una quadrica Q ⊂ P n (C ) si dice cono quadrico se esiste un punto
P ∈ Supp Q tale che ogni retta P ∨ Q è contenuta in Supp Q. I punti come P costituiscono il vertice del
cono quadrico.

Mat3M 2007/2008 38
Proposizione 13. Q di matrice A è un cono quadrico sse det A = 0
Dimostrazione. Mostriamo per converso che se det A 6= 0 esiste sempre Q tale che P ∨ Q ∈ / Q, cioè detti
P = σhwi esiste v tale che g(v, w) 6= 0. Ma se w 6= 0, il suo ortogonale hwi⊥ ha dimensione n. Dunque
/ hwi⊥ tale che g(v, w) 6= 0.
esiste v ∈
Se quel w sta in Supp Q abbiamo finito. Altrimenti cerchiamo U = αw + v isotropo:

g(w, w)
0 = g(u, u) = 2αg(v, w) + g(w, w) α=− Q.E.D.
2g(v, w)

Polarità
Sia C una conica non degenere di matrice A. Dato P = σhvi possiamo considerare lo spazio (è un
iperpiano) hvi⊥ , mediante l’ortogonale indotto dalla g che definisce la conica. Tale iperpiano, che in P 2 è
una retta, è detto polare di P rispetto a C (se la conica è non degenere, la corrispondenza punto – polare
è biunivoca).
Alcune osservazioni:
 p0 
ˆ Se P ha coordinate pp1 , la sua polare è la retta
2

P t AX = 0, cioè la retta di coordinate plückeriane


b P tA
ˆ La relazione di appartenenza alla polare è “sim-
metrica”, nel senso che se P ∈ πC (Q) allora
b
Q ∈ πC (P ): questo si nota osservando che
b

b
P t AQ = 0 ⇐⇒ (P t AQ)t = Qt AP = 0

Proposizione 14. Se P = σhvi,P ∈ C , allora πC (P ) è la tangente in P alla conica (ovvero la polare


interseca la conica in P con molteplicità 2).

Dimostrazione. Se P ∈ C , v è isotropo per g. Se w ∈ πC (P ) ∩ Supp C esso è un vettore isotropo e


ortogonale a v. Ciò vuol dire che σhv, wi è un sottospazio isotropo. Ma poiché g è non degenere, questo
sottospazio deve avere dimensione al più 1 (geometricamente, una retta isotropa spezzerebbe la conica in
un prodotto di rette). Q.E.D.
Osservazione. Presi due punti sulla conica Q1 , Q2 , possiamo trovare il polo della retta Q1 ∨ Q2 con un
ragionamento di questo tipo:
Q2 ∈ πC (P ) ⇐⇒ P ∈ πC (Q2 )
Q1 ∈ πC (P ) ⇐⇒ P ∈ πC (Q1 )
e dunque P è l’intersezione dell due polari tangenti i punti Q1 ,Q2 . Il ragionamento si può fare anche alla
rovescia: dato P ∈/ Supp C la sua polare è la retta che passa per i due punti di tangenza alla conica delle
due rette uscenti da P .

Proiettività e Coniche I
Scelta una retta r non tangente a una conica C consideriamo l’applicazione ϕ : r → r che manda X in
πC (X) ∩ r
Osserviamo: i due punti R1 6= R2 di intersezione tra C ed r sono uniti per ϕ. Inoltre ϕ(P ) = P ′ .
Da ciò si deduce che P ∈ πC (P ′ ). Ma P ∈ r, e dunque è l’unico punto che può essere l’immagine di P ′ .
Conclusione: (P, P ′ ) è una coppia involutoria per ϕ, che dunque è un’involuzione.

Mat3M 2007/2008 39
πC (X) πC (X)

b b

r φ(X) r
b b
X b
b
b
X
b

b
b b

C C

Si ha in particolare (R1 R2 Xϕ(X)) = −1, cioè data una retta non tangente a C , i due punti di
intersezione separano armonicamente ogni coppia di punti corrispondenti. Altro risultato geometrico
interessante è il fatto che la polare di un punto che non appartenga ad una data conica si può costruire
con la sola riga: se il punto è esterno a C , prese due rette qualunque non tangenti alla conica, e le loro
intersezioni con essa, si può costruire con la sola riga il quarto armonico A ∨ E dopo (P AE), e su C ∨ D
dopo (P CD). Detti Q1 , Q2 questi punti, la polare di P è Q1 ∨ Q2 . Se il punto è interno alla conica, lo si
lascia per esercizio.
Vorremmo ora trattare analiticamente il problema di individuare il cono quadrico tangente a Q uscente
da un punto esterno P . Un punto X appartiene a tale cono quadrico sse la retta P ∨ X interseca Q in
un sono punto contato due volte. Un generico punto di P ∨ X è σht0 v + t1 xi. Esso interseca Q quando
(t0 v + t1 x)t A(t0 v + t1 x) = 0, cioè quando t20 (v t Av) + 2t0 t1 (v t Ax) + t21 (xt AX) = 0, equazione di secondo
grado in t0 t1 . Essa ha due soluzioni coincidenti quando il suo discriminante è nullo, cioè quando
(v t AX)2 − (v t AV )(xt AX) = 0 (eq. del cono tangente alla conica)
(v t AX) è la polare (che in generale è l’iperpiano tangente alla quadrica che passa per il punto P ) di
P , mentre (xt AX) è l’equazione della conica (o della quadrica) considerata.

Coniche nello Spazio Proiettivo


Noteremo ora come le proprietà e le classi di coniche che potremo individuare cambieranno sensibilmente
a seconda dello spazio in cui ci troviamo, in virtù del principio che vuole che sia rispettato il gruppo
di trasformazioni che definisce lo spazio. Per fare un esempio, lo spazio affine nasce dal proiettivo dalla
scelta di un iperpiano particolare, e il gruppo di trasformazioni detto delle Affinità è quello che tiene fisso
proprio quell’iperpiano. All’interno dello spazio affine è poi possibile definire un concetto di metrica, e da
quel momento lo spazio acquista la struttura di spazio euclideo: le trasformazioni che preservano questa
struttura sono ora le isometrie.
Cominciamo ora dalla classificazione meno fine di tutte, essendo molto più vasta la classe delle
trasformazioni (le proiettività) che sono permesse.
Definizione 29 (Equivalenza Proiettiva). Due coniche si dicono proiettiva mente equivalenti se esiste
una proiettività f ∈ End(P 2 (K ))27 che trasforma l’una nell’altra.
In termini di matrici facciamo agire sull’insieme delle matrici simmetriche l’intero PGLn (K ): se A, B
sono matrici di due coniche, A ≡ B sse B = λP t AP per qualche P ∈ PGLn (K ) e qualche λ ∈ K .
27 E’ importante che questo K sia un corpo dove la proposizione 1 ha senso.

Mat3M 2007/2008 40
Osservazione. Il rango di una conica viene lasciato invariato da questa equivalenza (ed è proprio la
ragione per cui ha senso parlare del rango di una conica, la possibilità di cambiare riferimento e di far
restare degeneri le coniche degeneri). Possiamo dunque classificare le coniche degeneri come segue
ˆ Coniche che sono il quadrato di una forma lineare;

ˆ Coniche che sono il prodotto di due forme lineari distinte;

ˆ Coniche che sono forme non fattorizzabili sul corpo reale (si spezzano nel prodotto di due rette
complesse).
L’ultima classe origina dal fatto che in questo studio quasi sempre tacitamente porremo che il corpo
su cui si lavora sia R : trasformazioni reali non possono toccare coordinate complesse, e dunque non c’è
modo di classificare le coniche irriducibili se non come costituenti una classe a sé stante. Le rette in cui si
spezza il cono quadrico sono comunque due distinte, ma risultano invisibili nel piano reale. Osserviamo
anche come la classificazione proiettiva delle coniche sia, essenzialmente, la classificazione canonica delle
forme bilineari secondo Sylvester. Proprio come in quel caso, i quozienti dipendono fortemente dal corpo
su cui si lavora: per questo distinguiamo i casi. Su C e su corpi algebricamente chiusi si possono trovare
solo tre classi di coniche distinte dal rango:

Semplicemente degenere Doppiamente degenere Non degenere


1  1 
1 0 13
0 0

x20 + x21 = 0 x0 = 0 x20 + x21 + x22 = 0

Il discorso si fa già più interessante su R : la classificazione secondo Sylvester evidenzia quattro classi
distinte (per le forme non degeneri). La possibilità di lavorare a meno di proporzionalità però le riduce a
due:
Conica senza punti reali Conica con punti reali
1 
±13 ± −1
−1

x20 + x21 + x22 = 0 x20 − x21 − x22 = 0

Proiettività e coniche II
Abbiamo parlato di una quadrica come del dato di una
quadratica in P , e del suo supporto come del luogo dei punti
b

b proiettivi che sono vettori isotropi per Q. Esiste ora un altro


C1 b

modo di definire il supporto di una conica, sfruttando quella


C2
b
che è l’identificazione P (V ) ∼ P (V ∗ ) permessa dalla presenza
di una applicazione bilineare. L’ente duale al punto proiet-
b
tivo è un fascio di iperpiano (nel piano un fascio di rette) di
b centro il punto: vedremo ora come la forma canonica di una
b
quadrica (nel piano una conica) sia essenzialmente definita da
una proiettività tra fasci di rette.
b

b
b
Proposizione 15. Sia C una conica in P 2 (C ), C1 , C2 due
punti del suo supporto. Allora la corrispondenza ΥC : C1∗ →

C2 che alla retta r del fascio di centro C1 associa la retta C2 ∨ (r ∩ C ) è una proiettività. Viceversa,
dati due punti distinti C1 , C2 e una applicazione ̺ tra i fasci di rette di centro quei punti che sia una
proiettività, allora l’insieme dei punti r ∩ ̺(r) è il supporto di una conica.

Mat3M 2007/2008 41
Dimostrazione. Per la prima asserzione: usiamo un riferimento  ⋆ 0 0 comodo. {C0 , C1 C2 }, ove C0 è il polo
della retta C∨ C2 . In tale riferimento la conica ha matrice 0 0 ⋆ e si può sempre scegliere bene il punto
1 0 0 0⋆ 0
unità in modo da avere 0 0 1 . Ora, la generica retta del fascio C1∗ è r di coordinate (a 0 b) in quel
010
riferimento, e la sua altra intersezione con la conica è soluzione del sistema
(  
ax0 + bx2 = 0 2ab
σh b 2 i = Q
2

x20 + 2x1 x2 = 0 −2a

 
x0 2ab 0
La retta C2 ∨ Q è quella di equazione det x1 b2 0 = 0, cioè (b − 2a 0). Quindi la corrispondenza
x2 −2a 1

0 −2 28
tra fasci è una proiettività
0 di soprastante
  1 0 . Per mostrare il
secondo asserto utilizziamo lo stesso
0
riferimento: C1 = 1 , C2 0 e un sistema di coordinate coerente nel piano proiettivo. Una proiettività
0  1
̺ : C1 → C2 ha matrice αγ βδ . L’intersezione tra un retta e la sua immagine risulta dal sistema r ∩ r̺c
∗ ∗

(usiamo la matrice dei complementi algebrici, potendo lavorare a meno di proporzionalità). Risolvendo in
(a, b) si deve imporre che la matrice dei coefficienti abbia determinante nullo:
 
x0 x2  2
−2γ α −δ
det −x1β+x0δ x1α−x0γ = 0 αx x
0 1 + βx x
1 2 − γx0 − δx x
0 2 = α 0 β Q.E.D.
−δ β 0

Coniche nel Piano Affine


Ora vorremmo studiare come cambi la classificazione delle coniche, riducendo il gruppo delle trasformazioni
geometriche alle sole affinità. Lo spazio affine consiste essenzialmente di uno spazio proiettivo cui è stato
tolto un iperpiano detto “iperpiano dell’infinito”. Una scelta canonica (perché facilita conti e definizioni)
è quella di pensare A n ֒→ P n togliendo l’iperpiano x0 = 0. Nel caso del piano, A 2 (C ) può essere pensato
immerso in P 2 (C ) \ H∞ ove H∞ : x0 = 0 è la retta impropria del piano. Il passaggio di coordinate è
 x0   1   1 
x1 2 x1/x0 = x
x1 x2 /x0 y

Operata questa riduzione possiamo permetterci di usare solo trasformazioni affini, cioè solo proiettività
che lasciano fissa la retta impropria (nel senso che H∞ è globalmente unito per ogni F che sia affinità). La
classificazione quindi si arricchisce nel modo che andiamo ad esporre: le definizione di equivalenza affine
tra due coniche è analoga a quella proiettiva, cambiando solo il fatto che come detto ora usiamo solo un
sottogruppo di PGL(V ). Le coniche saranno ora classificate dalle posizioni reciproche tra supporto della
conica e retta all’infinito. Le possibilità sono due sul campo complesso:
ˆ C ∩ r∞ = {P, Q}, con P 6= Q: si parla di conica a centro.

ˆ C ∩ r∞ = {2P } (un sono punto doppio) si parla di parabola.

Se K = R invece le cose si fanno più interessanti: e le coniche a centro si dividono a loro volta in
ˆ Ellissi se i punti sono complessi coniugati

ˆ Iperboli se i punti sono reali distinti.


28 Sarebbe interessante classificare questa proiettività. La sua soprastante è diagonalizzabile? Lascia unita qualche retta?

Cosa succede della retta C1 ∨ C2 ? E delle due tangenti alla conica in 2C1 e C2 ?

Mat3M 2007/2008 42
Scegliendo la retta canonica x0 = 0 all’infinito possiamo trovare una condizione abbastanza semplice da
dare al determinante di una sottomatrice della conica che la identifica: il sistema per trovare i punti di
intersezione tra conica e r∞ si riduce a
(
x0 = 0
a11 x21 + a12 x1 x2 + a22 x22 = 0

Questo sistema ha due soluzioni distinte o coincidenti a seconda che il discriminante ∆ = a212 − a11 a22 sia
o meno nullo:
ˆ Se ∆ > 0 si ha un’ellisse;

ˆ Se ∆ < 0 si ha una iperbole;

ˆ Se ∆ = 0 si ha una parabola.

Salta inoltre quasi subito all’occhio la relazione ∆ = A11 (ove A11 è il complemento algebrico di posto 1, 1
di A).
Il centro di una conica a centro è dunque il polo della retta all’infinito. Un modo semplice per trovarne le
coordinate sfrutta la regola di Cramer: per trovare il punto di coordinate (1 xC yX ) tale che C t A = (ρ 0 0),
cioè tale che sia appunto il polo di x0 = 0 a meno di proporzionalità, si deve risolvere il sistema
(
a11 xC + a12 yC = −a01
a12 xC + a22 yC = −a02
 
det A∞
dunque le coordinate omogenee del punto si trovano come (A∞ )12 .
(A∞ )13

Definizione 30 (Equivalenza Affine). Due coniche in A 2 si diranno affinemente equivalenti se esiste una
trasformazione affine che muta l’una nell’altra. In termini di matrici, scelta la solita retta all’infinito, e
date alle coniche C , D due matrici C, D, deve esistere una matrice del sottogruppo Aff che trasformi Cin
D:    
1 vt c00 ct 1 0t
=D
0 Πt c C∞ v Π

Osservazione. In questo caso, chiamando K lo spazio delle coniche, il quoziente K/ ∼A è più ricco perché
consta di più classi rispetto al proiettivo: qui figurano classi che non ha senso distinguere in P .
E’ importante del resto notare come la classificazione ottenuta dipenda fortemente dalla scelta di una
ben determinata retta impropria. La nostra scelta semplifica i conti che dovremo fare e aiuta a visualizzare
meglio le caratteristiche dei rappresentati delle classi che definiremo, ma è importante fissare bene due
concetti:
ˆ Il numero degli elementi di K/ ∼A è indipendente dalla scelta di una particolare retta impropria, e
in questo senso la classificazione ottenuta è “abbastanza” canonica.
ˆ Bisogna però osservare che la scelta di un’ altra retta impropria può modificare parecchio la forma
canonica di una data conica in P 2 : si potrebbe dire che la classe delle iperboli è quella fatta da
tutte le possibili coniche che intersecano in due punti distinti la retta x0 = 0: cambiando retta,
cambieranno allora le coniche che intersecano quella determinata retta, e saranno diverse anche
quelle che (ad esempio) le sono tangenti in due punti coincidenti, cioè le parabole.

Mat3M 2007/2008 43
Forme Canoniche
Iperboli Scegliamo un buon riferimento: P∞ sia un
punto di r∞ distinto dalle due intersezioni A1 , A2 =
C ∩ r∞ . La polare di P∞ è allora una retta che pas-
c sa per il centro C della conica, e interseca r∞ nel punto
Q∞ . Scelti C = σhv0 i, P∞ = σhv1 i, Q∞ = σhv  2 i si
 ha
⋆ 29
A2 b
P∞ che la matrice della conica assume la forma ⋆ ).
A1 b
Q∞ b

b

Si può a questo punto fissare in modo opportuno


 U (pun- 
±1
to unità) in modo da ricondursi alla forma ±1 .
±1
Ora, C 6≃ ±13 altrimenti la conica non avrebbe punti re-
b

C ali (che invece, per ipotesi di essere un’iperbole)


  ci sono.
−1
Scegliamo a questo punto la forma 1 che con-
−1
venzionalmente è la rappresentante della classe delle iperboli. Data una qualunque iperbole, è possibile
ricondurla mediante affinità alla forma
X2 − Y 2 = 1

Ellissi Un conto del tutto simile porge la forma canonica


di una ellisse. Sia C il centro della conica (interno ad
essa dato che la retta r∞ tocca C in due punti complessi
coniugati). Scegliamo poi P∞ ∈ r∞ : πC (P∞ ) ≥ C. Sia
C b poi Q∞ = r∞ ∩ π(P∞ ). Usiamo come riferimento C =
σhv0 i, P∞ = σhv1 i, Q∞ = σhv2 i. La matrice della conica
è allora nuovamente diagonale, dato che quello scelto è un
Q∞
riferimento
 ±1 autopolare.
 Da qui è possibile ricondursi alla
r∞ (πC (P∞ )) P∞
b

b
forma ±1 e notando che la restrizione di C a r∞
±1
 ±1  è per ipotesi senza punti reali scegliere la forma canonica
1 con la scelta di un opportuno punto unità. Nulla ci si dice però sul quell’ultimo segno. A seconda
1
della scelta fatta la forma quadratica sarà meno definita, cioè la conica avrà o meno punti reali:

+1 Ellisse senza punti Reali X 2 + Y 2 = −1


−1 Ellisse con punti Reali X2 + Y 2 = 1

Osservazione (Triangoli Autopolari). . Definiamo come triangolo [dualmente, trilatero] autopolare il


dato di tre punti [dualmente, di tre rette non concorrenti] tali che ogni punto sia il polo della retta che
passa per gli altri due [dualmente, tali che ogni retta sia la polare dell’intersezione delle altre due]. I
riferimenti autopolari sono quelli che si scelgono nel piano (anche se la nozione può benissimo essere
estesa, parlando di tetraedro, o simplesso autopolare, sostituendo “retta” con “iperpiano polare indotto
da una quadrica Q”) per classificare affinemente le quadriche. La scelta di questi riferimenti, era, per la
Geometria precedente l’approccio algebrico, un metodo sintetico per definire riferimenti ortogonali sugli
spazi: notare solo quanto appare naturale questa proprietà se lo studio viene affrontato con la teoria degli
spazi vettoriali!
Esiste poi un interessante proprietà dei quadrangoli piani inscritti in una conica data:
Proposizione 16. Sia ABCD un quadrangolo inscritto in una conica C . Allora il triangolo diagonale,
formato dalle intersezioni delle 6 diagonali prese a due a due è autopolare.
Dimostrazione. Si basa su un fatto già visto, che cioè la polare di un punto P taglia su qualunque altre
due rette non tangenti a C (che quindi la intersecano in A e B) del fascio P ∗ il quarto armonico dopo
P AB. Q.E.D.
29 Il triangolo CP∞ Q∞ è cioè autopolare: ogni vertice è il polo della retta opposta

Mat3M 2007/2008 44
Un interessante corollario permette di tradurre in un linguaggio proiettivo/affine una proprietà met-
rica: se due diagonali di un quadrangolo si incontrano nel centro della conica, allora ABCD è un
parallelogramma.
Concludiamo questa breve digressione lasciando un quesito:

Costruzione geometrica delle polari Come fare a costruire con la sola riga la polare di un punto
interno ad una conica data C ? Ci sono almeno due modi diversi. . .

Parabole Analogamente a quanto fatto in preceden-


za, scegliamo un opportuno riferimento: la conica in-
P∞
b terseca la retta impropria in 2P∞ : scegliamo dunque
Q∞ Q∞ 6= P∞ e tracciamo la sua polare, che passa per
b
P∞ e interseca C in un altro punto V , sicuramente
distinto da P∞ . La polare di V è la retta V ∨ Q∞ . In
questo modo si ottiene per C una matrice antidiago-
nale (non sarebbe possibile ottenerne una diagonale,
perché?), che scegliendo
 U punto unità può essere ri-
±1
dotta a ±1 . I due segni esterni devono essere
±1
uguali per simmetria della matrice, e il segno centrale
b
V può essere scelto ad arbitrio (scegliere uno piuttosto
che l’altro porta ad avere parabole che sono comunque
equivalenti). Scegliamo dunque il segno positivo e ot-
−1
teniamo la forma canonica di matrice 1 ed
−1
equazione X 2 = 2Y .

Coniche nel Piano Euclideo


Lo spazio affine nasce dal proiettivo come A n = P n \ H∞ . Lo spazio euclideo nasce come ulteriore
raffinamento dello spazio affine, ed è essenzialmente il dato di un A n (V ) dotato di una metrica, cioè di
una applicazione bilineare definita positiva (e quindi proiettivamente equivalente al prodotto scalare di
matrice 1). La metrica posta stacca sull’iperpiano all’infinito una quadrica priva di punti reali che è detta
assoluto dello spazio. Essa, in un opportuno riferimento, ha la forma
(
x0 = 0
H :
x21 + x22 = 0

Questa definizione permette di esprimere certe proprietà metriche in maniera più intrinseca: ad esempio,
la relazione di perpendicolarità diventa la polarità indotta dall’assoluto su En .
Noi ci occuperemo per ora solo del piano euclideo, dove l’assoluto è fatto da due punti complessi
coniugati. In coordinate standard si ha
(
x0 = 0 n 0   0 o
H : 2 2
= 1 , 1
x1 + x2 = 0 i −i

Quei due punti si dicono i punti ciclici del piano. Si presenta ora un problema di classificazione analogo
ai precedenti, con la differenza che ora a poter agire su K è solo il gruppo delle isometrie rispetto alla
t
metrica. Queste trasformazioni hanno matrici del tipo P = v1 0R ove r ∈ O2 , gruppo ortogonale, cioè
delle matrici tali che R R = 1. Se tra due coniche di matrici A, B c’è la relazione B = ̺P t AP allora le
t

due si dicono metricamente equivalenti.

Mat3M 2007/2008 45
Restano ovviamente definite tutte le classi precedenti, ma ora due coniche che non si possano far
coincidere mediante sole (glisso)rotazioni, traslazioni, (glisso)riflessioni non sono più equivalenti. La clas-
sificazione è resa più ardua anche dal fatto che dobbiamo trovare due direzioni (saranno gli assi della
conica) che siano coniugati per la conica e perpendicolari per l’assoluto. Tali direzioni però esistono di
certo in base al Teorema Spettrale, non resta che individuarle. Lavorando in coordinate si ha che presa la

generica matrice A, dato l’assoluto e un punto P∞ esso deve realizzare insieme al suo ortogonale P∞ la
relazione
P∞ AP∞ ⊥
=0 (p1 p2 )A ( pp12 ) = a12 p21 + (a22 − a11 )p1 p2 − a12 p22 = 0
Quest’ultima è detta equazione degli assi: affinché vi siano soluzioni reali deve accadere che (a22 − a11 )2 −
4a212 ≥ 0: questo è sempre vero se A è reale. Trovate le direzioni ortogonali e coniugate che risolvono

l’equazione degli assi possiamo cambiare coordinate in C = σhv0 i, P∞ = σhv1 i, P∞ = σhv2 i. Non è però
possibile a questo punto scegliere il punto unità arbitrariamente, dato che siamo vincolati alla scelta di
una base ortonormale. Ci si può avvalere dei disegni di prima:

Coniche a Centro Poniamo come al solito l’origine del riferimento nel centro della conica. Ora, scelto
un punto sulla retta all’infinito e il suo
 ⋆ ortogonale
 euclideo, essi identificano le direzioni degli assi del
riferimento in cui la matrice ha forma α
β
. A questo punto possiamo usare il fattore di proporzionalità
 −1 
per ridurre a −1 (scelta convenzionale) per portare la matrice nella forma canonica a . Riflettere
b
su quando Q può essere o no definita porta a distinguere due casi ulteriori:
ˆ Se 0 < a ≤ b si tratta di una ellisse.

ˆ Se b < 0 < a si tratta di un’iperbole.


Parabole P∞ sia il punto di intersezione tra C e la retta impropria. P∞ sia la direzione su r∞ ortogonale
a P∞ rispetto all’assoluto (o se si vuole, il quarto armonico secondo l’involuzione degli angoli retti, dopo
¯ ∞ )). La polare di P ⊥ passa per P∞ e interseca C in un secondo punto. Questo punto è il vertice
(I IP ∞

della parabola,
 e va scelto
 come origine. P∞ , P∞ sono gli assi coordinati:
 in tale riferimento la parabola
−1 ⋆
ha matrice a (dopo essersi ricondotti alla forma α si sceglie comodamente il punto unità
−1 ⋆
del riferimento).
Vorremmo ora concentrarci su qualche risultato collaterale: osserviamo i conti da fare per ottenere la
forma canonica euclidea
 di una conica. Cerchiamo una matrice P di isometria, che quindi ha l’aspetto
t
generale di v1 0Θ (rotazione di Θ composta a traslazione di v): dobbiamo svolgere il prodotto
 t     t t t t t

a00 at 1 0t = ̺ a00 +v a+a v+v A∞ v a R+v A∞ R
C = ̺P t AP = ̺ 01 R
v
t a A∞ v R t t
R a+R A v t
R A R
∞ ∞

Questa
 −1 matrice, aseconda dei casi, sarà uguale ad una delle due forme canoniche per le coniche euclidee:
 −1
a oppure a . Ogni informazione può essere ricavata dopo aver notato quali siano le re-
b −1
lazioni tra la matrice della conica e la sua rappresentante in forma canonica: ciò che stiamo operando è
sostanzialmente un cambio di riferimento ortonormale, e dunque possiamo subito notare che la matrice
A∞ è simile mediante R (che essendo ortogonale ha la proprietà per cui R−1 ≡ Rt ) alla sottomatrice
della forma canonica: sia che si tratti di una conica a centro che di una parabola possiamo dire che a
e b sono gli autovalori di A∞ a meno della costante ̺: tale costante può essere determinata nel caso di
coniche a centro notando che le isometrie conservano i volumi, e dunque il determinante di A è uguale al
determinante della sua forma canonica C, che può essere calcolato in −ab. Il calcolo esplicito si trova con

−ab = det C = ̺3 det A e ab = det C∞ = ̺2 det A∞

quindi ̺ = − det A∞
det A . Se invece si tratta una parabola, la condizione da usare è l’invariante traccia:
tr3 A
tr A∞ = tr C, che da la condizione necessaria a determinare ̺ come − det A . Un simile utilizzo dei
cosiddetti “invarianti ortogonali” (tutte quelle quantità che si conservano per similitudine, unite a quelle

Mat3M 2007/2008 46
che si conservano per isometria) è utile per determinare senza troppi conti i parametri euclidei di una
conica.

Fuochi di una Conica


Come già detto, il piano euclideo risulta dal-
P∞ la posizione in A 2 di una forma quadratica

r∞ I
b b b

definita (e dunque priva di punti reali). L’in-


tersezione di tale quadrica con la retta impro-
← Q∞ F2 pria consta di due punti distinti, complessi co-
b

F niugati, e prende il nome di assoluto del piano.


b

b
I due punti di tale quadrica sonodetti  punti
0
b
ciclici dell’assoluto di coordinate 1 . Ogni
±i
F̄ retta che passi per uno dei punti ciclici è detta
retta isotropa, e ogni fascio proprio del piano
possiede due rette isotrope: nella proiettività
F1
b tra fasci indotta dall’assoluto sul piano quelle
due rette sono unite. In altre parole l’assoluto
H induce una involuzione in ogni proiettività
tra fasci di rette, detta involuzione degli angoli retti, che manda ogni retta nella sua ortogonale in senso
metrico, e dunque lascia unite le rette isotrope. Vogliamo basarci su questo fatto per studiare uno dei
luoghi caratteristici delle coniche a centro (e in un senso un po’ diverso, anche delle parabole), cioè i fuochi
di una conica: data una conica C nel piano euclideo, restano individuate quattro tangenti isotrope alla
stessa, due per ogni punto ciclico. Siano F1 = t1 ∩t1 , F2 = t2 ∩t2 , F = t1 ∩t2 , F = t1 ∩t2 . F1 , F2 sono detti
fuochi reali della conica (essendo intersezioni di rette complesse coniugate, le loro coordinate sono reali).
Avvalendosi del disegno mostriamo le relazioni che intercorrono tra fuochi, centro e rette congiungenti.
Osserviamo anzitutto che F1 F̄ F2 F è un quadrangolo piano completo: si ha che (I IP ¯ ∞ Q∞ ) = −1 (cosa
che comunque già sapevamo, considerando che P∞ , Q∞ sono punti tagliati da due rette corrispondenti
nella involuzione degli angoli retti sulla retta impropria. Nella involuzione che C induce sul fascio di cen-
tro F1 , le rette F1 F2 ed F1 Q∞ sono corrispondenti (involuzione = proiettività = birapporto conservato),
e per la stessa ragione nell’involuzione sul fascio F2∗ le rette F1 F2 , F2 Q∞ si corrispondono. Ragionan-
do allo stesso modo su F F̄ si riesce a capire come F1 F2 sia un’asse della conica, e F F̄ sia l’altro asse:
F1 F2 ∩ F F̄ = C è il centro della conica,, e per uno stesso argomento di birapporto si può scoprire che
(F F̄ CQ∞ = (F1 F2 CP∞ ) = −1. Essendo P∞ , Q∞ due punti impropri la conclusione è che C biseca i
segmenti F1 F2 e F F̄ .

Osservazione. Di tutto quanto detto è possibile dare una (per alcuni più convincente, per altri più o meno
comprensibile) prova algebrica, che non val la pena ricopiare passo per passo: basti solo aggiungere che
ora tutte le definizioni classiche, di Geometria sintetica (per intendersi, quelle proposte nelle K òνικoν di
Apollonio di Perga30), possono essere derivate dalla descrizione della conica in questione in un riferimento
che sceglie uno dei fuochi come origine.

Fasci di Coniche
Nel piano proiettivo un fascio di rette è l’ente duale di un dato punto P . r1 , r2 fanno da riferimento sul
fascio, con le loro coordinate φ1 , φ2 : ogni altra retta s avrà coordinate ψ = λφ1 + µφ2 al variare di λ, µ
30 L’opera di Apollonio fu basilare nello studio della geometria sintetica: sulle sue idee finirono per ragionare figure come

quelle di Fermat e Newton, che vi trovarono argomenti di discussione l’uno nel campo dell’aritmetica e l’altro nel campo
dell’astronomia. Per curiosità, e per chi non abbia arrugginito troppo il suo latino, l’opera completa Sulle coniche si può
trovare a http://www.wilbourhall.org/index.html, sito che raccoglie copie liberamente scaricabili di opere di Diofanto,
Archimede, Tolomeo e Apollonio, fianco di opere di autori molto meno noti in Occidente come Brahmagupta.

Mat3M 2007/2008 47
non entrambi nulli. Ora, è possibile trovare un isomorfismo tra lo spazio delle coniche e lo spazio puntato
P 5 (K ) nel modo che segue:
 a00 
a01
C =  aa02
11
 In tal modo lo spazio delle coniche X è in isomorfismo conP 5 (K )
a12
a22

in pratica ogni entrata distinta della matrice della conica fa da coordinata di un vettore in P 5 . Con questa
identificazione lo studio dei fasci di coniche si riduce allo studio dei fasci di rette in P 5 .
Quello su cui vogliamo concentrarci ora è un caso particolare del Teorema di Bèzout, che afferma che
l’intersezione di due curve algebriche di grado m ed n è fatta esattamente da mn punti, contati con le loro
molteplicità.) Siano C, D due coniche nel piano proiettivo complesso. Allora il luogo base del fascio C, D
consta esattamente di 4 punti contati con le loro molteplicità.
Potendo scegliere ad arbitrio una conica per generare il fascio, sostituiamo D con una conica degenere:
ora il problema è ridotto a provare che sono quattro e solo quattro i punti del luogo

C ∩ (r ∪ s) = (C ∩ r) ∪ (C ∩ s)

ma questo lo sappiamo già: l’intersezione di una conica con una retta nei complessi consta sempre di due
punti. Q.E.D.
Osservazione. Se A, B sono matrici delle coniche C, D allora la conica generica del fascio (C, D) è degenere
sse det(λA + µA′ ) = 0. Da ciò (dal fatto che det D è un polinomio omogeneo di III grado in µ/λ) consegue
che a) ogni fascio di coniche reali ha o una o tre coniche non degeneri.
Il luogo base del fascio di coniche può essere di cinque tipi diversi (con A, B . . . indichiamo i punti
base):
ˆ ABCD coniche secanti (quattro punti distinti)
ˆ AABC coniche tangenti (tre punti distinti, uno di molteplicità 2)
ˆ AABB coniche bitangenti (due punti distinti, entrambi di molteplicità 2)

ˆ AAAB coniche osculatrici (due punti distinti, uno di molteplicità 3)


ˆ AAAA coniche iperosculatrici (un solo punto)
Affrontiamo il problema di ricostruire il fascio a partire dalla conoscenza del luogo base: data l’arbitrarietà
nella scelta delle coniche a generare il fascio, sarà più conveniente scegliere di trovare coniche degeneri.

Coniche Secanti : il fascio è determinato dalla conoscenza di due delle tre coniche degeneri passanti
per i 4 punti.

b
P3
b
P4

b
P1

b
P2

Mat3M 2007/2008 48
Coniche Tangenti Il fascio non può essere ricostruito a partire dalla conoscenza dei soli punti base,
essendo necessario conoscere o l’equazione della retta tangente a tutte le altre coniche del fascio (che passa
per AA) oppure l’equazione di una qualunque conica non degenere (per fissare univocamente la retta di
tangenza). A quel punto il fascio è descritto dalle due coniche degeneri della figura.

b
P2
C
b
P1
b
P3

Coniche Bitangenti Il fascio si può ricostruire noti i punti base e almeno una conica non degenere, che
serve a fissare univocamente le due rette di tangenza. A quel punto il fascio si scrive come combinazione
delle due coniche degeneri (coppia di rette e retta doppia per i due punti base).

b
P1
C
b
P2

Coniche Osculatrici Il fascio è determinato quando si conoscano i punti base e una conica non degenere
che fissi la retta osculatrice (l’unica conica degenere è la coppia di rette).

b
P1
C

b
P2

Coniche Iperosculatrici Il fascio è determinato dalla conoscenza del punto di iperosculamento (l’unica
conica degenere è la retta doppia che è tangente a tutte le altre) e di una conica non degenere

b
P1

Mat3M 2007/2008 49
Quadriche
Naturale generalizzazione è ora quella che ci porta a studiare le superfici definite nello spazio tridimension-
ale da equazioni di secondo grado, che saranno dette quadriche dello spazio proiettivo tridimensionale. Il
percorso ricalcherà quello già compiuto nel caso delle coniche: da una prima nozione di equivalenza proi-
ettiva, arricchiremo man mano la struttura dello spazio e passeremo alla classificazione affine ed euclidea.
Cominciamo con l’ovvia definizione di base
Definizione 31 (Quadrica in P 3 ). Definiamo quadrica dello spazio proiettivo il dato di una forma
quadratica Q nelle variabili ( X0 X1 X2 X3 ). Ad una quadrica resta associata la matrice simmetrica
 a00 a01 a02 a03 
A = aa01 a11 a12 a13
02 a12 a22 a23
a03 a13 a23 a33

Osservazione. Come nel caso delle coniche, resta determinata a meno di proporzionalità una proiettività
ϕ : P (V ) → P (V ∗ ) detta polarità associata alla quadrica, che manda punti in iperpiani. L’immagine di un
dato punto P è detto iperpiano polare di P , e i punti della conica possono essere definiti, oltre che come i
punti proiettivi che sono vettori isotropi per Q, anche come tutti i punti contenuti nel proprio iperpiano
polare.
Cominciamo cercando di classificare proiettivamente le quadriche degeneri, vale a dire i coni quadrici
tridimensionali. Come è lecito aspettarsi, la classificazione si arricchisce date le maggiori possibilità di
degenerazione (semplice, doppia o tripla) della matrice della conica. La dimensione del nucleo della g
associata a Q determina la forma della conica non degenere, e sia che esse siano degeneri che non degeneri,
la classificazione delle quadriche nel campo più “libero” che possiamo immaginare, quello complesso, è
essenzialmente una classificazione per rango. Si ha dunque che
ˆ Se rk A = 1 il supporto di Q è un piano doppio 2π;

ˆ Se rk A = 2 si hanno invece due piani distinti ρ, σ;

ˆ Se invece il nucleo della g (=il vertice del cono quadrico) ha dimensione 1, si ottiene un vero e proprio
cono, tale che un qualunque piano sghembo con esso taglia su Q una conica non degenere31 ;
ˆ Infine si hanno le quadriche non degeneri.

La classificazione su C è conclusa.
Spostandosi al campo reale, analogamente a prima, le classi aumentano per due ragioni: esistono forme
definite e forme non definite, cioè forme che possiedono vettori isotropi e forme che non li possiedono
(ricordiamo che su C ogni forma quadratica è congruente al prodotto scalare 1), e non ha senso parlare di
definitezza, dato che ogni forma bilineare su C possiede un sottospazio isotropo della dimensione massima
possibile). Le possibili segnature su R 4 sono 5, e a meno di proporzionalità diventano 3:
 ±1   ±1   ±1 
±1 ±1 ±1
±1 ±1 ∓1
±1 ∓1 ∓1
Quadrica senza punti reali Non definite con segnatura (3,1) Non definite con segnatura (2,2)
La differenza fondamentale tra le due classi proiettive di quadriche si esplica essenzialmente in:
ˆ Le quadriche con segnatura (3, 1) si dicono a punti ellittici. L’intersezione tra la quadrica e l’iperpiano
polare di uno dei suoi punti è sempre costituita da un solo punto di molteplicità 2 (in termini
geometrici si può pensare una superficie ellittica come “a curvatura positiva”, dando alla locuzione
un significato intuitivo: la segnatura sopra indicata mostra infatti come il sottospazio isotropo di
dimensione massima ammissibile all’interno del supporto di Q sia unidimensionale).
31 La teoria delle coniche può essere derivata totalmente da certe condizioni imposte sulla posizione reciproca tra un cono

e un piano sghembo al suo vertice. Come fare?

Mat3M 2007/2008 50
ˆ Le quadriche con segnatura (2, 2) si dicono invece a punti iperbolici: l’intersezione tra quadrica e
piano polare di uno dei suoi punti è costituita da una conica degenere, e nella fattispecie da un cono
quadrico — retta doppia, che ha per vertice il punto della quadrica. Da un punto di vista geometrico
le superfici iperboliche sono quelle “a curvatura negativa”, e la loro caratteristica può essere spiegata
pensando che il massimo sottospazio ammissibile sul supporto di Q sia bidimensionale (rette).

Schiere di rette Vorremmo a questo punto focalizzarci su una proprietà geometrica delle quadriche
a punti iperbolici, che discende dalla definizione appena data: ogni quadrica a punti iperbolici non solo
contiene rette nel supporto, ma è completamente formata da due schiere di rette Ω e Ψ tali che ogni
retta di Ωè sghemba a tutte le altre rette della stessa schiera, e interseca tutte le rette dell’altra schiera.
Tale proprietà intrinseca delle quadriche a punti iperbolici permette, ad esempio in edilizia, di costruirne
una senza dover utilizzare superfici curve ma modellando il cemento su un’anima di sbarre di metallo
intrecciate nel modo giusto, oppure in medicina ....
Per mostrarla possiamo cominciare in questo modo: data la segnatura della quadrica, esiste di certo
un riferimento in cui la matrice di Q è tale che essa abbia la forma Y0 Y1 + Y2 Y3 = 0 (se si vuole, data la
segnatura di Q esiste un cambio di coordinate che porti la differenza di quadrati (φ20 − φ21 ) + (φ22 − φ23 ) = 0
ove le φj sono forme lineari distinte, nella forma suddetta, col cambio di coordinate Y0 = φ0 + φ1 ,
Y1 = φ0 − φ1 , Y2 = φ2 + φ3 , Y3 = φ2 − φ3 . A questo punto, a meno di permutare i prodotti, possiamo
partire da Y0 Y1 = −Y2 Y3 e supporre prima Y0 , Y2 6= 0 e poi Y1 Y3 6= 0. Si ottengono cosı̀ i due sistemi
( (
Y1 Y3 λ λY2 − µY1 = 0 Y0 Y2 λ λY3 − µY0 = 0
=− = ⇒ =− = ⇒
Y2 Y0 µ λY0 + µY3 = 0 Y3 Y 1 µ λY1 + µY2 = 0

Al variare di λ, µ non entrambi nulli quelle sono le due schiere di rette cercate.

Quadriche nello Spazio Affine


Passando allo spazio affine, cioè fissando un piano all’infinito, possiamo permetterci solo trasformazioni
che lo lasciano unito. Utilizziamo cioè solo proiettività che siano affinità. Due quadriche si diranno allora
affinemente equivalenti se è possibili ottenerle una dall’altra mediante un cambio di riferimento che sia
una affinità. La descrizione si arricchisce, dato che dobbiamo tenere conto delle posizioni reciproche tra
quadrica e piano all’infinito. Su C , avremo allora che a seconda che Q ∩ π∞ sia una conica degenere
o meno, la quadrica si classificherà affinemente come paraboloide oppure quadrica a centro (il centro è
il polo di π∞ ). Nel campo reale invece avranno luogo ulteriori distinzioni: se Q ∩ π∞ ha punti reali si
parlerà di iperboloide, se invece non ne ha parleremo di ellissoide (a sua volta questa classe è suddivisa in
ellissoidi con e senza punti reali, a seconda che la quadrica nella sua totalità sia definita o meno). Infine
i paraboloidi possono suddividersi in ellittici o iperbolici, a seconda di quale sia la segnatura dell’intera
forma quadratica. Come al solito, per le quadriche a centro sfrutteremo la possibilità di trovare una
base ortonormale (che in A 3 sarà un simplesso autopolare) per diagonalizzare A: nel caso di quadriche
a centro porremo l’origine nel centro, e useremo come assi una base ortogonale (data appunto dai vertici
del simplesso autopolare). Otterremo dunque una delle forme seguenti32 a seconda che la quadrica sia
1 
1
Iperboloide Iperbolico −1
 −1 −1 
−1
Iperboloide Ellittico −1
1 1
Ellissoide senza punti reali 1
1
 −1 1 
Ellissoide con punti reali 1
1
1
32 Resta inteso il metodo che abbiamo usato: scelta la base ortogonale, la possibilità di scegliere il punto unità ad arbitrio
permette di ortonormalizzarla: il senso geometrico della cosa è chiaro, potendo utilizzare delle omotetie non ha senso
distinguere quadriche che si possono ottenere l’una dall’altra dilatandole di un fattore α.

Mat3M 2007/2008 51
Un discorso a parte merita la classificazione degli iperboloidi: potremo “alzare di una dimensione” il
disegno fatto in P 2 per ottenere una cosa del genere:
Sia P∞ l’intersezione Q ∩ π∞ . Prendiamo r∞ contenuta nel piano all’infinito: la polarità indotta da
Q associa ora punti a piani e rette a rette 33 . La polare di r∞ passa per P∞ , non giace su π∞ , e interseca
la quadrica in un altro punto (detto vertice del paraboloide) V . Scelta la base

V = σhv0 i, R1 , R2 = σhv1 i, σhv2 i, P∞ = σhv3 i


 ⋆
  −1

⋆ 1
la matrice ha la forma ⋆ e la scelta del punto unità porta alla forma ±1 : la scelta di
⋆ −1
+1, −1 dipende dalla segnatura della quadrica: si parlerà di paraboloide ellittico se sgn Q = (3, 1) (quindi
scegliendo −1) e di paraboloide iperbolico se sgn Q = (2, 2) (quindi scegliendo +1).

Quadriche nello Spazio Euclideo


Fissiamo in A 3 = P 3 (R ) \ π∞ una forma quadratica definita positiva. In una certa base essa avrà la
forma x20 + x21 + x22 + x33 = 0 (e quindi matrice 1): la sua intersezione con π∞ costituisce l’assoluto dello
spazio euclideo. (
x0 = 0
H :
x21 + x22 + x33 = 0
(è una conica senza punti reali tagliata sul piano all’infinito). Su ogni piano contenuto in A 3 viene quindi
indotta una metrica euclidea (con punti ciclici i punti di intersezione dell’assoluto dello spazio con la retta
impropria di quel particolare piano).
Due quadriche si diranno ora isometriche se esiste una isometria dello spazio che trasforma una nel-
l’altra: B = ̺X t AX ove X è isometria: X t X = 1. Nel caso di quadriche a centro dobbiamo determinare
un’origine e tre assi ortonormali che facciano da riferimento: il centro della quadrica si può trovare come
il punto di coordinate omogenee (A11 , −A12 , A13 , A14 )t (gli Aij sono i complementi algebrici di A), e
per trovare gli assi ci appelliamo al teorema spettrale, che ci permette di diagonalizzare ortogonalmente
la matrice A∞ . Il risultato è che ogni quadrica a centro è isometrica a
 −1 
D= a
b
c

resta da determinare solo ̺: un conto analogo a quello fatto per le quadriche porge che ̺ = − det A∞
det A . Ora
a seconda della quadrica si avranno dei parametri a, b, c concordi o discordi:
ˆ Se a ≥ b ≥ c > 0 si ha un’ellissoide con punti reali di equazione aX 2 + bY 2 + CZ 2 = 1

ˆ Se 0 > a ≥ b ≥ c si ha un’ellissoide senza punti reali (la matrice è definita)

ˆ Se a ≥ b > 0 > c si ha un’iperboloide iperbolico, se invece a > 0 > b ≥ c se ne ha uno ellittico.

Per quanto riguarda i paraboloidi facciamo delle considerazioni: si ha det A 6= 0 = det A∞ : in questo caso
non può esistere una forma canonica di A che sia diagonale, perché la matrice A∞ ha l’autovalore 0. Ciò
che dobbiamo fare è essenzialmente diagonalizzare A∞ per ricondurci ad una forma che sia simile a quella
ottenuta nella classificazione affine: possiamo trovare il coefficiente ̺ dopo qualche conto, imponendo
che il determinante delle due matrici resti invariato per isometrie. Per il resto, σhker A∞ i (il sottospazio
proiettivo generato dall’autospazio di 0) sia il punto di intersezione del paraboloide con il piano all’infinito.
Scegliamo poi v2 , v3 che sia base di autovettori (relativi ai due autovalori non nulli) per A∞ . Presa r∞ =
σhv1 , v2 i la sua polare è detta asse del paraboloide (passa per σhv3 i), e il secondo punto di intersezione
dell’asse con la quadrica è il vertice di quest’ultima. Scegliendo la base fatta da vertice e autovettori di
33 La retta polare secondo Q si può ottenere geometricamente come intersezione dei due piani polari di due qualunque

punti di r∞

Mat3M 2007/2008 52
 ⋆

a
A∞ (tenendo per ultimo quello che genera il suo nucleo) la matrice A ha forma b la possibilità di

riscalare le coordinate dell’origine permette poi di ricondursi alla forma canonica
 −1

a
D= b
−1

A seconda della segnatura di A si può poi parlare di paraboloide iperbolico o ellittico. La classificazione è
conclusa.

Sfere – Cerchi su Quadriche


Analogamente a quanto detto nel caso delle coniche, un’ellissoide è una sfera se a = b = c > 0. Intersecando
la sfera con l’iperpiano improprio si ha
(
x21 + x22 + x23 = x20 /a
⇒ x21 + x22 + x23 = 0
x0 = 0

cioè Q ∩ π∞ è tutto l’assoluto (generalizza quanto detto per i cerchi). Chiameremo dunque sfera (anche
in dimensioni più alte) ogni quadrica che contiene tutto l’assoluto.
Ci poniamo ora questo problema: ci sono piani che tagliano sulle quadriche dei cerchi? H e Q ∩ π∞
si intersecano in 4 punti a coppie complesse coniugate oppure in due punti doppi (non ci sono altre
possibilità)34 :
Fissato il piano all’infinito, i casi possibili sono 5, a seconda delle caratteristiche dell’intersezione
Q ∩ π∞ ∩ H (che è una conica, diciamola C∞ ):
ˆ C∞ è non degenere, a punti reali, e interseca l’assoluto in P QP̄ Q̄. Le rette (reali) P ∨ P̄ e Q ∨ Q̄
danno le giaciture dei piani che tagliano cerchi sulla quadrica.

P b
Q
b

b P

b
Q

ˆ C∞ è non degenere, a punti reali, e incontra l’assoluto in P P P̄ P̄ . In tal caso la retta P ∨ P̄ è


l’unica che taglia cerchi sulla quadrica (che è di rotazione attorno all’asse perpendicolare, cioè polare
secondo la metrica, a tale piano).

Q ∩ π∞
P b
Q
b

b P

Q b

ˆ C∞ è degenere, reale, di rango 235 e interseca l’assoluto in quattro punti P QP̄ Q̄. Le rette reali in
cui si spezza la conica C∞ sono già quelle che tagliano cerchi su Q.
34 Visto che c’è una certa difficoltà a trovare una nomenclatura non ambigua, usiamo questa notazione: l’intersezione

Q ∩ π∞ ∩ H può essere costituita o dal ciclo base P QP̄ Q̄ oppure da quello P P P̄ P̄


35 Non può essere reale di rango 1, altrimenti la quadrica sarebbe degenere.

Mat3M 2007/2008 53
P
b

b P

ˆ C∞ è degenere, e si spezza in due rette complesse coniugate r, r: le rette che tagliano cerchi su Q
sono quelle “trasverse” (si vede in figura). Ora, nulla vieta che la coppia di rette complesse coniugate
sia tangente all’assoluto. In quel caso (disegnarlo) l’unica giacitura che taglia cerchi su Q è quella
della retta che passa per i due punti di tangenza, e la quadrica è un paraboloide di rotazione (lungo
l’asse perpendicolare, cioè polare secondo la metrica, al piano)
r

P
b

H
r
b
P
b

b Q
b
Q

Complementi
Teorema di Laguerre Siano r, s due rette incidenti in P 36 . La formula di Laguerre dà un modo
elegante di caratterizzare l’angolo formato da r, s mediante il birapporto tra loro e le rette isotrope ρ, σ
del fascio F di centro P .
σ r ρ

b I b I¯
H
b A
b B
b
P
s

Prendiamo come riferimento P e due punti, A su r e B su s. Si ha allora


1 0 0
P = 0 A = a1 B = b1
0 a2 b2

r = ( 0 a2 −a1 ) = ( 0 1 m1 ) s = ( 0 b2 −b1 ) = ( 0 1 m2 ) ρ = (0 1 i) σ = ( 0 1 −i )
m2 −m1
1 + m1 m2 − i(m2 − m1 ) 1− i 1+m 1 m2
A questo punto (r s ρ σ) = (m1 m2 i − i) = = m2 −m1 .
1 + m1 m2 + i(m2 − m1 ) 1+ i 1+m 1 m2
Ricordando l’identità trigonometrica e2iθ = 1−it
1+it , ove t = tan θ, si ha
m2 − m1 m2 − m1
= tan θ =⇒ θ = arctan = rs
ˆ
1 + m1 m2 1 + m1 m2
1
Ora 2iθ = log(r s ρ σ) e dunque ha senso definire rs
ˆ = 2i log(r s ρ σ)37 . Q.E.D.
36 Lavoriamo nel piano quindi questo è sempre vero: la richiesta generale è che r, s non siano sghembe
37 Il logaritmo usato è il logaritmo principale del numero complesso di modulo 1 z = eiθ : ovviamente |z| = 1, e dunque
log eiθ = i arg z

Mat3M 2007/2008 54

Potrebbero piacerti anche