Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
GEOMETRIE di GALOIS
Antonio Maschietti
Dipartimento di Matematica
Università “La Sapienza”
ROMA
A.A. 2002–2003
ii 0.
Indice
1 Campi Finiti 1
1.1 Campi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Polinomi in una indeterminata . . . . . . . . . . . . . . . . . . . 3
1.3 Polinomi in più indeterminate . . . . . . . . . . . . . . . . . . . . 7
1.4 Zeri di un polinomio . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.5 Ampliamenti di campi . . . . . . . . . . . . . . . . . . . . . . . . 11
1.6 Classificazione dei campi finiti . . . . . . . . . . . . . . . . . . . . 16
1.7 Estensioni algebriche di un campo finito . . . . . . . . . . . . . . 18
1.8 Polinomi su campi finiti . . . . . . . . . . . . . . . . . . . . . . . 19
1.9 Funzioni polinomiali . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.10 Il Teorema di Chevalley–Warning . . . . . . . . . . . . . . . . . . 24
1.11 Equazioni di secondo grado . . . . . . . . . . . . . . . . . . . . . 26
3 Geometria affine 39
3.1 Sottospazi affini . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.2 Il gruppo affine . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4 Geometria proiettiva 47
4.1 Geometria affine e geometria proiettiva . . . . . . . . . . . . . . . 49
4.2 Informazioni numeriche sugli spazi proiettivi finiti . . . . . . . . 51
4.3 Gruppi proiettivi . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.4 Dualità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
5 Geometria Polare 57
5.1 Forme sesquilineari . . . . . . . . . . . . . . . . . . . . . . . . . . 57
5.2 Polarità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
5.3 Forme quadratiche . . . . . . . . . . . . . . . . . . . . . . . . . . 60
5.4 Gruppi di isometrie . . . . . . . . . . . . . . . . . . . . . . . . . . 62
5.5 Geometria simplettica . . . . . . . . . . . . . . . . . . . . . . . . 64
iv 0. INDICE
Campi Finiti
In questo capitolo esporremo gli aspetti fondamentali dei campi finiti, spesso
denominati anche campi di Galois. In particolare enunceremo e dimostreremo il
teorema che li caratterizza completamente e vedremo procedimenti costruttivi. I
prerequisiti che il lettore dovrebbe conoscere sono l’Algebra lineare e l’Algebra.
Come notazione, se A è un insieme finito il simbolo |A| indicherà il numero
degli elementi di A.
1.1 Campi
Un campo è un anello commutativo con unità i cui elementi non nulli formano
un gruppo. La definizione, per esteso, è la seguente.
Sia K un campo. Osserviamo che gli unici ideali di K (pensato come anello)
sono (0) e K. Infatti se I ⊆ K è un ideale e a ∈ I con a 6= 0, allora aa−1 = 1 ∈ I
e quindi I = K.
Introdurremo ora la nozione di caratteristica di un campo. Per ogni intero
positivo n ∈ N, definiamo n · 1 (qui 1 è l’identità moltiplicativa del campo K)
come la somma di 1 con se stesso n volte. È chiaro allora che n · 1 è un elemento
di K. Due casi possono verificarsi:
(1) n · 1 6= 0 per ogni n 6= 0, oppure
(2) esiste n > 1 tale che n · 1 = 0.
Nel caso (1) diremo che K ha caratteristica 0; nell’altro caso che K ha
caratteristica positiva. Inoltre, nel caso di caratteristica positiva, sia p il minimo
intero positivo (certo esistente) tale che p · 1 = 0. Proviamo che p deve essere
un numero primo. Se fosse p = rs con r > 1 ed s > 1 (quindi r < p ed s < p),
allora
p · 1 = (r · 1)(s · 1) = 0
con r · 1 e s · 1 entrambi non nulli; ciò è assurdo, dato che K non ha divisori
dello zero.
La caratteristica di K nel caso (2), in virtù di quanto precede, è il numero
primo p, definito come il minimo intero positivo tale che p · 1 = 0.
I campi Q, R e C hanno tutti caratteristica 0; mentre il campo Zp ha
caratteristica p (se p è un numero primo).
Un campo si dice finito se contiene un numero finito di elementi. È chiaro
che ogni campo finito ha caratteristica positiva p, con p numero primo.
1.2. Polinomi in una indeterminata 3
n+m
X
f (x)g(x) := ai bj xi+j .
i+j=0
È pressocché immediato verificare che K[x], con le due operazioni sopra definite,
è un anello commutativo con unità, privo di divisori dello zero. È anche facile
verificare che K[x] è uno spazio vettoriale su K di dimensione infinita, una sua
base essendo (1, x, x2 , . . . , xn , . . . ), n ∈ N.
Dalle definizioni che abbiamo dato segue facilmente che
Proposizione 1.2 Il grado del polinomio prodotto di due polinomi non nulli
uguaglia la somma dei loro gradi.
f = gq + r
1.2. Polinomi in una indeterminata 5
Dimostrazione: Scriviamo
f (x) = an xn + · · · + a0
g(x) = bm xm + · · · + b0 ,
ove n = deg(f ), m = deg(g), sicché an e bm sono entrambi non nulli. Il teorema
si dimostra per induzione su n.
Se n = 0 e deg(g) > deg(f ), poniamo q = 0 e r = f . Se deg(f ) = deg(g) = 0,
poniamo q = 0 e r = an b−1
m .
Si supponga che il teorema sia stato dimostrato per polinomi di grado < n
(con n > 0). Possiamo supporre deg(g) ≤ deg(f ) (altrimenti si assuma q = 0 e
r = f ). Allora
f (x) = an b−1
m x
n−m
g(x) + r1 (x)
dove deg(r1 ) < n. Per l’ipotesi induttiva, esistono q1 ed r tali che
f (x) = an b−1
m x
n−m
g(x) + q1 (x)g(x) + r(x) = (an b−1
m x
n−m
+ q1 (x))g(x) + r(x)
q(x) = an b−1
m x
n−m
+ q1 (x)
f = q1 g + r1 = q2 g + r2 ,
(q1 − q2 )g = r2 − r1 .
Poiché
deg(r2 − r1 )) = deg((q1 − q2 )g) = deg(q1 − q2 ) + deg(g)
e deg(r2 − r1 ) < deg(g), la precedente uguaglianza può sussistere soltanto se
q1 − q2 = 0, cioè q1 = q2 , e quindi r1 = r2 , come era da dimostrare.
f = qg + r
segue che d|f e d|g. È cosı̀ verificata la prima condizione perché d sia un MCD
di f e g. Inoltre è anche d = rf + sg, per qualche r, s ∈ K[x] (infatti d ∈ (f, g)).
Sia ora h ∈ K[x] un divisore comune di f e g. Allora
f = wh e g = zh .
Si ha pertanto
a(k) xk11 . . . xknn · b(h) xh1 1 . . . xhnn = a(k) b(h) xk11 +h1 . . . xknn +hn
L’ipotesi che il campo sia infinito è essenziale. Sia infatti K un campo finito
con q = pn elementi. Per definizione, K ∗ , che contiene q − 1 elementi, è un
gruppo abeliano. Quindi per ogni a ∈ K ∗ risulta aq−1 = 1 (conseguenza del
teorema di Lagrange sui gruppi finiti). Ne segue anche, per a 6= 0, aq = a,
ovvero aq − a = 0. Sicuramente la uguaglianza appena scritta vale anche se
a = 0. Concludiamo che il polinomio xq − x ha per zero ogni elemento di K,
ma chiaramente non è il polinomio nullo. Questo fatto è un tratto distintivo dei
campi finiti, che approfondiremo in seguito.
Dal teorema precedente sappiamo che se a ∈ K è uno zero del polinomio f ,
allora x − a divide f (x). Si dice che a ∈ K è uno zero di molteplicità m, con
m ≥ 1 intero, se (x − a)m divide f (x), ma (x − a)m+1 non divide f (x). In altre
parole, la molteplicità dello zero a di f è la massima potenza di x − a che divide
f (x). Se la molteplicità dello zero a è strettamente maggiore di 1 diremo che a
è uno zero multiplo, od anche che è una radice multipla. Nel caso m = 1, lo zero
si dice semplice. Si può anche considerare il caso che m possa essere 0, cioè che
l’elemento a non sia uno zero di f . La definizione ora data può allora esprimersi
dicendo che per ogni a ∈ K esiste la fattorizzazione
(f + g)0 = f 0 + g 0 , (f g)0 = f 0 g + f g 0
e, se a ∈ K,
(af )0 = af 0 .
Teorema 1.3 Siano a, b elementi del campo K. Allora per ogni intero n ≥ 0
n
n
X n n−k k
(a + b) = a b .
k
k=0
Omettiamo la dimostrazione.
Sia L un ampliamento di K. Per α ∈ L definiamo
Iα := {f (x) ∈ K[x] | f (α) = 0} .
Iα è l’insieme di tutti i polinomi di K[x] che hanno α come zero. Questa
definizione è ben posta, nel senso che K[x] ⊂ L[x]: ogni polinomio a coefficienti
in K è anche un polinomio di L[x]; quindi f (x) ∈ K[x] induce una funzione
polinomiale su L.
È facile verificare che Iα è un ideale di K[x]. Poiché K[x] è a ideali principali,
esiste un polinomio p(x) ∈ K[x] tale che
Iα = (p(x)) .
Quindi ogni polinomio di Iα è un multiplo di p(x). Le possibilità per Iα sono
due:
(I) Iα = (0); non esiste cioè alcun polinomio non nullo di K[x] che abbia α
come zero: si dice che l’elemento α ∈ L è trascendente su K;
(II) Iα = (p(x)) e deg(p) ≥ 1. In questo caso l’elemento α ∈ L si dice algebrico
su K.
Esaminiamo più attentamente il caso che l’elemento α ∈ L sia algebrico su
K. Si ha Iα = (p(x)) e deg(p) ≥ 1. Tra tutti i polinomi f (x) ∈ K[x] che hanno
α come zero p(x) ha grado minimo e deg(p) = 1 se e solo se α ∈ K. Poiché p(x)
ha grado minimo, p è un polinomio irriducibile. Possiamo “normalizzare” p di
modo che abbia coefficiente direttore uguale ad 1, cioè renderlo monico. Con
questa normalizzazione p(x) si dice il polinomio minimo di α. Osserviamo che
essendo p(x) irriducibile, l’ideale (p(x)) è massimale e quindi l’anello quoziente
K[x]/(p(x))
è un campo. Abbiamo provato
Proposizione 1.8 Sia α ∈ L ⊃ K algebrico su K. Allora il polinomio minimo
di α è irriducibile e K[x]/(p(x)) è un campo.
Cerchiamo una descrizione per K[x]/(p(x)). A tal fine, denotiamo con K[α]
il sottoinsieme di L che consiste di tutte le combinazioni lineari finite delle
potenze di α a coefficienti in K. Si tratta evidentemente di un sottoanello di L.
Consideriamo l’omomorfismo di anelli
K[x] → K[α]
che è l’identità su K e trasforma x in α. È un omomorfismo suriettivo. Infatti
se γ ∈ K[α] allora
γ = a0 + a1 α + a2 α2 + · · · + as αs
e il polinomio
f (x) = a0 + a1 x + · · · + as xs
calcolato in α è esattamente γ. Sussiste allora la proposizione seguente.
1.5. Ampliamenti di campi 13
f (α) = r(α) = b0 + b1 α + · · · + bs αs
di K e verificante le proprietà formali (1), (2), (3) e (4) che abbiamo assegnato
per definire i polinomi in una indeterminata. Imponiamo ad α la condizione
p(α) = 0 e denotiamo con K[α] l’insieme di tutte le combinazioni lineari finite
di potenze di α. Allora K[α] è un anello, oltre che un spazio vettoriale su K. Si
ha inoltre un omomorfismo di anelli
K[x] → K[α]
K[x]/(p(x)) ∼
= K[α] .
R[x]/(x2 + 1) ∼
= R[i]
R[i] = {a + bi | a, b ∈ R} .
Z3 [x]/(x2 + 1) ∼
= Z[i]
Z2 [ω] = {0, 1, ω, 1 + ω} .
ω(ω + 1) = ω 2 + ω = 1
ω2 = ω + 1
ω 3 = ω 2 ω = (ω + 1)ω = ω 2 + ω = 1 .
♥
Proposizione 1.16 Per ogni numero primo p e per ogni intero n ≥ 1 esiste
un campo finito avente esattamente q = pn elementi.
Queste due proposizioni ci dicono, in sostanza, che ogni campo finito di or-
dine q = pn è isomorfo al campo di spezzamento del polinomio xq − x. Questo
campo è generalmente chiamato il campo di Galois di ordine q, e viene deno-
tato GF (q) (GF sta per Galois field. Altra notazione per il campo finito con q
elementi è F q ). Più generalmente, ogni campo finito è anche chiamato campo
di Galois.
Vogliamo ora esaminare la struttura additiva e moltiplicativa del campo
finito K = F q di q = pn elementi. Già sappiamo che come gruppo additivo
F q è isomorfo al prodotto cartesiano di n copie di Zp . Consideriamo allora il
gruppo moltiplicativo F ∗q . È un gruppo commutativo di ordine q − 1. Se N è il
minimo comune multiplo degli ordini degli elementi di F ∗q , allora esiste in F ∗q
un elemento g di ordine N . Inoltre, ogni elemento di F ∗q è zero del polinomio
xN − x, che ha grado N . Quindi deve essere N ≥ q − 1; ma per costruzione N
divide q − 1 e dunque N ≤ q − 1. In conclusione N = q − 1. Pertanto g è un
elemento di ordine q − 1 ed è un generatore di F ∗q . Abbiamo provato
Ker(um ) = {x ∈ F ∗q | xm = 1}
d = a(q − 1) + bm .
|Im(um )| = |Im(ud )| .
18 1. Campi Finiti
a(q−1)/d = 1 .
σi : F q m → F q m
i
definita da σi (a) = aq , a ∈ F qm , è un automorfismo di F qm che fissa tutti gli
elementi di F q . Sia j ≥ 0 un altro intero. Allora σi+j è un altro automorfismo
di F qm che fissa tutti gli elementi di F q ; inoltre
σi+j = σi ◦ σj = σj ◦ σi .
Si può dimostrare che quelli definiti, per 0 ≤ i ≤ m−1, sono tutti e soli gli auto-
morfismi di F qm che fissano tutti gli elementi di F q ; inoltre questi automorfismi
formano un gruppo ciclico di ordine m.
Definiamo le due seguenti applicazioni di F qm in F q :
l’applicazione traccia
2 m−1
T : F qm → F q , T(x) = x + xq + xq + · · · + xq
l’applicazione norma
2 m−1 m
−1)/(q−1)
N : F qm → F q , N(x) = x · xq · xq · · · · · xq = x(q .
1.8. Polinomi su campi finiti 19
H = {xq − x | x ∈ F qm }
x ∈ F q m → xq − x ∈ F q m
R ∩ I = (0) .
b1 xq−1
1 + . . . bq−1 x1 + bq
1.8. Polinomi su campi finiti 21
K[X] = R + J .
quindi
s −(q−1)
xs11 = x11 + x1s1 −q (xq1 − x1 ) .
Se è s1 − (q − 1) ≥ q, si ripete il procedimento.
x5 = x3 + x2 (x3 − x) .
Il monomio −x3 y 3 va ridotto sia rispetto alla x sia rispetto alla y. Riducendo
rispetto alla x si ha:
−x3 y 3 = −xy 3 − y 3 (x3 − x) .
Operiamo ora allo stesso modo sul monomio −xy 3 che non è ridotto nella y:
Quindi
e
F ∗ (x, y) = x3 − 2xy + y 2 = x3 + xy + y 2
tenendo in conto che in Z3 , −2 ≡ 1 (mod 3). ♥
Lemma 1.3 Si ha I = J.
deg(F ∗ ) ≤ deg(F ) .
In questo modo F è sia un anello sia uno spazio vettoriale su K. Una base di F
sopra K è la seguente. Per ogni a ∈ K n definiamo l’applicazione
χa : K n → K
assume il valore 1 su a e vale 0 altrove (si ricordi che aq−1 = 1 per ogni elemento
non nullo di K).
Sia ora
ϕ : K[X] → F
l’applicazione che al polinomio F ∈ K[X] associa la funzione polinomiale indotta
da F ; è chiaro che una tale funzione appartiene a F e che ϕ è un omomorfismo
di anelli.
K[X]/J ∼
=F.
F1 (X) = 0 , . . . , Fs (X) = 0
Corollario 1.4 (Teorema di Chevalley) Nelle stesse ipotesi del Teorema 1.9,
se inoltre ciascuno dei polinomi F1 , . . . , Fs è privo del termine costante, allora
il sistema
F1 (X) = 0, F2 (X) = 0, . . . , Fs (X) = 0
ha almeno una soluzione non banale (diversa cioè dalla soluzione (0, . . . , 0)) in
K n.
Dimostrazione: L’assenza di termini costanti comporta che (0, . . . , 0) è una
soluzione del sistema. Quindi N ≥ 1. Poiché p divide N (Teorema 1.9), deve
essere N ≥ p; allora il numero N − 1 delle soluzioni non banali del sistema è
N − 1 ≥ p − 1 ≥ 2 − 1 = 1.
ax2 + bx + c = 0 , a 6= 0 . (1.1)
4a(ax2 + bx + c) = 0
ax2 + c = 0
equivale alla
c
x2 =
a
(si osservi che in un campo di caratteristica 2 si ha −1 = 1; quindi si può omet-
tere il segno −). La precedente equazione ha dunque soluzione se e solo se c/a è
un quadrato. Questa condizione è sempre verificata se il campo è finito, dato che
allora l’applicazione x 7→ x2 è un automorfismo del campo (è l’automorfismo di
Frobenius).
Sia ora b 6= 0. L’equazione data è equivalente alla
a 2 a ac
x + x + 2 = 0;
b b b
da cui, posto
a
y= x
b
si trae
ac
y2 + y = .
b2
1.11. Equazioni di secondo grado 27
Segue allora che se esiste una soluzione α della precedente equazione, risulta
ac
= α2 + α .
b2
Supponiamo che K = F q con q = 2n . Consideriamo l’applicazione
Ta : F q → Z2
definita ponendo
n−1
Ta (x) = x + x2 + · · · + x2 .
L’applicazione Ta è la traccia assoluta di F q (cioè è l’applicazione traccia di F q
sopra Z2 ). È un facile esercizio verificare che
T0 = {x ∈ F q | Ta (x) = 0}
T1 = {x ∈ F q | Ta (x) = 1}
Si osservi che T0 ∩ T1 = ∅ e che |T0 | = |T1 | = q/2. Inoltre
T0 = Ker(Ta ) ;
ax2 + bx + c = 0
(x + y)α = xα + y α , (xy)α = xα y α .
Il simbolo |A| sarà utilizzato per indicare il numero degli elementi dell’insieme
finito A.
Il caso che tratteremo più a fondo è quello in cui il campo K è il campo
di Galois GF (q), con q potenza di un numero primo. In tal caso ovviamente
ogni spazio vettoriale di dimensione finita su K consiste di un numero finito di
vettori. Precisamente:
(x1 , . . . , xn ) → (x1 , . . . , xn )
Gli elementi della n−pla (x1 , . . . , xn ) sono le coordinate (o, componenti) del
vettore v. Adotteremo la convenzione di considerare le n−ple di coordinate dei
vettori come matrici n × 1 (vettori colonna).
Sia T un operatore lineare di V . Avendo fissato la base B, all’operatore
T resta associata una ben determinata matrice quadrata di ordine n, la cui
colonna i−esima rappresenta le coordinate del vettore T (v i ), i = 1, . . . , n. Con
questa definizione, se X è la n−pla delle coordinate del vettore v, allora il
vettore trasformato T (v) ha coordinate date dalla n−pla AX (prodotto righe
per colonne della matrice A associata a T e della matrice colonna X). Se T è un
automorfismo, allora la matrice ad esso associato è invertibile. Abbiamo dunque
Proposizione 2.2 Fissata una base di V , esiste una corrispondenza biunivoca,
che è un isomorfismo di gruppi, tra il gruppo lineare generale di V e le matrici
invertibili di ordine n.
Sia T ∈ GL(V ). Al variare della base B di V , la matrice associata a T
descrive una classe completa di matrici simili. Quindi il determinante e la la
traccia dell’operatore lineare T sono den definiti; li denoteremo con det(T ) e
Tr(T ). Se l’automorfismo lineare T di V ha determinante uguale ad 1, diremo che
T è unimodulare. Gli automorfismi unimodulari di V sono un gruppo, denotato
con SL(V ) e detto gruppo lineare speciale.
j : ΓL(V )→Aut(K)
con GL(n, q). Con SL(n, K) (risp., SL(n, q)) denoteremo il gruppo delle matrici
su K (risp., GF (q)) d’ordine n il cui determinante vale 1.
3. |ΓL(V )| = r|GL(V )|
Dimostrazione: Siano (e1 , . . . , en ) e (f 1 , . . . , f n ) due basi ordinate di V .
Esiste uno ed un solo automorfismo lineare L ∈ GL(V ) tale che L(ei ) = f i ,
i = 1, . . . , n. Pertanto |GL(V )| uguaglia il numero delle basi ordinate di V .
Calcoliamo questo numero. Il primo elemento di una base ordinata può essere
un qualunque vettore non nullo e quindi può essere scelto in q n − 1 modi; il
secondo elemento deve essere linearmente indipendente dal primo; quindi può
essere scelto in q n − q modi; in generale l’(i + 1)-esimo elemento della base può
essere scelto fuori del sottospazio generato dai primi i elementi della base; quindi
si hanno q n − q i scelte possibili. Allora
T(L,α) : v ∈ V → L(v α ) ∈ V
è un isomorfismo di gruppi.
Pertanto lo studio del gruppo ΓL(V ) si riconduce allo studio del gruppo
GL(V ) e del gruppo degli automorfismi del campo.
Ker(T ) = {v ∈ V | T (v) = 0}
e l’immagine
Dimostrare:
una loro combinazione lineare che dia il funzionale nullo. Allora per ogni ej
risulta !
Xn n
X
ai fi (ej ) = ai fi (ej ) = aj = 0 ;
i=1 i=1
Sia E = (e1 , . . . , en ) una base per V . Assumiamo come base per K l’elemento
1. Sia f un funzionale lineare. La matrice di f relativa alle due basi scelte è la
matrice A di ordine 1 × n le cui colonne sono i valori che f assume sui vettori
della base E. Sia A = (a1 , . . . , an ). Se v ∈ V ha coordinate X = (x1 , . . . , xn )t
allora il vettore f (v) ha nelle basi fissate coordinate AX. Quindi Ker(f ) ha
equazione cartesiana AX = 0, cioè
a1 x1 + · · · + an xn = 0 .
(i) T (v) = v, se v ∈ H,
(ii) T (v) − v ∈ H, se v ∈
/ H.
Dimostrazione: Sia b ∈
/ H. Poniamo
c = f (b)−1 b ; a = T (c) − c .
Per ogni x ∈ V si ha
Pertanto
x − f (x)f (b)−1 b = x − f (x)c ∈ H .
36 2. Geometria degli Spazi Vettoriali
da cui
T (x) = x − f (x)[c − T (c)] = x + f (x)a .
Si noti che la medesima trasvezione può essere individuata da più coppie di-
verse (f, a). Però, se T non è l’identità, sono univocamente individuati il suo
asse, Ker(f ), ed il suo centro span(a). Abbiamo già osservato che l’identità può
considerarsi come una trasvezione; nella formula che la descrive si assume f = 0
oppure a = 0.
Teorema 2.1 Per ogni f, f1 , f2 ∈ V 0 e a, a1 , a2 ∈ V si hanno le seguenti
identità.
1. Tf,a1 +a2 = Tf,a1 ◦ Tf,a2
2. Tf1 +f2 ,a = Tf1 ,a ◦ Tf,a2
3. S ◦ Tf,a ◦ S −1 = Tf (S −1 ),S(a) , per ogni S ∈ GL(V ), ove f (S −1 ) è il fun-
zionale lineare definito da
f (S −1 )(v) = f (S −1 (v)) .
−1
Dalla identità 1. segue in particolare che Tf,a = Tf,−a .
Corollario 2.1 La totalità delle trasvezioni aventi lo stesso asse H = Ker(f )
è un gruppo commutativo isomorfo al gruppo additivo del sottospazio H.
Vediamo come possono rappresentarsi con matrici le trasvezioni aventi lo
stesso asse H. Fissiamo la base E = (e1 , . . . , en−1 , en ) di modo che (e1 , . . . , en−1 )
sia una base per H. Allora se T è una trasvezione di asse H si ha
T (ei ) = ei , i = 1, . . . , n − 1
n−1
X
T (en ) − en = ai ei .
i=1
2.3. La struttura di SL(V ) 37
Quindi la matrice di T è
1 0 ... 0 a1
0 1 ... 0 a2
. . .
A= ... ... ... ...
0 0 ... 1 an−1
0 0 ... 0 1
I + aEij
(I + aEij )A = A + aEij A
XP = {Tf,u | f ∈ V 0 , f (u) = 0} .
Geometria affine
Gli spazi affini, e come vedremo più oltre gli spazi proiettivi, forniscono l’ambien-
te geometrico nel quale più adeguatamente si studiano gli spazi vettoriali. In
effetti, in uno spazio vettoriale c’è un elemento privilegiato, il vettore nullo, che
in diverse situazioni ha un ruolo speciale; ad esempio, è fissato da ogni trasfor-
mazione semilineare. Per rendere uno spazio vettoriale “omogeneo”, tale cioè
che tutti i suoi vettori abbiano lo stesso ruolo, bisognerà aggiungere trasfor-
mazioni che rendano appunto i vettori indistinguibili. Queste trasformazioni
sono le traslazioni ed è su di esse che si basa il concetto di spazio affine. In tutto
quel che segue K è un campo fissato.
Definizione 3.1 Uno spazio affine su K è una coppia (A, V ), ove A è un
insieme non vuoto, i cui elementi diremo punti e V uno spazio vettoriale su K,
tale che esista un’applicazione
Φ:V ×A→A
verificante i due seguenti assiomi:
(A1) per ogni v, w ∈ V e per ogni punto P ∈ A,
Φ(0, P ) = P e Φ(v + w, P ) = Φ(v, Φ(w, P )) ;
Si noti allora che il simbolo + è usato sia per la somma di due vettori sia per la
“somma punto–vettore”. Gli assiomi di spazio affine si riscrivono allora
(A1) per ogni v ∈ V e P ∈ A
0+P =P , (v + w) + P = v + (w + P )
(A2) per ogni coppia di punti P, Q esiste esattamente un vettore v tale che
v + P = Q.
Dagli assiomi (A1) e (A2) segue che ciascun vettore v ∈ V induce una cor-
rispondenza biunivoca dell’insieme A in sé. Denoteremo questa corrispondenza
con tv e la chiameremo traslazione di vettore v; dunque
t0 = I e che tv+w = tv ◦ tw .
→
− :A×A→V
−−→
che associa alla coppia di punti (P, Q) il vettore P Q e che gode delle seguenti
proprietà, per ogni scelta dei punti P, Q, R:
−−→
(B1) P + P Q = Q
−−→ −−→ −→
(B2) P Q + QR = P R (regola del parallelogramma).
Si può dimostrare che queste due proprietà possono essere assunte come assiomi
per gli spazi affini e da esse discenderebbero gli assiomi (A1) e (A2). Si osservi
−−→
che talvolta si usa scrivere il vettore P Q come Q − P , di modo che formalmente
si può operare algebricamente sui punti. Negli esempi useremo l’una o l’altra
delle applicazioni Φ oppure → − per descrivere gli spazi affini. Inoltre porremo
per definizione P + v = v + P , per ogni punto P ed ogni vettore v.
♥ Esempio. Ogni spazio vettoriale V può essere riguardato come uno spazio
affine. Si definisce l’insieme dei punti A coincidente con l’insieme V dei vettori.
L’applicazione Φ : V × A → A associa alla coppia (v, w) il punto v + w. Gli
assiomi sono facilmente verificati.
Se, in questo esempio, si prende in particolare, V = K n , si ottiene lo spazio
affine numerico di dimensione n sopra K. Questo spazio affine è denotato con
An (K). ♥
Definizione 3.2 Sia (A, V ) uno spazio affine. Un riferimento affine nello spazio
A consiste di un punto O ∈ A (origine) ed di una base (e1 , . . . , en ) di V ; si de-
nota con RA(Oe1 . . . en ).
U = U + P0 = {u + P0 | u ∈ U } = P0 + U .
U =U +P
per ogni P ∈ U.
Se U è un sottospazio e U = U + P0 , si dice che U è il sottospazio passante
per il punto P0 ed avente giacitura U (oppure, anche, parallelo ad U ).
Nel seguito useremo liberamente il linguaggio tipico della geometria elemen-
tare. Ad esempio, se P è un punto del sottospazio U diremo che U “passa”per
il punto P o che è “incidente”il punto P .
I sottospazi di dimensione 0 sono tutti e soli i singoli punti di A.
I sottospazi di dimensione 1 si dicono rette; in tal caso invece che di giacitura
si parla di direzione. Se R è una retta, allora
R = P0 + U
ove t ∈ K.
Il teorema che segue stabilisce il legame tra gli spazi affini e la teoria dei
sistemi di equazioni lineari.
Teorema 3.1 Sia A uno spazio affine di dimensione n e sia RA(Oe1 . . . en )
un riferimento affine. Allora se
a11 x1 + · · · + a1n xn = b1
a21 x1 + · · · + a2n xn = b2
..
.
as1 x1 + · · · + asn xn = bs
ϕ : A1 → A2
ϕ∗ : V1 → V2
equivale all’altra:
per ogni P, Q ∈ A1 , se Q = P + v, con v ∈ V1 , allora
Geometria proiettiva
Gli spazi proiettivi nascono dall’esigenza di costruire una geometria nella quale
venga eliminata la nozione di parallelismo, introdotta negli spazi affini. Inoltre
gli spazi proiettivi sono l’ambiente nel quale meglio si interpretano i concetti
dell’algebra lineare e i gruppi lineari.
Definizione 4.1 Sia V un K−spazio vettoriale di dimensione finita. Lo spazio
proiettivo associato a V è l’insieme P (V ) i cui elementi, detti punti, sono i
sottospazi vettoriali di dimensione 1 di V .
La dimensione di P (V ) è definita come dim(V )−1 e si denota con dim(P (V )).
Nel caso dim(P (V )) = 1 oppure 2 lo spazio proiettivo P (V ) è detto retta proi-
ettiva oppure piano proiettivo.
Ogni vettore non nullo v di V genera un sottospazio vettoriale di dimensione
1:
span(v) = {av | a ∈ K} .
Quindi span(v) determina un punto di P (V ). I punti di P (V ) sono denotati con
lettere latine maiuscole. Se P è un punto, la scrittura
P = [v]
P (U ) ∩ P (W ) = {P ∈ P (V ) | P ∈ P (U ), P ∈ P (W )} .
È facile provare che
P (U ) ∩ P (W ) = P (U ∩ W ) .
La definizione data non esclude che P (U ) ∩ P (W ) = ∅, e ciò accade se e solo se
U ∩ W = {0}.
Il sottospazio congiungente P (U ) e P (W ) è per definizione il sottospazio
P (U + W ).
Sussiste il teorema seguente, che è la versione proiettiva della formula di
Grassmann.
Teorema 4.1 Sia P (V ) uno spazio proiettivo di dimensione n definito da V .
Se P (U ) e P (W ) sono sottospazi proiettivi, allora
dim(P (U + W )) = dim(P (U )) + dim(P (W )) − dim(P (U ∩ W )) .
La dimostrazione si ottiene applicando la formula di Grassmann.
Si dice che i punti P1 = [v 1 ],..., Pk = [v k ] dello spazio proiettivo P (V ) sono
indipendenti (risp., dipendenti) se i vettori v 1 ,..., v k sono linearmente indipen-
denti (risp., linearmente dipendenti). Inoltre la scrittura
a1 P1 + · · · + ak Pk , con ai ∈ K
denota il punto proiettivo
[a1 v 1 + · · · + ak v k ] .
4.1. Geometria affine e geometria proiettiva 49
Si verifiche che queste definizioni sono ben poste. Si definisce allora sottospazio
generato dai punti P1 , . . . , Pk il sottospazio proiettivo
L(P1 , . . . , Pk ) = hv 1 , . . . , v k i .
e il punto
U = [v 0 + v 1 + · · · + v n ] = (1, 1, . . . , 1)
si dicono, rispettivamente, punti fondamentali e punto unità del riferimento
proiettivo.
(q n − 1)(q n − q) . . . (q m − q m−1 ) .
P GL(V ) ∼
= GL(V )/Z
P SL(V ) ∼
= SL(V )/(Z ∩ SL(V ))
Per analogia, i gruppi P ΓL(V ), P GL(V ), P SL(V ) sono anche detti, rispet-
tivamente, gruppo semilineare proiettivo generale, gruppo lineare proiettivo gen-
erale, gruppo proiettivo speciale.
Abbiamo visto che nel caso dei gruppi lineari un ruolo speciale spetta alle
trasvezioni. Vediamo che tipo di collineazioni inducono.
Definizione 4.5 Una collineazione non identica ϕ di P (V ) è detta centrale se
esiste un punto C di P (V ), tale che ϕ trasformi in sé ogni sottospazio contenente
C. Il punto C è detto centro di ϕ.
4.4 Dualità
Sia V 0 lo spazio duale del K−spazio vettoriale V , che supporremo di dimensione
finita. Lo spazio proiettivo P (V 0 ) si chiama lo spazio proiettivo duale di P (V ).
54 4. Geometria proiettiva
Ker(ϕ) = {v ∈ V | ϕ(v) = 0}
(X a )a = X e (S a )a = S .
Dimostrazione: Esercizio.
inoltre
dim(span(δ −1 (H1 ), . . . , δ −1 (Hn−k ))) = n − k − 1 .
In questo modo si ottiene una correlazione di P (V ). Esplicitamente questa cor-
relazione opera al seguente modo. Sia S un sottospazio di P (V ) con dim(S) = k.
Si associa ad S l’annullatore S a = {[ϕ] ∈ P (V 0 ) | ϕ(v) = 0 per ogni [v] ∈ S
e quindi Λ1 (S) = {Ker(ϕ) | [ϕ] ∈ S a }. Ora ogni iperpiano di Λ1 (S) può essere
espresso come combinazione lineare di opportuni n − k iperpiani H1 , . . . , Hn−k .
Allora la correlazione che stiamo descrivendo associa ad S il sottospazio
Geometria Polare
β(v, w) = f (w)(v) .
f (w) = β(−, w) .
Dimostrazione: Esercizio.
Sia β una forma σ−sesquilineare. Una coppia di vettori (v, w) si dice or-
togonale se β(v, w) = 0. In generale non accade che β(v, w) = 0 implichi
β(w, v) = 0, il che rende asimmetrica la relazione di ortogonalità. Pertanto
ci interesseremo soltanto alle forme sesquilineari riflessive.
Definizione 5.2 Una forma sesquilineare β è detta riflessiva se
Segue allora dal teorema fondamentale della geometria proiettiva che la forma
σ−sesquilineare β e la forma τ −sesquilineare γ inducono la stessa correlazione
di P (V ) se e solo se, per qualche b ∈ K,
σ = τ e γ(v, w) = bβ(v, w) .
4. (X ∩ Y )⊥ = X ⊥ + Y ⊥ .
X σ = (xσ1 , . . . , xσn )t .
β(v, w) = X t AY σ .
5.2 Polarità
Una polarità è una correlazione di P (V ) di ordine due. Se π è una polarità si
dice che la coppia (P (V ), π) determina una geometria polare. Osserviamo che
una correlazione π è una polarità se e solo se π = π −1 . Ciò significa che se β è
la forma σ−sesquilineare associata a π, allora π è indotta sia dall’isomorfismo
−1
v 7→ β(−, v) sia dall’isomorfismo u 7→ β(u, −)σ . Infine è ora facile verificare
che π è una polarità se e solo se la forma associata β è riflessiva (infatti, β è
riflessiva se e solo (X ⊥ )⊥ = X). Dunque classificare le polarità che si possono
definire su P (V ) equivale a classificare i tipi di forme σ−sesquilineari che si
possono definire su V . A tal proposito sussiste il seguente teorema.
Dimostrazione: Omessa.
Q0 : V → K
Q(v) = Q(x1 e1 + · · · + xn en )
si ottiene
n
X X
Q(v) = Q((x1 , . . . , xn )) = x2i Q(ei ) + xi xj aij .
i=1 1≤i<j≤n
M = (bij )i,j=1,...,n ,
ove (
aij = β(ei , ej ) se i < j
bii = Q(ei ) e bij =
0 se i > j
Con questa definizione si ha, denotando con X la matrice delle coordinate di v
n
X X
Q(v) = Q((x1 , . . . , xn )) = X t M X = bii x2i + bij xi xj .
i=1 1≤i<j≤n
J = M + Mt .
Definizione 5.4 Sia Q una forma quadratica su V e sia β la sua forma polare.
Si dice che Q è non degenere se
Dimostrazione: Omessa.
Si osservi che l’indice di Witt è al più la metà della dimensione di V , dato che
se M è un sottospazio totalmente isotropo allora M ⊆ M ⊥ e
J = (β(ei , ej )) , i, j = 1, . . . , n .
5.5. Geometria simplettica 65
ove (
1 se i = j
β(ei , ej ) = β(f i , f j ) = 0 e β(ei , f j ) = δij = .
0 se i 6= 0
Una prima conseguenza è che dim(V ) = 2m è pari e che per ogni intero positivo
m esiste uno ed un solo spazio simplettico (a meno di isometrie).
La base ordinata (e1 , f 1 , . . . , em , f m ) determinata con il procedimento di
cui sopra è detta base simplettica. Se questa base viene riordinata nella base
(e1 , . . . , em , f 1 , . . . , f m )
At JA = J .
Quindi
det(A)2 = 1 .
Pertanto se g ∈ Sp(V ), allora det(g) = ±1. Di conseguenza, gli elementi di
Sp(V ) che hanno determinante uguale ad 1 formano un sottogruppo normale di
Sp(V ) (dato che ha indice 2 in Sp(V )) ed appartengono a SL(V ).
La determinazione di basi simplettiche porta alla conclusione che l’indice di
Witt di (V, β) è 1/2dim(V ), poiché, ad esempio, il sottospazio
M = he1 , . . . , em i
da cui
X q 2n − 1
H(n − 1) = H(n − 1) .
q−1
P ∈W (2n−1,q)
H(n) = (q n + 1)H(n − 1) , n ≥ 2
q 2n − 1 q 2n−1 .
V = he1 , f 1 i ⊥ he1 , f 1 i⊥ ,
V = he1 , f 1 , . . . , ej , f j i ⊥ he1 , f 1 , . . . , ej , f j i⊥
se e solo se det(A) = 1.
M = (bij )i,j=1,...,n ,
ove (
aij = β(ei , ej ) se i < j
bii = Q(ei ) e bij =
0 se i > j
Quindi, nel caso β non degenere, gli elementi di O(V, Q) si ripartiscono nei
due sottoinsiemi disgiunti, uno formato dagli elementi di determinante 1 (che
quindi sono elementi di SL(V )) e l’altro costituito dagli elementi di determi-
nante −1. Questa distinzione non sussiste nel caso di caratteristica due. Anzi
in caratteristica due si ha che O(V, Q) è un sottogruppo del gruppo simplettico
relativo alla forma polare di Q, se non degenere.
Nel caso di caratteristica diversa da due, gli elementi di O(V, Q) a deter-
minante 1 si chiamano rotazioni. Questi elementi formano un sottogruppo di
indice 2, quindi è un sottogruppo normale, detto gruppo speciale ortogonale e
denotato con SO(V, Q).
Nel caso generale, la trasformazione scalare aI, con a ∈ K ∗ , appartiene ad
O(V, Q) se e solo se a2 = 1, da cui a = ±1. Quindi il gruppo ortogonale proiettivo,
denotato con P O(V, Q), è isomorfo a
(Si tenga conto della relazione che lega Q e β). Pertanto la coppia (e1 , f 1 ) è
una coppia iperbolica (eventualmente alterando f 1 per un fattore non nullo) e
genera un piano iperbolico.
V = he1 , f 1 i ⊥ he1 , f 1 i⊥
72 5. Geometria Polare
he1 , . . . , em i
Nel caso q pari (caratteristica due) ogni elemento del campo è un quadrato. Nel
caso dispari vi sono elementi quadrati e elementi non quadrati. In ogni caso,
comunque, il gruppo ortogonale è sempre lo stesso, dato che si può passare
dall’una all’altra forma quadratica moltiplicando per un non quadrato. Quindi
il gruppo ortogonale viene denotato, in ogni caso, con O(2m + 1, q). La forma
quadratica è detta di tipo parabolico.
III. dim(U ) = 2. Si ha dim(V ) = 2m + 2. Dal Lemma 5.2 possiamo scrivere
Allora
Q(xe + yf ) = x2 + xy + ay 2 , ove a = Q(f ) .
5.6. Geometria ortogonale 73
(e1 , f 1 , . . . , em , f m , e, f )