Sei sulla pagina 1di 123

Capitolo 1

Concetti fondamentali

1.1 Cenni sulla Teoria degli Insiemi


Lo scopo di questa sezione è di dare quel minimo di Teoria degli Insiemi
necessario per il nostro lavoro e di introdurre la notazione di base.
In Matematica esistono dei concetti detti primitivi che non sono defini-
bili; tali sono, per esempio in geometria, i concetti di punto, retta e piano.
Un’altro di questi concetti è quello di insieme, cioè una collezione di oggetti o
enti di qualsiasi specie presi con un dato criterio. Cosı̀ parliamo dell’insieme
degli abitanti della Provincia di Lodi o l’insieme N dei numeri naturali cioè
dei numeri 0, 1, 2, 3, . . . .1 Gli insiemi sono caratterizzati da una o più pro-
prietà; cosı̀ diciamo che un elemento x appartiene ad un insieme A quando
x ha la(le) proprietà caratterizzante(i) A. Per esempio, supponiamo che A
sia l’insieme dei numeri naturali caratterizzati dalla proprietà P di essere
dispari; scriveremo questo insieme in forma concisa come segue
A = {n ∈ N |n dispari }
– qui le graffette { } stanno a indicare che abbiamo un insieme, il simbolo ∈
ci dice che l’elemento n appartiene all’insieme N ed il simbolo | si traduce con
“tale che”. Di sopra abbiamo adoperato in modo intuitivo anche il simbolo
= (uguale a). Come si vedrà più avanti, a volte è necessario precisare cosa
si intenda con il concetto di uguaglianza.
Nell’insieme dei numeri naturali si possono fare due operazioni algebriche
importanti: la somma + e la moltiplicazione ×. Queste godono di importanti
proprietà; cominciamo con la somma.
1
In questo corso assumiamo il concetto di numero naturale come intuitivo; tuttavia la
definizione rigorosa di numero naturale è tutt’altro che semplice; infatti, solo verso la fine
del secolo 19o , il matematico tedesco Gottlob Frege riusci a ricongiungere l’idea di numero
naturale alla teoria degli insiemi.

1
2 CAPITOLO 1. CONCETTI FONDAMENTALI

S1 (Commutatività) Per qualsiasi a, b ∈ N, a + b = b + a. Sostituendo


l’espressione “per qualsiasi” con il simbolo logico ∀, possiamo riscrivere
la proprietà di commutatività nella forma concisa

(∀a, b ∈ N) a + b = b + a .

S2 (Associatività) (∀a, b, c ∈ N) (a + b) + c = a + (b + c) .

S3 (∀a ∈ N) a + 0 = 0 + a = a .

Per la moltiplicazione valgono le seguenti proprietà:

M1 (Commutatività) (∀a, b ∈ N) a × b = b × a .

M2 (Associatività) (∀a, b, c ∈ N) (a × b) × c = a × (b × c) .

M3 (∀a ∈ N) a × 1 = 1 × a = a .

Le due operazioni sono collegate tra di loro dalla


Proprietà Distributiva : (∀a, b, c ∈ N) a × (b + c) = (a × b) + (a × c) .
Partendo dai numeri naturali e con l’aiuto della somma, possiamo definire
altri “numeri”: dato un numero naturale qualsiasi a, definiamo il negativo
di a (anche detto inverso additivo di a) come l’unico “numero” x tale che
a + x = x + a = 0; l’inverso di a è anche denotato con il simbolo −a. Per
una questione di completezza troviamo conveniente scrivere esplicitamente
la proprietà che ogni intero ha un inverso:

S4 (∀a ∈ Z)a + (−a) = 0 .

Questa proprietà dovrebbe essere letta assieme alle proprietà S1, S2 e S3 dei
naturali scritte prima.
Si osservi che con questa definizione abbiamo costruito un insieme Z “più
grande” di N ed abbiamo esteso la definizione di somma agli elementi di Z.
L’insieme Z – detto insieme dei numeri interi – è “più grande” di N nel
senso che
(∀a ∈ N) a ∈ Z .
Simbolicamente scriviamo N ⊂ Z e leggiamo N è contenuto in Z. In gen-
erale, diciamo che un insieme A è contenuto in un insieme B (o che A è un
sottoinsieme di B) se, e soltanto se (∀a ∈ A) a ∈ B; simbolicamente,

A ⊂ B ⇐⇒ (∀a ∈ A) a ∈ B

(il simbolo ⇐⇒ stà per “se, e soltanto se”) .


1.1. CENNI SULLA TEORIA DEGLI INSIEMI 3

Ora siamo in condizioni di definire l’uguaglianza di insiemi: due insiemi


A e B sono uguali (scriviamo A = B) ⇐⇒ A ⊂ B e B ⊂ A.
Sia C un sottoinsieme di un insieme B; l’insieme differenza di B e C è
per definizione l’insieme

B \ C = {x ∈ B|x 6∈ C}

dove 6∈ è la negazione del simbolo logico ∈ e vuol dire che x non è un elemento
di C o in altre parole, x non appartiene a C. Diamo un esempio concreto
della differenza di due insiemi: consideriamo l’insieme dei numeri interi Z e
sia {0} il sottoinsieme di Z costituito dal solo elemento 0 ∈ Z; allora, Z \ {0}
è l’insieme dei numeri interi diversi da 0.
Siano A e B due insiemi dati; definiamo gli insiemi
1. intersezione A ∩ B = {x|x ∈ A e x ∈ B} ,
S
2. unione A B = {x|x ∈ A e/o x ∈ B} ,

3. prodotto (cartesiano) A × B = {(a, b)|a ∈ A e b ∈ B} .


Se gli insiemi A e B non hanno elementi in comune diciamo che A ∩ B è
vuoto e scriviamo A ∩ B = ∅ .
Una relazione da un insieme A ad un insieme B è semplicemente un
sottoinsieme R ⊂ A × B; se (a, b) ∈ R diciamo che l’elemento a ∈ A è in
relazione con l’elemento b ∈ B (scriviamo anche aRb invece di (a, b) ∈ R). Il
dominio di R è l’insieme

dom(R) = {a ∈ A|(∃b ∈ B) aRb}

(qui il simbolo ∃ significa “esiste”) e la portata di R è l’insieme

por(R) = {b ∈ B|(∃a ∈ A) aRb} .

Una relazione di equivalenza in un insieme A è una relazione R da A a se


stesso per la quale valgono le seguenti proprietà:
1. Riflessività : (∀a ∈ A) aRa ,

2. Simmetria : aRb ⇒ bRa (si legga: se aRb allora bRa) ,

3. Transitività : aRb e bRc ⇒ aRc .


Per qualsiasi a ∈ A, la classe di equivalenza a dell’elemento a determinata
dalla relazione di equivalenza R è l’insieme

a = {x ∈ A|aRx} ⊂ A .
4 CAPITOLO 1. CONCETTI FONDAMENTALI

Osserviamo subito che se due elementi a e b presi arbitrariamente in A non


sono equivalenti tramite R – scriviamo a¬Rb e qui ¬R indica la negazione
della proprietà R – allora
a∩b=∅ .
Infatti, se a ∩ b 6= ∅ allora esisterebbe un elemento x ∈ A|xRa e xRb. Le
proprietà di simmetria e transitività ci dicono allora che aRb contrariamente
all’ipotesi fatta su a e b. Vogliamo anche osservare che l’insieme A si scrive
nella forma [
A = a.
a∈A
Infatti: [ [
(∀a ∈ A)a ∈ a ⇒ a ∈ a⇒A⊂ a
a∈A a∈A
e [
(∀x ∈ a)(∃a ∈ A)x ∈ a ⇒ x ∈ A .
a∈A
Con questo abbiamo dimostrato il seguente risultato:
Teorema 1.1.1 Una relazione di equivalenza R in un insieme A determina
una partizione di A in classi di equivalenza disgiunte.
Denotiamo con A/R l’insieme delle classi di equivalenza definite da R in
A; l’insieme A/R è anche detto insieme quoziente di A per R.
Nell’insieme degli interi esiste un’altra operazione importante: la divi-
sione. Dati a, b ∈ Z, diciamo che a divide b (o che b è divisibile per a) se
esiste q ∈ Z tale che b = a × q (q è detto quoziente). Per esempio, 54 è
divisibile per 9 ma non lo è per 5. Adottiamo la notazione a|b per dire che
a divide b. Si osservi che il concetto di divisione appena introdotto definisce
una relazione in Z, la relazione di divisibilità; questa relazione è riflessiva e
transitiva come si può facilmente dimostrare, ma non è simmetrica (a|b e
b|a ⇐⇒ ±a = b). Fra non molto vedremo come si può ottenere una
relazione di equivalenza partendo dalla divisione (con resto). Prima però
osserviamo che possiamo “ordinare” l’insieme Z: diciamo che l’intero a è più
grande dell’intero b (notazione: a > b) se a + (−b) = a − b ∈ N \ {0}.2 In
questo modo scriviamo l’insieme Z nella forma
{. . . − 3, −2, −1, 0, 1, 2, 3, . . .}
e tra due elementi, il più grande è quello che si trova più a destra. Gli interi
a tali che a > 0 sono gli interi positivi. Per concludere queste osservazioni
sull’ordinamento degli interi osserviamo le seguenti proprietà:
2
Se includiamo lo zero, cioè se a − b ∈ N allora diciamo che a è più grande o uguale a
b e scriviamo a ≥ b.
1.1. CENNI SULLA TEORIA DEGLI INSIEMI 5

O1 La somma di due interi positivi è un intero positivo.


O2 Il prodotto di due interi positivi è un intero positivo.
O3 (∀a ∈ Z) vale soltanto una delle alternative seguenti: (i) a > 0, (ii) a =
0, (−a) > 0.
Queste tre proprietà caratterizzano Z come insieme ordinato.
Ora riprendiamo i nostri due numeri 54 e 5; il 5 non divide il 54 però sta
10 volte nel 54 cioè, 10 × 5 = 50 e 11 × 5 = 55 con 55 > 54 > 50; infatti,
possiamo scrivere 54 = 10 × 5 + 4. Con questo esordio scriviamo la seguente
definizione: a divide con resto l’intero b se esistono due interi q e r tali che
a > r ≥ 0 e b = a × q + r; l’intero r è detto resto della divisione di b per
a. Naturalmente, se r = 0, allora a|b. In un corso rigoroso di Algebra si
dimostra che la divisione con resto è sempre possibile nell’insieme degli interi
e che il quoziente ed il resto sono determinati in modo unico (cf. [?]).
Ora torniamo alle nostre relazioni di equivalenza. Sia a > 0 un numero
naturale fissato. Diciamo che due interi b e c sono equivalenti modulo a
e scriviamo b ≡ c (mod a), se nella divisione di b e c per a otteniamo il
medesimo resto r. La dimostrazione del fatto che l’equivalenza modulo a è
una relazione di equivalenza è lasciata agli Esercizi. Nell’esempio numerico
dato sopra vediamo che l’equivalenza (mod. 5) produce una partizione di Z
in cinque classi disgiunte: 0, 1, 2, 3 e 4.
Una funzione f da un insieme A ad un insieme B (scriviamo f : A → B)
è una relazione da A a B con dominio A che assegna ad ogni elemento di A
un unico elemento di B. Diamo alcuni esempi di funzioni.
La somma di numeri naturali è una funzione
+:N×N→N
che associa ad ogni coppia di numeri naturali (p, q) il numero naturale p + q
(osservazione: (∀(p, q), (r, s) ∈ N × N) (p, q) = (r, s) ⇐⇒ p = q e r = s).
Una funzione f : A → B determina (ed è determinata) dall’insieme
Ins(f ) ⊂ A × B = {(x, f (x)) ∈ A × B|x ∈ A e
(x, f (x)) = (y, f (y)) ⇐⇒ x = y} .
Una funzione f : A → B è iniettiva (risp. suriettiva) quando a due elementi
qualsiasi di A, f fa corrispondere due elementi distinti di B (risp. quando
per qualsiasi elemento b ∈ B esiste un elemento a ∈ A tale che f (a) = b).
Una funzione f : A → B che sia al medesimo tempo iniettiva e suriettiva è
detta biiezione. In simboli,
f : A → B iniettiva se (∀x, y ∈ A) f (x) = f (y) ⇐⇒ x = y ,
6 CAPITOLO 1. CONCETTI FONDAMENTALI

f : A → B suriettiva se (∀b ∈ B)(∃a ∈ A)f (a) = b .

1.2 Numeri razionali; numeri reali


Per definizione, l’insieme Q dei numeri razionali è l’insieme di tutte le coppie
(p, q) ∈ Z × Z tali che q =
6 0 e con la seguente definizione di uguaglianza:

(p, q) = (r, s) ⇐⇒ ps = qr .

Per dirlo con altre parole, osserviamo che la relazione di uguaglianza appena
definita è in effetti una relazione di equivalenza ≡ nell’insieme Z × (Z \ {0});
dunque, Q è l’insieme quoziente

Q = (Z × (Z \ {0}))/ ≡

(cfr. Teorema 1.1.1).


Consideriamo il sottoinsieme Q1 = {(p, 1)|p ∈ Z} di Q; la funzione

f : Z → Q1 , z 7→ (z, 1)

è una biiezione e cosı̀ possiamo identificare Z al sottoinsieme Q1 di Q e per


abuso di linguaggio scriviamo Z ⊂ Q . Possiamo ora estendere le definizioni
di somma e moltiplicazione degli interi ai razionali:

+:Q×Q→Q

(∀(p, q), (r, s) ∈ Q) (p, q) + (r, s) = (ps + rq, qs)


×:Q×Q→Q
(∀(p, q), (r, s) ∈ Q) (p, q) × (r, s) = (pr, qs) .
Il verbo “estendere” che abbiamo usato di sopra non è stato preso a caso:
infatti, le funzioni + : Q×Q → Q e × : Q×Q → Q applicate al sottoinsieme
Z × Z danno luogo a esattamente la somma e la moltiplicazione sugli interi.
Abbiamo scritto i razionali come coppie di numeri interi (a, b), con b = 6 0;
a
tuttavia i razionali sono scritti normalmente in forma frazionale b . D’ora in
poi adotteremo questa scrittura per i razionali.
Osserviamo che se b|a, cioè a = b × q per un certo intero q, allora il
razionale ab coincide con l’intero q.
Un intero p è detto primo se divisibile soltanto per se stesso e per l’unità 1;
per esempio, i numeri 2, 3, 5, 7, 11, 13 e 17 sono primi. Non si conoscono tutti
1.2. NUMERI RAZIONALI; NUMERI REALI 7

i primi e non abbiamo tutt’ora un algoritmo che ci permetta di individuare


i numeri primi; tuttavia, sappiamo già dall’antichità greca, che un numero
naturale può essere scritto in maniera unica come prodotto di potenze di
primi. Cosı̀ per esempio

630 = 2 × 32 × 5 × 7 , 5577 = 3 × 11 × 132 .

Questo fatto ci serve per capire che esistono numeri che non sono razionali; a
questa conclusione erano già arrivati Pitagora ed i suoi seguaci, verso il 530
A.C. ! Vediamo l’argomento. Prendiamo un quadrato di lato 1 e calcoliamo
la lunguezza d di una delle sue diagonali;√per il noto teorema di Pitagora sui
triangoli rettangoli d2 = 2 e dunque, d = 2. Supponiamo che d sia razionale,
cioè d = pq . Allora, p2 = 2q 2 . Ora 2 divide 2q 2 e perciò 2 divide p2 ; a causa
della decomposizione di un numero in potenze di primi sopra accennata, 2
divide p2 (o sta in p2 ) un numero pari di volte; ne segue che 2 deve per forza
dividere q 2 un numero pari di volte e perciò 2 divide 2q 2 = p2 un numero
dispari di volte (quelle pari in cui divide q 2 più una volta dovuto al fattore 2)
contradicendo la conclusione anteriore che 2 sta in p2 un numero pari di volte!
Un numero
√ che non sia il quoziente di due numeri interi come appunto è il
caso di 2 è detto numero irrazionale. Cosa sappiamo sui numeri irrazionali?
Tanto, e poco! Ad esempio, sappiamo che esistono infiniti numeri irrazionali
però non li conosciamo tutti; sappiamo che il numero π = C/d – il quoziente
della lunghezza di una circonferenza per √ il suo diametro – è irrazionale, ma
non sappiamo tutt’ora se il numero π 2 sia o no irrazionale! Per fortuna
c’è un’altro modo di studiare gli irrazionali, basato sulla scrittura decimale
dei numeri. Un qualsiasi numero naturale si scrive (in modo univoco) come
combinazione lineare di potenze intere non-negative del numero 10 (dieci) a
coefficienti nell’insieme {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}; cosı̀ il numero

537104 = 5 × 105 + 3 × 104 + 7 × 103 + 1 × 102 + 0 × 101 + 4 × 100

Abbiamo cosı̀ scritto i numeri interi in base 10. In questo modo i nu-
meri interi sono guardati come polinomi e le regole dell’algebra elementare
ci permettono di fare i calcoli in maniera efficace; in altre parole, possiamo
facilmente sommare, moltiplicare e dividere i numeri fra loro e così ottenere
anche una rappresentazione decimale dei razionali. Per esempio,
1 814
= 0, 3333... , = 23, 2571428571428571...
3 35
In queste rappresentazioni notiamo che esiste un gruppo di numeri (periodo)
che si ripete continuamente: in 0, 333... il numro 3 è ripetuto indefinitamente;
in 23, 2571428571428... il gruppo 571428 è ripetuto “ad infinitum”; questo
8 CAPITOLO 1. CONCETTI FONDAMENTALI

fenomeno accade sempre per il quoziente di due interi, cioè per i razionali.
D’altro canto, i numeri irrazionali non hanno questo comportamento:

π = 3, 14159265358979323846.... , 2 = 1, 4142....

in questi numeri non possiamo trovare un periodo che si ripeta! Non diamo la
dimostrazione di queste nostre affermazioni; lo studente potrà incontrarle in
altri corsi o in testi più specializzati. Ad ogni modo, le terremo per buone e ce
ne serviremo per costruire la retta reale. Intanto definiamo l’insieme dei nu-
meri reali R come l’unione dell’insieme Q dei numeri razionali e dell’insieme
I dei numeri irrazionali: R = Q ∪ I. È evidente che Q ∩ I = ∅. Abbiamo la
seguente successione di insiemi:

N⊂Z⊂Q⊂R

Ricordiamo che l’insieme Q è munito di due operazioni fondamentali: la


somma ed la moltiplicazione; queste coincidono con le operazione di somma
e moltiplicazione dei razionali scritti nella loro rappresentazione decimale e
cosı̀ estendiamo la somma, la moltiplicazione e le loro inverse (differenza e
divisione) anche ai reali. Per semplificare la notazione scriveremo ab invece
di a × b per qualsiasi a, b ∈ R. Ricapitoliamo quanto detto: l’insieme R dei
numeri reali è dotato di due operazioni

+:R×R→R , ×:R×R→R

con le seguenti proprietà:

A Proprietà Associativa: (∀a, b, c ∈ R) (a + b) + c = a + (b + c) e (ab)c =


a(bc) .

C Proprietà Commutativa: (∀a, b ∈ R) a + b = b + a e ab = ba .

N Esistenza di un elemento neutro: (∀a ∈ R) a + 0 = 0 + a = a e a1 =


1a = a .

IA Esistenza dell’inverso additivo: (∀a ∈ R)(∃ − a ∈ R) a + (−a) = 0 .

6 0)(∃a−1 ∈ R) aa−1 =
IM Esistenza dell’inverso moltiplicativo: (∀a ∈ R|a =
1.

D Proprietà Distributiva: (∀a, b, c ∈ R) a(b + c) = ab + ac .

Nota : L’inverso additivo −a (risp. moltiplicativo a−1 ) di qualsiasi reale a


è unico.
1.2. NUMERI RAZIONALI; NUMERI REALI 9

L’insieme dei razionali Q con le sue operazioni di somma e moltiplicazione


gode delle stesse proprietà; queste sono le proprietà che caratterizzano un
campo; in questo senso parliamo del campo Q dei razionali e del campo R dei
reali.
L’idea di numero reale che abbiamo presentato sopra ha un carattere poco
formale; il primo a formulare una teoria completa e soddisfacente dei numeri
reali fu il matematico tedesco Julius Wilhelm Richard Dedekind tramite la
nozione di partizione del campo razionale; qui non faremo una presentazione
della teoria di Dedekind ma faremo una piccola incursione al concetto di
ordinamento dei razionali che appunto sta alla base del lavoro di Dedekind.
Similmente a quanto succede con l’insieme degli interi, il campo razionale è
ordinato; in altre parole, in Q possiamo definire a > b e e dimostrare che
valgono le proprietà O1, O2 e O3 della sezione 1.1. Dimostriamo formalmente
questo fatto nel teorema seguente.

Teorema 1.2.1 Il campo Q dei razionali è ordinato.

Dimostrazione – Per definizione, diciamo che ab > 0 ⇐⇒ ab > 0. Ricor-


diamo che ab = dc ⇐⇒ ad = cb. Moltiplichiamo i due lati dell’eguaglianza
ad = cb per bd per ottenere (ab)d2 = (cd)b2 . Siccome ab > 0 e d2 > 0 i
due lati dell’ultima uguaglianza sono positivi; in particolare, da (cd)b2 > 0 e
b2 > 0 concludiamo che cd > 0, cioè se una rappresentazione di un numero
complesso è positiva nel senso da noi definito, tutte le altre lo sono! In questo
modo vediamo che la nostra definizione è indipendente dal rappresentante; il
concetto di “positività” che abbiamo dato per i razionali è ben definito.
Ora dimostriamo O1: siano dati ab > 0 e dc > 0. Vogliamo dimostrare che

a c ad + bc
+ = > 0 , ossia (ad + bc)bd > 0 .
b d bd
Abbiamo le ineguaglianze

ab > 0, cd > 0 ⇒ abd2 > 0, cdb2 > 0

e dunque,
bd(ad + bc) = abd2 + cdb2 > 0 .
Lasciamo la dimostrazione di O2 e O3 a carico dello studente. 2

Anche il campo reale è ordinato; assumeremo questo fatto come vero


senza entrare nel merito delle dimostrazioni.
10 CAPITOLO 1. CONCETTI FONDAMENTALI

1.3 Numeri complessi


Il campo dei numeri reali può essere esteso ad un campo più ampio. Come nel
caso dei razionali e reali, generiamo questo nuovo insieme numerico cercando
di dare un significato ad una particolare operazione che in generale non può
essere fatta nell’insieme di partenza. Nel caso presente cerchiamo di dare un
significato alla radice quadrata di un numero negativo: per definizione, la
radice quadrata di un reale positivo k è un numero reale x tale che x2 = k
(chiaramente, se x ha questa proprietà, anche −x deve averla). D’altro canto
sappiamo che il quadrato di un numero reale diverso da zero è sempre un
numero positivo e pertanto, la proprietà x2 = k non può essere valida per
qualsiasi x =6 0 e k < 0. Questo problema fu considerato dai matematici
sin da tempi molto antichi; infatti, Erone di Alessandria riusci a risolvere
l’equazione x2 + 63 = 0 (circa l’anno 100 A.D.) e Girolamo√Cardano nel √ 1545
scrisse che il numero 40 può decomporsi√ nella forma (5 + −15)(5 − −15)
senza però lasciare chiaro cosa fosse −15. Fu il matematico tedesco Karl
Friedrich Gauss (nel 1832) a dare il nome di numeri complessi ai numeri del
tipo a + ib, con a, b ∈ R e i tale che i2 + 1 = 0. In questa sezione daremo
una definizione rigorosa dei numeri complessi e studieremo le loro proprietà.
Sia C il prodotto cartesiano C = R × R e definiamo una operazione di
somma ed una di moltiplicazione in questo insieme:

+ : (C × C → C , (a, b) + (a0 , b0 ) = (a + a0 , b + b0 ) ,

× : C × C → C , (a, b) × (a0 , b0 ) = (aa0 − bb0 , ab0 + a0 b) .


Osserviamo esplicitamente che le operazioni di somma e moltiplicazione
in C godono delle medesime proprietà della somma e la moltiplicazione dei
numeri reali (vedere Sezione ??, Proprietà [A], [C],[N], [IA], [IM] e [D]): la
[A] e la [C] sono immediate; (0, 0) è l’elemento neutro additivo e (1, 0) è
l’elemento neutro moltiplicativo; l’esistenza dell’inverso additivo non pone
problemi; l’inverso moltiplicativo di (a, b) 6= 0 (almeno uno dei numeri reali
a b
a, b deve essere 6= 0) è dato da ( a2 +b2 , − a2 +b2 ) (fare i conti!); la proprietà

distributiva si verifica facilmente. Dunque C è un campo.


Ora prendiamo l’insieme D di tutti i “numeri” del tipo a + ib con a, b ∈ R
2
e i = −1 che Gauss chiamò numeri complessi; per definizione

(a + ib) + (a0 + ib) = (a + a0 ) + i(b + b0 )

(a + ib)(a0 + ib0 ) = aa0 + iab0 + ia0 b + i2 bb0 = (aa0 − bb0 ) + i(ab0 + a0 b) .


1.3. NUMERI COMPLESSI 11

La funzione φ : C → D definita dalla relazione


(∀(a, b) ∈ C) φ(a, b) = a + ib
rispetta le operazioni di somma e moltiplicazione nei due insiemi ossia,
φ((a, b) + (a0 , b0 )) = φ(a + a0 , b + b0 ) = (a + a0 ) + i(b + b0 ) =
= (a + ib) + (a0 + ib0 ) = φ(a, b) + φ(a0 , b0 )
φ((a, b)(a0 , b0 )) = φ(aa0 − bb0 , ab0 + a0 b) =
= (aa0 − bb0 ) + i(ab0 + a0 b) = φ(a, b)φ(a0 , b0 ) .
Supponiamo che φ(a, b) = φ(a0 , b0 ); allora a + ib = a0 + ib0 e perciò a − a0 =
i(b0 − b). Prendendo i quadrati di ambi i lati dell’uguaglianza otteniamo (a −
a0 )2 = i2 (b0 −b)2 = −(b0 −b)2 ; ma il quadrato di un numero reale 6= 0 è sempre
positivo e dunque l’ultima uguaglianza è possibile solamente se a = a0 e b = b0 ;
ciò ci fa concludere che (a, b) = (a0 , b0 ) o, in altre parole, elementi distinti di
C hanno immagini distinte per φ. In questo modo abbiamo stabilito che
φ è una biiezione da C a D; nuovamente osserviamo che la φ mantiene le
operazioni; per questi motivi φ è detta un isomorfismo. Poiché C è un campo
l’isomorfismo φ ci permette di dimostrare facilmente che l’insieme D assieme
alle sue operazioni di somma e moltiplicazione è un campo, senza verificare
le proprietà di campo direttamente sulle operazioni in D; lasciamo questo
argomento alle esercitazioni. D’ora in poi scriveremo i numero complessi
sempre nella loro forma gaussiana a+ib. Osserviamo che l’insieme dei numeri
complessi del tipo a + i0 coincide con l’insieme dei numeri reali; dunque
R ⊂ C.
Il vantaggio di scrivere un numero complesso z = a + ib nella forma
(a, b) ∈ C – che come insieme coincide con il prodotto cartesiano R × R – è
che cosi possiamo considerarlo come un punto del piano R2 e fare intervenire
concetti di geometria elementare. Sia P ∈ R2 il punto di coordinate (a, b).
Sia y 0 la retta passante per P e perpendicolare alla retta Ox; questa retta
taglia l’asse Ox nel punto A = (a, 0) e il triangolo OAP è rettangolo. Sia
α = 6 (AOP ) l’angolo di vertice O, di lati OA, OP e orientato da √ OA a
OP Siccome la distanza tra P e O è espressa dal numero r = + a2 + b2
abbiamo: a = r cos α e b = r sin α e perciò possiamo scrivere
z = a + ib = r(cos α + sin α)
La parte destra dell’uguaglianza è la forma trigonometrica del numero com-
plesso a + ib. Il numero reale non-negativo r è il modulo di z; scriviamo
anche r = |z|; l’angolo α è detto argomento del numero complesso z. Per un
qualsiasi numero complesso z = a + ib, il coniugato di z è per definizione il
numero complesso z = a − ib; si noti che |z| = |z| e zz = |z|2 .
12 CAPITOLO 1. CONCETTI FONDAMENTALI

Teorema 1.3.1 (Teorema di de Moivre)3 Siano

z = r(cos α + i sin α) , z 0 = r0 (cos α0 + i sin α0 )

due numeri complessi arbitrari. Allora

zz 0 = rr0 [cos(α + α0 ) + i sin(α + α0 )]

Dimostrazione – A parole, il Teorema di de Moivre dice che il valore asso-


luto (risp. l’argomento) del prodotto di due numeri complessi è il prodotto
(risp. la somma) dei valori assoluti (risp. degli argomenti) dei fattori. Infatti,

zz 0 = rr0 (cos α + i sin α)(cos α0 + i sin α0 )

= rr0 [(cos α cos α0 − sin α sin α0 ) + i(cos α sin α0 + sin α cos α0 )]


= rr0 [cos(α + α0 ) + i sin(α + α0 )]
in virtù delle note formule che danno il coseno e il seno della somma di due
angoli. 2

Una applicazione immediata ed importante del Teorema di de Moivre è


la determinazione delle radici ennesime dell’unità cioè, dei numeri complessi
z = a + ib tali che z n = 1 per n ≥ 2 intero. Evidentemente z = 1 + i0 è una
radice dell’unità; però ci sono altre n − 1 radici dell’unità, tutte diverse tra
loro e diverse da 1 (si noti che se n è pari -1 è una radice dell’unità). Infatti,
cominciamo per osservare che il numero complesso 1 + i0 si può scrivere nella
forma 1 + i0 = cos 2π + i sin 2π; per ogni intero k = 1, 2, . . . , n − 1 prendiamo
il numero complesso
2kπ 2kπ
zk = 1(cos + i sin );
n n
questo, in virtù del Teorema di de Moivre, è tale che (zk )n = 1 e dunque
è una radice dell’unità. Ripetiamo: per ogni numero intero n ≥ 1 ci sono
esattamente n radici dell’unità distinte tra loro, una delle quali è 1.

1.3.1 Equazioni di secondo grado


Sia data una funzione

P (x) = ax2 + bx + c : R → R
3
Abraham de Moivre, matematico inglese nato in Francia nel 1667, deceduto a Londra
nel 1754.
1.3. NUMERI COMPLESSI 13

con a, b, c ∈ R; il problema che ci poniamo è quello di trovare dei numeri


complessi (o reali) z per i quali valga l’uguaglianza az 2 + bz + c = 0. Se a = 0
e b 6= 0 allora si ha che bz + c = 0 vale per z = −cb
. Supponiamo che a 6= 0.
In questo caso consideriamo l’espressione algebrica
b c b 1 b c 1 b
x2 + x + = x2 + x + ( )2 + − ( )2 =
a a a 4 a a 4 a
1b 2 c 1 b 2
= (x + ) + − ( ) =0
2a a 4 a
1b
Se scriviamo y = x + 2a
l’ultima espressione ci permette di concludere che

1 b c b2 − 4ac
y 2 = ( )2 − =
4 a a 4a2
e dunque √
−b ± b2 − 4ac
x= .
2a
In altre parole, il polinomio P (x) si decompone nella forma
√ √
−b + b2 − 4ac −b − b2 − 4ac
P (x) = a(x − )(x − ).
2a 2a
Il numero reale ∆ = b2 − 4ac è il discriminante dell’equazione algebrica
P (x) = ax2 + bx + c = 0. Questo numero è importante per l’analisi delle
soluzioni dell’equazione P (x) = 0.
Caso a : ∆ > 0 – L’equazione P (x) = 0 ha due soluzioni reali distinte:
√ √
−b + b2 − 4ac −b − b2 − 4ac
x0 = e x1 = ;
2a 2a
Caso b : ∆ < 0 – P (x) = 0 ha due soluzioni complesse date dai due numeri
complessi coniugati
√ √
−b + i −b2 + 4ac −b − i −b2 + 4ac
x0 = e x1 = x0 == ;
2a 2a
Caso c : ∆ = 0 – in questo caso abbiamo la decomposizione
−b −b −b 2
P (x) = ax2 + bx + c = a(x − )(x − ) = a(x − )
2a 2a 2a
(cioè il polinomio a1 P (x) è un quadrato perfetto) e la soluzione −b
2a
compare
due volte.
14 CAPITOLO 1. CONCETTI FONDAMENTALI

In sintesi, l’equazione ax2 + bx + c = 0 ha due soluzioni reali (uguali o


distinte) o due soluzioni complesse coniugate date dalla formula

−b ± b2 − 4ac
x= ; (1.1)
2a
a causa della formula anteriore si dice che ax2 + bx + c = 0 è risolubile per
radicali.

1.3.2 Equazioni di terzo grado


Come per le equazioni algebriche di secondo grado, anche le equazioni del
terzo grado sono risolubli per radicali. Vediamo come.
Sia data l’equazione

ax3 + bx2 + cx + d = 0

con a 6= 0. Possiamo assumere senza perdita di generalità che l’equazione sia


del tipo
x3 + bx2 + cx + d = 0 .
Ora facciamo la sostituzione x = y − b/3 per ottenere l’equazione

y 3 + py + q = 0 ; (1.2)

a questo punto facciamo la sostituzione di Viète4


p
y=z− (1.3)
3z
per ottenere l’equazione
p3
z3 − +q =0
27z 3
e dunque, dopo multiplicazione per z 3 , l’equazione

p3
z 6 + qz 3 − =0. (1.4)
27
Ora facciamo la sostituzione z 3 = w; questa ci porta all’equazione

p3
w2 + qw − =0 (1.5)
27
4
François Viète, matematico francese nato a Fontenay-le-Comte nel 1540, morto a
Parigi nel 1603.
1.4. COORDINATE CARTESIANE 15

che si può risolvere per radicali mediante 1.1:


s
q q 2 p3
w=− ± +
2 4 27
e dunque, s
q q 2 p3
z3 = − ± + . (1.6)
2 4 27
Queste due equazioni danno luogo a sei soluzioni tramite la formula di de
Moivre (le soluzioni sono infatti uguali due a due e cosı̀ abbiamo effettiva-
mente solo tre soluzioni) che devono essere riportate nell’uguaglianza 1.3 per
trovare i valori di y; infine, troviamo le soluzioni di

x3 + bx2 + cx + d = 0

facendo la sostituzione y = x + b/3.

1.4 Coordinate cartesiane


Nella Sezione 1.2 abbiamo descritto (in modo non rigoroso) il concetto di
numero reale. Ora vediamo come il campo reale possa essere messo in cor-
rispondenza biunivoca con i punti di una retta. Scegliamo due punti di una
retta orizzontale r; chiameremo 0 il punto a sinistra e 1 quello di destra; il
punto 0 è detto origine ed il punto 1 unità. La distanza tra i punti 0 e 1
è la unità di distanza. Partendo dall’origine e muovendoci nella retta verso
destra, segnamo i punti che distano 2, 3, 4, . . . unità di misura da 0 (questo
processo può essere fatto con un semplice compasso); i punti segnati rappre-
senteranno i numeri naturali 2, 3, 4, . . . (il numero 1 è in corrispondenza con
il punto 1). Ora muoviamoci sulla retta verso sinistra, sempre partendo da
0, e segnamo i punti distanti 1, 2, 3, 4, . . . unità da 0: questi punti rappre-
sentano gli interi negativi. In questo modo abbiamo messo in corrispondenza
biunivoca un certo sottoinsieme di punti della retta e gli elementi di Z (il
naturale 0 è in corrispondenza con l’origine).
Arrivati qui osserviamo che con un regolo ed un compasso possiamo di-
videre il segmento determinato da due punti consecutivi in dieci segmenti
uguali; in questo modo possiamo segnare sulla retta certi numeri razion-
4
ali: per esempio, il razionale 125
= 2 + 10 . In verità possiamo segnare sulla
retta il punto corrispondente a qualsiasi numero decimale a patto di con-
cordare che qualsiasi segmento sulla retta possa essere diviso in dieci parti
uguali, per piccolo che esso sia! Per esempio, vogliamo segnare il punto cor-
rispondente a π = 3, 141592 . . .: prima osserviamo che 3 < π < 4, poi che
16 CAPITOLO 1. CONCETTI FONDAMENTALI

3, 1 < π < 3, 2; ma il segmento con estremi 3, 1 e 3, 2 si suddivide in 10 parti


uguali e 3, 14 < π < 3, 15, e cosı̀ di seguito... Inversamente, e con argomenti
analoghi, ad ogni punto della retta corrisponde un numero decimale infinito,
cioè un numero reale. In questo modo abbiamo una corrispondenza biunivo-
ca tra i punti della retta orizzontale r e quelli del campo reale R; per questo
motivo chiameremo la retta r retta reale (infatti, questo nome sarà dato a
qualsiasi retta nella quale si sceglie un’origine ed una unità e i cui punti siano
identificati biunivocamente ai numeri reali). Si osservi che con questo possi-
amo individuare numericamente la posizione di un punto qualsiasi della retta
r in relazione all’origine 0 e all’unità 1. Il verso da 0 a 1 è il verso positivo
della retta reale.
L’idea di mettere in corrispondenza biunivoca i numeri reali con i punti
di una retta fu di importanza capitale per lo svolgimento della matematica;
vediamo come è possibile sfruttarla per dare la posizione di un punto del piano
o dello spazio relativamente ad un sistema di riferimento. Cominciamo con il
piano. Sia π un piano e su di esso prendiamo due rette x e y perpendicolari
una all’altra. Sia O il punto di intersezione di x con y; supponiamo che la
retta x sia orizzontale e che la y sia verticale. Ora consideriamo le due rette
come “rette reali” scegliendo l’intersezione O come origine per ambedue e
scegliendo un punto unità sulla retta x a destra di O e una unità sulla y “al
di sopra di” O o più precisamente, in tal modo che la parte positiva di x
preceda la parte positiva di y nel verso anti-orario. È conveniente assumere
che le distanze all’origine dei due punti unità scelti siano uguali. In questo
modo abbiamo due rette reali perpendicolari con origine O nel piano π: la
retta x (anche detta asse Ox) e la retta y (o asse Oy).
Sia P un punto arbitrario di π; abbiamo tre possibilità: 1. P ∈ x; 2.
P ∈ y; 3. P 6∈ x e P 6∈ y.
Caso 1. : al punto P corrisponde un numero reale a della retta reale x;
associamo la coppia di numeri reali (a, 0) a P e scriviamo P = (a, 0);
Caso 2. : al punto P corrisponde un numero reale b della retta reale y;
associamo la coppia di numeri reali (0, b) a P e scriviamo P = (0, b);
Caso 3. : l’assioma delle parallele di Euclide (vedere Appendice) ci dice che
possiamo tracciare per P una e soltanto una retta x1 (risp. y1 ) parallella
alla retta x (risp. y); il lettore è pregato di osservare che la retta x1 è
perpendicolare alla retta y (notazione: x ⊥ y) e che y1 è perpendicolare a
x (ossia y1 ⊥ x). La retta y1 interseca l’asse Ox nel punto A e la retta x1
taglia y nel punto B i quali sono rappresentati rispettivamente dai numeri
reali a e b; in questo modo associamo al punto P la coppia di numeri reali
(a, b). Reciprocamente, data una qualsiasi coppia di numeri reali (a, b), ad
essa corrisponde un punto (ed uno solo) del piano π (il lettore può fare
l’apposito disegno). I numeri a, b sono le coordinate cartesiane di P . Gli assi
1.4. COORDINATE CARTESIANE 17

Ox e Oy stabiliscono un sistema (ortogonale) di coordinate cartesiane sul


piano π.5 Siccome gli insiemi x e y sono identificati a R, indichiamo il piano
π anche con R2 = R × R.
Una conseguenza immediata di questo modo di qualificare numericamente
i punti del piano π è la possibilità di calcolare la distanza tra due punti
arbitrari di π. Infatti, siano dati due punti P, P 0 ∈ π di coordinate cartesiane
P = (a, b) e P 0 = (a0 , b0 ) (caso generico 3.). Da P tracciamo le rette x1 ⊥ y
e y1 ⊥ x e da P 0 tracciamo le rette x01 ⊥ y e y10 ⊥ x. Le rette x1 , x01 , y1 e y10
si intersecano come segue:
x1 ∩ y1 = P = (a, b) , x1 ∩ y10 = Q0 = (a0 , b) ,
x01 ∩ y1 = Q = (a, b0 ) e x10 ∩ y10 = P 0 = (a0 , b0 ) .
I punti P, Q, P 0 e Q0 sono i vertici di un rettangolo; la distanza dP P 0 tra
P e P 0 è precisamente la lunghezza della diagonale P P 0 ossia, la lunghezza
dell’ipotenusa del triangolo rettangolo P P 0 Q0 (o P QP 0 ). Dal Teorema di
Pitagora concludiamo che
(dP P 0 )2 = (dP Q0 )2 + (dP 0 Q0 )2 = (a − a0 )2 + (b − b0 )2
ossia q
dP P 0 = + (a − a0 )2 + (b − b0 )2
(prendiamo la determinazione positiva della radice quadra perchè parliamo
della distanza tra due punti).
Queste idee sono facilmente esportabili allo spazio tridimensionale. Siano
dati un piano π ed un punto U 6∈ π. Sia z l’unica retta che passa per U ed è
perpendicolare al piano π e sia O = z ∩ π il punto di intersezione di z con π.
Prendiamo un sistema ortogonale di coordinate cartesiane Ox, Oy nel piano
π; le tre rette x, y e z sono perpendicolari due a due e si incontrano tutte
nel punto O, che scegliamo come origine del nostro sistema di coordinate
cartesiane spaziali; finalmente, scegliamo convenientemente una unità in Oz
(di lunghezza uguale alle unità di Ox, Oy orientando l’asse = z in modo che
i sensi positivi dei tre assi Ox, Oy e Oz (in quest’ordine) soddisfino la regola
del cavatappi: prendiamo un cavatappi a vite e mettiamo la vite in parallelo
con l’asse Oz; quando giriamo la leva del cavatappi da Ox a Oy allora la vite
avanza nel verso positivo dell’asse degli z.
Sia P un punto arbitrario dello spazio R3 . Indichiamo con xOy il piano
determinato dagli assi Ox e Oy; similmente abbiamo i piani xOz e yOz. Sup-
poniamo che P non appartenga a nessuno di questi tre piani. Consideriamo
5
L’aggettivo cartesiane proviene da Cartesius, nome latino del matematico francese
René Descartes (1596-1650). La cosa curiosa è che non fu Descartes a introdurre le
coordinate cartesiane in matematica.
18 CAPITOLO 1. CONCETTI FONDAMENTALI

i tre unici piani passanti per P e paralleli ai piani yOz, xOz e xOy; questi
piani intersecano i tre assi coordinati Ox, Oy e Oz rispettivamente nei punti
A, B e C; ma questi punti sono univocamente associati a numeri reali a, b e
c rispettivamente. Cosı̀ il punto P avrà coordinate cartesiane (a, b, c); recip-
rocamente, qualsiasi terna di numeri reali (a, b, c) è associata ad un punto di
R3 . Con questo stabiliamo un sistema (ortogonale) di coordinate cartesiane
nello spazio che sarà anche indicato con R3 = R × R × R per ragioni simili
a quelle date per il piano.
Come si calcola la distanza tra due punti di R3 ? Siano dati P = (a, b, c) e
P 0 = (a0 , b0 , c0 ); come prima cosa proiettaiamo P e P 0 perpendicolarmente sul
piano xOy per ottene i punti Q = (a, b, 0) e Q0 = (a0 , b0 , 0); poi prendiamo il
piano π che contiene P ed è parallelo a xOy; questo piano interseca la retta
P 0 Q0 in un punto R = (a0 , b0 , c). Ora osserviamo che il triangolo P P 0 R è
rettangolo ed il suo lato P R è parallelo al segmento QQ0 . Dunque i segmenti
P R e QQ0 hanno la stessa lunghezza
q
dQQ0 = dP R = + (a − a0 )2 + (b − b0 )2 .

Ma il triangolo P P 0 R è rettangolo e perciò

(dP P 0 )2 = (dP R )2 + (dP 0 R )2

donde concludiamo che


q
dP P 0 = + (a − a0 )2 + (b − b0 )2 + (c − c0 )2 .

1.5 Matrici
Nella sezione 1.1 abbiamo costruito l’insieme Z dei numeri interi; abbiamo
visto che Z è munito di una operazione (somma di interi)

Z × Z → Z , (p, q) 7→ p + q

che gode delle proprietà S1,S2,S3 e S4. Questo conferisce a Z la struttura


di gruppo; in particolare, dovuto alla commutatività della somma (vedi pro-
prietà S1), il gruppo Z si dice commutativo o Abeliano.6 In questa sezione
costruiremo gruppi abeliani più elaborati i cui elementi sono detti matrici.
6
In onore del matematico norvegese Niels Henrik Abel (1802-1829) uno dei primi a
studiare queste strutture algebriche.
1.5. MATRICI 19

Siano m ed n due numeri naturali 6= 0 fissati; per definizione una matrice


reale con m righe ed n colonne è un quadro di m × n numeri reali del tipo
 
a11 a12 ... a1n−1 a1n
 
 a21 a22 ... a2n−1 a2n 
 
 . . ... . . 
A=  
 . . ... . . 
 
 
 . . ... . . 
am1 am2 ... amn−1 amn

Una tale matrice è anche detta matrice reale m×n o m×n-matrice reale. Ev-
identemente è perfettamente plausibile dare una definizione simile nei campi
dei razionali o complessi, o anche nel gruppo dei numeri interi; d’ora in
poi tralasceremo l’aggettivo “reale” in questa sezione poiché ci occuperemo
soltanto di questo tipo di matrici.
Per un qualsiasi 1 ≤ i ≤ m la ima -riga della matrice A di sopra è data
dagli elementi ai1 , ai2 , . . . , ain−1 , ain e per 1 ≤ j ≤ m, la j ma -colonna di A è
data da a1j , a2j , . . . , am−1j , amj . Si osservi che la ima -riga e la j ma -colonna si
“intersecano” nell’elemento aij . Per alleggerire e semplificare la notazione,
molte volte scriveremo le matrici come la A di sopra nella forma A = (aij ).
Due m × n-matrici A = (aij ) e B = (bij ) sono uguali se, e soltanto se

(∀1 ≤ i ≤ m , 1 ≤ j ≤ n) aij = bij .

Sia Mm×n l’insieme di tutte le m×n-matrici. In questo insieme possiamo


definire una operazione di somma:

+ : Mm×n × Mm×n → Mm×n

che associa ad una copia di matrici (A = (aij ), B = (bij )) la matrice A + B =


(aij + bij ).
Teorema 1.5.1 L’insieme Mm×n con l’operazione di somma di matrici è
un gruppo abeliano.

Dimostrazione – Si deve dimostrare che la somma di matrici obbedisce alle


regole definite in S1, S2, S3 e S4. Cominciamo con S1. Siano A = (aij ) e B =
(bij ) due matrici arbitrarie; per qualsiasi i, j la commutatività della somma di
numeri reali implica aij +bij = bij +aij e perciò, A+B = B+A. L’associatività
proviene dall’associatività della somma di numeri reali e cosı̀ vale S2. La
matrice O = (oij ) tale che

(∀i, j ∈ N)(1 ≤ i ≤ m , 1 ≤ j ≤ n) oij = 0


20 CAPITOLO 1. CONCETTI FONDAMENTALI

è l’elemento neutro per la somma di matrici: infatti, per qualsiasi A = (aij ),


A + O = O + A è la matric che ha per elementi generici aij + 0 = aij ; dunque
S3 vale. Ora cerchiamo gli inversi. Anche questi sono facili a trovarsi: data
la matrice A = (aij ), la matrice −A = (−aij ) è tale che A + (−A) = O e
cosı̀ S4. 2

Chiaramente, per qualsiasi numero intero positivo p e qualsiasi A ∈


M(m × n),
pA = A + .... + A , p volte .
Più generalmente,

(∀r ∈ R)(∀A = (aij ) ∈ M(m × n)) rA = (raij ) .

Da questo punto fino alla fine della sezione ci interesseremo esplicitamente


delle matrici quadrate, cioè delle matrici in cui il numero di righe è uguale
al numero delle colonne. Offriamo due spiegazioni a sostegno di questa nos-
tra scelta: una, perché le matrici quadrate (con lo stesso n) possono essere
moltiplicate tra loro e l’altra, perché associato ad una matrice quadrata vi è
un numero di grande importanza detto determinante della matrice.
Definiamo
× : Mn×n × Mn×n → Mn×n
n
X
(∀(A = (aij ), B = (bij ) ∈ Mn×n ) A × B = (cij = ai` b`j ) .
`=1

Se n = 1, siccome le matrici 1 × 1 sono identificate ai numeri reali, questa


moltiplicazione coincide con il prodotto nei reali. Scriviamo l’esempio n = 2.
Allora   !
a11 b11 + a12 b21 a11 b12 + a12 b22
A × B = AB =
a21 b11 + a22 b21 a21 b12 + a22 b22
Il lettore è ora pregato di ricordarsi che la moltiplicazione dei numeri reali è
associativa, commutativa e distributiva relativamente alla somma; questi fat-
to ha come diretta conseguenza il risultato riportato a seguito, i cui dettagli
di dimostrazione sono lasciati al lettore.

Teorema 1.5.2 La moltiplicazione delle matrici di Mn×n è associativa e


distributiva relativamente alla somma.

In altre parole, il teorema asserisce che

(∀A, B, C ∈ M(n × n)) A(BC) = (AB)C e A(B + C) = AB + AC .


1.5. MATRICI 21

Il lettore può dimostrare facilmente (tramiti appositi esempi) che il prodotto


di matrici non è commutativo. Come per i reali, la moltiplicazione delle
matrici quadrate ha un elemento neutro: esso è dato dalla matrice In = (δij )
con (
1 se i = j
δij =
0 se i =
6 j
Molte matrici sono invertibili, cioè hanno un inverso. Ad esempio, la
matrice   !
2 1
A=
1 1
ha per inverso la matrice
  !
−1 1 −1
A =
−1 2

(fare i conti).
Purtroppo non tutte le matrici quadrate hanno un inverso per moltipli-
cazione: infatti, la matrice
  !
1 1
A=
1 1

non ha inverso. Vediamo i dettagli del perché. Si supponga che A abbia un


inverso X = (xij ) ; allora
  !
x11 + x21 x12 + x22
AX =
x11 + x21 x12 + x22

e siccome AX = I2 , dovremmo avere le seguenti equazioni:

x11 + x21 = 1 x12 + x22 = 0


x11 + x21 = 0 x12 + x22 = 1

ma questo è impossibile: non possiamo trovare due numeri reali x11 e x21 tali
che la loro somma sia simultaneamente uguale a 1 ed a 0!
Uno dei problemi che si possono risolvere tramite i determinanti è appunto
quello di scoprire se una matrice è invertibile o no. Il determinante è una
funzione
det : Mn×n → R
definita induttivamente nel modo seguente. Per n = 1 , definiamo il de-
terminante di una matrice A = (a11 ) ≡ a11 come det(A) = a11 . Ora
sia n > 1 e supponiamo di sapere calcolare il determinante di qualsiasi
22 CAPITOLO 1. CONCETTI FONDAMENTALI

(n − 1) × (n − 1)-matrice. Allora, per qualsiasi n × n-matrice A = (aij )


definiamo n X
det(A) = (−1)j+1 a1j det A1j
j=1

dove A1j è la (n − 1) × (n − 1)-matrice ottenuta da A per la eliminazione della


prima riga e della j ma colonna di A. A volte il numero det A1j è chiamato
minore dell’elemento a1j .
Osservazione - Nella definizione di determinante data di sopra abbiamo preso
la prima riga della matrice A come preferenziale e abbiamo fatto i nostri
calcoli relativamente ai minori di quella riga. Si dimostra che è possibile
prendere una qualsiasi riga (o anche colonna!) come preferenziale; infatti,
abbiamo il seguente risultato (che però non dimostriamo qui):

Teorema 1.5.3
(∀A = (aij ) ∈ Mn×n )
n
X n
X
det(A) = (−1)i+j aij det Aij = (−1)i+j aij det Aij .
j=1 i=1

Scriviamo esplicitamente il determinante di A nei casi n = 2, 3.

Caso n = 2 : det(A) = a11 a22 − a12 a21

Caso n = 3 : det(A) = a11 M11 − a12 M12 + a13 M13 =


  !   !   !
a22 a23 a21 a23 a21 a22
a11 det − a12 det + a13 det
a32 a33 a31 a33 a31 a32
I minori degli elementi di una matrice sono anche presenti nella costruzione
dell’inverso di una matrice (nel caso in cui questi abbia un inverso). In ques-
ta sezione ci limitiamo a scrivere l’inverso di una matrice con determinante
non nullo nei casi n = 2 e n = 3 lasciando la teoria generale ad un futuro
appendice. Si noti che il caso n = 1 è banale: una matrice A = (a11 ) è
invertibile ⇐⇒ a11 = 6 0; A−1 = ((a11 )−1 ).
Passiamo al caso n = 2. Supponiamo che la matrice
  !
a11 a12
A=
a21 a22

abbia det(A) 6= 0; allora, A ha una matrice inversa


  !
−1 1 a22 −a12
A = .
det(A) −a21 a11
1.5. MATRICI 23

Infatti   !  !
a11 a12 a22 −a12
=
a21 a22 −a21 a11
  !
a11 a22 − a12 a21 a12 a11 − a11 a12
= =
a21 a22 − a22 a21 a11 a22 − a21 a12
  !
det(A) 0
= .
0 det(A)
La matrice  
a11 a12 a13
A =  a21 a22 a23 


a31 a32 a33
6 0 ha inverso
con det(A) =
 
M11 −M21 M31
1  
A−1 =  −M 12 M 22 −M32  .
det(A)
M13 −M23 M33
Il lettore è invitato a fare i calcoli per convincersi della veracità della nostra
asserzione.
La trasposta di una (m × n-matrice A = (aij ) è la matrice AT = (bji ) con
bji = aij ossia, è la matrice ottenuta da A scambiando le righe per le colonne.
Una matrice A che coincide con la sua trasposta è detta simmetrica; le matrici
simmetriche sono particolarmente importanti in geometria analitica dovuto
ai loro legami con le coniche e le quadriche.
Ora vediamo alcune proprietà dei determinanti.
Teorema 1.5.4 Per qualsiasi n × n-matrice A,
det AT = det A .

Dimostrazione – Il teorema è ovvio per n = 1. Procediamo per induzione su


n. Supponiamo che il risultato sia vero per n − 1. Supponiamo che A = (aij );
allora, AT = (aTij ) = (aji ) e per l’ipotesi di induzione,
T
det Aij = det Aji .
Ma allora,
n
X n
X
det AT = (−1)i+j aTij det ATij = (−1)i+j aji det Aji = det A .
i=1 i=1
2
24 CAPITOLO 1. CONCETTI FONDAMENTALI

Teorema 1.5.5 Sia A una n × n-matrice. Allora:


1. se gli elementi della ima riga (o colonna) sono tutti 0, det A = 0;

2. se la matrice A0 proviene dalla matrice A per multiplicazione di tutti


gli elementi della ima riga (o colonna) di A per un numero c, det A0 =
c det A;

3. se ogni elemento aij della ima riga (o colonna) di A è uguale ad una


0
somma aij = aij + a”ij ,

det A = det A0 + det A”

dove A0 , A” sono le matrici provenienti da A ottenute sostituendo gli


elementi aij per a0ij e a”ij rispettivamente.

La dimostrazione è una conseguenza diretta delle definizioni ed è lasciata a


carico del lettore.

Teorema 1.5.6 (i) Se A0 è ottenuta da A scambiando due righe (o colonne)


di quest’ultima, allora
det A0 = − det A ;
(ii) se due righe (o colonne) di A sono uguali, det A = 0 ;
(iii) se due righe (o colonne) di A sono proporzionali, det A = 0.

Dimostrazione – (i) Per induzione su n (evidentemente con n ≥ 2). Sia


  !
a11 a12
A= .
a21 a22

Allora
det A = a11 a22 − a12 a21 .
Supponiamo per ipotesi che
  !
0 a12 a11
A = ;
a22 a21

allora,
det A0 = a12 a21 − a11 a22 = − det A .
Ora assumiamo che il risultato sia valido per n − 1, con n − 1 ≥ 2 e dunque,
n ≥ 3. Supponiamo che la ima riga di A non sia una delle righe scambi-
ate e facciamo l’espansione del determinante di A d’accordo con questa ima
1.5. MATRICI 25

riga. Allora a0 ij = aij e ogni matrice A0ij si ottiene dalla corrispondente Aij
scambiando due righe (corrispondenti alle righe cambiate di A). Dunque,
det A0ij = − det Aij e
n
X n
X
det A0 = (−1)i+j a0ij det A0ij = − (−1)i+j aij det Aij = − det A .
j=1 j=1

(ii) Supponiamo che le righe i e k di A siano uguali. Scambiando tra loro


queste righe otteniamo dalla prima parte che
det A = − det A .
Ma questo è possibile solo nel caso in cui det A = 0.
(iii) Supponiamo che aij = rakj , j = 1, . . . , n per i e j con i 6= j fissati. Da
questo concludiamo che
n
X n
X
i+j
det A = (−1) aij det Aij = 0
(−1)i+j rakj det Aij
j=1 j=1

0
dove Aij è una matrice con due righe uguali. Ma det A0ij = 0 per la parte
(ii). 2

Teorema 1.5.7 Sia A0 la matrice ottenuta da una matrice A multiplicando


la riga i di A per una costante c e sommando il risultato alla riga k con
k 6= i. Allora,
det A0 = det A .

Dimostrazione – Gli elementi a0kj della k ma riga di A0 sono dati da


a0kj = caij + akj , j = 1, . . . , n .
Per i risultati anteriori, l’espansione del determinante di A0 tramite la sua
k ma riga è
det A0 = c det A” + det A ,
con A” una matrice avente due righe uguali (i righi i e k) e dunque, tale che
det A” = 0. Questo conclude la dimostrazione. 2

Teorema 1.5.8 Sia A una n × n-matrice data, n ≥ 2. Allora, per qualsiasi


k 6= i,
n
X
(−1)i+j aij det Akj = 0 .
i=1
26 CAPITOLO 1. CONCETTI FONDAMENTALI

In altre parole, il teorema dice che se sviluppiamo un determinante pren-


dendo una riga ed i minori relativi ad una riga diversa, otteniamo 0. Un
risultato simile vale per le colonne.
Dimostrazione – La formula scritta nell’enunciato del teorema significa che
stiamo calcolando il determinante di una matrice A0 con due righe uguali: la
riga i e la riga k. Dunque, per il Teorema 1.5.6, parte (ii). 2

In forma concentrata, la definizione di determinante ed il teorema ante-


riore possono essere scritti come segue:
per l’espansione a righe:
n
X
(−1)i+j aij det Akj = δik det A ;
i=1

per l’espansione a colonne:


n
X
(−1)i+k aik det Ajk = δij det A .
k=1
Capitolo 2

Algebra Vettoriale

2.1 Vettori reali


In questa sezione daremo una presentazione intuitiva dei vettori reali, come
quella che potremmo trovare eventualmente quando studiamo la Fisica per
la prima volta. Qualsiasi concetto fisico che abbia una grandezza ed una
direzione orientata (come per esempio, la velocità o la accelerazione) può
essere rappresentato da un vettore.
Il punto di partenza per la definizione di vettore è il concetto di segmento
orientato. Un segmento di estremi A e B (con A 6= B) contenuto nello spazio
R3 è detto orientato se gli si attribuisce un senso, diciamo da A a B (il senso
da B a A è opposto al senso da A a B). Notazione: AB ~ per il segmento
AB orientato da A a B; BA ~ per il segmento AB orientato da B a A. Il
~
punto A (risp. B) di AB è detto origine (risp. termine) di AB. ~ A volte è
conveniente indicare il segmento orientato AB ~ con la notazione AB ~ = B −A.
Due segmenti AB e CD paralleli hanno la medesima direzione.
Sia V l’insieme di tutti i possibili segmenti orientati di R3 . Diciamo che
due segmenti orientati sono equipollenti se sono paralleli (hanno la medes-
ima direzione), hanno la stessa lunghezza e lo stesso senso. Si osservi che
l’equipollenza è una relazione di equivalenza in V e perciò divide questo in-
sieme in classi di equivalenza disgiunte; ognuna di queste classi è un vettore
reale di R3 . L’insieme V (R3 ) di tutti questi vettori è detto spazio vettoriale
reale tridimensionale.
Attenzione : A volte indichiamo un vettore ~v con un segmento orientato
che lo rappresenti; cosı̀ scriviamo ~v = AB ~ pur sapendo che ~v è la classe di
~
equipollenza di AB.
Per definizione, la lunghezza |~v | di un vettore ~v è la lunghezza di qualsiasi
segmento orientato che lo rappresenta. Dato arbitrariamente ~v ∈ V (R3 ) il

27
28 CAPITOLO 2. ALGEBRA VETTORIALE

vettore −~v è il vettore ottenuto come la classe di equipollenza di un segmen-


to orientato parallelo ad un rappresentante di ~v e che ne ha la medesima
lunghezza ma orientamento opposto. Ora abbiamo tutti gli ingredienti per
definire la nostra prima operazione: il prodotto di un numero reale per un
vettore.
R × V (R3 ) → V (R3 ) , (k, ~v ) 7→ k~v
dove k~v è il vettore parallelo a ~v , di lunghezza |k||~v | e orientamento uguale
a quello di ~v se k > 0 o a quello di −~v se k < 0; se k = 0 allora k~v è il
vettore nullo ~0 rappresentato dall’origine O. In questo contesto il numero
reale k è anche detto scalare e cosı̀ questa operazione è anche conosciuta
come prodotto di un vettore per uno scalare.
La nostra seconda operazione è la somma di vettori.

V (R3 ) × V (R3 ) → V (R3 ) , (~v , w)


~ 7→ ~v + w
~

Siccome i vettori sono classi di equivalenza l’operazione deve essere defini-


ta su rappresentanti generici e deve essere indipendente da questi. Dati
~ ∈ V (R3 ) definiamo il vettore ~v + w
arbitrariamente ~v , w ~ come segue:

1. scegliamo un punto generico arbitrario A ∈ R3 ;


~ il rappresentante di ~v con origine in A;
2. sia AB
~ il rappresentante di w
3. sia AC ~ con origine in A;

4. sia ABCD il parallelogrammo ottenuto completando la figura data dai


segmenti AB e AC;
~
5. prendiamo il segmento orientato AD;

per definizione, ~v +w ~ Quanto all’indipendenza


~ è la classe di equipollenza di AD.
dai rappresentanti, se avessimo preso un’altra origine A0 e rappresentanti
A~0 B 0 , A~0 C 0 , il rettangolo A0 B 0 C 0 D0 sarebbe semplicemente una traslazione
parallela di ABCD e dunque, il segmento orientato A~0 D0 sarebbe equipollente
~ Perciò il nostro concetto di somma di vettori è ben definito.
a AD.
Un’altro modo di costruire la somma di due vettori che potrebbe essere
utile nelle esercitazioni è quello di partire da un rappresentante AB ~ di ~v , un
rappresentante BD ~ di w ~ e definire ~v +w ~ qui la notazione
~ come la classe di AD;
alternativa AB ~ = B − A si presenta come particolarmente interessante:

~v + w ~ + BD
~ = AB ~ = (B − A) + (D − B) = D − A .

Proprietà della somma di vettori:


2.1. VETTORI REALI 29

~ ∈ V (R3 )~v + w
S1 (Commutatività) (∀~v , w ~ =w
~ + ~v .

~ ~u ∈ V (R3 )(~v + w)
S2 (Associatività) (∀~v , w, ~ + ~u = ~v + (w
~ + ~u) .

S3 (∀~v ∈ V (R3 ))~v + ~0 = ~0 + ~v = ~v .

S4 (∀~v ∈ V (R3 ))~v + (−~v ) = ~0 .

l lettore è pregato di osservare che queste proprietà sono esattamente le stesse


che le proprietà della somma di numeri interi (vedere Sezione 1.1).
Il prodotto di un vettore per uno scalare ha le seguenti proprietà:

P1 (∀~v ∈ V (R3 ))1~v ) = ~v ;

P2 (∀k, ` ∈ R)(∀~v ∈ V (R3 ))k(`~v ) = (k`)~v ;

P3 (∀k, ` ∈ R)(∀~v ∈ V (R3 ))(k + `)~v = k~v + `~v .

La somma di vettori ed il prodotto di un vettore per uno scalare sono


collegate dalla seguente Proprietà Distributiva :

~ ∈ V (R3 ))k(~v + w)
D (∀k ∈ R)(∀~v , w ~ = k~v + k w.
~

La differenza tra due vettori ha una semplice interpretazione geometrica:


supponiamo volere “disegnare” ~v − w; ~ prendiamo come al solito i rappre-
sentanti AB~ e AC~ di ~v e w ~ allora,
~ rispettivamente; sia ~x la classe di CB;
~ + ~x = ~v e dunque ~v − w
w ~ = ~x; in altre parole,

~ = (B − A) − (C − A) = B − C .
~v − w

Le proprietà [S1],[S2],[S3],[S4],[P1],[P2],[P3] e [D] caratterizzano lo spazio


vettoriale V (R3 ); in verità tali proprietà sarebbero presenti nel caso in cui
facessimo le medesime costruzioni e ragionamenti in R2 , cioè se prendessimo
i nostri vettori sul piano R2 (in tale caso avremmo lo spazio vettoriale reale
bidimensionale. Le proprietà menzionate sono anche quelle che caratteriz-
zano uno spazio vettoriale astratto su un campo qualsiasi, come il lettore
vedrà in un corso di Algebra Lineare.
A questo punto sfruttiamo il fatto che in R3 abbiamo un sistema di co-
ordinate cartesiane dato dagli assi (ortogonali tra loro) Ox, Oy e Oz. Com-
inciamo per osservare che un qualsiasi vettore ~v ∈ V (R3 ) può sempre essere
rappresentato dal segmento orientato OA ~ con origine in O; ora, il termine A
3
è un punto di R e dunque è rappresentato dalle sue coordinate (a1 , a2 , a3 ) e
cosı̀ possiamo caratterizzare il vettore ~v dalle “coordinate” (a1 , a2 , a3 ) cioè,
scriviamo ~v = (a1 , a2 , a3 ). In questo contesto i numeri reali a, b, c saranno
30 CAPITOLO 2. ALGEBRA VETTORIALE

chiamati coordinate vettoriali di ~v . La lunghezza di un vettore ~v = (a1 , a2 , a3 )


è cosı̀ immediatamente calcolata:
q
|~v | = a12 + a22 + a23 .

Da questo è facile dedurre che

(∀k ∈ R)(∀~v = (a1 , a2 , a3 ) ∈ V (R3 )) k~v = (ka1 , ka2 , ka3 ) ;

in particolare, −1~v = (−a1 , −a2 , −a3 ).


Per la somma di vettori abbiamo una situazione un pò più complessa.
Prendiamo i vettori ~v = OA~ = (a1 , a2 , a3 ), w ~ = (b1 , b2 , b3 ) e la loro
~ = OB
somma ~v + w ~ I punti O, A, B e C sono i vertici di un parallelogrammo
~ = OC.
OACB che si proietta perpendicolarmente sul parallelogrammo OA1 C1 B1 del
piano determinato dagli assi Ox e Oy (infatti, il piano OAA1 determinato
dai punti O, A e A1 è parallelo al piano BCC1 perché i segmenti OA e
BC – risp. AA1 e CC1 – sono paralleli; dunque tagliano il piano Ox, Oy
in rette parallele e pertanto OA1 e B1 C1 sono paralleli ; in modo simile, i
segmenti OB1 e A1 C1 sono paralleli). Ora restringiamo la nostra attenzione
al parallelogrammo OA1 C1 B1 del piano Ox, Oy. Le coordinate dei vertici O,
A1 e B1 sono conosciute:

O = (0, 0, 0) , A1 = (a1 , a2 , 0) e B1 = (a01 , b2 , 0) .

Proiettiamo i vertici A1 , B1 e C1 perpendicolarmente sull’asse Ox; otteni-


amo i punti A01 = (a1 , 0, 0), B10 = (a1 , 0, 0) e C10 di cui dobbiamo trovare
la coordinata. Per una questione di similitudine di triangoli concludiamo
immediatamente che i segmenti OA01 e B10 C10 sono di uguale lunghezza; da
questo possiamo inferire che

dOA10 + dOB10 = dOB10 + dB10 C10 = dOC10

e perciò, la coordinata di C10 in x è esattamente a1 + a01 ; in altre parole, la


prima coordinata del punto C è a1 + a01 . Con ragionamenti simili sugli altri
assi coordinati, concludiamo che C = (a1 + b1 , a2 + b2 , a3 + b3 ) ossia,

~v + w ~ = (a1 + b1 , a2 + b2 , a3 + b3 ) .
~ = OC

~ = (b1 , b2 , b3 ), allora
È facile dimostrare che se ~v = (a1 , a2 , a3 ) e w

~ = (a1 − b1 , a2 − b2 , a3 − b3 )
~v − w
2.2. PRODOTTO SCALARE 31

Ci sono tre vettori di V (R3 ) che hanno una rilevanza non trascurabile
nella teoria degli spazi vettoriali reali tridimensionali; essi sono i vettori
unitari1
~i = (1, 0, 0) , ~j = (0, 1, 0) e ~k = (0, 0, 1) .

Il motivo della loro importanza è che essi possono generare qualsiasi vettore
reale in modo unico: infatti, dato arbitrariamente ~v = (a1 , a2 , a3 ), possiamo
scrivere
~v = a1~i + a2~j + a3~k
e, se ~v potesse essere scritto nella forma

b1~i + b2~j + b3~k

allora
(a1 , a2 , a3 ) = (b1 , b2 , b3 )
e dunque a1 = b1 , a2 = b2 e a3 = b3 . Diciamo che i vettori di V (R3 ) sono
combinazioni lineari dei vettori

~i , ~j e ~k

e che l’insieme {~i, ~j, ~k} è una base (canonica) di V (R3 ).

2.2 Prodotto Scalare


Il prodotto scalare in V (R3 ) è la funzione

<, >: V (R3 ) × V (R3 ) → R

definita come segue:

~ ∈ V (R3 )) < ~v , w
(∀~v , w ~ >= |~v ||w|
~ cos(θ)

dove θ = 6 (~v , w)
~ è l’angolo determinato dai vettori ~v , w
~ con 0 ≤ θ ≤ π.
Le seguenti proprietà del prodotto scalare sono conseguenze immediate
della definizione:

PS1 (∀~v ∈ V (R3 )) < ~v , ~0 >=< ~0, ~v >= 0 ;

~ ∈ V (R3 )) < ~v , w
PS2 (∀~v , w ~ >=< w,
~ ~v > (il prodotto scalare è commuta-
tivo);
1
Abbiamo scritto la parole unitari perché tali vettori hanno lunghezza 1.
32 CAPITOLO 2. ALGEBRA VETTORIALE

~ ∈ V (R3 ))(∀k ∈ R) < k~v , w


PS3 (∀~v , w ~ >=< ~v , k w
~ >= k < ~v , w
~>;

PS4 (∀~v ∈ V (R3 )) < ~v , ~v >= |~v |2 .

~ di V (R3 )) sono ortogonali l’uno


Teorema 2.2.1 Due vettori non nulli ~v e w
all’altro ⇐⇒ < ~v , w
~ >= 0.

Dimostrazione – Condizione necessaria : supponiamo che ~v sia perpendico-


lare a w
~ (notazione: ~v ⊥ w).
~ Allora, cos(θ) = 0 e dalla definizione deduciamo
che < ~v , w
~ >= 0.
Condizione sufficiente : qui l’ipotesi è che < ~v , w
~ >= 0; siccome i due vet-
tori non sono nulli, ~v | 6= 0 e w|
~ =6 0; la definizione di prodotto scalare ci fa
concludere che cos(θ) = 0 e perciò θ = π/2. 2

Molte volte ci conviene interpretare il prodotto scalare tramite il concetto


di proiezione di un vettore su un’altro. Siano ~v = AB~ ew ~ = AC~ due vettori
dati, con angolo α tra di loro. Dal punto B tracciamo una perpendicolare alla
retta AC; questa retta taglia AC in un punto C 0 . Definiamo la proiezione di
~v su w~ come il numero
projw~ (~v ) = σ dAC 0
dove dAC 0 è la distanza tra i punti A e C 0 e
(
1 se C 0 ∈ lato AC
σ=
−1 se C 0 ∈ lato opposto a AC

Geometricamente abbiamo la proiezione del segmento AB sulla retta per A


nella direzione di w
~ munita del segno positivo se 0 ≤ θ < π/2 e del segno
negativo se π/2 < θ ≤ π. Con questo abbiamo che

< ~v , w
~ >= |~v ||w|
~ cos(θ) = |w|proj
~ ~ (~
w v) .

La proiezione proj~v (w)


~ è definita in modo analogo; si osservi che

|w|proj
~ w v ) = |~v |proj~v (w)
~ (~ ~ .

Le proprietà PS1, PS2, PS3 e PS4 sono completate da una proprietà


distributiva del prodotto scalare relativamente alla somma di vettori. Per
alleggerire un pò la notazione, d’ora in poi prenderemo i rappresentanti dei
nostri vettori con origine nel punto O ∈ R3 , origine del sistema di coordinate
cartesiane. Adotteremo anche la convenzione di scrivere un vettore con la
medesima lettera latina minuscola del termine del suo rappresentante: ~a =
~
OA.
2.2. PRODOTTO SCALARE 33

Teorema 2.2.2 (Proprietà distributiva)

(∀~a, ~b, ~c ∈ V (R3 )) < ~a + ~b, ~c >=< ~a, ~c > + < ~b, ~c > .

Dimostrazione – Sia d~ = ~a +~b = OD. ~ Siano πA , πB e πD tre piani perpendi-


colari alla retta r per O nella direzione di ~c e che contengano rispettivamente,
i punti A, B e D. Siano

A0 = πA ∩ r , B 0 = πB ∩ r e D0 = πD ∩ r

le intersezioni dei tre piani con r. La proiezione (con segno) del segmento
orientato AD~ che rappresenta ~b è uguale a proj~c(~b) (i segmenti orientati OB
e AD sono equipollenti); d’altro lato,

~
~ = proj~c(d)
proj~c(~a) + proj~c(AD)

e dunque,
~ = proj~c(~a) + proj~c(~b) .
proj~c(d)
In questo modo,

< ~a + ~b, ~c >= |~c|proj~c (d)


~ = |~c|proj~c (~a) + |~c|proj~c (~b) =

=< ~a, ~c > + < ~b, ~c > .


2
Siccome il prodotto scalare è commutativo, ne segue che

< ~c, ~a + ~b >=< ~c, ~a > + < ~c, ~b > .

A questo punto ci conviene ragionare da un punto di vista algebrico.


Ricordiamoci che i vettori ~i, ~j e ~k formano una base di V (R3 ) cioè, un vettore
qualsiasi si esprime in modo unico come combinazione lineare con coefficienti
reali dei vettori della base. Ora notiamo che in vista della proprietà PS4 e
del Teorema 2.2.1

< ~i,~i >= 1 , < ~j, ~j >= 1 , < ~k, ~k >= 1

< ~i, ~j >= 0 , < ~i, ~k >= 0 e < ~j, ~k >= 0 .


La Proprietà distributiva ora interviene per farci vedere che il prodotto
scalare di due vettori arbitrari ~v = (a1 , a2 , a3 ) e w
~ = (b1 , b2 , b3 ) è dato da

< ~v , w
~ >= a1 b1 + a2 b2 + a3 b3 .
34 CAPITOLO 2. ALGEBRA VETTORIALE

Come applicazione calcoliamo il coseno dell’angolo θ di due vettori ~v =


(a1 , a2 , a3 ) e w
~ = (b1 , b2 , b3 ): siccome

~ >= |~v ||w|


< ~v , w ~ cos(θ)

i risultati anteriori ci dicono che


a1 b1 + a2 b2 + a3 b3
cos(θ) = q q .
a21 + a22 + a23 b21 + b22 + b32

2.3 Prodotto Vettoriale


Un’altra operazione nell’insieme V (R3 ) è data dal cosiddetto prodotto vetto-
riale
∧ : V (R3 ) × V (R3 ) → V (R3 ) , (~v , w)
~ 7→ ~v ∧ w
~
definita nel modo seguente: come al solito, sia θ l’angolo 0 ≤ θ ≤ π definito
dai vettori ~v e w;
~ allora,

~v ∧ w
~ = |~v ||w|
~ sin(θ) ~u

dove ~u è un vettore unitario perpendicolare al piano dei vettori ~v , w ~ in modo


che la terna (~v , w,
~ ~u) soddisfi la regola del cavatappi (vedere Sezione 1.4).
Osserviamo che siccome la funzione sin(θ) ≥ 0 per tutti i valori di θ compresi
tra 0 e π, il coefficiente |~v ||w|
~ sin(θ) ≥ 0 e perciò ~v ∧ w
~ e ~u hanno il medesimo
senso.
Le proprietà seguenti si dimostrano facilmente dalla definizione del prodot-
to vettoriale:

PV1 (∀~v ∈ V (R3 )) ~v ∧ ~0 = ~0 ∧ ~v = ~0 ;

~ ∈ V (R3 )) ~v ∧ w
PV2 (∀~v , w ~ = −w
~ ∧ ~v (il prodotto vettoriale non è commu-
tativo);

~ ∈ V (R3 ))(∀k ∈ R) (k~v ) ∧ w


PV3 (∀~v , w ~ = ~v ∧ (k w)
~ = k(~v ∧ w).
~

La proprietà distributiva (valida per il prodotto scalare) è anche presente


nel prodotto vettoriale ma la sua dimostrazione è un tantino più difficile. Per
cominciare, osserviamo che la lunghezza del vettore ~v ∧ w ~ è data dal numero
positivo
|~v ||w|
~ sin(θ)
2.3. PRODOTTO VETTORIALE 35

e siccome |~v | sin(θ) non è altro che l’altezza del parallelogrammo di base w ~
determinato dai vettori ~v e w, ~ ne segue che |~v ∧ w|
~ è l’area di tale parallelo-
~ ∈ V (R3 ) è il numero
grammo. Ilprodotto triplo di tre vettori arbitrari ~u, ~v , w
reale
~ >= |~u||~v ∧ w|
< ~u, ~v ∧ w ~ cos(φ)
dove φ è l’angolo tra i vettori ~u e ~v ∧ w
~ (si noti che 0 ≤ φ ≤ π). Se ~u e ~v ∧ w
~
sono vettori non nulli

< ~u, ~v ∧ w
~ >= 0 ⇐⇒ cos(φ) = 0 ⇐⇒

φ = π/2 ⇐⇒ ~u, ~v , w
~ sono complanari .
~ (ossia, i loro rappresentanti con orig-
Escludendo questo caso, i vettori ~u, ~v , w
ine comune) formano un parallelepipedo di base ~v , w ~ e lato ~u di cui |~u|| cos(φ)|
è l’altezza; siccome |~v ∧ w|
~ è l’area del parallelogrammo ~v , w, ~

| < ~u, ~v ∧ w
~ > | = volume del papallelepipedo ~u, ~v , w
~ .

Da quest’ultimo fatto concludiamo che

| < ~u, ~v ∧ w
~ > | = | < w,
~ ~u ∧ ~v > |

perché questi due numeri positivi rappresentano il volume del medesimo par-
allelepipedo. In verità posiamo fare un passo in più: possiamo dimostrare
che
< ~u, ~v ∧ w ~ ~u ∧ ~v > .
~ >=< w,
Infatti, facciamo un disegno rappresentante i tre vettori in questione; il piano
~ divide R3 in due semispazi, S~v,w~ che contiene il vettore ~v ∧ w
~v , w ~ ed il suo
opposto S~vopp
,w
~ . Analogamente, il piano ~
u , ~
v divide R 3
in due semispazi, S~u,~v
opp
che contiene il vettore ~u ∧~v ed il suo opposto S~u,~v . Ora si osservi che ~u ⊂ S~v,w~
(risp. ~u ⊂ S~vopp
,w ~ ⊂ S~u,~v (risp. w
~ ) se, e soltanto se, w ~ ⊂ S~uopp
,~v ). Questo fatto ci
permette di concludere che cos(~u, ~v ∧ w) ~ e cos(w, ~ ~u ∧~v ) sono ambedue positivi
o ambedue negativi.
Con questa osservazione e la commutatività del prodotto scalare arrivi-
amo alla seguente conclusione:
PT
~ ∈ V (R3 ))
(∀~u, ~v , w
< ~u, ~v ∧ w
~ >=< w,
~ ~u ∧ ~v >=< ~v , w
~ ∧ ~u > .

Teorema 2.3.1 (Proprietà distributiva del prodotto vettoriale)

~ ∈ V (R3 )) ~u ∧ (~v + w)
(∀~u, ~v , w ~ = ~u ∧ ~v + ~u ∧ w
~ .
36 CAPITOLO 2. ALGEBRA VETTORIALE

Dimostrazione – Prendiamo il vettore


~t = ~u ∧ (~v + w)
~ − ~u ∧ ~v − ~u ∧ w
~
e calcoliamo il prodotto scalare < ~t, ~t >= |~t|2 con l’aiuto della proprietà PT
e della distributività del prodotto scalare. Abbiamo
< ~t, ~t >=< ~t, ~u ∧ (~v + w)
~ − ~u ∧ ~v − ~u ∧ w
~ >=
~ > − < ~t, ~u ∧ ~v > − < ~t, ~u ∧ w
=< ~t, ~u ∧ (~v + w) ~ >=
~ > − < ~t, ~u ∧ ~v > − < ~t, ~u ∧ w
=< ~t ∧ ~u, ~v + w ~ >=
=< ~t ∧ ~u, ~v > + < ~t ∧ ~u, w
~ > − < ~t ∧ ~u, ~v > − < ~t ∧ ~u, w
~ >= 0 .
Ma |~t| = 0 ⇐⇒ ~t = 0 e dunque,
~ = ~u ∧ ~v + ~u ∧ w
~u ∧ (~v + w) ~
come volevamo dimostrare. 2

Per concludere questa nostra presentazione fortemente geometrica del


prodotto vettoriale, osserviamo che siccome sin(θ) = 0 ⇐⇒ θ = 0, π,
due vettori non nulli ~v , w
~ hanno prodotto vettoriale nullo se, e soltanto se,
sono paralleli (hanno la medesima direzione). Dunque,
(∀~v ∈ V (R3 )) ~v ∧ ~v = ~v ∧ −v
~ =0;

in particolare,
~i ∧ ~i = ~j ∧ ~j = ~k ∧ ~k = 0 .
Le seguenti uguaglianze si dimostrano facilmente:
~i ∧ ~j = ~k , ~j ∧ ~k = ~i , ~k ∧ ~i = ~j ,
~j ∧ ~i = −~k , ~k ∧ ~j = −~i , ~i ∧ ~k = −~j .
Ora passiamo a guardare il prodotto vettoriale algebricamente. Calco-
liamo il prodotto vettoriale di due vettori arbitrari ~v = (a1 , a2 , a3 ) e w ~ =
(b1 , b2 , b3 ). Per fare questo, scriviamo i due vettori come combinazioni lineari
dei vettori della base canonica:
~ = b1~i + b2~j + b3~k ;
~v = a1~i + a2~j + a3~k e w
a causa della proprietà distributiva del prodotto vettoriale (Teorema 2.3.1)
concludiamo che
~ = (a2 b3 − a3 b2 )~i − (a1 b3 − a3 b1 )~j + (a1 b2 − a2 b1 )~k
~v ∧ w
2.4. APPLICAZIONI 37

ossia,
~ = (a2 b3 − a3 b2 , a3 b1 − a1 b3 , a1 b2 − a2 b1 ) .
~v ∧ w
Il lettore è pregato di osservare che d’accordo con la regola di calcolo
del determinante di una matrice quadra di tre righe e tre colonne, possiamo
scrivere  
~i ~j ~k
~ = det 
~v ∧ w 
 a1 a2 a3  .
b1 b2 b3
Anche il prodotto triplo ha una sua formulazione algebrica elementare:
infatti, dati i vettori

~a = (a1 , a2 , a3 ) , ~b = (b1 , b2 , b3 ) e ~c = (c1 , c2 , c3 ) ,

un semplice calcolo ci permette di scrivere


 
a1 a2 a3
~  
< ~a, b ∧ ~c >= det  b1 b2 b3  .
c1 c2 c3

2.4 Applicazioni
In questa sezione si faranno alcune applicazioni dei vettori reali alla geometria
euclidea.
I punti, le rette ed i piani sono enti primitivi della geometria e come
tali non si definiscono esplicitamente. In una costruzione sistematica del-
la geometria euclidea essi vengono “individuati” da alcune loro proprietà
caratteristiche dette assiomi, considerate come verità non dimostrabili; come
esempi citiamo i seguenti:

Due punti distinti A e B determinano sempre una retta r = AB.

Tre punti A, B e C non situati in una medesima retta determinano sempre


un piano π = ABC.

Se due punti A e B di una retta r appartengono ad un piano π, allora


qualsiasi punto della retta r appartiene al piano π.

Se due piani π e µ hanno un punto A in comune, allora π e µ hanno al meno


un secondo punto in comune.

Se tre punti appartengono ad una retta, uno e soltanto uno dei punti si
trova tra gli altri due.
38 CAPITOLO 2. ALGEBRA VETTORIALE

In un piano π possiamo tracciare da un punto A, non appartenete ad una


retta r, una ed una sola retta s che non interseca la retta r; la retta s
è la parallela ad r passante per A (Assioma di Euclide).
Gli assiomi riportati di sopra sono tratti dal lavoro del matematico tedesco
David Hilbert (1862-1943) sui fondamenti della geometria [3]. Noi abbiamo
già fatto uso implicitamente di questi assiomi, affidandoci alla nostra intu-
izione e a ciò che abbiamo imparato nelle scuole medie e superiori, quando
abbiamo introdotto la nozione di vettore.
Cominciamo per studiare “vettorialmente” la retta r = AB definita da
due punti distinti A, B ∈ R3 . Ricordiamo al lettore che un punto arbitrario
A ∈ R3 definisce un vettore ~a = OA. ~ Si noti che per qualsiasi numero reale
m, il termine C del vettore ~c = ~a + m(~b − ~a) si trova nella retta r cioè, i
punti A, B e C sono allineati; in particolare, per qualsiasi 0 ≤ m ≤ 1, il
punto C è un punto del segmento AB (con C = A se m = 0 e C = B se
m = 1). Reciprocamente, supponiamo che C ∈ r. Allora esiste un numero
reale m per il quale AC ~ = mAB. ~ Se sommiamo il vettore ~a = OA ~ a ambi i
lati di questa uguaglianza otteniamo OA ~ + AC~ = OA ~ + mAB ~ e da questa,
~
~c = ~a +m(b−~a); l’ultima equazione vettoriale può essere riscritta nella forma
~c = (1 − m)~a + m~b (si osservi esplicitamente che la somma dei coefficienti di
~a e ~b è uguale a 1). Le osservazioni precedenti dimostrano il seguente
Teorema 2.4.1 Condizione necessaria e sufficiente perché un punto C ∈
R3 appartenga alla retta r = AB è che esistano due numeri reali λ, µ con
λ + µ = 1 e ~c = λ~a + µ~b.
Le equazioni
~c = ~a + m(~b − ~a) (2.1)
~c = λ~a + µ~b con λ, µ ∈ R e λ + µ = 1 (2.2)
sono due forme della equazione vettoriale della retta r = AB.
Possiamo fare uso del Teorema 2.4.1 per ottenere le coordinate di un
punto qualsiasi della retta r = AB, con A = (a1 , a2 , a3 ) e B = (b1 , b2 , b3 ); per
esempio se C è il punto medio del segmento AB,
1 1 a1 + b1 a2 + b2 a3 + b3
~c = ~a + ~b = ( , , ). (2.3)
2 2 2 2 2
In generale, se C = (x, y, z) l’equazione 2.1 diventa
(x, y, z) = (a1 , a2 , a3 ) + m(b1 − a1 , b2 − a2 , b3 − a3 )
e dunque
x = a1 + m(b1 − a1 ) , y = a2 + m(b2 − a2 ) , z = a3 + m(b3 − a3 ) (2.4)
e queste sono le equazioni parametriche della retta AB.
2.4. APPLICAZIONI 39

Teorema 2.4.2 (Teorema di Pitagora) Sia ABC un triangolo con angolo


retto nel vertice C. Allora,

|AB|2 = |BC|2 + |CA|2 .

~ ~b = CA
Dimostrazione – Consideriamo i vettori ~a = BC, ~ e ~c = BA.
~
Allora, ~b = ~c − ~a e dunque

|~b|2 =< ~b, ~b >= |~a|2 + |~c|2 − 2 < ~a, ~c > .

Ma l’ultimo addendo è nullo perché 6 (~a, ~c) = π/2. 2


Il lettore dovrebbe rivedere la dimostrazione classica del teorema!

Teorema 2.4.3 La somma delle lunghezze di due lati di un triangolo è


maggiore della lunghezza del terzo lato.

Dimostrazione – Prendiamo un triangolo di vertici A, B, C ed i vettori


~ ~b = CA
~a = BC, ~ = ~a + ~b; come per il Teorema 2.4.2
~ e ~c = BA

|~c|2 = |~a|2 + |~b|2 + 2|~a||~b| cos(6 (~a, ~b)) ;

siccome 6 (~a, ~b) =


6 0, π abbiamo

|~c|2 < |~a|2 + |~b|2 + 2|~a||~b| = (|~a| + |~b|)2

e dunque
|~c| < |~a| + |~b| .
2

Teorema 2.4.4 Le mediane di un triangolo si incontrano in un punto P che


le divide nella ragione 1 : 2.

Dimostrazione – Siano A, B e C i vertici del nostro triangolo e siano


M1 ∈ AB, M2 ∈ BC e M3 ∈ AC i punti medi dei tre lati del triangolo.
Vogliamo dimostrare che AM2 ∩ BM3 ∩ CM1 = P e

M1 P M2 P M3 P 1
= = = .
CP AP BP 2
40 CAPITOLO 2. ALGEBRA VETTORIALE

Prendiamo i vettori ~a, ~b, ~c, m ~2 e m


~ 1, m ~ 3 ; dal Teorema 2.4.1 concludiamo che

1 1
~ 1 = ~a + ~b ,
m (2.5)
2 2
1 1
~ 2 = ~b + ~c ,
m (2.6)
2 2
1 1
~ 3 = ~c + ~a .
m (2.7)
2 2
Per eliminazione di ~b dalle equazioni 2.5 e 2.6 otteniamo

2m
~ 1 + ~c = 2m
~ 2 + ~a

e per eliminazione di ~c da 2.6 e 2.7,

2m ~ 3 + ~b ;
~ 2 + ~a = 2m

queste due ultime equazioni divise per 3 ci permettono di scrivere che

2 1 2 1 2 1~
p~ = m~ 1 + ~c = m~ 2 + ~a = m~3 + b.
3 3 3 3 3 3
A causa del Teorema 2.4.1, concludiamo dall’equazione

2 1
p~ = m~ 1 + ~c
3 3
che il punto P ∈ AM2 ; analogamente, le altre uguaglianze ci permettono di
concludere che P ∈ BM3 e P ∈ CM1 . D’altra parte, possiamo scrivere

2 1 1
p~ = m~ 1 + ~c = m
~ 1 + (~c − m
~ 1)
3 3 3

e da questo concludiamo che P si trova a una distanza uguale a 31 dCM1 da


M1 e dunque
M1 P 1
= ;
CP 2
gli altri due casi sono dimostrati in modo simile. 2

Teorema 2.4.5 Le diagonali di un parallelogrammo si incontrano nel loro


punto medio.
2.4. APPLICAZIONI 41

Dimostrazione – Siano A, B, C e D i vertici del parallelogrammo. Siccome


i lati opposti del parallelogrammo sono paralleli è immediato che ~b−~a = ~c − d~
e da questa uguaglianza concludiamo che
1 1 1 1
p~ = ~b + d~ = ~a + ~c
2 2 2 2
cioè, le diagonali si incontrano in un punto P che infatti è il loro punto medio
dalla formula 2.3. 2

Teorema 2.4.6 La mediana alla base di un triangolo isocele è perpendicolare


alla base.

Dimostrazione – Siano A, B i vertici della base del triangolo, M sia il punto


medio e O sia il terzo vertice. Da ciò che abbiamo visto in precedenza,
1 1~
m
~ = ~a + b
2 2
e dunque, il prodotto scalare
1
~ ~b − ~a >= (|~b|2 − |~a|2 ) = 0
< m,
2
~ ⊥ ~b − ~a.
perchè |~b| = |~a|. In altre parole, m 2

Teorema 2.4.7 L’angolo iscritto in un semicerchio è un angolo retto.

Dimostrazione – Consideriamo un semicerchio di centro O, diametro AB e


semicirconferenza Γ; sia C ∈ Γ. Vogliamo dimostrare che l’angolo 6 (BC, AC) =
π/2. I punti A, B e C danno luogo ai vettori
~ , ~b = OB
~a = OA ~ = −~a , ~c = OC
~ ,

~ = ~c − ~a e BC
AC ~ = ~c + ~a .
Siccome
~ BC
< AC, ~ >=< ~c − ~a, ~c + ~a >= 0
e questi vettori non sono nulli, concludiamo che 6 (BC, AC) = π/2 (vedere
Corollario ??). 2
42 CAPITOLO 2. ALGEBRA VETTORIALE

Teorema 2.4.8 (Legge dei seni) Sia ABC un triangolo di angoli

α = 6 (BA, AC) , β = 6 (AB, BC) , γ = 6 (AC, CB) ;

allora
|CB| |AC| |AB|
= = .
sin(α) sin(β) sin(γ)

~ v = AC
Dimostrazione – Prendiamo i vettori ~u = CB,~ ~ ew ~ si osservi
~ = AB;
che w
~ = ~u + ~v . Sappiamo che w ~ = ~0; d’altro lato,
~ ∧w

~ ∧w
w ~ =w
~ ∧ (~u + ~v ) = w
~ ∧ ~u + w
~ ∧ ~v

e dunque,
|w||~
~ u| sin(β) = |w||~
~ v | sin(α) .

Da quest’ultima uguaglianza si conclude che

|CB| |AC|
= .
sin(α) sin(β)

L’altra uguaglianza dell’enunciato si dimostra in modo simile. 2

Il prossimo risultato è una generalizzazione del notissimo Teorema di


Pitagora.

Teorema 2.4.9 (Legge dei coseni) Sia ABC un triangolo con angolo α =
6 (BA, AC). Allora,

|BC|2 = |AB|2 + |AC|2 − 2|AB||AC| cos(α) .

Dimostrazione – Come nel teorema precedente prendiamo i vettori ~u =


~ v = AC
CB,~ ~ ew ~ allora ~u = w
~ = AB; ~ − ~v Ora calcoliamo il prodotto scalare
de ~u con se stesso:
< ~u, ~u >=< w
~ − ~v , w
~ − ~v >=

|~v |2 + |w|
~ 2 − 2 < ~v , w ~ 2 − 2|~v ||w|
~ >= |~v |2 + |w| ~ cos(α)

e da questa equazione troviamo il risultato. 2


2.5. TRASLAZIONI E ROTAZIONI 43

2.5 Traslazioni e Rotazioni


Nel Capitolo 3 ci preoccuperemo di capire quali equazioni algebriche di sec-
ondo grado in x, y rappresentano una conica e più precisamente, che tipo di
conica. Per arrivare a questo ultimo obiettivo sarà necessario modificare le
equazioni in modo da ottenere una equazione di secondo grado di cui conosci-
amo la curva; ciò si ottiene mediante cambiamenti del sistema di coordinate
cartesiane. In seguito studieremo questi cambiamenti di coordinate; siccome
faremo ragionamenti simili anche per le superfici quadriche (vedere il Capi-
tolo 4), tanto vale studiare subito i cambiamenti dei sistemi di coordinate
nello spazio tridimensionale.
Consideriamo lo spazio R3 assieme ad un suo sistema (ortogonale) di
coordinate cartesiane Ox, Oy, Oz. Sia O0 = (k, `, m) un punto arbitrario
di R3 , origine di un nuovo sistema (ortogonale) di coordinate cartesiane
O0 x0 , O0 y 0 , O0 z 0 in tal modo che i piani O0 x0 y 0 , O0 y 0 z 0 e O0 x0 z 0 siano paral-
leli rispettivamente ai piani Oxy, Oyz e Oxz. Se un punto P dello spazio
ha coordinate (x, y, z) nel sistema originale e coordinate (x0 , y 0 , z 0 ) nel nuovo
sistema, allora è facile capire che

x0 = x − k , y 0 = y − ` , z 0 = z − m ,

o equivalentemente,

x = x0 + k , y = y 0 + ` , z = z 0 + m .

Ora prendiamo R3 con due sistemi ortogonali di coordinate cartesiane


Ox, Oy, Oz e Ox0 , Oy 0 , Oz 0 (i due hanno la medesima origine). Siano ~i, ~j, ~k i
vettori unitari di base nel primo sistema e ~i0 , j~0 , k~0 quelli del secondo. Si noti
che un vettore arbitrario ~v di V (R3 ) può essere scritto in termini della base
{~i, ~j, ~k} come
~v =< ~v ,~i > ~i+ < ~v , ~j > ~j+ < ~v , ~k > ~k .
Dunque i vettori ~i0 , j~0 , k~0 si possono scrivere come segue:
~i0 =< ~i0 ,~i > ~i+ < ~i0 , ~j > ~j+ < ~i0 , ~k > ~k ,

j~0 =< j~0 ,~i > ~i+ < j~0 , ~j > ~j+ < j~0 , ~k > ~k e
k~0 =< k~0 ,~i > ~i+ < k~0 , ~j > ~j+ < k~0 , ~k > ~k .
Riscriviamo questo sistema nella forma

 ~

 i0 = a11~i + a12~j + a13~k

j~0 = a21~i + a22~j + a23~k (2.8)

 k~0 = a31~i + a32~j + a33~k
44 CAPITOLO 2. ALGEBRA VETTORIALE

e rileviamo esplicitamente la matrice


 
a11 a12 a13
R =  a21 a22 a23 

 (2.9)
a31 a32 a33
che chiamiamo di matrice di rotazione. Siccome

< ~i,~i >=< ~j, ~j >=< ~k, ~k >= 1

< ~i, ~j >=< ~j, ~k >=< ~k,~i >= 0


e le medesime relazioni valgono per i vettori ~i0 , j~0 e k~0 perché il sistema
Ox0 , Oy 0 , Oz 0 è ortogonale, otteniamo le equazioni
a211 + a12
2
+ a213 =1
a221 + a22
2
+ a223 =1
2 2 2
a31 + a32 + a33 =1
(2.10)
a11 a21 + a12 a22 + a13 a23 =0
a11 a31 + a12 a32 + a13 a33 =0
a21 a31 + a22 a32 + a23 a33 =0
ossia, i vettori le cui componenti sono gli elementi delle righe di A – i cosid-
detti vettori righe di A – sono ortonormali tra di loro, cioè ogni vettore riga
ha lunghezza 1 e due vettori righe distinti sono perpendicolari tra loro. Per
questo motivo la matrice A è detta ortogonale; infatti, cosı̀ sono dette tutte
le matrici i cui vettori righe (o colonne) sono ortonormali.
Sia AT la trasposta della matrice A (ricordiamo che AT si ottiene scriven-
do le righe di A come colonne di AT ). Allora, dalle equazioni 2.10 concludi-
amo che
AAT = AT A = I3
e cioè, A è invertibile e ha per inversa la matrice AT .
Ricordando che prendiamo sempre i nostri sistemi di coordinate in modo
che gli assi siano perpendicolari tra loro e con l’orientamento dato dalla regola
del cavatappi e ricordando anche le caratterizzazioni del prodotto triplo di tre
vettori come volume e come determinante, concludiamo che il determinante
della matrice di rotazione 2.9 è uguale a 1: infatti, i vettori ortonormali ~i0 , j~0
e k~0 determinano un parallelepipedo di volume 1 e d’altro lato,
 
a11 a12 a13
~0 ~0 ~0  
< i , j ∧ k >= det  a21 a22 a23  = det(A).
a31 a32 a33
Raccogliamo gli ultimi risultati in un unico teorema:
2.5. TRASLAZIONI E ROTAZIONI 45

Teorema 2.5.1 Sia  


a11 a12 a13
 
R =  a21 a22 a23 
a31 a32 a33
una matrice di rotazione. Allora valgono i seguenti risultati:
1. i vettori righe di R hanno lunghezza 1 e sono ortogonali tra di loro;
2. det R = 1;
3. R è invertibile e R−1 = RT .
Sia P un punto arbitrario di R3 . Supponiamo che P abbia coordinate
(x, y, z) nel sistema Ox, Oy, Oz; quali saranno le sue coordinate nel sistema
~ non dipende dalla
Ox0 , Oy 0 , Oz 0 ? Come ente geometrico il vettore p~ = OP
scelta del sistema di coordinate per R ma relativamente alle basi {~i, ~j, ~k} e
3

{~i0 , j~0 , k~0 } ha coordinate diverse; cosı̀ ,

p~ = x~i + y~j + z~k

e
p~ = x0~i0 + y 0 j~0 + z 0 k~0 .
Da quest’ultima combinazione lineare otteniamo

x0 =< p~, ~i0 > , y 0 =< p~, j~0 > , z 0 =< p~, k~0 > ,

e dalle equazioni 2.8 concludiamo che


x0 = a11 x + a12 y + a13 z
y 0 = a21 x + a22 y + a23 z
z 0 = a31 x + a32 y + a33 z
ossia,     
x0 a11 a12 a13 x
 0    
 y  =  a21 a22 a23   y 
z0 a31 a32 a33 z
Nel piano R2 le cose procedono in maniera analoga. Sia Ox, Oy un sis-
tema di coordinate ortogonali e sia dato un punto O0 = (k, `) ∈ R2 ; ora
prendiamo un nuovo sistema (ortogonale) di coordinate cartesiane O0 x0 , O0 y 0
in tal modo che gli assi O0 x0 , O0 y 0 siano paralleli rispettivamente agli assi
Ox, Oy. Se un punto P del piano ha coordinate (x, y) nel sistema originale
e coordinate (x0 , y 0 ) nel nuovo sistema, allora è facile capire che

x0 = x − k , y 0 = y − ` ,
46 CAPITOLO 2. ALGEBRA VETTORIALE

o equivalentemente,
x = x0 + k , y = y 0 + ` .
Ora prendiamo R2 con due sistemi ortogonali di coordinate cartesiane con
la medesima origine Ox, Oy e Ox0 , Oy 0 . Siano ~i, ~j i vettori unitari di base
nel primo sistema e ~i0 , j~0 quelli del secondo. Come nel caso tridimensionale,
scriviamo i vettori ~i0 , j~0 nella forma
~i0 =< ~i0 ,~i > ~i+ < ~i0 , ~j > ~j ,

j~0 =< j~0 ,~i > ~i+ < j~0 , ~j > ~j .


Riscriviamo questo sistema nella forma
(
~i0 = a11~i + a12~j
(2.11)
j~0 = a21~i + a22~j

e rileviamo esplicitamente la matrice di rotazione


  !
a11 a12
A= (2.12)
a21 a22

Anche in questo caso


a211 + a12
2
=1
2 2
a21 + a22 = 1
a11 a21 + a12 a22 = 0
ossia, i vettori righe di A – sono ortonormali tra di loro e dunque, AAT =
AT A = I2 . Anche nel caso bidimensionale, det(A) = 1. Infatti, pensiamo
alla rotazione nel piano come una rotazione nello spazio attorno all’asse Oz;
allora abbiamo le equazioni vettoriali

 ~0
 i
 = a11~i + a12~j + 0~k

j~0 = a21~i + a22~j + 0~k (2.13)

 k~0 = 0~i + 0~j + 1~k

dalle quali possiamo estrarre la matrice


 
a11 a12 0

B= a21 a22 0 
 .
0 0 1

Come per il caso n = 3,

< ~i0 , j~0 ∧ k~0 >= det(B) = 1


2.5. TRASLAZIONI E ROTAZIONI 47

e siccome det(B) = det(A), concludiamo che det(A) = 1.


Sia P un punto arbitrario di R2 con coordinate (x, y) nel sistema Ox, Oy
e coordinate (x0 , y 0 ) nel sistema Ox0 , Oy 0 . Come nel caso più generale

x0 = a11 x + a12 y
y 0 = a21 x + a22 y

ossia,   !   !  !
x0 a11 a12 x
=
y0 a21 a22 y
Facciamo un esempio specifico. Supponiamo ruotare il piano Ox, Oy
attorno all’origine nel senso anti-orario di un angolo θ; allora,
(
~i0 = cos θ~i + sin θ~j
j~0 = − sin θ~i + cos θ~j

d’onde concludiamo che un punto P di coordinate (x, y) nel sistema Ox, Oy


ha coordinate (
x0 = x cos θ + y sin θ
y 0 = −x sin θ + y cos θ
nel sistema Ox0 , Oy 0 ; i valori di x, y in termini di x0 , y 0 sono dati dalle
equazioni (
x = x0 cos θ − y 0 sin θ
(2.14)
y = x0 sin θ + y 0 cos θ

Teorema 2.5.2 Traslazioni e rotazioni conservano distanze e angoli.

Dimostrazione – Vogliamo dimostare che traslazioni e rotazioni manten-


gono la lunghezza dei vettori e gli angoli tra essi. Cominciamo con le traslazioni.
Sia τ una traslazione di R3 data dalle equazioni

x = x0 + k , y = y 0 + ` , z = z 0 + m .
~ con A = (a1 , a2 , a3 ).
Sia ~v un vettore rappresentato dal segmento orientato OA
Allora τ trasforma tale segmento nel segmento orientato τ (OA)~ di estremi
~ = ~v o in altre
O0 = (k, `, m) e A0 = (a1 + k, a2 + `, a3 + m); dunque τ (OA)
parole, le traslazioni mantengono i vettori.
Sia ora σ una rotazione definita dalla matrice ortonormale
 
a11 a12 a13
A=

 21 a22 a23  .
a
a31 a32 a33
48 CAPITOLO 2. ALGEBRA VETTORIALE

Dato ~v = (a1 , a2 , a3 ), abbiamo

σ(~v ) =

(a11 a1 + a12 a2 + a13 a3 , a21 a1 + a22 a2 + a23 a2 , a31 a1 + a32 a2 + a33 a3 )


e facendo i conti, otteniamo

|σ(~v )|2 = a12 + a22 + a32 = |~v |2 .

Più generalmente, facendo i conti si vede che una rotazione non altera il
prodotto scalare di due vettori, cioè

< σ(~v ), σ(w)


~ >=< ~v , w
~>

e perciò
< σ(~v ), σ(w)
~ > < ~v , w
~>
= = cos α
|σ(~v )||σ(w)|
~ |~v ||w|
~
dove α è l’angolo tra ~v e w.
~ 2
Capitolo 3

Curve algebriche piane

3.1 Curve piane


In questo capitolo studieremo le figure piane definite come luoghi geometrici
di tutti i punti di R2 che siano soluzioni di una equazione algebrica reale
f (x, y) = 0. Questi luoghi sono detti curve (algebriche) piane.
Cominciamo per fare alcune considerazioni generali sulle curve piane. Si
chiama ordine di una curva il grado del polinomio che la determina. Se un
polinomio f (x, y) si scrive come prodotto di due polinomi di gradi ≥ 1 come

f (x, y) = g(x, y)h(x, y)

la curva piana Λ definita da f (x, y) = 0 si decompone come l’unione delle


curve determinate da g(x, y) = 0 e h(x, y) = 0, dette componenti di Λ. Per
esempio, la curva di ordine 3 definita dall’equazione

x3 − y 3 + x2 (1 − y) + y 2 (1 + x) − x + y − 1 = (x − y + 1)(x2 + y 2 − 1) = 0

ha come componenti la curva definita dall’equazione

x2 + y 2 − 1 = 0

e quella definita da
x−y+1=0 .
Si noti che queste due curve si incontrano in due punti: (−1, 0) e (0, 1). La
curva di ordine 2 data da

x2 + y 2 − 2xy + 2x − 2y + 1 = (x − y + 1)2 = 0

ha come (unica) componente la curva x − y + 1 = 0 che però deve essere


contata due volte.

49
50 CAPITOLO 3. CURVE ALGEBRICHE PIANE

Ora diamo l’enunciato di un teorema che ha avuto molta importanza


per la Geometria Algebrica, dove compare sotto varie forme equivalenti; la
dimostrazione di questo teorema sfugge agli scopi di questo corso però il suo
contenuto è di interesse per il nostro lavoro; il lettore curioso potrà trovarne
una dimostrazione in [7].

Teorema 3.1.1 (Teorema di Bézout)1 Due curve algebriche di ordini m e n


che hanno più di mn punti in comune hanno una componente comune.

Trattandosi della ricerca di punti comuni a due curve algebriche piane


(cioè dei punti del piano che soddisfano simultaneamente due equazioni alge-
briche reali in due variabili) il risultato va interpretato nel campo complesso
e con i dovuti riguardi per le cosiddette multiplicità di intersezione. Facciamo
un esempio semplice. Sia γ data dall’equazione

x2 + y 2 = 1

e sia r una curva di equazione x − k = 0. Allora

1. se −1 < k < 1,

Γ ∩ r = (k, ± 1 − k 2 ) ;

2. se k < −1 o k > 1,

Γ ∩ r = (k, ±i k 2 − 1) ;

3. se k = 1 (resp. k = −1),

Γ ∩ r = (1, 0) resp. (−1, 0)

ma ognuna di queste intersezioni deve essere contata 2 volte cioè, ogni


intersezione ha molteplicità 2.

Ora cominceremo a studiare alcune curve speciali di R2 : le rette e le cosid-


dette coniche ossia: circonferenza, parabola, ellisse e iperbole. Nel capitolo
successivo studieremo le coniche dal punto di vista puramente geometrico.
1
Etienne Bézout, Nemours 1730 – Les Basses-Loges (Fontainebleau) 1783.
3.1. CURVE PIANE 51

3.1.1 Rette
Consideriamo il piano R2 munito di un sistema ortogonale di coordinate Ox,
Oy. Osserviamo subito che le equazioni 2.1 e 2.2 si trasferiscono naturalmente
al piano R2 ; questo vale anche per le equazioni parametriche: dati A =
(a1 , a2 ) e B = (b1 , b2 ) la retta r = AB ha le equazioni parametriche

x = a1 + m(b1 − a1 ) , y = a2 + m(b2 − a2 ) . (3.1)

Facciamo un’analisi più aprofondita di queste equazioni parametriche.


Per cominciare, supponiamo che a1 = b1 ; in questo caso il vettore ~b − ~a =
(0, b2 − a2 ) è parallelo al vettore ~j (cioè all’asse Oy) e l’equazione x − a1 =
0 caratterizza tutti i punti di r. Analogamente, se a2 = b2 , la retta r è
rappresentata dall’equazione y − a2 = 0. Supponiamo finalmente che a1 6= b1
e a2 6= b2 (non è possibile avere simultaneamente a1 = b1 e a2 = b2 perché
siamo partiti da punti distinti A e B). In questo caso abbiamo
x − a1 y − a2
m= = ;
b1 − a1 b2 − a2
scrivendo

a = b2 − a2 , b = a1 − b1 e c = a2 (b1 − a1 ) − a1 (b2 − a2 )

otteniamo l’equazione lineare in x e y

ax + by + c = 0 .

I tre casi considerati ci mostrano che le equazioni parametriche di una retta


per due punti distinti possono essere trasformate in una equazione lineare
(con coefficienti reali)

ax + by + c = 0 con almeno uno tra a, b =


6 0.

Reciprocamente, sia data una equazione lineare in x, y con coefficienti reali

ax + by + c = 0 ; (3.2)

dimostriamo che i punti (x, y) del piano che soddisfano l’equazione apparten-
gono tutti ad una retta. Supponiamo per ora che a, b e c siano tutti e tre non
nulli. Se y = 0 l’equazione 3.2 implica ax + c = 0 e le coordinate del punto
A = (−c/a, 0) soddisfano 3.2; se x = 0, sono le coordinate di B = (0, −c/b)
a soddisfare 3.2. Ora calcoliamo l’equazione vettoriale della retta r = AB:
essa è
c c c
(x, y) = (− , 0) + m( , − )
a a b
52 CAPITOLO 3. CURVE ALGEBRICHE PIANE

o in forma parametrica,
c c c
x+ = m , y = −m
a a b
e quindi, eliminando la m tra le due otteniamo l’equazione ax + by + c = 0
che coincide con l’equazione data. I casi in cui a = 0 oppure b = 0 (non è
possibile avere ambedue a = 0 e b = 0) sono discussi in modo analogo; si noti
che se a = 0 abbiamo una retta parallela a Ox, se b = 0 la retta è parallela
all’asse Oy e se c = 0 la retta passa per il punto origine O.
A questo punto vogliamo osservare esplicitamente il vettore ~n = (a, b)
ottenuto dai coefficienti di x e y nell’equazione ax + by + c = 0 di una retta
r di R2 è perpendicolare alla direzione della retta; infatti:
1. a = 0 ⇒ r k Ox e ~n = (0, b) ⊥ Ox e perciò ~n ⊥ r;

2. b = 0 ⇒ r k Oy e ~n = (a, 0) ⊥ Oy e perciò ~n ⊥ r;
3. a 6= 0, b 6= 0, c = 0 ⇒ r passa per l’origine e contiene il punto (1, −a/b);
il vettore ~v = (1, −a/b) ha la medesima direzione di r e < ~n, ~v >= 0 e
dunque ~n ⊥ r;
4. a 6= 0, b 6= 0, c 6= 0 ⇒ r incontra Ox in (−c/a, 0) e Oy in (0, −c/b); il
vettore ~v = (c/a, −c/b) è nella direzione di r e < ~n, ~v >= 0.
Esistano altri modi per dare l’equazione di una retta nel piano.
Retta per un punto e in una direzione data - Sono dati A = (a1 , a2 ) e ~n =
~ e ~n sono paralleli; dunque abbiamo le
(a, b). Se X = (x, y) ∈ r i vettori AX
equazioni parametriche:

x = a1 + ma , y = a2 + mb .

Retta per un punto e perpendicolare ad una direzione data - Sono dati A =


(a1 , a2 ) e ~n = (a, b). Allora
~ ⊥ ~n ⇐⇒ < (x − a1 , y − a2 ), (a, b) >= 0
AX

e dunque,
ax + by + (−aa1 − ba2 ) = 0 .
Retta perpendicolare ad una direzione data e ad una distanza data dall’origine
- Sia ~n = (a, b) un vettore dato. Cerchiamo l’equazione di una retta r che
sia perpendicolare alla direzione di ~n e che si trovi ad una distanza d > 0
dall’origine O. Sia ~c = (x, y) un vettore di R2 . Allora,

< ~c, ~n >= |~n||~c| cos(6 (~n, ~c)) =


3.1. CURVE PIANE 53

= a2 + b2 proj~n (~c) ;
d’altro lato, < ~c, ~n >= ax + by e perciò,

ax + by = a2 + b2 proj~n (~c) .

Ora i punti C del piano che appartengono ad una tale retta devono soddisfare
la condizione |proj~n (~c)| = d e siccome il numero proj~n (~c) può essere positivo
o negativo, abbiamo due possibili soluzioni:

ax + by + d a2 + b2 = 0

ax + by − d a2 + b2 = 0
Siano dati una retta r ⊂ R2 di equazione

ax + by + c = 0

ed un punto A = (a1 , a2 ) ∈ R2 tale che A 6∈ r. Ci proponiamo di calcolare


la distanza tra A e r. La retta n per A e perpendicolare a r ha equazioni
parametriche
x = a1 + ma , y = a2 + mb ;
sostituendo questi valori per x e y nell’equazione della retta abbiamo a(a1 +
ma) + b(a2 + mb) + c = 0 e dunque

aa1 + ba2 + c
m=−
a 2 + b2
(il denominatore non può essere nullo). Allora

aa1 + ba2 + c aa1 + ba2 + c


r ∩ n = B = (a1 − a, a 2 − b)
a2 + b2 a2 + b2
La distanza tra A e B (cioè, la distanza tra A e r) è data dal numero

1
d = |aa1 + ba2 + c| √ .
a2 + b2

3.1.2 La circonferenza
Siano dati un punto C ∈ R2 ed un numero reale positivo r; l’insieme γ dei
punti P ∈ R2 tali che dP C = r è la circonferenza di centro C e raggio r. Si
usa anche dire che la circonferenza di centro C e raggio r è il luogo geometrico
dei punti di R2 la cui distanza a C è r.
54 CAPITOLO 3. CURVE ALGEBRICHE PIANE

La forma più semplice dell’equazione della circonferenza si ottiene pren-


dendo il centro C come origine del sistema ortogonale di coordinate carte-
siane: allora q
P ∈ γ ⇐⇒ x2 + y 2 = r
ossia
x2 + y 2 = r 2 .
Questa è l’equazione canonica della circonferenza.
Anche l’equazione della circonferenza di raggio r e centro C = (c1 , c2 ) si
ottiene banalmente ed è

(x − c1 )2 + (y − c2 )2 = r2 .

Supponiamo che C abbia le coordinate (c1 , c2 ); allora,


q
P = (x, y) ∈ γ ⇐⇒ dP C = (x − c1 )2 + (y − c2 )2 = r

ossia,
(x − c1 )2 + (y − c2 )2 = r2
o equivalentemente,

x2 + y 2 − 2xc1 − 2yc2 + c21 + c22 − r2 = 0 .

Come si può constatare dall’ultima equazione, l’equazione di una circon-


ferenza nelle condizioni date è una equazione quadratica (di secondo grado)
in x e y senza termine “misto” in xy e con i coefficienti di x2 e y 2 uguali a 1.
Inversamente, supponiamo di avere l’equazione

x2 + y 2 + dx + ey + f = 0 (3.3)

con e, d, f numeri reali arbitrari. Affermiamo che tale equazione rappresenta


una circonferenza purché d2 + e2 − 4f > 0 ! Per dimostrare questa nostra
affermazione trasformiamo l’equazione con il metodo del completamento dei
quadrati: osserviamo che 3.3 è equivalente all’equazione
d2 e2 d2 e2
x2 + dx + + y 2 + ey + = −f + +
4 4 4 4
ossia,
d e 1
(x + )2 + (y + )2 = (d2 + e2 − 4f )
4 4 4
rappresenta una circonferenza di centro (−d/2, −e/2) e raggio
q
r = 1/2 d2 + e2 − 4f .
3.1. CURVE PIANE 55

Sappiamo dalla geometria elementare che tre punti determinano una cir-
conferenza; vediamo con un semplice esempio como ciò accade. Siano dati i
punti A = (1, 1), B = (0, 3) e C = (−1, 0). Prendiamo i segmenti AB e AC
e i loro rispettivi punti medi M1 = (1/2, 2) e M2 = (0, 1/2). Le rette r1 e r2
passanti per M1 e M2 e perpendicolari ai segmenti AB e AC rispettivamente
si incontrano nel centro della circonferenza Z perché le distanze da Z ai punti
A, B e C sono uguali. Le equazioni di queste rette sono

r1 : 2x − 4y + 7 = 0
;
r2 : −4x − 2y + 1 = 0

il loro punto di incontro


q è Z = (−1/2, 3/2) e la distanza di Z a A, per
esempio, è uguale a 5/2. Dunque troviamo che la circonferenza passante
per i tre punti dati ha equazione

x2 + y 2 + x − 3y = 0 .

D’altro lato è possibile fare un ragionamento puramente algebrico per


trovare l’equazione della circonferenza per i punti A, B e C. Infatti, im-
ponendo che le coordinati di tali punti soddisfini l’equazione generale della
circonferenza 3.3 otteniamo il sistema lineare


 d + e + f = −2
3e + f = −9


−d + f = −1

che ha per soluzione (unica) d = 1, e = −3 e f = 0 donde concludiamo che


l’equazione 3.3 diventa

x2 + y 2 + x − 3y = 0 .

3.1.3 La parabola
Una parabola è il luogo geometrico dei punti del piano R2 che sono equidis-
tanti da una retta ed un punto di R2 ; la retta d è la direttrice ed il punto F
è il fuoco della parabola.
Per trovare una equazione che rappresenti “canonicamente” una parabola
procediamo nel modo seguente: sia p > 0 la distanza dal fuoco alla direttrice;
prendiamo un sistema ortogonale di coordinate cartesiane xOy in R2 in tal
modo che F = (p/2, 0) e d abbia equazione x + p/2 = 0. Allora,
q
dP F = dP d ⇐⇒ (x − p/2)2 + y 2 = |x + p/2|
56 CAPITOLO 3. CURVE ALGEBRICHE PIANE

e dunque,
p2 p2
x2 − px ++ y 2 = x2 + px +
4 4
e cosı̀ abbiamo una equazione canonica della parabola.

y 2 = 2px , p > 0 .

Il punto (0, 0) è il vertice della parabola e l’asse Ox è detto asse di sim-


metria, questo perché, dato un qualsiasi punto (xo , yo ) della parabola, anche
il punto (xo , −yo ) appartiene alla parabola.
Ci sono altre tre possibili posizioni per la parabola e perciò, altre tre
equazioni canoniche; per esempio, se prendiamo il punto (−p/2, 0) per fuoco
e la retta x − p/2 = 0 come direttrice, troviamo l’equazione

y 2 = −2px , p > 0 ;

le altre due possibilità sono:

x2 = 2py , p > 0 ,

x2 = −2py , p > 0 .

3.1.4 L’ellisse
L’ellisse è il luogo geometrico dei punti del piano tali che la somma delle
distanze da due punti fissi è costante. Questi due punti fissi sono detti fuochi.
La definizione ha senso soltanto nel caso in cui questa costante sia più
grande della distanza tra i fuochi. Per ottenere l’equazione canonica dell’ellisse
prendiamo un sistema di coordinate avente per asse orizzontale Ox la retta
passante per i due fuochi F ed F 0 e per origine il punto medio del segmento
F F 0 . Dunque i fuochi avranno coordinate F = (c, 0) e F 0 = (−c, 0). Sia
2a > 0 la costante data. La definizione ora ci dice che P = (x, y) è un punto
dell’ellisse se, e soltanto se
q q
(x − c)2 + y 2 + (x + c)2 + y 2 = 2a .

Se trasferiamo uno dei radicali a destra e prendiamo il quadrato dei due lati
dell’uguaglianza otteniamo
q
(x − c)2 + y 2 = 4a2 − 4a (x + c)2 + y 2 + (x + c)2 + y 2 ;

facendo i conti otteniamo


q c
(x + c)2 + y 2 = a + x .
a
3.1. CURVE PIANE 57

Calcoliamo nuovamente i quadrati di ambi i lati per ottenere

2 2 2c2 2
(x + c) + y = a + 2cx + 2 x
a
e pertanto,
x2 y2
+ =1.
a2 a2 − c2

Siccome a > c possiamo prendere il numero reale b = a2 − c2 e l’equazione
anteriore diventa
x2 y 2
+ 2 =1,
a2 b
una forma canonica dell’equazione dell’ellisse. Da questa equazione osservi-
amo che la nostra ellisse interseca l’asse Ox nei punti A = (a, 0), A0 = (−a, 0)
e (a causa del Teorema di Pitagora) incontra l’asse Oy nei punti B = (0, b)
e B 0 = (0, −b). Il segmento A0 A (risp. B 0 B) è detto asse maggiore (risp.
asse minore) dell’ellisse; l’intersezione dell’asse maggiore con l’asse minore è
il centro dell’ellisse. Si noti che l’asse maggiore (risp. asse minore) è un asse
di simmetria nel senso che se un ponto (xo , yo ) appartiene all’ellisse anche
(xo , −yo ) (risp. (−xo , yo )) appartienne all’ellisse. Il centro dell’ellisse è cen-
tro di simmetria della figura nel senso che dato un qualsiasi punto (xo , yo )
dell’ellisse, il punto (−xo , −yo ) è anche nella figura.
Si noti che se prendessimo i punti F = (0, c) e F 0 = (0, −c) come fuochi,
avremmo l’equazione canonica
x2 y 2
+ 2 =1
b2 a
Finalmente, il quoziente
c
e=
a
è detto eccentricità dell’ellisse; chiaramente 0 < e < 1.
Ritorniamo per un momento alla definizione della parabola per ricordare
che questa figura piana è definita come il luogo geometrico dei punti P le cui
distanze ad un punto F ed una retta d sono uguali; in altre parole,
dP F
=1.
dP d
Consideriamo l’ellisse E di equazione canonica come sopra, con fuochi F =
(c, 0), F 0 = (−c, 0) e prendiamo le rette d e d0 di equazioni
a a
x− =0 e x+ =0
e e
rispettivamente. Vogliamo dimostrare il seguente
58 CAPITOLO 3. CURVE ALGEBRICHE PIANE

Teorema 3.1.2
dP F
P ∈ E ⇐⇒ =e
dP d
oppure
dP F 0
P ∈ E ⇐⇒ =e.
dP d0
Dimostrazione – Condizione necessaria :
P ∈ E ⇒ dP F /dP d = e – Supponiamo che P = (x, y) soddisfi l’equazione
dell’ellisse; allora,
(a2 − c2 )x2 + a2 y 2 = a2 (a2 − c2 )
e da questa otteniamo
c2 x2 + a4 = a2 c2 + a2 y 2 + a2 x2 . (3.4)
Ora q
dP F (x − c)2 + y 2
=
dP d |x − a2 /c|
e perciò prendendo i quadrati di ambi i lati e semplificando otteniamo
dP F 2 c2 [x2 − 2cx + c2 + y 2 ]
( ) = ;
dP d c2 x2 − 2a2 cx + a4
sostituendo l’espressione
c2 x2 + a4
nel denominatore di questa uguaglianza per il suo valore in 3.4 si ha
dP F 2 c2 [x2 − 2cx + c2 + y 2 ] c
( ) = 2 2 2 2
= ( )2
dP d a [x − 2cx + c + y ] a
e perciò
dP F
=e.
dP d
Condizione sufficiente : dP F /dP d = e ⇒ P ∈ E – La condizione ci dice che
q
(x − c)2 + y 2 = e|x − a2 /c| .
Prendendo i quadrati dei due lati dell’espressione e semplificando otteniamo
che
x2 y 2
+ 2 =1
a2 b
ossia P ∈ E.
Risulati analoghi si ottengono per il fuoco F 0 e la direttrice d0 . 2
3.1. CURVE PIANE 59

3.1.5 L’iperbole
L’iperbole è il luogo geometrico dei punti del piano tali che la differenza delle
distanze da due punti fissi detti fuochi è una costante positiva.
Come per l’ellisse, prendiamo un sistema di coordinate avente per asse
orizzontale Ox la retta passante per i due fuochi F ed F 0 e per origine il punto
medio del segmento F F 0 . Siano F = (c, 0) e F 0 = (−c, 0) le coordinate dei
fuochi e sia 2a > 0 la costante data. La definizione ora ci dice che P = (x, y)
è un punto dell’iperbole se, e soltanto se
q q
(x − c)2 + y2 − (x + c)2 + y 2 = ±2a .

Trasferendo un radicale a destra e quadrando i lati otteniamo


q
(x − c)2 + y 2 = (x + c)2 + y 2 ± 4a (x + c)2 + y 2 + 4a2

che si trasforma nell’uguaglianza


q
±4a (x + c)2 + y 2 = 4a2 + 4cx ;

dividendo i due lati per 4a e quadrando nuovamente otteniamo

c2 2
x2 + 2cx + c2 + y 2 = a2 + 2cx + x
a2
ossia,
c2
2
− 1)x2 − y 2 = c2 − a2
(
a
2 2
e dividendo per c − a otteniamo

x2 y2
− =1.
a2 c2 − a2
Ora dimostriamo che c > a. Prendiamo un triangolo P F F 0 il cui vertice P
è un punto della nostra iperbole. Sia d1 (risp. d2 ) la lunghezza del segmento
P F (risp. P F 0 ); da una nota proprietà dei triangoli (vedere il Teorema 2.4.3)

2c + d2 > d1 e 2c + d1 > d2

e perciò
2c > d1 − d2 , 2c > d2 − d1
ossia, 2c > |d1 − d2 |; d’altro lato, |d1 − d2 | = 2a e allora
√ 2c > 2a cioè, c > a.
Questo ci permette di prendere il numero reale b = c2 − a2 e sostituendo
60 CAPITOLO 3. CURVE ALGEBRICHE PIANE

questo valore nell’equazione dell’iperbole troviamo finalmente la seguente


forma canonica dell’equazione dell’iperbole:

x2 y 2
− 2 =1.
a2 b
Come nel caso dell’ellisse, se prendessimo i fuochi F = (0, c) e F 0 = (0, −c)
avremmo l’equazione
y 2 x2
− 2 =1.
a2 b
La retta passante per i due fuochi F e F 0 è l’asse trasverso; la perpen-
dicolare a quest’asse passante per il punto medio del segmento F F 0 è l’asse
coniugato; finalmente, l’intersezione di questi due assi è il centro dell’iperbole.
Come nel caso dell’ellisse, gli assi sono assi di simmetria ed il centro è un
vero centro di simmetria per la figura.
L’eccentricità dell’iperbole è il quoziente
c
e= ;
a
in questo caso e > 1.
Come per l’ellisse, l’iperbole I di equazione

x2 y 2
− 2 =1
a2 b
ha due direttrici: le rette d e d0 di equazioni
a a
x− =0 e x+ =0
e e
rispettivamente. Come per la parabola e la ellisse abbiamo il seguente
risultato:

Teorema 3.1.3
dP F
P ∈ I ⇐⇒ =e
dP d
oppure
dP F 0
P ∈ I ⇐⇒ =e.
dP d0

Dimostrazione – La dimostrazione è perfettamente analoga a quella del


Teorema 3.1.2 ed è lasciata come esercitazione. 2
3.2. GEOMETRIA GRECA 61

3.2 Le coniche nella geometria greca


In questa sezione studieremo le coniche dal punto di vista geometrico cioè,
faremo una incursione in quella straordinaria parte della scienza che fu appun-
to la geometria greca. Fu Menacheo, allievo di Platone, che verso il 350 a.C.
iniziò lo studio sistematico delle curve piane si ottengono come l’intersezione
di un cono circolare retto di R3 con un piano che non passa per il suo ver-
tice.2 Menacheo arrivò alle coniche nel tentativo di risolvere il problema di
Delo ossia, il problema della duplicazione del cubo (dato un cubo di spigolo
` – pertanto di volume V = `3 – costruire un cubo di spigolo `0 di volume
2V).3
Consideriamo lo spazio R3 diviso in due parti dal piano orizzontale R2 e
sia a una retta perpendicolare a R2 ; sia ora g una retta che interseca a nel
punto V e facente un angolo α con a, 0 < α < π/2. Ora facciamo ruotare g
attorno ad a in modo che l’angolo α non si alteri mai; la figura C ottenuta è
un doppio cono di apertura α, generatrice g e vertice V (attenzione: la retta
verticale a non è parte del doppio cono!). Chiameremo falde i coni di C : più
precisamente, falda superiore e falda inferiore. Sia π ⊂ R3 un piano che non
contiene il vertice V . Prenderemo in considerazione tre casi:
1. π è perpendicolare all’asse a;

2. g é parallela al piano π e questo incontra il doppio cono in una sola


falda;

3. π incontra il doppio cono in ambe le falde.


Caso 1 – Sia Γ = π ∩ C l’intersezione del piano π con il cono; sia C il punto di
intersezione di π con l’asse di rotazione a. Siccome il cono C è ottenuto per
rotazione della generatrice g intorno all’asse, il punto A = g ∩ π descrive una
circonferenza di centro C e contenuta in π e che coincide con Γ. Più avanti
riprenderemo il discorso sulla circonferenza.
Caso 2 – Supponiamo che π incontri il doppio cono nella falda inferiore. Il
piano verticale π 0 determinato dalle rette a e g incontra π in una retta g 0 par-
allela a g e interseca il doppio cono in una seconda retta g 00 ; sia W = g 0 ∩g 00 . È
facile costruire nel piano π 0 una circonferenza γ con centro O nell’asse a e che
sia tangente alle rette g, g 0 e g 00 : infatti, a è la bisettrice dell’angolo 6 (g, g 00 )
2
Nella geometria greca i coni era visti come solidi e perciò le sezioni di un cono con un
piano erano, per i geometri greci, delle superficie piane limitate da curve (curve che noi
oggi chiamiamo propriamente coniche).
3
Il problema della duplicazione del cubo si chiama anche “problema di Delo” perché
Eratostene, in una lettera al re Tolomeo III, disse essere stato proposto dall’oracolo di
Apollo agli abitanti della città di Delo.
62 CAPITOLO 3. CURVE ALGEBRICHE PIANE

con vertice V ; costruendo la bisettrice b dell’angolo 6 (g 0 , g 00 ) con vertice W


otteniamo il centro O = a ∩ b della nostra circonferenza; finalmente da O
tracciamo le perpendicolari p, p0 e p00 a g, g 0 e g 00 rispettivamente ottenendo
i punti Q = p ∩ g, F = p0 ∩ g 0 e Q00 = p00 ∩ g 00 che sono, rispettivamente, i
punti di tangenza delle rette g, g 0 e g 00 con la circonferenza γ. Ruotando γ
attorno all’asse a otteniamo una sfera σ che è tangente al piano π nel punto
F . Questa sfera è anche tangente alla falda inferiore del doppio cono in una
circonferenza γ1 contenuta in un piano orizzontale π 00 che contiene i punti
Q e Q00 ; osserviamo che l’angolo β formato da π e π 00 è uguale a π/2 − α.
Sia P un punto dell’intersezione π ∩ C. La retta P V è contenuta in C; sia
T = P V ∩ γ1 . Siccome P V e P F sono tangenti a σ in T e F rispettivamente,
i segmenti P F e P T hanno uguale lunghezza ossia,
dP F = dP T .
Sia ora P1 la proiezione ortogonale di P sul piano π 00 . Il triangolo P T P1 ha
gli angoli
6 (T P P1 ) = α e 6 (P P1 T ) = π/2

e dunque, per la legge dei seni (vedere Teorema 2.4.8),


P P1
= PT
sin(π/2 − α)
cioè,
dP P 1
= dP T = dP F .
cos(α)
D’altro lato, siano d = π ∩ π 00 e D la proiezione ortogonale del punto P sulla
retta d. Il triangolo P P1 D ha gli angoli
6 (P P1 D) = π/2 e 6 (P DP1 ) = π/2 − α
e nuovamente per la legge dei seni,
d P P1
= dP d ;
cos(α)
in definitiva,
dP F
=1.
dP d
La curva piana ottenuta come intersezione del cono C e del piano π è la
parabola di fuoco F e direttrice d; i suoi punti sono caratterizzati dalla
proprietà
dP F
P ∈ C ∩ π ⇐⇒ =1.
dP d
3.2. GEOMETRIA GRECA 63

Ora osserviamo che la retta g 0 = π ∩ π 0 (ricordiamo che π 0 è il piano de-


terminato dalle rette a e g) incontra la retta g in un punto U e la retta g 00 nel
punto W ; questi due punti appartengono all’intersezione C∩π. Cosı̀ abbiamo
un triangolo U V W nel quale possiamo iscrivere una circonferenza γ con cen-
tro O ∈ a; d’altro lato, abbiamo anche una figura formata dal segmento U W
e dalle semi-rette che non contengono V e partono da U e W rispettivamente
nelle direzioni di g e g 00 ; sia γ 0 la circonferenza con centro O0 ∈ a e tangente
a U W e alle semi-rette appena descritte. Queste circonferenze danno luogo
a due sfere σ e σ 0 che sono tangenti al piano π nei punti (fuochi) F e F 0
rispettivamente. In questa costruzione troviamo anche le rette (direttrici)

d = π ∩ π 00 e d0 = π ∩ π10

dove π10 è il piano orizzontale della circonferenza data dall’intersezione

σ0 ∩ C .

Limitiamoci, per ora a studiare la situazione relativamente al fuoco F ed


alla direttrice d. Sia β l’angolo tra i piani π e π 00 . Come nel Caso 1 abbiamo:

dP P1
= dP F
cos(α)

dP P 1
= dP d
sin(β)
e dunque,
dP F sin(β) sin(β)
= = .
dP d cos(α) sin(π/2 − α)
sin(β)
Nelle condizioni date il quoziente cos(α) è una costante e; per giunta, π/2−α >
β e perciò 0 < e < 1.
Considerazioni analoghe possono essere fatte relativamente al fuoco F 0 ed
alla direttrice d0 . La curva C ∩ π è l’ellisse di fuochi F , F 0 e direttrici d, d0 ; i
suoi punti sono caratterizzati dalla proprietà

dP F dP F 0
P ∈ C ∩ π ⇐⇒ = =e, 0<e<1.
dP d dP d0

La costante e è detta eccentricità dell’ellisse.


Caso 3 – Lasciamo questo caso al lettore come esercitazione; ci limitiamo ad
osservare che procedendo come nei due casi anteriori troveremo due sfere σ e
σ 0 situate in due falde distinte, nonché due fuochi e due direttrici; finalmente,
64 CAPITOLO 3. CURVE ALGEBRICHE PIANE

l’eccentricità e è maggiore di 1. La figura ottenuta è l’iperbole caratterizzata


da
dP F dP F 0
P ∈ C ∩ π ⇐⇒ = =e, e>1.
dP d dP d0
È interessante notare che per Menacheo la circonferenza non aveva legami
con le coniche perchè lui studiò queste figure intersecando un cono con un
piano perpendicolare ad una generatrice, dunque ottenendo una parabola se
α = π/4, una ellisse se α < π/4 ed una iperbola se α > π/4 (Menacheo poteva
ottenere una circonferenza solo se α = 0, ma in tal caso la circonferenza ha
raggio nullo).
Ora riprendiamo le nostre considerazioni sulla circonferenza. Come ab-
biamo visto questa figura geometrica può essere ottenuta come intersezione
di un piano π con un cono di asse a e generatrice g purché π sia perpendi-
colare ad a. Possiamo dire che la circonferenza proviene da una ellisse con
i due fuochi coincidenti; ma dove si trovano le direttrici? Per dare una sp-
iegazione di come stanno le cose facciamo un salto indietro, alla Sezione ??
e precisamente, alla definizione di eccentricità. Ricordiamo che la parabola
ha eccentricità e = 1, e che per l’ellisse (risp. iperbola) l’eccentricità vale
0 < e < 1 (risp. e > 1); per giunta, l’eccentricità è data dal quoziente delle
distanze di un punto della figura ad un fuoco e alla corrispondente direttrice.
Ora, facendo coincidere i fuochi della circonferenza con il centro, la distanza
tra un punto della circonferenza ed un suo fuoco è la lunghezza del raggio;
d’altro lato, se prendessimo la direttrice come la retta impropria del piano
della circonferenza, la distanza da un punto della circonferenza alla direttrice
sarebbe infinita e al limite, il quoziente dP F /dP d sarebbe 0. In questo senso
la circonferenza si ravvicina alla parabola perchè ha un solo fuoco ed una
sola direttrice (all’infinito).

3.3 Classificazione delle coniche


Abbiamo visto che la circonferenza, la parabola, l’ellisse e l’iperbola, quan-
do riferite ad un sistema di coordinate conveniente, sono rappresentate da
equazioni algebriche di secondo grado in x e y. Ora vedremo come trasfor-
mare una equazione di secondo grado nelle variabili x e y in modo a potere
riconoscere quale figura piana rappresenti. Il nostro approccio sarà inizial-
mente molto elementare, per poi cercare di risolvere il problema in forma più
completa e definitiva.
La forma più generale di una equazione algebrica di secondo grado in x e
y è
Ax2 + Bxy + Cy 2 + Dx + Ey + F = 0 , (3.5)
3.3. CLASSIFICAZIONE DELLE CONICHE 65

con almeno uno dei coefficienti A, B e C diversi da zero (caso contrario


avremmo una equazione di primo grado).
Ci proponiamo di studiare la curva determinata dall’equazione 3.5 d’accordo
con il fatto che i coefficienti A, B e C siano nulli o no. Ci sono alcuni casi da
considerare.
Caso A - B = 0 e AC 6= 0.
Facciamo una traslazione del sistema di coordinate tramite le equazioni

x = x0 + k , y = y 0 + ` ;

l’equazione 3.5 diventa

A(x0 + k)2 + C(y 0 + `)2 + D(x0 + k) + E(y 0 + `) + F = 0

ossia,

Ax02 + Cy 02 + (2Ak + D)x0 + (2C` + E)y 0 + Ak 2 + C`2 + Dk + E` + F = 0

Se imponiamo le condizioni

2Ak + D = 0 e 2C` + E = 0

cioè, se scegliamo k = −D/2A e ` = −E/2C, l’ultima equazione diventa

1 1
Ax02 + Cy 02 = D2 /A + E 2 /C − F . (3.6)
4 4
Quest’ultima equazione ci permette di classificare il luogo

Ax2 + Cy 2 + Dx + Ey + F = 0 :

infatti, d’accordo con le equazioni canoniche (vedi Sezione ??) consideriamo


le seguenti possibilità:

1. AC > 0 : allora il luogo dei punti del piano che soddisfano l’equazione
3.6 è:
(i) una ellisse se 14 D2 /A + 41 E 2 /C − F > 0,
(ii) il punto (k, `) se 14 D2 /A + 14 E 2 /C − F = 0,
(iii) l’insieme vuoto se 14 D2 /A + 14 E 2 /C − F < 0,
(iv) una circonferenza se A = C e 41 D2 /A + 14 E 2 /C − F > 0;
66 CAPITOLO 3. CURVE ALGEBRICHE PIANE

2. AC < 0 : il luogo geometrico definito da 3.6 è:


(v) una iperbole se 14 D2 /A + 14 E 2 /C − F 6= 0,
(vi) l’insieme definito dalle due rette
q q q q
|A|x0 − |C|y 0 = 0 , |A|x0 + |C|y 0 = 0

passanti per l’origine, se 14 D2 /A + 14 E 2 /C − F = 0;


Nei casi (ii) e (vi) diciamo che la conica è degenere.
Esempio 1 - Studiare la curva piana di equazione

9x2 + 25y 2 + 18x − 100y − 116 = 0 .

Con la traslazione
x0 = x + 1 , y 0 = y − 2
l’equazione diventa
x02 y 02
+ =1
25 9
che rappresenta una ellissi.
Esempio 2 - Il luogo dell’equazione

3x2 + y 2 + 5 = 0

è vuoto perché la somma di tre fattori positive non può mai essere nulla.
Caso B - B = 0 e uno dei due coefficienti A o C sia nullo (diciamo, per
esempio, che C = 0); abbiamo l’equazione

Ax2 + Dx + Ey + F = 0 .

Facciamo il cambiamento di variabili

x = x0 + k , y = y 0

per ottenere l’equazione

Ax02 + (2Ak + D)x0 + Ey 0 + Ak 2 + Dk + F = 0

e imponendo l’uguaglianza 2Ak + D = 0 abbiamo

Ax02 + Ey 0 − D2 /4A + F = 0 .

Se E = 0 allora
x02 = D2 /4A − F
3.3. CLASSIFICAZIONE DELLE CONICHE 67

e cosi abbiamo l’insieme vuoto se D2 /4A − F < 0 o il prodotto delle rette


q q
0
x − D2 /4A − F = 0 e x0 + D2 /4A − F = 0

(conica degenerata); altrimenti, se E 6= 0 facciamo la traslazione


1 2
x0 = x00 , y 0 = y 00 + (D /4A − F )
E
per ottenere l’equazione
Ax002 = −Ey 00
di una parabola con vertice nell’origine.
Esempio 3 - Per l’equazione

x2 + 4x + 4y + 4 = 0

facciamo la traslazione
x = x0 − 2 , y 0 = y
per ottenere
x02 = −4y 0 ,
equazione di una parabola.
Caso C - B 6= 0.
Vogliamo dimostrare che è possibile fare una rotazione conveniente di
angolo θ del sistema di coordinate in modo a fare scomparire il fattore con
xy, ritornando cosı̀ ai casi A e B. Infatti, consideriamo la rotazione
(
x = x0 cos θ − y 0 sin θ
y = x0 sin θ + y 0 cos θ

(cfr. Equazioni 2.14, Sezione 2.5); sostituendo questi valori nell’equazione


3.5 otteniamo l’equazione

A(x0 cos θ − y 0 sin θ)2 + B(x0 cos θ − y 0 sin θ)(x0 sin θ + y 0 cos θ)+

+C(x0 sin θ + y 0 cos θ)2 + D(x0 cos θ − y 0 sin θ)+


E(x0 sin θ + y 0 cos θ) + F = 0 .
Dopo le dovute semplificazioni otteniamo l’equazione

[A cos2 θ + B sin θ cos θ + C sin2 θ]x02 + (3.7)

[2(C − A) sin θ cos θ + B(cos2 θ − sin2 θ)]x0 y 0 +


68 CAPITOLO 3. CURVE ALGEBRICHE PIANE

[A sin2 θ − B sin θ cos θ + C cos2 θ]y 02 +


[D cos θ + E sin θ]x0 + [−D sin θ + E cos θ]y 0 + F = 0 .
Il nostro obiettivo è quello di trovare un angolo θ tale che

2(C − A) sin θ cos θ + B(cos2 θ − sin2 θ) = 0 .

D’altro lato è saputo che

sin 2θ = 2 sin θ cos θ , cos 2θ = cos2 θ − sin2 θ

e dunque, l’ultima uguaglianza si scrive

(C − A) sin 2θ + B cos 2θ = 0

ossia,
A−C
cot 2θ = . (3.8)
B
Ricapitolando, per una equazione quadratica arbitraria

Ax2 + Bxy + Cy 2 + Dx + Ey + F = 0

esiste sempre una rotazione di assi con centro di rotazione O di un angolo


θ, 0 < θ < π, tale che l’equazione 3.8 sia valida, e che fa scomparire il
coefficiente del fattore misto.
Esempio 4 - Sia data l’equazione di secondo grado in x, y

8x2 − 4xy + 5y 2 − 144 = 0 .

D’accordo con la formula 3.8, cot 2θ = −3/4; da questa uguaglianza conclu-


diamo che
cos2 2θ/ sin2 2θ = 9/16
e siccome sin2 2θ + cos2 2θ = 1, otteniamo
9
cos2 2θ = .
25
D’altro lato, cot 2θ essendo negativo, l’angolo 2θ è compreso tra π/2 e π e
pertanto, cos 2θ = −3/5. Da questo valore, ricordando che
s s
1 − cos 2θ 1 + cos 2θ
sin θ = , cos θ = ,
2 2
otteniamo s s
1 1
sin θ = 2 , cos θ =
5 5
3.3. CLASSIFICAZIONE DELLE CONICHE 69

e dunque la rotazione  q q
 x= 1 0
x − 2 15 y 0
q5 q
 y= 2 15 x0 + 15 y 0 .
Sostituendo questi valori nella equazione quadratica data otteniamo

4x02 + 9y 02 = 144

ossia,
x02 y 02
+ =1
36 16
che è l’equazione canonica di una ellisse con le seguenti caratteristiche
√ nel
sistema di coordinate Ox0 , Oy 0 : i fuochi hanno coordinate (±2 5, 0), i vertici
sono (±6, 0).
Esempio 5 - Classificare la conica data dall’equazione

6x2 + 24xy − y 2 − 12x + 26y + 11 = 0 . (3.9)

Facciamo subito la traslazione

x = x0 + k , y = y 0 + `

per eliminare i termini lineari; il sistema


(
B` + 2Ak = −D
2C` + Bk = −E

che per la nostra curva diventa


(
24` + 12k = 12
−2` + 24k = −26

ha una unica soluzione: k = −1, ` = 1. Con questo, l’equazione data si


trasforma nell’equazione

6x02 + 24x0 y 0 − y 02 + 30 = 0 .

Ora facciamo la rotazione di angolo θ tale che


6+1
cot 2θ =
24
(vedere l’equazione 3.8); da questo concludiamo che cos 2θ = 7/25 e dunque,
4 3
cos θ = , sin θ =
5 5
70 CAPITOLO 3. CURVE ALGEBRICHE PIANE

(vedere Esempio 4). Cosı̀ otteniamo la rotazione

x0 = 45 x − 53 y
y 0 = 53 x + 54 y

e da questa, l’equazione

15x2 − 10y 2 + 30 = 0

ossia,
y 2 x2
− =1
3 2
che è l’equazione di una iperbole.
A questo punto ci poniamo il problema seguente: è possibile trovare
dei numeri collegati a l’equazione 3.5 che siano invarianti per traslazioni
e rotazioni e che possano dare indicazioni sul tipo di conica rappresentata
dall’equazione? Per rispondere a questa domanda (la cui risposta sarà affer-
mativa) cominciamo per scrivere 3.5 in forma matriciale. Più precisamente,
rappresentiamo un punto arbitrario X = (x, y) ∈ R2 dalla matrice colonna
 
x
X = y 


1

e prendiamo la (3 × 3)-matrice simmetrica (detta matrice dei coefficienti di


3.5)  
A B/2 D/2

C =  B/2 C E/2  
D/2 E/2 F
ricavata dai coefficienti dell’equazione. Allora

Ax2 + Bxy + Cy 2 + Dx + Ey + F = 0

è equivalente all’equazione matriciale


 T   
x A B/2 D2 x
 

 y   B/2

C E/2   y 
=0 (3.10)
1 D/2 E/2 F 1

in cui  T
x  ‘
 
 y  = x y 1
1
3.3. CLASSIFICAZIONE DELLE CONICHE 71

è la matrice trasposta.
Dentro la matrice dei coefficienti ci sono due sottomatrici di interesse
particolare:   !
A B/2
Q=
B/2 C
associata ai termini quadratici e
  !
D/2
L=
E/2

associata ai termini lineari di 3.5. Con questa notazione l’equazione 3.10 può
anche scriversi nella forma più compressa
  !
T Q L
X X =0 (3.11)
LT F

Teorema 3.3.1 I numeri reali

I1 = A + C , I2 = det Q e I3 = det C

sono invarianti per traslazioni e rotazioni.

Dimostrazione – Cominciamo con una traslazione x = x0 + k , y = y 0 + `;


l’equazione 3.5 diventa

Ax02 + B(x0 + k)(y 0 + `) + Cy 02 + (2Ak + D)x0 + (2C` + E)y 0 +

Ak 2 + C`2 + Dk + E` + F = 0
cioè

Ax02 + Bx0 y 0 + Cy 02 + (2Ak + B` + D)x0 + (2C` + Bk + E)y 0 +

Ak 2 + Bk` + C`2 + Dk + E` + F = 0 ;
Siccome i coefficienti di x2 e y 2 sono rimasti immutati è chiaro che I1 non
è cambiato con la traslazione. Un calcolo diretto dei determinanti I2 e I3
prima e dopo la traslazione dimostra l’invarianza.
Ora facciamo una rotazione
(
x = x0 cos θ − y 0 sin θ
y = x0 sin θ + y 0 cos θ

ossia,
X = RX 0
72 CAPITOLO 3. CURVE ALGEBRICHE PIANE

con  
cos θ − sin θ 0

R =  sin θ cos θ 0  ;
0 1
allora 3.10 diventa
T
X 0 RT CRX 0 = 0 .
Siccome
det R det RT = 1
(i due determinanti sono ambedue +1 o -1) – vedere Teorema 2.5.1 – si ha

det RT CR = det C

(ricordiamo al lettore che il determinante di un prodotto è il prodotto dei


determinanti). Questo dimostra l’invarianza di I3 per rotazioni.
Riguardo l’invarianza di I2 per rotazioni riprendiamo l’equazione 3.11 e
osserviamo che la matrice Q dei termini quadratici viene trasformata dalla
rotazione di sopra nella matrice
  !T   !
0 cos θ − sin θ cos θ − sin θ
Q = Q
sin θ cos θ sin θ cos θ

e dunque det Q0 = det Q = I2 è invariante.


Finalmente, per l’invarianza di I1 osserviamo che i coefficienti A e B si
trasformano, rispettivamente, in

A = A cos2 θ + B sin θ cos θ + C sin2 θ

e
C = A sin2 θ − B sin θ cos θ + C cos2 θ
e siccome sin2 θ + cos2 θ = 1, abbiamo

I1 = A + B .

Teorema 3.3.2 Il grafico di una equazione

Ax2 + Bxy + Cy 2 + Dx + Ey + F = 0

(oltre a possibili casi degeneri) è:


3.3. CLASSIFICAZIONE DELLE CONICHE 73

(i) una parabola se I2 = 0;

(ii) una ellisse se I2 > 0 e A 6= C o una circonferenza se I2 > 0 e A = C;

(iii) una iperbole se I2 < 0.

Dimostrazione – Trasformiamo l’equazione

Ax2 + Bxy + Cy 2 + Dx + Ey + F = 0

in una equazione del tipo 3.7 tramite una rotazione di angolo θ. Dal Teo-
rema 3.3.1 sappiamo che I2 non cambia nella nuova equazione; d’altro lato,
scegliamo θ in modo che cot 2θ = (A−C)/B in modo a eliminare il coefficiente
del termine misto. In questo modo abbiamo che
1
AC = AC − B 2 = I2
4
e cosı̀ il segno di AC è uguale a quello di I2 ; l’analisi sulla classificazione
delle curve piane di equazione 3.5 con il coefficiente del termine misto uguale
a zero fatta nel principio della sezione ci permette di concludere la veracità
del risultato enunciato. 2

Nella sezione ?? abbiamo visto che l’ellisse e l’iperbole hanno un centro di


simmetria (infatti, in quella sezione abbiamo le coniche con le loro equazioni
canoniche e il centro di simmetria dell’ellisse e dell’iperbole coincide con
l’origine del sistema di coordinate). Ora vogliamo dimostrare il seguente
risultato:

Teorema 3.3.3 Il luogo geometrico definito dall’equazione

Ax2 + Bxy + Cy 2 + Dx + Ey + F = 0

ha un centro di simmetria ⇐⇒ I2 6= 0.

Dimostrazione – Facciamo una traslazione del sistema di coordinate tramite


le equazioni
x = x0 + k , y = y 0 + ` ;
sostituendo questi valori di x e y nell’equazione generale e facendo i conti
arriviamo alle equazione

Ax02 + Bx0 y 0 + Cy 02 + (B` + 2Ak + D)x0 + (2C` + Bk + E)y 0 +


74 CAPITOLO 3. CURVE ALGEBRICHE PIANE

+(Ak 2 + Bk` + C`2 + Dk + E` + F ) = 0


Ora osserviamo che il sistema lineare nelle variabili k e `
(
B` + 2Ak = −D
2C` + Bk = −E

ha una soluzione (unica) ⇐⇒ il determinante della matrice dei coefficienti


è non banale, ossia
B 2 − 4AC 6= 0 .
La soluzione del sistema lineare fornisce le coordinate del centro di simmetria;
infatti, dando a k ed ` i valori ottenuti come soluzioni del sistema, l’equazione
generale diventa

Ax02 + Bx0 y 0 + Cy 02 + (Ak 2 + Bk` + C`2 + Dk + E` + F ) = 0

e questa ha un centro di simmetria: (x0 , y 0 ) è soluzione di quest’ultima


equazione ⇐⇒ (−x0 , −y 0 ) è soluzione. 2

Ora vediamo con un esempio come possiamo usare gli invarianti per
classificare rapidamente una conica. Riprendiamo l’esempio 5, ossia

6x2 + 24xy − y 2 − 12x + 26y + 11 = 0

la cui matrice è  
6 12 −6

C= 12 −1 13 

−6 13 11
e dunque,
I1 = 5 , I2 = −150 , I3 = −6 × 750 .
Siccome I2 6= 0 la conica è a centro e dunque (a meno di degenerazione) è
una ellisse o una iperbole; con questo sappiamo che dopo una traslazione ed
una eventuale rotazione la matrice associata si riduce ad una matrice del tipo
 
A 0 0
 
 0 C 0 
0 0 F

con AC 6= 0. Allora abbiamo

I1 = A + C , I2 = AC , I3 = ACF
3.4. CONICHE E ALGEBRA LINEARE 75

e dunque, facendo i calcoli otteniamo


(
15
A=
−10
(
−10
C=
15
F = 30
donde (scrivendo x, y invece di x, y come nell’esempio) concludiamo che
l’equazione canonica della curva è

15x2 − 10y 2 + 30 = 0

oppure
−10x2 + 15y 2 + 30 = 0
che in ambi i casi rappresentano iperboli.
Il lettore si domanderà come spiegare questa doppia rappresentazione.
Ebbene, la prima si ottiene dall’equazione

6x02 + 24x0 y 0 − y 02 + 30 = 0

tramite la rotazione di angolo θ la cui matrice è


  !
4/5 −3/5
R=
3/5 4/5

in quanto che la seconda si ottiene con una rotazione di angolo ben più ampio,
cioè π/2 + θ.

3.4 La classificazione delle coniche tramite l’algebra


lineare
Cominciamo per riscrivere l’equazione generale di una curva del secondo
ordine Γ
Ax2 + Bxy + Cy 2 + Dx + Ey + F = 0 (3.12)
nella forma

a11 x2 + 2a12 xy + a22 y 2 + 2a13 x + 2a23 y + a33 = 0 , (3.13)

con
a11 = A , 2a12 = B , a22 = C ,
76 CAPITOLO 3. CURVE ALGEBRICHE PIANE

2a13 = D , 2a23 = E e a33 = F .


La forma matriciale dell’equazione 3.24 è

X T CX = 0 (3.14)

in cui  
x

X = y 

1
e  
a11 a12 a13

C =  a12 a22 a23 

a13 a23 a33
è la matrice dei coefficienti di Γ.
Abbiamo definito i vettori reali a due dimensioni partendo da concetti
puramente geometrici e abbiamo anche osservato che possiamo rappresentare
tali vettori tramite coppie di numeri reali. In questa sezione i nostri vettori
sarrano rappresentati da matrici reali; dunque, un vettore

~v = (x, y) ∈ V (R2 )

si scriverà normalmente nella forma matriciale


  !
x
~v = .
y

A questo punto osserviamo che una matrice reale


  !
a11 a12
A=
a21 a22

agisce linearmente sullo spazio vettoriale V (R2 ) rasformando vettori in vet-


tori: più precisamente, il prodotto matriciale
  !  !   !
a11 a12 x a11 x + a12 y
=
a21 a22 y a21 x + a22 y

definisce una funzione


A : V (R2 ) → V (R2 )
tale che
~ ∈ V (R2 ))
(∀α, β ∈ R)(∀~v , w
A(α~v + β w)
~ = αA(~v ) + βA(w)
~ . (3.15)
3.4. CONICHE E ALGEBRA LINEARE 77

Il vettore α~v + β w
~ è detto combinazione lineare dei vettori ~v e w;
~ la matrice
A, considerata come funzione, è detta trasformazione lineare. Lasciamo al
lettore il compito di dimostrare 4.15.
Vogliamo ora studiare il seguente problema: sia data una (2 × 2)-matrice
A; è possibile trovare un numero reale λ 6= 0 ed un vettore non-nullo ~vλ ∈
V (R2 ) tali che
A(~vλ ) = λ~vλ ? (3.16)
Si osservi che l’equazione 4.16 si scrive in forma matriciale come segue:
  !  !   !
a11 a12 x x

a21 a22 y y

ossia   !  !   !  !
a11 a12 x λ 0 x
= .
a21 a22 y 0 λ y
Da questa equazione ricaviamo l’equazione matriciale
  !  !   !
a11 − λ a12 x 0
=
a21 a22 − λ y 0

che equivale al sistema lineare omogeneo


(
(a11 − λ)x + a12 y = 0
(3.17)
a21 x + (a22 − λ)y = 0

Ora un tale sistema ha soluzioni non banali se, e soltanto se

det A = 0 ;

sviluppando il determinante, otteniamo un’equazione algebrica del secondo


grado in λ
λ2 − (a11 + a22 )λ − a12 a21 = 0 (3.18)
detta polinomio caratteristico di A.
Le radici dell’equazione 4.18 sono gli autovalori di A: un vettore ~vλ
corrispondente ad una radice λ di 4.18 è un autovettore di A. In teoria
l’equazione caratteristica potrebbe avere soluzioni complesse che a noi non
interesserebbero; perciò ci limiteremo a studiare il caso in cui A è simmet-
rica (ossia A = AT , la trasposta di A) perchè per una matrice simmetrica
distinta da un multiplo della matrice banale I2 si dimostra che le radici del
suo polinomio caratteristico sono reali (vedere Teorema 3.4.1); d’altronde,
78 CAPITOLO 3. CURVE ALGEBRICHE PIANE

siamo anche interessati a studiare i polinomi caratteristici di matrici sim-


metriche perchè le matrici delle coniche sono simmetriche. In particolare, ci
interessiamo alla sottomatrice
  !
a11 a12
Q=
a12 a22

della matrice C di 3.24.


Teorema 3.4.1 Una matrice reale simmetrica
  !
a11 a12
A=
a12 a22

che non sia un multiplo della matrice identità I2 ha due autovalori reali
distinti.

Dimostrazione – Le radici del polinomio caratteristico

λ2 − (a11 + a22 )λ + det A = 0

di A sono date dalla formula


q
λ = 1/2[(a11 + a22 ) ± (a11 + a22 )2 − 4 det A] .

Si noti che il discriminante

∆ = (a11 + a22 )2 − 4 det A = (a11 − a22 )2 + 4a12


2
≥0

perché somma di quadrati; d’altro lato, ∆ = 0 soltanto nel caso in cui la


matrice A = ∇I∈ . 2

Lemma 3.4.2 Siano date le matrici


  !   !
x1 y1
X = , Y= e A = (aij )i,j=1,2 .
x2 y2

Allora,
Y T AX = X T AT Y .

Dimostrazione – Cominciamo per osservare che


2 X
X 2
Y T AX = ( aij xj )yi
i=1 j=1
3.4. CONICHE E ALGEBRA LINEARE 79

e
2 X
X 2
X T AT Y = ( aji yi )xj
j=1 i=1

La proprietà commutativa dei numeri reali dimostra il risultato. 2

Si noti che se A è simmetrica allora vale

Y T AX = X T AY . (3.19)

Teorema 3.4.3 Assumiamo che la matrice reale

A = (aij )i,j=1,2

sia simmetrica e che λ e µ siano due autovalori (reali) distinti di A. Allora


gli autovettori ~vλ e ~vµ associati a questi due autovalori sono perpendicolari
tra loro.

Dimostrazione – Si vuole dimostrare che < ~vλ , ~vµ >= 0. A questo scopo
osserviamo che

< ~vµ , A(~vλ ) >=< ~vµ , λ~vλ >= λ < ~vλ , ~vµ > .

D’altro lato, il Lemma 3.4.2 tradotto in linguaggio vettoriale ci dice che

< ~vµ , A(~vλ ) >=< ~vλ , AT (~vµ ) > ;

siccome A = AT ,

< ~vλ , AT (~vµ ) >=< ~vλ , A(~vµ ) >= µ < ~vλ , ~vµ >

e dunque,
(λ − µ) < ~vλ , ~vµ >= 0 .
Ma per ipotesi λ − µ 6= 0 e dunque

< ~vλ , ~vµ >= 0 .

Ora applichiamo i risultati precedenti alla classificazione delle coniche.


Sia Γ una conica di equazione

a11 x2 + 2a12 xy + a22 y 2 + 2a13 x + 2a23 y + a33 = 0 .


80 CAPITOLO 3. CURVE ALGEBRICHE PIANE

Come al solito indichiamo con C la matrice di Γ e con Q la sottomatrice dei


suoi termini quadratici. Ricordiamo al lettore che se

det Q = I2 6= 0

la conica Γ ha un centro di simmetria (vedere Teorema 3.3.3). Partiamo


da questo caso. Facciamo una traslazione del sistema di coordinate xOy in
modo che l’origine O0 del nuovo sistema x0 O0 y 0 sia coincidente con il centro
di Γ (naturalmente, gli assi O0 x0 e O0 y 0 sono paralleli agli assi Ox e Oy,
rispettivamente. Con questo eliminiamo i due termini lineari e la matrice C
si trasforma in una matrice
 
a11 a12 0

C0 = 
 a12 a22 0 
0 f

(le sottomatrici dei termini quadratici di C e C 0 coincidono; vedere la di-


mostrazione del Teorema 3.3.1). Ci sono due casi da considerare.
Caso 1 - Q = rI2 . Dividendo f per r, se necessario, possiamo infatti
assumere che Q = I2 ; dunque, possiamo scrivere l’equazione di Γ nella forma

x2 + y 2 = f /r .

Se f /r < 0, l’insieme Γ è vuoto; se f /r = 0, Γ è il l’unione q di due rette


complesse; se f /r > 0 allora Γ è una circonferenza di raggio f /r riferita al
sistema x0 O0 y 0 .
Caso 2 - Q 6= rI2 . Per il Teorema 3.4.1 Q ha due autovalori distinti λ e µ;
per il Teorema 3.4.3, gli autovettori ~vλ e ~vµ associati sono perpendicolari tra
di loro. Sia R la (2 × 2)-matrice i cui vettori colonna sono i vettori unitari
~c1 = ~vλ /|~vλ | e ~c2 = ~vµ /|~vµ |; osserviamo che siccome ~c1 e ~c2 sono ortonormali,
la matrice R è di rotazione.
Per le proprietà degli autovettori e autovalori di Q abbiamo
  !
λ 0
QR = R
0 µ

ossia, la rotazione di matrice R sul sistema x0 O0 y 0 trasforma l’equazione

a11 x02 + 2a12 x0 y 0 + a22 y 02 + f = 0

della conica Γ (relativa al sistema di coordinate x0 O0 y 0 ) nell’equazione

λx2 + µy 2 + f = 0
3.5. FASCI 81

e questa ci permette di classificare facilmente Γ.


Ci manca studiare il caso in cui Γ non ha un centro di simmetria, ossia
quando det Q = 0. Sappiamo che Γ è una parabola; il problema è quello
di trovare gli assi relativamente ai quali l’equazione di Γ assume la forma
canonica. Siccome il determinante di Q è nullo, Q 6= rI2 e dunque Q ha
dua autovalori distinti λ e µ e due autovettori (unitari) ~cλ e ~cµ ortogonali tra
loro. Questi ultimi producono una matrice di rotazione che impieghiamo per
eliminare l’eventuale termine misto (in xy). Più precisamente: prendiamo la
3 × 3-matrice di rotazione
  !
~cλ ~cµ 0
R= ;
0 0 1

a questo punto sostituiamo la matrice


 
x
X = y 


1
per matrice RX e cosı̀ l’equazione matriciale di Γ ossia

X T CX = 0

assume la forma
 
λ 0 a
T 
T
(RX ) C(RX ) = X  0 µ b 
X .
a b a33
Ora usiamo il “metodo della completazione dei quadrati” per eliminare i
termini lineari.

3.5 Fasci
In questa sezione parleremo di fasci di rette e di coniche; questi ci serviran-
no per introdurre le cosiddette coordinate omogenee e per risolvre numerosi
problemi.

3.5.1 Fasci di rette


Cominciamo con un esempio numerico. Siano date le rette di equazioni
2x + 4y − 1 = 0
3x − y + 12 = 0
82 CAPITOLO 3. CURVE ALGEBRICHE PIANE

Queste due rette debbono incontrarsi perchè i loro vettori normali


~r = (2, 4) , r~0 = (3, −1)
non sono paralleli. Ma quale è il punto di intersezione? Per ottenerlo,
moltiplichiamo la seconda equazione per 4 e sommiamola alla prima per
ottenere
14x + 47 = 0
cioè, x = −47/14; sostituendo x della prima equazione per −47/14 otteniamo
y = 27/14 (se avessimo sostituito x della seconda equazione per −47/14 e
avessimo fatto i conti per trovare il valore di y, avremmo trovato il medesimo
risultato: y = 27/14). I valori x = −47/14 e y = 27/14 soddisfano ambedue
le equazioni e perciò, il punto
(x, y) = (−47/14, 27/14)
è comune alle due rette.
Passiamo al caso generale. Siano date le rette
r: ax + by + c = 0
r0 : a0 x + b0 y + c0 = 0
e supponiamo che i rispettivi vettori normali
~r = (a, b) , r~0 = (a0 , b0 )
non siano paralleli. Per trovare il punto di intersezione P = r ∩ r0 multi-
plichiamo l’equazione di r per −a0 , quella di r0 per a e facciamo l’addizione
delle due equazioni per ottenere
(ab0 − a0 b)y = a0 c − ac0 .
Ora possiamo calcolare y purché
  !
a b
ab0 − a0 b = det 6= 0 .
a0 b 0
Per arrivare a questo fatto dimostriamo il seguente
Lemma 3.5.1 Due rette
r : ax + by + c = 0
r0 : a0 x + b0 y + c0 = 0
non sono parallele ⇐⇒
  !
a b
det 6= 0 .
a0 b0
3.5. FASCI 83

Dimostrazione – Consideriamo il piano R2 immerso in R3 tramite l’identificazione


dei punti (x, y) ∈ R2 e (x, y, 0) ∈ R3 . Ora prendiamo i vettori non paralleli

~r = (a, b, 0) , r~0 = (a0 , b0 , 0)

e osserviamo che   !
a b ~k = ~
~r ∧ r~0 = det 6 O
a0 b 0
(vedere Sezione 2.3). 2
Dunque
a0 c − ac0
y= 0 .
ab − a0 b
In maniera perfettamente analoga otteniamo

b0 c − bc0
x= .
ab0 − a0 b

Possiamo descrivere la soluzione (x, y) in termini di certe matrici e dei


loro determinanti (vedere la Sezione 1.5).4 Infatti, consideriamo il sistema di
equazioni lineari (lineari perché tutte le equazioni coinvolte sono del primo
grado)
ax + by = −c
a0 x + b0 y = −c0
e osserviamo che   !
−c b
det
−c0 b0
x=   !
a b
det
a0 b0
e   !
a −c
det
a0 −c0
y=   !
a b
det
a0 b0
Sia P = (x0 , y0 ) il punto di intersezione di due rette

r : ax + by + c = 0
r0 : a0 x + b0 y + c0 = 0 ;
4
Questo tema sarà ripreso più a lungo nell’Appendice A di questo capitolo.
84 CAPITOLO 3. CURVE ALGEBRICHE PIANE

l’insieme di tutte le rette del piano che passano per il punto P è detto fascio di
rette per P . Algebricamente, tale fascio è rappresentato da una combinazione
lineare
α(ax + by + c) + β(a0 x + b0 y + c0 ) = 0
nella quale α, β sono due numeri reali tali che α2 + β 2 6= 0. Una qualunque
retta del fascio è data da una equazione

(aα + a0 β)x + (bα + b0 β)y + (cα + c0 β) = 0 . (3.20)

La domanda che ora uno si pone naturalmente è: come interpretare queste
idee nel casi in cui r ed r0 siano parallele? Per cominciare, i vettori ~r e r~0
sono paralleli e perciò, esiste t ∈ R tale che r~0 = t~r, ossia,

a0 = ta , b0 = tb .

In questo caso l’equazione 3.20 diventa

a(α + tβ)x + b(α + tβ)y + cα + c0 β = 0

e perciò, abbiamo una collezione di rette parallele, anch’essa detta fascio


(di rette parallele). Le rette di un tale fascio sono caratterizzate dal fatto
che tutte hanno la medesima direzione, quella del vettore ~v ⊥ = (b, −a); tali
rette non si incontrano in R2 d’accordo con gli assiomi di Euclide, ma si
potrebbe pensare di farle incontrare in un punto di una estensione ideale di
R2 . Questo si può fare introducendo le cosiddette coordinate omogenee del
piano. Nell’insieme R3 di tutte le terne di numeri reali (x1 , x2 , x3 ) con almeno
uno dei numeri xi 6= 0 , i = 1, 2, 3 prendiamo la relazione di equivalenza

(x1 , x2 , x3 ) ≡ (x01 , x02 , x03 ) ⇐⇒ (∃k ∈ R)|x0i = kxi , i = 1, 2, 3 ;

l’insieme quoziente R3 / ≡ è il piano proiettivo reale RP 2 . Le classi di equiv-


alenza [x1 , x2 , x3 ] sono punti di RP 2 . Si noti che esiste una corrispondenza
biunivoca tra i punti di R2 e l’insieme degli elementi [x1 , x2 , x3 ] ∈ RP 2 con
x3 6= 0, data dalla funzione

φ : R2 → RP 2 , (x, y) 7→ [x, y, 1] ;

in questo senso possiamo considerare R2 come un sottoinsieme di RP 2 . Un


punto del tipo [x1 , x2 , 0] è detto punto improprio di R2 ; l’insieme di tutti i
punti improprii [x1 , x2 , 0] è la retta impropria di R2 .
Ora vogliamo sapere quale sia il luogo geometrico ` dei punti di RP 2 che
soddisfano una equazione lineare del tipo

ax1 + bx2 + cx3 = 0


3.5. FASCI 85

con a, b, c ∈ R. Chiaramente il punto [b, −a, 0] appartiene a `; oltre a questo,


se x3 =
6 0 tutti i punti della retta
ax + by + c = 0
con x = x1 /x3 e y = x2 /x3 sono anch’essi in `. Cosı̀ , l’equazione
ax1 + bx2 + cx3 = 0
rappresenta una retta (appunto la retta ax + by + c = 0 di R2 ) più il punto
improprio [b, −a, 0] dato dalla direzione della retta ax + by + c = 0.
Ritonando al problema di come interpretare il fascio di rette parallele
a(α + tβ)x + b(α + tβ)y + cα + c0 β = 0
possiamo ora dire che questo è un vero fascio
a(α + tβ)x1 + b(α + tβ)x2 + (cα + c0 β)x3 = 0
di rette di RP 2 passanti per il punto improprio [b, −a, 0].

3.5.2 Fasci di Coniche


Nella prima parte di questa sezione abbiamo parlato di fasci di rette; in parti-
colare, ci siamo serviti dei fasci di retter parallele per introdurre il concetto di
punto improprio. Ora vogliamo studiare i fasci di coniche, non con l’intuito
di introdurre nuovi concetti ma con l’idea di servircene come metodo per la
determinazione di una conica data da un certo numero di punti o condizioni.
Si ricorda che ci vogliano tre punti non alineati per costruire una cir-
conferenza che li contenga; in particolare, abbiamo risolto quel problema
algebricamente prendendo l’equazione generica della circonferenza
x2 + y 2 + dx + ey + f = 0
imponendo la condizione che le coordinate dei punti la soddisfino, costruendo
un sistema lineare di tre equazioni nelle variabili d, e e f la cui soluzione ci
fornisce i dati necessari per ottenere l’equazione richiesta. Si osservi che in
verità dovremmo avere scritto l’equazione generica
a11 x2 + a22 y 2 + 2a13 x + a23 y + a33 = 0
con a11 = a22 e perciò con quattro incognite (appunto le a11 , a13 , a23 e a33 )
cosa che richiede tre condizioni per la sua soluzione. Per la determinazione
di una conica in generale, l’equazione generica che trattiamo è del tipo
a11 x2 + 2a12 xy + a22 y 2 + 2a13 x + 2a23 y + a33 = 0 (3.21)
86 CAPITOLO 3. CURVE ALGEBRICHE PIANE

oppure

a11 x12 + 2a12 x1 yx2 a22 x22 + 2a13 x1 x3 + 2a23 x2 x3 + a33 x23 = 0

nel caso in cui consideriamo coordinate omogenee (cioè, vogliamo lavorare


anche con i punti impropri). Ora le variabili in gioco sono sei e cosı̀ abbiamo
bisogno di cinque punti (tre dei quali presi arbitrariamente non siano mai
alineati) per determinarle!
Facciamo un esempio numerico. Determinare la conica passante per i
punti

A = (−2, 0), B = (0, 1), C = (2, 0), D = (0, −1), E = (1, −1) .

Imponendo la condizione che questi punti soddisfino l’equazione 3.21 otteni-


amo il sistema lineare




a22 + 2a23 + a33 =0



 a22 − 2a23 + a33 =0
4a11 + 4a13 + a33 =0



 4a11 − 4a13 + a33 =0


 a11 − 2a12 + a22 + 2a13 − 2a23 + a33 =0

di cinque equazioni a sei variabili; dunque dando un valore ad una di esse,


diciamo a33 = 1, otteniamo i valori a11 = −1/4, a12 = −1/4, a22 = −1,
a13 = a23 = 0 e cosı̀ abbiamo la conica di equazione

x2 + xy + 4y 2 − 4 = 0 .

In seguito proponiamo un altro metodo, basato sulla costruzione di un


apposito fascio di coniche.
Siano date le coniche Γ e Γ0 di equazioni omogenee

X T CX = 0

X T C 0X = 0
rispettivamente. Per il Teorema di Bézout 3.1.1 le due coniche si intersecano
in quattro punti, diciamo A, B, C e D (presi in senso lato: punti propri,
impropri o immaginari). Consideriamo ora la combinazione lineare

λX T CX + µX T C 0 X = 0 ; (3.22)

questa nuova equazione può essere scritta nella forma

X T (λC + µC 0 )X = 0
3.6. CONICHE ∩ RETTE 87

in cui la matrice
D = λC + µC 0
è simmetrica, come il lettore può facilmente costatare. Dunque, l’equazione
3.22 rappresenta una conica per qualsiasi valori dati ai parametri λ e µ;
l’equazione 3.22 è l’equazione del fascio di coniche passante per i punti base
A, B, C e D.
Ora riprendiamo il problema di determinare la conica passante per

A = (−2, 0), B = (0, 1), C = (2, 0), D = (0, −1), E = (1, −1) .

I punti A, B, C e D determinano quattro rette di equazioni

r1 : x − 2y + 2 = 0
r2 : x + 2y − 2 = 0
r3 : x − 2y − 2 = 0
r4 : x + 2y + 2 = 0

e queste definiscono due coniche degenerate

(x − 2y + 2)(x − 2y − 2) = 0 , (x + 2y − 2)(x + 2y + 2) = 0

passanti per i quattro punti A, B, C e D e pertanto, componenti del fascio


di coniche

λ(x − 2y + 2)(x − 2y − 2) + µ(x + 2y − 2)(x + 2y + 2) = 0

di base A, B, C e D. Ma noi vogliamo la conica di quel fascio che contenga


E = (1, −1), cosa che per µ = 1 risulta in λ = 3/5. Facendo i conti otteniamo
la conica
x2 + xy + 4y 2 − 4 = 0 .

3.6 Intersezioni di coniche con rette


Cominciamo per riscrivere l’equazione generale di una curva del secondo
ordine Γ
Ax2 + Bxy + Cy 2 + Dx + Ey + F = 0 (3.23)
in coordinate omogenee e nella forma

a11 x21 + 2a12 x1 x2 + a22 x22 + 2a13 x1 x3 + 2a23 x2 x3 + a33 x23 = 0 , (3.24)

con
a11 = A , 2a12 = B , a22 = C ,
88 CAPITOLO 3. CURVE ALGEBRICHE PIANE

2a13 = D , 2a23 = E e a33 = F .


L’equazione 3.24 si scrive in forma matriciale
X T CX = 0 . (3.25)
in cui  
x1
X = 
 x2 
x3
e  
a11 a12 a13
C= 
 a12 a22 a23 
a13 a23 a33
è la matrice dei coefficienti di Γ.
Ora prendiamo una retta r che passa per un punto Z di coordinate omoge-
nee [z1 , z2 , z3 ] e nella direzione di un vettore ~v = (k, `) 6= 0. Se identifichiamo
la direzione ~v al punto improprio [k, `, 0], l’equazione parametrica della retta
r in forma matriciale è
     
x1 z1 k
     
 x2  =  z2  + m  `  . (3.26)
x3 z3 0
Con la notazione
   
x1 z1
X =   
 x2  , Z =  z2 
x3 z3
e  
k
 
K= ` 
0
l’equazione 3.26 della retta r diventa
X = Z + mK .
Dunque, un punto X ∈ r appartiene alla conica 3.24 ⇐⇒
(Z + mK)T C (Z + mK) = 0 ,
ossia,
m2 KT CK + 2mKT CZ + Z T CZ = 0 (3.27)
(vedere il Lemma 3.4.2).
Questa equazione di secondo grado nell’incognita m da molte informazioni
sulla posizione relativa di r e Γ. Infatti, l’equazione può avere
3.6. CONICHE ∩ RETTE 89

1. zero soluzioni reali (cioè, ha due soluzioni complesse coniugate): la


retta non interseca la conica;

2. una soluzione reale: la retta r è tangente a Γ;

3. due soluzioni reali: la retta è secante a Γ,

4. infinite soluzioni reali (quando i tre coefficienti sono nulli): r è parte


integrante della conica.

Per capire meglio queste nostre dichiarazioni si rende necessaria una


analisi accurata di 3.27; cosı̀ dividiamo la discussione in vari casi.
Caso I:
KT CK 6= 0 , KT CZ =6 0 e Z T CZ = 0 .
Allora 3.27 ha una soluzione m = 0 (che indica il fatto Z ∈ Γ già
evidenziato da Z T CZ = 0) e anche la soluzione

2KT CZ
m=−
KT CK
che da luogo al punto Y ∈ Γ ∩ r le cui coordinate omogenee sono definite
dall’equazione matriciale
     
x1 z1 k
    2KT CZ  
 x2  =  z 2  −  `  .
KT CK
x3 z3 0

La retta r è allora secante a Γ.


Caso II:
KT CK 6= 0 , KT CZ = 0eZ T CZ = 0 .
L’equazione di secondo grado nella variabile m

m2 KT CK + 2mKT CZ + Z T CZ = 0

ha una radice doppia m = 0 e perciò il punto Z ∈ Γ deve essere contato due


volte; dunque la retta r è tangente a Γ nel punto Z.
Quale sarebbe l’equazione della tangente a Γ in Z? La condizione KT CZ =
0 si traduce nell’equazione

(a11 z1 + a12 z2 + a13 z3 )k + (a12 z1 + a22 z2 + a23 z3 )` = 0 . (3.28)

nelle variabili k, ` – che non possono ambedue essere nulle, trattandosi delle
coordinate di un vettore direzione non nullo ~v ; abbiamo due possibilità:
90 CAPITOLO 3. CURVE ALGEBRICHE PIANE

(i) Almeno uno dei coefficienti di k e `

f1 = a11 z1 + a12 z2 + a13 z3

f2 = a12 z1 + a22 z2 + a23 z3


è diverso da zero. Prendiamo la retta t di equazione omogenea

f1 x1 + f2 x2 + f3 x3 = 0

con f3 = a13 z1 + a23 z2 + a33 z3 . Siccome

f1 z1 + f2 z2 + f3 z3 = Z T CZ = 0 (3.29)

il punto Z ∈ t; d’altro lato, il vettore w


~ = (f1 , f2 ) è perpendicolare alla retta
t ed al vettore ~v (vedere l’equazione 3.28). Dunque la retta t è nella direzione
di ~v ; siccome Z ∈ t, la retta t coincide con la retta r e l’equazione

f1 x1 + f2 x2 + f3 x3 = 0

ossia

(a11 z1 +a12 z2 +a13 z3 )x1 +(a12 z1 +a22 z2 +a23 z3 )x2 +(a13 z1 +a23 z2 +a33 z3 )x3 = 0
(3.30)
è l’equazione della retta tangente a Γ passante per Z.
(ii) I due coefficienti f1 e f2 sono nulli.
Siccome il punto Z = [z1 , z2 , z3 ] è un punto proprio, la terza coordinata
z3 6= 0 e dunque, da 3.29 concludiamo che

f3 = a13 z1 + a23 z2 + a33 z3 = 0

Tutto ciò ci porta ad un sistema omogeneo di tre equazioni a tre variabili




 a11 z1 + a12 z2 + a13 z3 = 0
a12 z1 + a22 z2 + a23 z3 = 0


a13 z1 + a23 z2 + a33 z3 = 0

nel quale la variabile z3 =


6 0. Ciò è possibile ⇐⇒

I3 = det C = 0 .

In questo caso la conica è detta degenere.


Caso III:
KT CK = 0 , KT CZ 6= 0 e Z T CZ = 0 .
3.6. CONICHE ∩ RETTE 91

La condizione KT CK = 0 ci dice che il punto improprio [k, `, 0] appartiene


alla conica di equazione 3.24; inoltre, la condizione significa che

k 2 a11 + 2k`a12 + `2 a22 = 0 . (3.31)

Un’analisi dell’equazione 3.31 ci permette di riconoscere le coniche che


intersecano la retta impropria. Per esempio, facciamo l’ipotesi che ` 6= 0 e
a11 6= 0; allora, scrivendo k/` = t, abbiamo
1 q
2
t= [−a12 ± a12 − a11 a22 ]
a11
Questa equazione ha due soluzioni distinte in t se

a212 − a11 a22 > 0 ;

siccome a212 − a11 a22 = −I2 , la curva Γ è una iperbole (cfr. Teorema 3.3.2).
Il Teorema appena citato ci dice che una iperbole ha due punti impropri.
Il lettore può verificare facilmente che l’ellisse

x2 y 2
+ 2 =1, (3.32)
a2 b
non ha punti impropri mentre la parabola

y 2 = 2px , p > 0 (3.33)

ha un solo punto improprio: [1, 0, 0].


Nel caso in considerazione l’equazione 3.27 diventa

2mKT CZ = 0

che ha una sola soluzione m = 0 e dunque, oltre ad un punto improprio, la


retta r interseca la conica (iperbole o parabola) nel punto (proprio) Z.
Caso IV:
KT CK = 0 , KT CZ = 0 e Z T CZ = 6 0.
La condizione KT CK = 0 ci dice che stiamo lavorando con una iperbole
od una parabola. La seconda condizione, ossia

KT CZ = 0

è valida solo per l’iperbole; se aggiungiamo a queste due condizioni l’ipotesi


Z T CZ 6= 0, vediamo che l’equazione 3.27 non è valida, e perciò nessun punto
proprio delle rette r (trovate tramite 3.31) incontra l’iperbole; questo fatto
92 CAPITOLO 3. CURVE ALGEBRICHE PIANE

ed il Teorema di Bézout ci permettono di concludere che ciascuno dei due


punti impropri intersezione delle due rette r con l’iperbole deve essere contato
due volte o , in altre parole, le rette r sono tangenti all’iperbole per i punti
impropri. Queste due rette sono le asintote all’iperbole.
Le asintote all’iperbole
x2 y 2
− 2 =1
a2 b
sono le rette date dalle equazioni
b
x±y =0 .
a
Per la parabola
y 2 = 2px , p > 0
la situazione è un pó diversa: infatti questa equazione soddisfa la prima ma
non la seconda delle tre condizioni evidenziate nela Caso IV; ciò nonostante
possiamo dire che la parabola ha una asintota: la retta impropria x3 = 0.
Infatti, questa retta ha un unico punto di intersezione con la parabola, ossia
il punto [1, 0, 0] e perciò è “tangente” alla conica in quel punto.
Caso V:
KT CK = 0 , KT CZ = 0 e Z T CZ = 0 .
In questo caso, oltre alle equazioni 3.31 e 3.28, abbiamo
a11 z12 + 2a12 z1 z2 + a22 z22 + 2a13 z1 z3 + 2a23 z2 z3 + a33 z32 = 0 . (3.34)
Quest’ultima ci dice che le asintote all’iperbole hanno punto propri Z in
comune con l’iperbole; dunque le asintote sono parti integranti dell’perbole
che è degenerata (prodotto di due rette). Per esempio, la conica Γ
x2 − y 2 = 0
e la retta passante per [0, 0, 1] e nella direzione di ~v = (1, 1) soddisfano le tre
condizioni ed Γ è l’unione delle rette x ± y = 0.
Pasiamo ora ad alcuni esempi. Consideriamo la circonferenza di centro
nell’origine e raggio unitario ed il punto Z = (0, 2) nell’asse y; in coordinate
omogenee abbiamo l’equazione
x21 + x22 − x23 = 0
ed il punto Z = [0, 2, 1]. Qui abbiamo le matrici
     
1 0 0 k 0
C= 0 1 0 
    
 , K =  `  e Z =  2  .
0 0 −1 0 1
3.6. CONICHE ∩ RETTE 93

L’equazione 3.27 assume la forma

m2 (k 2 + `2 ) + 4`m + 3 = 0

e facendo k = 1 otteniamo i vettori direzione


√ √
~v = (1, 3) , w~ = (1, − 3) .

Le rette tangenti alla circonferenza passanti per il punto Z sono date dalle
equazioni parametriche (
x=m √
y =2+m 3
(
x=m √
y =2−m 3
√ √
È facile calcolare i punti di tangenza: ( 3/2, 1/2) e (− 3/2, 1/2). La
retta passante per questi due punti di tangenza è detta retta polare della
circonferenza data relativamente al punto esterno Z.
La parabola ha una retta tangente particolare. Infatti, consideriamo la
parabola
y 2 = 2px , p > 0
ossia, x22 −2px1 x3 = 0 in coordinate omogenee. Si noti che il punto improprio
P = [1, 0, 0] appartiene a questa parabola; facendo i conti si ottiene che
l’equazione 3.30 diventa x3 = 0 ossia, la retta impropria x3 = 0 è tangente
alla parabola y 2 = 2px , p > 0.
94 CAPITOLO 3. CURVE ALGEBRICHE PIANE
Capitolo 4

Superfici algebriche

4.1 Il piano
Ora ci trasferiamo allo spazio R3 .
Cominciamo con il seguente

Teorema 4.1.1 L’equazione del piano π che contiene il punto A = (x1 , x2 , x3 )


ed è perpendicolare al vettore ~n = (a, b, c) è

a(x − x1 ) + b(y − x2 ) + c(z − x3 ) = 0 . (4.1)

Dimostrazione – Chiaramente i valori x = x1 , y = x2 e z = x3 ci danno


una soluzione dell’equazione; pertanto A ∈ π. Supponiamo ora che B =
(y1 , y2 , y3 ) sia anch’esso in π. Allora

a(y1 − x1 ) + b(y2 − x2 ) + c(y3 − x3 ) = 0 .

Le equazioni parametriche della retta AB sono

x = x1 + m(y1 − x1 ) , y = x2 + m(y2 − x2 ) , z = x3 + m(y3 − x3 )

per qualsiasi valore di m (cioè, per qualsiasi punto X(m) della retta AB –
vedere Sezione 2.4, equazioni 2.4); sostituendo questo valori nell’equazione
4.1 otteniamo

a(x1 + m(y1 − x1 ) − x1 ) + b(x2 + m(y2 − x2 ) − x2 )+

+c(x3 + m(y3 − x3 ) − x3 ) =
m[a(y1 − x1 ) + b(y2 − x2 ) + c(y3 − x3 )] = 0

95
96 CAPITOLO 4. SUPERFICI ALGEBRICHE

e dunque X(m) ∈ π. Allora il luogo dei punti di R3 che soddisfano l’equazione


è realmente un piano. Finalmente osserviamo che ~n ⊥ π. Infatti, se (x, y, z) ∈
π il vettore ~v = (x − x1 , y − x2 , z − x3 ) è perpendicolare a ~n perché

< ~n, ~v >= a(x − x1 ) + b(y − y1 ) + c(z − z1 ) = 0 .

2
Ponendo −d = ax1 + bx2 + cx3 l’equazione 4.1 diventa

ax + by + cz + d = 0 . (4.2)

Reciprocamente, supponiamo ci sia data un’equazione lineare nelle vari-


abili x, y, z a coefficienti in R, diciamo ax + by + cz + d = 0, con al meno uno
dei coefficienti a, b o c diversi da zero (in altre parole, con a2 +b2 +c2 6= 0). Si
osservi che esistono punti di R3 le cui coordinate non soddisfano l’equazione.
Dunque il luogo dei punti di R3 che sono soluzioni dell’equazione è diver-
so da R3 . D’altro lato, l’equazione lineare data ha infinite soluzioni: basta
dare arbitrariamente un valore ad una delle variabili nel caso in cui uno dei
coefficienti reali sia nullo e calcolare il valore della variabile rimanente, op-
pure dare valori arbitrari a due delle variabili nel caso in cui i tre coefficienti
siano non nulli e calcolare il valore della terza variabile. Fissiamo un punto
A = (x1 , x2 , x3 ) tale che ax1 + bx2 + cx3 + d = 0; per qualsiasi altro punto
B = (y1 , y2 , y3 ) soluzione dell’equazione si verificano due condizioni: 1) tutti
i punti della retta AB soddisfano l’equazione e 2), la retta AB è perpendi-
colare al vettore ~n = (a, b, c). Allora, 4.2 è la forma generale dell’equazione
di un piano in R3 .
Distanza da un punto ad un piano – Dati A = (x1 , x2 , x3 ) e π di equazione
ax + by + cz + d = 0, vogliamo calcolare la distanza di A a π. Il vettore
~n = (a, b, c) è perpendicolare a π e dunque, la retta r per A e parallela a ~n è
perpendicolare a π; sia B = r ∩ π. La distanza cercata è precisamente dAB .
Ora passiamo ai calcoli. Le equazioni parametriche di r sono

x = x1 + ma , y = x2 + mb , z = x3 + mc

e cosı̀ dall’equazione del piano otteniamo

a(x1 + ma) + b(x2 + mb) + c(x3 + mc) + d = 0

cosa che ci permette di trovare il valore di m e delle coordinate di B:

ax1 + bx2 + cx3 + d


m=− ,
a2 + b2 + c2
4.1. IL PIANO 97

ax1 + bx2 + cx3 + d


z1 = x1 − a ,
a2 + b2 + c2
ax1 + bx2 + cx3 + d
z2 = x2 − b ,
a2 + b2 + c2
ax1 + bx2 + cx3 + d
z3 = x3 − c .
a2 + b2 + c2
La formula che ci da la distanza tra due punti ci permette di concludere che

|ax1 + bx2 + cx3 + d|


dAB = √ .
a2 + b2 + c2

D’accordo con gli assiomi della geometria euclidea, due piani distinti han-
no una retta in comune o non si incontrano per niente (cioè sono paralleli).
Dunque, una retta può essere rappresentata anche dalla soluzione comune di
due equazioni lineari reali in x, y e z:
(
π : ax + by + cz + d = 0
π 0 : a0 x + b0 y + c0 z + d0 = 0

Le equazioni parametriche della retta definita dai due piani sopra si ri-
cavano facilmente tramite l’algebra vettoriale. Infatti i vettori ~n = (a, b, c) e
~n0 = (a0 , b0 , c0 ) sono perpendicolari ai piani π e π 0 rispettivamente; dunque il
vettore
~n ∧ ~n0 = (bc0 − cb0 , ca0 − ac0 , ab0 − ba0 )
ha la direzione della retta r = π ∩ π 0 . In questo modo, una volta individuate
le coordinate di un punto qualsiasi di r – diciamo A = (a1 , a2 , a3 ) ∈ r –
abbiamo le equazioni parametriche di r:

x = a1 + m(bc0 − cb0 ) , y = a2 + m(ca0 − ac0 ) , z = a3 + m(ab0 − ba0 ) ,

Distanza da un punto ad una retta – (1) Supponiamo dati un punto A =


(x1 , x2 , x3 ) ed una retta r di equazioni parametriche

x = y1 + ma , y = y2 + mb , z = y3 + mc .

Il punto B = (y1 , y2 , y3 ) ∈ r e

~ = a(x1 − y1 ) + b(x2 − y2 ) + c(x3 − y3 )


proj~n (BA) √
a2 + b2 + c2
98 CAPITOLO 4. SUPERFICI ALGEBRICHE

~ >). Sia C la
(questo valore si ottiene tramite il prodotto scalare < ~n, BA
proiezione ortogonale di A su r; dal Teorema di Pitagora1 concludiamo che

3
X [a(x1 − y1 ) + b(x2 − y2 ) + c(x3 − y3 )]2
|CA|2 = (xi − yi )2 − .
i=1 a2 + b2 + c2

(2) Siano A = (x1 , x2 , x3 ) ed r data dall’intersezione di due piani


(
ax + by + cz + d = 0
a0 x + b0 y + c0 z + d0 = 0

La retta r è nella direzione del vettore

~r = (a, b, c) ∧ (a0 , b0 , c0 ) = (bc0 − b0 c, a0 c − ac0 , ab0 − a0 b)

e dunque, l’equazione del piano π per A e perpendicolare a r è

(bc0 − b0 c)(x − x1 ) + (a0 c − ac0 )(y − x2 ) + (ab0 − a0 b)(z − x3 ) = 0 .

D’altro lato π taglia r nel punto C (proiezione ortogonale di A su r) le cui


coordinate sono date dalla soluzione comune del sistema lineare


 ax + by + cz + d = 0

 a0 x + b0 y + c0 z + d0 = 0


 (bc0 − b0 c)(x − x1 ) + (a0 c − ac0 )(y − x2 )+

+(ab0 − a0 b)(z − x3 ) = 0 .

La distanza dAC si calcola ora come la radice quadrata positiva della somma
dei quadrati delle differenze delle rispettive coordinate di A e C.

4.2 Altre superfici


Una superficie algebrica dello spazio tridimensionale è rappresentata da una
equazione polinomiale di secondo grado nelle variabile x, y e z. Due tali
superfici si intersecano, in generale, secondo una curva spaziale.
1
Il lettore conosce la dimostrazione di questo teorema dalle scuole medie o superiori; per
una dimostrazione elementare e molto semplice fatta con l’aiuto dei vettori reali, vedere il
Teorema 2.4.2.
4.2. ALTRE SUPERFICI 99

4.2.1 La sfera
La sfera è il luogo geometrico dei punti di R3 che si trovano ad una distanza
fissa r > 0 da un punto C = (c1 , c2 , c3 ) detto centro (della sfera). Il valore r
è il raggio (della sfera). L’equazione (canonica) di una tale sfera si determina
facilmente ed è:

(x − c1 )2 + (y − c2 )2 + (z − c3 )2 = r2 .

Si noti che i coefficienti dei termini quadratici sono tutti uguali a 1. Se


l’equazione di una sfera è data nella forma

x2 + y 2 + z 2 + Dx + Ey + F z + G = 1

troviamo il suo centro e raggio con una traslazione di coordinate ossia, usando
il metodo della “completazione dei quadrati” come nell’esempio a seguito.
Esempio 1 : Trovare il centro ed il raggio della sfera

x2 + y 2 + z 2 + 4x − 6y + 10z − 2 = 0

Riscriviamo l’equazione nella forma

(x2 + 4x + 4) + (y 2 − 6y + 9) + (z 2 + 10z + 25) − 4 − 9 − 25 − 2 = 0

ossia
(x + 2)2 + (y − 3)2 + (z + 5)2 = 40

e perciò abbiamo una sfera di centro C = (−2, 3, −5) e raggio 2 10. In
pratica abbiamo fatto fatto la traslazione


 x = x0 + 2
y = y0 − 3


z = z0 + 5 .

4.2.2 Superfici cilindriche


Una superficie cilindrica è una superficie generata da una retta

r ⊂ R3

(detta generatrice) che è obbligata a muoversi parallelamente a se stessa e


avente sempre un punto in comune con una curva δ dello spazio (detta curva
direttrice).
100 CAPITOLO 4. SUPERFICI ALGEBRICHE

Non è difficile trovare l’equazione di una superficie cilindrica. Assumiamo


che la direttrice δ sia definita dall’interzezione di due superfici

F (x, y, z) = 0 e G(x, y, z) = 0

e che la generatrice sia data da una retta nella direzione di un vettore


~v = (a, b, c). Sia (x0 , y0 , z0 ) il punto in comune delle direttrice e la gen-
eratrice; allora, l’equazione della superficie cilindrica cosı̀ definita è data
dalla soluzione del sistema di equazioni




F (x0 , y0 , z0 ) = 0



 G(x0 , y0 , z0 = 0
x = x0 + ma



 y = y0 + mb


 z = z0 + mc
(le ultime tre equazioni sono le equazioni parametriche della generatrice).
Facciamo alcuni esempi.
Esempio 2 - L’equazione
x2 + y 2 = 9
è l’equazione del cilindro di direttrice definita dall’intersezione della sfera

x2 + y 2 + z 2 = 9

con il piano z = 0 e avente per generatrice una retta parallela all’asse 0z. Si
noti che tale cilindro è un cono avente per vertice il punto improprio [0, 0, 1, 0].
Esempio 3 - Sia δ la parabola y 2 = 2x del piano xOy e r una retta parallela
all’asse Oz e avente un punto in comune con δ. La superficie cilindrica
ottenuta in questo modo, la cui equazione è appunto y 2 = 2x in R3 è detta
paraboloide cilindrico.

4.2.3 Superfici di rotazione


Una superfcie di rotazione è una superficie generata da una curva γ (la gen-
eratrice) che ruota senza deformarsi attorno ad una retta r fissa (detta asse
di rotazione). Supponiamo che γ sia data dall’intersezione di due superfici

f (x, y, z) = 0 , g(x, y, z) = 0

e che l’asse di rotazione r sia espresso mediante le sue equazioni parametriche




 x = x0 + ma
y = y0 + mb


z = z0 + mc
4.3. QUADRICHE 101

Un punto arbitrario P = (x1 , y1 , z1 ) ∈ γ descrive una circonferenza durante


la rotazione; questa circonferenza è infatti l’intersezione del piano passante
per P e perpendicolare a r con la sfera di centro (x0 , y0 , z0 ) passante per P .
Cosi abbiamo due altre equazioni in gioco:

a(x − x1 ) + b(y − y1 ) + c(z − z1 ) = 0

per il piano, e

(x − x0 )2 + (y − y0 )2 + (z − z0 )2 = (x0 − x1 )2 + (y0 − y1 )2 + (z0 − z1 )2

per la sfera. Ci serviamo di queste due equazioni più le equazioni

f (x1 , y1 , z1 ) = 0 , g(x1 , y1 , z1 ) = 0

per liberarci dalle coordinate (x1 , y1 , z1 ) e cosı̀ ottenere finalmente l’equazione


della superficie di rotazione.

4.3 Quadriche
Una quadrica è il luogo dei punti (x, y, z) ∈ R3 che soddisfano un’equazione
matriciale del tipo
 T   
x a11 a12 a13 a14 x
 y   a12 a22 a23 a24  y 
    
     =0 (4.3)
 z   a13 a23 a33 a34  z 
1 a14 a24 a34 a44 1
(si noti che la matrice intermedia è simmetrica) o se vogliamo, un’equazione
polinomiale di secondo grado tipo

a11 x2 + 2a12 xy + a22 y 2 + 2a13 xz + 2a23 yz + a33 z 2

+2a14 x + 2a24 y + 2a34 z + a44 = 0 .


In seguito descriviamo sei tipi di quadriche con le loro equazioni canon-
iche.
Elissoide - Luogo geometrico definito da un’equazione della forma
x2 y2 z2
+ + =1 (4.4)
A2 B 2 C 2
Iperboloide ellittico a una falda - Luogo geometrico definito da un’equazione
della forma
x2 y2 z2
+ − =1 (4.5)
A2 B 2 C 2
102 CAPITOLO 4. SUPERFICI ALGEBRICHE

Iperboloide ellittico a due falde - Luogo geometrico definito da un’equazione


della forma
x2 y2 z2
− − =1 (4.6)
A2 B 2 C 2
Paraboloide ellittico - Luogo geometrico definito da un’equazione della forma

x2 y2
+ =z (4.7)
A2 B 2
Paraboloide iperbolico - Luogo geometrico definito da un’equazione della
forma
x2 y2
− =z (4.8)
A2 B 2
Cono ellittico - Luogo geometrico definito da un’equazione della forma

x2 y2 z2
+ = (4.9)
A2 B 2 C2
Per avere un’idea della forma geometrica di queste sei quadriche studiamo
le loro intersezioni con gli assi e i piani coordinati, e più in generale, le
intersezioni di dette quadriche con vari piani paralleli ai piani coordinati.
Cominciamo con l’ellissoide. Questa figura interseca gli assi Ox, Oy e Oz
rispettivamente nei punti

(±A, 0, 0) , (0, ±B, 0) e (0, 0, ±C) .

Le intersezioni dell’ellissoide con i piani coordinati xOy, xOz e yOz sono


rispettivamente le ellissi

x2 y2 x2 z2
+ = 1 , + =1e
A2 B 2 A2 C 2
y2 z2
+ =1.
B2 C 2
Le intersezioni dell’ellissoide 4.4 con un piano

x = k , −A < k < A

sono le ellissi
y2 z2
+ =1
B 2 (1 − k 2 /A2 ) C 2 (1 − k 2 /A2 )
(le intersezioni con i piani x = ±A sono i punti (±A, 0, 0)). Otteniamo
risultati simili per le intersezioni di 4.4 con piani y = k e z = k.
4.3. QUADRICHE 103

Se A = B = C = r l’ellissoide 4.4 è una sfera di raggio r e centro


nell’origine; se due di quei tre numeri sono uguali, abbiamo una superficie di
rotazione detta ellissoide di rotazione (o anche sferoide); per esempio

x2 y2 z2
+ + =1
A2 B 2 A2
è l’equazione della superficie di rotazione generata dall’ellisse
(
x2 y2 z2
A2
+ B2
+ C2
=1
z=0

intorno all’asse degli y.


L’iperboloide ellittico a una falda 4.5 taglia l’asse Ox (rispetivamente Oy)
nei punti (±A, 0, 0) (rispettivamente (0, ±B, 0)), ma non interseca l’asse degli
z perché l’equazione
−z 2 /C 2 = 1
non ha soluzione! Le intersezioni di 4.5 con i piani z = k sono le ellissi

x2 y2
+ =1
A2 (1 − k 2 /C 2 ) B 2 (1 − k 2 /C 2 )

e le sue intersezioni con i piani y = k sono le iperbole

x2 z2
− =1.
A2 (1 − k 2 /B 2 ) C 2 (1 − k 2 /B 2 )

Ora passiamo all’iperboloide ellitico a due falde. Questa superficie in-


terseca l’asse degli x nei punti (±A, 0, 0) e non intrseca gli altri due assi;
si osservi che |x| ≥ A altrimenti la parte sinistra dell’equazione 4.6 sarebbe
strettamente minore di 1. Questa superficie non interseca il piano yOz e
taglia gli altri due piani coordinati in iperbole. Finalmente, le intersezioni
dell’iperboloide ellitico a due falde con i piani di equazioni x = k , |k| > A
sono le ellissi
x2 z2
+ =1;
B 2 (k 2 /A2 − 1) C 2 (k 2 /A2 − 1)
se |k| < A non c’è intersezione.
Il paraboloide ellittico di equazione 4.7 interseca gli assi coordinati nell’origine
(0, 0, 0); le sue intersezioni con i piani xOz e yOz sono parabole. D’altro lato,
la superficie 4.7 interseca i piani z = k , k > 0 in ellissi. Se A = B abbi-
amo un paraboloide di rivoluzione generato dalla rotazione di un’apposita
parabola intorno all’asse Oz.
104 CAPITOLO 4. SUPERFICI ALGEBRICHE

Il paraboloide ellittico di equazione 4.8 incontra gli assi Ox, Oy e Oz nel


punto (0, 0, 0). La sua intersezione con il piano x = 0 è la parabola

y 2 = −B 2 z

di vertice (0, 0) e contenuta semipiano negativo del piano x = 0, inquanto


che la sua intersezione con il piano y = 0 è la parabola

x2 = A2 z

di vertice (0, 0) e contenuta nel semipiano positivo del piano y = 0. Fi-


nalmente, l’intersezione di 4.8 con il piano z = 0 è la conica degenerata
nell’unione delle due rette

Bx + Ay = 0 , Bx − Ay = 0 .

L’ultima delle nostre quadriche, ossia il cono ellittico di equazione

x2 y2 z2
+ =
A2 B 2 C2
incontra gli assi coordinati nell’origine e i piani x = 0, y = 0 in due rette
passanti per l’origine; i piani z = k , k 6= 0 intersecano il cono ellittico in
ellissi ed i piani paralleli ai piani x = 0 e y = 0 (ma non coincidenti con
questi) lo incontrano in iperboli. Se A = B abbiamo il cono a due falde già
incontrato nella Sezione 3.2.
Concludiamo questa sezione notando che le quadriche seguenti hanno un
centro di simmetria:

1. elissoide;

2. iperboloide ellittico a una falda;

3. iperboloide ellittico a due falde;

4. cono ellittico.

4.4 Classificazione delle quadriche


Nella sezione anteriore abbiamo trovato le equazioni canoniche delle quadriche
cioè, le equazioni che descrivono le quadriche nel modo più semplice e che
4.4. CLASSIFICAZIONE DELLE QUADRICHE 105

si ottengono scegliendo sistemi di coordinate cartesiane ortogonali ben po-


sizionati. Parafrasando il formalismo che abbiamo usato con le coniche
osserviamo subito che l’equazione generale di una quadrica è del tipo

a11 x2 +2a12 xy+2a13 xz+a22 y 2 +2a23 yz+a33 z 2 +2a14 x+224 y+2a34 z+a44 = 0 ;
(4.10)
in forma matriciale questa equazione si scrive come segue:
  
a11 a12 a13 a14 x
 ‘ a12 a22 a23 a24  y 
  
x y z 1    (4.11)
 a13 a23 a24 a34  z 
a14 a24 a34 a44 1

e in forma compatta,
X T CX = 0 (4.12)
dove C è la matrice (simmetrica) dei coefficienti e
 
x
 y 
X =

 
 z 
1

è la matrice definita dal punto arbitrario (x, y, z) ∈ R3 .


Per fare scomparire tutti i temini lineari usiamo il “metodo della comple-
tazione dei quadrati” (come abbiamo fatto con le coniche) ossia, sostituiamo
le coordinate x, y e z per x + k, y + ` e z + m rispettivamente, per ottenere
da 4.12 l’equazione

X T CX + 2X T CK + KT CK = 0 (4.13)

dove  
k
 ` 
K=


 .
 m 
1
I termini lineari sono raggruppati nel termine

X T CK ;

infatti, facendo i conti vediamo che

X T CK =
106 CAPITOLO 4. SUPERFICI ALGEBRICHE

(a11 k + a12 ` + a13 m + a14 )x + (a12 k + a22 ` + a23 m + a24 )y+


(a13 k + a23 ` + a33 m + a34 )z + a14 k + a24 ` + a34 m + a44
e dunque i coefficienti di x, y e z sono simultaneamente nulli se, e solamente
se, 
 a11 k + a12 ` + a13 m = −a14

a12 k + a22 ` + a23 m = −a24 (4.14)


a13 k + a23 ` + a33 m = −a34
che a sua volta ha una unica soluzione se, e solamente se,
 
a11 a12 a13
 
det  a12 a22 a23  6 0.
=
a13 a23 a33

In questo caso, la quadrica ha il punto (k, `, m) per centro di simmetria.


Infatti, abbiamo dimostrato il seguente risultato.
Teorema 4.4.1 Una quadrica di equazione 4.11 ha un centro se, e solamente
se,  
a11 a12 a13
det  
 a12 a22 a23  6= 0 .
a13 a23 a33
Ricordiamo al lettore che le quadriche a centro sono: l’ellissoide, gli
iperboloidi ellittici a una o due falde e il cono ellittico.
Una volta eliminati i termini lineari dall’equazione generale dobbiamo
eliminare i termini misti in xy, xz e yz. Per questo abbiamo bisogno di fare
una rotazione. Per affrontare il problema ci serviamo della nostra esperienza
con le coniche e precisamente, a quanto esposto nella Sezione 3.4. Per una
ragione di completezza della presente sezione, esponiamo in poche righe i
risultati principali ottenuti in 3.4. I termini quadratici dell’equazione di una
conica sono racchiusi in una 2 × 2-matrice Q; questa, essendo simmetrica
ha due autovalori reali (eventualmente coincidenti) dai quali ricaviamo due
autovettori che saranno ortogonali tra di loro se Q 6= rI2 ; i vettori unitari
associati sono le colonne della matrice di rotazione richiesta. Seguiamo queste
idee nella presente sezione.
Sia  
a11 a12 a13

A= a21 a22 a23  
a31 a32 a33
una 3 × 3-matrice reale data. Questa definisce una funzione

A : V (R3 ) → V (R3 )
4.4. CLASSIFICAZIONE DELLE QUADRICHE 107
 P3 
i=1 a1i xi
 P3
(∀~v = (x1 , x2 , x3 ) ∈ V (R3 ), A(~v ) =  a x  
P3i=1 2i i
i=1 a3i xi
che è lineare, ossia tale che

~ ∈ V (R3 ))
(∀α, β ∈ R)(∀~v , w

A(α~v + β w)
~ = αA(~v ) + βA(w)
~ . (4.15)
Come per il caso 2 × 2, vogliamo trovare gli autovalori e gli autovettori di
una trasformazione lineare A ossia, cerchiamo i possibili numeri reali λ 6= 0
e i vettori non-nulli ~vλ ∈ V (R3 ) tali che

A(~vλ ) = λ~vλ . (4.16)

Si osservi che l’equazione 4.16 si scrive in forma matriciale come segue:


    
a11 a12 a13 x1 x1
    
 a21 a22 a23   x2  = λ  x2 
a31 a32 a33 x3 x3
ossia      
a11 a12 a13 x1 λ 0 0 x1
     
 a21 a22 a23   x2  =  0 λ 0   x2  .
a31 a32 a33 x3 0 0 λ x3
Da questa equazione ricaviamo l’equazione matriciale
    
a11 − λ a12 a13 x1 0


 a21 a22 − λ 
a23   x2  =  0 


a31 a32 a33 − λ x3 0

che equivale al sistema lineare omogeneo




 (a11 − λ)x1 + a12 x2 + a13 x3 = 0
a x + (a22 − λ)x2 + a23 x3 = 0 (4.17)
 21 1

a31 x1 + a32 x2 + (a33 − λ)x3 = 0

Ora un tale sistema ha soluzioni non banali se, e soltanto se

det A = 0 ;

sviluppando il determinante, otteniamo il polinomio caratteristico di A:


3
X X X
−λ3 + ( aii )λ2 − ( aii ajj − aij aji )λ + det A = 0 . (4.18)
i=1 i<j i<j
108 CAPITOLO 4. SUPERFICI ALGEBRICHE

Come nella Sezione 3.4 le radici dell’equazione 4.18 sono gli autovalori e i
vettori corrispondenti ~vλ sono gli autovettori di A. Come per il caso 2 × 2,
le 3 × 3-matrici simmetriche sono speciali, ma sono più difficili da trattare.
Il passo successivo è quello di dimostrare che per qualsiasi 3 × 3-matrice
reale simmetrica A esiste una (3 × 3)-matrice di rotazione R tale che
 
λ1 0 0

RT AR =  0 λ2 0 

0 0 λ3
dove λ1 , λ2 , λ3 sono gli autovalori di A; in altre parole, ci piacerebbe di-
mostrare che qualsiasi 3 × 3-matrice simmetrica è diagonalizzabile. Vediamo
come si potrebbe procedere. Sia λ1 un autovalore reale di A (esiste perché
l’equazione caratteristica di A ha almeno una soluzione reale. Sia ~v1 un au-
tovettore corrispondente, che possiamo assumere unitario. Sia w ~ ∈ V (R3 ) un
vettore in una direzione diversa dalla direzione di ~v1 e prendiamo il vettore
w− ~ ~v1 > ~v1
~ < w,
~v2 = .
|w−
~ < w,
~ ~v1 > ~v1 |
Il vettore ~v2 è unitario e perpendicolare a ~v1 . Finalmente, sia ~v3 = ~v1 ∧ ~v2 ;
si noti che |~v3 | = 1 e che la matrice R1 le cui colonne sono appunto i vettori
~v1 , ~v2 e ~v3 è di rotazione. Siccome

(RT1 AR1 )T = RT1 AR1

la matrice
RT1 AR1
è simmetrica; allora
 
λ1 0 0
T  
R1 AR1 =  0 b11 b12 
0 b12 b22

perché A(~v1 ) = λ1~v1 . Se la matrice simmetrica


  !
b11 b12
B=
b12 b22

fosse distinta da una matrice del tipo rI2 , allora per il Teorema ?? esistireb-
bero due autovalori distinti λ2 e λ3 di B e una (2 × 2)-matrice di rotazione
R2 tale che   !
T λ2 0
R2 BR2 =
0 λ3
4.4. CLASSIFICAZIONE DELLE QUADRICHE 109

e con questo si avrebbe una matrice


  !
1 0
R = R1
0 R2

tale che  
λ1 0 0
R AR =  0 λ2 0 
T 

0 0 λ3
Purtroppo non sappiamo se la matrice
  !
b11 b12
B=
b12 b22

è distinta da rI2 e perciò non abbiamo una dimostrazione del risultato che
vorremmo avere!
Il risultato che cerchiamo è vero ma per dimostrarlo sarà necessario seguire
una linea diversa da quella indicata anteriormente. Ci limiteremo a lavorare
all’interno dello spazio vettoriale reale tridimensionale V (R3 ) ma il lettore
deve avere presente il fatto che i nostri risultati si possono estendere senza
maggiori difficoltà al caso generale di uno spazio vettoriale reale di dimensione
n.
Cominciamo il nostro lavoro ricordando osservando che il prodotto scalare
è bilineare, cioè
~ ∈ V (R3 ))(∀a, b ∈ R)
(∀~u, ~v , w
< a~u + b~v , w
~ >= a < ~u, w
~ > +b < ~v + w
~ >,
~ >= a < ~u, ~v > +b < ~u, w
< ~u, a~v + bw ~> .
Diciamo che una trasformazione lineare A : V (R3 ) → V (R3 ) è autoag-
giunta quando

(∀~u, ~v ∈ V (R3 )) < A(~u), ~v >=< ~u, A(~v ) > .

Lemma 4.4.2 Una trasformazione lineare

A : V (R3 ) → V (R3 )

è autoaggiunta ⇐⇒ la matrice di A è simmetrica.

Dimostrazione – Indichiamo la matrice di A con la medesima lettera A =


(aij |i, j = 1, 2, 3); inoltre, per semplificare le nostre dimostrazioni indichiamo
i vettori della base canonica di V (R3 ) con ~e1 , ~e2 e ~e3 .
110 CAPITOLO 4. SUPERFICI ALGEBRICHE

⇒:
(∀i, j = 1, 2, 3)aij =< A(~ei ), ~ej >=< ~ei , A(~ej ) >= aji .
⇐:

(∀i, j = 1, 2, 3) < A(~ei ), ~ej >= aij = aji =< ~ei , A(~ej ) > . (4.19)

Dati due vettori arbitrari


3
X 3
X
~u = ui~ei , ~v = vi~ei ,
i=1 i=1

dalla bilinearità di A e 4.19 concludiamo che

< A(~u), ~v >=< ~u, A(~v ) > .

Ad ogni trasformazione lineare autoaggiunta A si associa una forma


bilineare simmetrica
B : V (R3 ) × V (R3 ) → R
(∀(~u, ~v ) ∈ V (R3 ) × V (R3 ))B(~u, ~v ) =< A(~u), ~v > . (4.20)
La bilinearità di questa forma proviene dalla bilinearità del prodotto scalare
e dalla linearità di A, inquanto che la simmetria segue dalla autoaggiunzione
di A.
Una forma quadratica è una funzione

Φ : V (R3 ) → R

tale che, per qualsiasi ~v = (x, y, z) ∈ V (R3 )),

Φ(~v ) = a11 x2 + 2a12 xy + 2a13 xz + a22 y 2 + 2a23 yz + a33 z 2 .

Dal punto di vista matriciale possiamo scrivere


  
a11 a12 a13 x
Φ(~v ) =  a12 a22 a23   y 
 

a13 a23 a33 z

Lemma 4.4.3 Esiste una corrispondenza biunivoca tra l’insieme delle trasfor-
mazioni lineari autoaggiunte di V (R3 ) e l’insieme delle forme quadratiche a
valori reali definite su V (R3 ).
4.4. CLASSIFICAZIONE DELLE QUADRICHE 111

Dimostrazione – Infatti, ad ogni forma bilineare simmetrica


B : V (R3 ) × V (R3 ) → R
si associa una forma quadratica
Q : V (R3 ) → R
definita dall’equazione
Q(~v ) = B(~v , ~v )
per qualsiasi ~v ∈ V (R3 ). D’altro lato, una forma quadratica Q : V (R3 ) → R
determina una trasformazione bilineare simmetrica
1
B(~u, ~v ) = [Q(~u + ~v ) − Q(~u − Q(~v )] .
2
2

Il nostro obiettivo è dimostrare che per una trasformazione lineare au-


toaggiunta
A : V (R3 ) → V (R3 )
esiste una base ortonormale di V (R3 ) tale che relativamente a questa, A
è una matrice diagonale. Sia Q l’unica forma quadratica associata alla
trasformazione lineare A. Come già fatto di sopra, scriviamo
  
a11 a12 a13 x
Q(x, y, z) =  a
 12 a 22 a  
23   y  . (4.21)
a13 a23 a33 z
Vogliamo studiare il comportamento di Q relativamente ad un cambiamento
di coordinate; seguendo le indicazioni della Sezione 2.5, prendiamo un nuovo
sistema di coordinate cartesiane Ox0 , Oy 0 , Oz 0 tali che i vettori base unitari
siano dati dalle formule

 ~

 i0 = u1~i + u2~j + u3~k

j~0 = v1~i + v2~j + v3~k (4.22)

 k~0 = w1~i + w2~j + w3~k

(cfr. 2.8); dunque, se p~ ∈ V (R3 ) ha coordinate (x, y, z) nel sistema Ox, Oy, Oz
e coordinate (x0 , y 0 , z 0 ) nel sistema Ox0 , Oy 0 , Oz 0 avremmo



 ~x = u1 x~0 + v1 y~0 + w1 z~0

~y = u2 x~0 + v2 y~0 + w2 z~0

 ~z = u3 x~0 + v3 y~0 + w3 z~0
112 CAPITOLO 4. SUPERFICI ALGEBRICHE

Nel nuovo sistema, la forma quadratica Φ diventa uguale a

Φ(~v ) = a11 (u1 x~0 + v1 y~0 + w1 z~0 )2 +

+2a12 (u1 x~0 + v1 y~0 + w1 z~0 )(u2 x~0 + v2 y~0 + w2 z~0 ) + . . .


. . . + a33 (u3 x~0 + v3 y~0 + w3 z~0 )2 =
β11 x02 + 2β12 x0 y 0 + 2β13 x0 z 0 + β22 y 02 + 2β23 y 0 z 0 + β33 z 02 .
A conti fatti, il coefficiente β11 assume la forma seguente:

β11 = (a11 u1 + a12 u2 + a13 u3 )u1 + (a12 u1 + a22 u2 + a23 u3 )u2

+(a13 u1 + a23 u2 + a33 u3 )u3 .


Per semplificare la notazione scriviamo


 A1 = a11 u1 + a12 u2 + a13 u3
A2 = a12 u1 + a22 u2 + a23 u3 (4.23)


A3 = a13 u1 + a23 u2 + a33 u3

e dunque,
β11 = A1 u1 + A2 u2 + A3 u3 .
Analogamente, otteniamo

β12 = A1 v1 + A2 v2 + A3 v3
β13 = A1 w1 + A2 w2 + A3 w3 .

I coefficienti β23 , β22 e β33 sono calcolabili in modo simile, ma non sono
necessari al momento.
La forma quadratica Φ è detta pura se i coefficienti

β12 = β13 = β23 = 0 ;

in tale caso la forma quadratica Φ diviene

Φ = β11 x02 + β22 y 02 + β33 z 02 .

Il problema è appunto quello di trovare un cambiamento di coordinate tale


che Φ diventi una forma quadratica pura. Un sistema ortogonale di coor-
dinate cartesiane nel quale la forma quadratica Φ è pura è detto un sis-
tema principale di assi. Il seguente teorema vale in qualsiasi dimensione; qui
presentiamo la sua dimostrazione nel caso n = 3.2
2
Osserviamo in particolare che il “teorema degli assi principali” è più generale dei
risultati descritti nella Sezione 3.4.
4.4. CLASSIFICAZIONE DELLE QUADRICHE 113

Teorema 4.4.4 (Teorema degli assi principali) Una forma quadratica Φ


ha sempre un sistema di assi principali ossia, esitano sistemi ortogonali di
coordinate cartesiane per i quali Φ può essere scritto come

Φ = λ1 x2 + λ2 y 2 + λ3 z 2 .

Per giunta, i valori λ1 , λ2 , λ3 sono le radici del polinomio caratteristico 4.18.

Dimostrazione – Cominciamo il nostro lavoro imponendo le condizioni




 β11 = A1 u1 + A2 u2 + A3 u3 = λ
β12 = A1 v1 + A2 v2 + A3 v3 = 0 (4.24)


β13 = A1 w1 + A2 w2 + A3 w3 = 0

Siccome la matrice di cambiamento delle coordinate in 4.22 è ortinormale,


abbiamo anche le seguenti equazioni


 u12 + u22 + u23 = 1
u1 v1 + u2 v2 + u3 v3 = 0 (4.25)


u1 w1 + u2 w2 + u3 w3 = 0

Multiplicando le equazioni 4.25 per λ e sottraendole dalle equazioni 4.24


si ottiene il seguente sistema omogeneo di equazioni lineari nelle incognite
A1 − λu1 , A2 − λu2 e A3 − λu3 :


 u1 (A1 − λu1 ) + u2 (A2 − λu2 ) + u3 (A3 − λu3 ) = 0
v1 (A1 − λu1 ) + v2 (A2 − λu2 ) + v3 (A3 − λu3 ) = 0 (4.26)


w1 (A1 − λu1 ) + w2 (A2 − λu2 ) + w3 (A3 − λu3 ) = 0 .

Siccome la matrice del sistema 4.26 coincide con la matrice del cambiamento
di coordinate, il suo determinante è ±1 e dunque, il sistema ha soltanto la
soluzione banale, ossia

A1 = λu1 , A2 = λu2 , A3 = λu3 .

Sostituendo questi valori nel sistema di equazioni 4.23 otteniamo un nuovo


sistema lineare


 (a11 − λ)u1 + a12 u2 + a13 u3 = 0
a12 u1 + (a22 − λ)u2 + a23 u3 = 0 (4.27)


a13 u1 + a23 u2 + (a33 − λ)u3 = 0

che esprime le condizioni a cui devono soggiacere le componenti del vettore


unitario ~i0 (vedere le equazioni 4.22). Il sistema lineare omogeneo 4.27 ha
114 CAPITOLO 4. SUPERFICI ALGEBRICHE

una soluzione non banale soltanto se il determinante della matrice dei coeffi-
cienti è nullo; ma tale determinate è appunto il polinomio caratteristico della
matrice A che è un polinomio del terzo grado e perciò ha certamente almeno
una radice reale λ1 . Facciamo la sostituzione di λ per λ1 nel sistema 4.27;
otteniamo un sistema omogeneo nelle variabili u1 , u2 e u3 la cui matrice ha
rango ≤ 2. Se il rango è 2, il vettore ~i0 è univocamente definito (a meno del
segno algebrico); se il rango è 1, allora ci sono infinite possibilità di scelta
per ~i0 ; in ogni caso, scegliamo ~i0 = ~i∗ e poi prendiamo arbitrariamente due
vettori unitari ~j ∗ e ~k ∗ in modo che i tre vettori ~i∗ , ~j ∗ e ~k ∗ siano ortogonali
tra loro. Questi tre vettori definiscono un sistema ortogonale di coordinate
cartesiane nel quale
β11 = λ1 , β12 = β13 = 0
e perciò, la forma quadratica Φ si scrive nella forma
Φ = λ1 x∗2 + β22 y ∗2 + 2β23 y ∗ z ∗ + β33 z ∗2 .
Se β23 = 0 siamo arrivati: abbiamo trasformato la nostra forma quadrat-
ica in una forma quadratica pura! (Si osservi che β22 e β33 potrebbero anche
essere uguali.) Supponiamo che β23 6= 0. In questo caso manteniamo l’asse
Ox∗ e cerchiamo di fare una rotazione del sistema y ∗ Oz ∗ in modo ad eliminare
β23 . Questo è facile: siccome la matrice reale simmetrica
  !
β22 β23
β23 β33
non è un multiplo di I2 per i teoremi 3.4.1 e 3.4.3 esiste un sistema ortogonale
di coordinate Oxo = Ox∗ , Oyo , Ozo per il quale Φ è una forma quadratica
pura del tipo
Φ = λ1 xo2 + λ2 yo2 + λ3 zo2
con λ1 , λ2 e λ3 numeri reali.
La prima parte del Teorema degli assi principali è dimostrata. Ci manca
dimostrare che i numeri reali λ2 e λ3 sono le radici del polinomio caratter-
istico 4.18 (sappiamo di già che λ1 è una radice di 4.18). Per fare questa
dimostrazione, prendiamo un sistema arbitrario di assi principali nel quale
abbiamo una forma quadratica
Φ = λ1 X 2 + λ2 Y 2 + λ3 Z 2 . (4.28)
Supponiamo che i tre vettori di base del sistema principale siano dati da



 I~ = u1~i + u2~j + u3~k

J~ = v1~i + v2~j + v3~k (4.29)

 K~ = w1~i + w2~j + w3~k
4.4. CLASSIFICAZIONE DELLE QUADRICHE 115

e che la trasformazione al sistema originale sia data dalle equazioni




 X = u1 x + u2 y + u3 z
Y = v1 x + v2 y + v3 z


Z = w1 x + w2 y + w3 z .
Sostituendo questi valori in 4.28 otteniamo

Φ = λ1 (u1 x + u2 y + u3 z)2 + λ2 (v1 x + v2 y + v3 z)2 + λ3 (w1 x + w2 y + w3 z)2 .

Da questa arriviamo all’espressione originale

Φ(~v ) = a11 x2 + 2a12 xy + 2a13 xz + a22 y 2 + 2a23 yz + a33 z 2

nella quale abbiamo i coefficienti


a11 = λ1 u21 + λ2 v12 + λ3 w12
a12 = λ1 u1 u2 + λ2 v1 v2 + λ3 w1 w2
a13 = λ1 u1 u3 + λ2 v1 v3 + λ3 w1 w3
(4.30)
a22 = λ1 u22 + λ2 v22 + λ3 w22
a23 = λ1 u2 u3 + λ2 v2 v3 + λ3 w2 w3
a33 = λ1 u23 + λ2 v32 + λ3 w32 .
Sostituendo queste uguaglianze nel polinomio caratteristico 4.18 e ricordando
che la matrice  
u1 u2 u3
 
 v1 v2 v3 
w1 w2 w3
(dunque valgono le uguaglianze 4.25), 4.18 diventa

λ3 + (λ1 + λ2 + λ3 )λ2 − (λ1 λ2 + λ2 λ3 + λ3 λ1 )λ + λ1 λ2 λ3 = 0

che si fattorizza nella forma

(λ − λ1 )(λ − λ2 )(λ − λ3 ) = 0

e dunque, λ1 , i = 1, 2, 3 sono le tre radici del polinomio caratteristico.


Si osservi che questo argomento è valido per qualsiasi sistema di assi prin-
cipali; dunque la forma quadratica Φ ha i medesimi coefficienti λi , i = 1, 2, 3
in tutti i sistemi possibili di assi principali. 2

L’equazione
3
X X X
3
−λ + ( aii )λ2 − ( aii ajj − aij aji )λ + det A = 0
i=1 i<j i<j
116 CAPITOLO 4. SUPERFICI ALGEBRICHE

è anche detta equazione secolare; questo nome viene dall’Astronomia: infatti,


nella teoria delle perturbazioni delle orbite dei pianeti compaiono equazioni
di questo tipo per misurare le perturbazioni delle orbite, perturbazioni che
si manifestano solo dopo lunghissimi intervalli di tempo.
A questo punto il percorso per classificare le quadriche è chiaro: (i) dalla
matrice C associata all’equazione della quadrica si estrae la matrice Q dei
termini quadratici; (ii) se det Q =
6 0 la quadrica ha un centro di simmetria le
cui coordinate possono essere calcolate risolvendo il sistema lineare


 a11 k + a12 ` + a13 m = −a14
a12 k + a22 ` + a23 m = −a24


a13 k + a23 ` + a33 m = −a34 ;

(iii) in ogni caso si calcolano le radici dell’equazione caratteristica proveniente


dalla 3 × 3-matrice simmetrica Q; queste radici – che non sono necessaria-
mente distinte tra loro – sono associate a sistemi di assi principali nei quali
l’equazione della quadrica assume una forma riconoscibile (vedere 4.3).

4.5 Appendice A - Sistemi di Equazioni lin-


eari
Nella Sezione ?? abbiamo osservato che se prendessimo due rette in R2 , di
equazioni
ax + by = −c e a0 x + b0 y = −c0
e se avessimo   !
a b
det 6= 0 ,
a0 b0
allora le rette si incontrerebbero, precisamente nel punto di coordinate (x, y)
date dalle equazioni   !
−c b
det
−c0 b0
x=   !
a b
det
a 0 b0
e   !
a −c
det
a0 −c0
y=   ! .
a b
det
a0 b0
4.5. APPENDICE A 117

Passiamo a R3 . Supponiamo che siano dati tre piani π, π 0 e π” di


equazioni rispettive


 ax + by + cz + d = 0
a0 x + b0 y + c0 z + d0 = 0 (4.31)


a”x + b”y + c”z + d” = 0

Geometricamente ci sono diverse possibilità: o questi piani non si incontrano,


cioè sono paralleli, o se si incontrano, possono incontrarsi tutti in una sola
retta, o in un solo punto o in due rette parallele.
Anche in questo caso, possiamo sapere, con un metodo puramente algebri-
co, di quale caso geometrico stiamo parlando; il determinante della matrice
dei coefficienti del sistema si rivela la pedina essenziale. Invece di studiare il
caso di tre equazioni a tre variabili (tre piani in R3 ) esamineremo il caso n
dimensionale più generale. Il nostro primo risultato è la cosiddetta Regola di
Cramer3
Un sistema di n equazioni lineari a n variabili




a11 x1 + a12 x2 + . . . + a1n xn = b1



 a21 x1 + a22 x2 + . . . + a2n xn = b2
... ... ... (4.32)



 ... ... ...


 an1 x1 + an2 x2 + . . . + ann xn = bn .

è detto risolubile se esiste una nupla (x1 , x2 , . . . , xn ) di numeri reali - detta


soluzione del sistema - che soddisfi simultaneamente tutte le equazioni del
sistema. Per esempio, il sistema di equazioni 4.31 definito dalle equazioni di
tre piani è risolubile se i piani si incontrano in un punto: la soluzione è data
dalle coordinate del punto di intersezione. Prima di passare alla Regola di
Cramer definiamo, per ogni intero 1 ≤ k ≤ n la matrice
 
a11 . . . a1(k−1) b1 a1(k+1) . . . a1n
 


a21 . . . a2(k−1) b2 a2(k+1) . . . a2n 

Bk =  ... 
 
 
 ... 
an1 . . . an(k−1) bn an(k+1) . . . ann

ottenuta dalla matrice A dei coefficienti del sistema 4.32 sostituendo gli el-
ementi aik della k ma colonna di A rispettivamente per i valori bi trovati nel
lato destro del sistema.
3
Gabriel Cramer, matematico svizzero (Ginevra 1704 - Bagnols-sur-Cèze, Nimes, 1752.)
118 CAPITOLO 4. SUPERFICI ALGEBRICHE

Teorema 4.5.1 Se il determinante della matrice A del sistema lineare 4.32


è diverso da zero (det A 6= 0) il sistema è risolubile; inoltre, il sistema ha
una unica soluzione e per ogni k tale che 1 ≤ k ≤ n,
det Bk
xk = . (4.33)
det A

Dimostrazione – Facciamo l’ipotesi che (x1 , . . . , xn ) sia una soluzione di


4.32. Multiplichiamo la ima riga

ai1 x1 + ai2 x2 + . . . + ain xn = bi

per (−1)i+k det Aik ; otteniamo l’uguaglianza


n
X
aij (−1)i+k det Aik xj = bi (−1)i+k det Aik .
j=1

Ora lasciamo variare l’indice i da 1 a n e facciamo la somma di tutte le


uguagliane ottenute:
n X
X n n
X
( aij (−1)i+k det Aik xj ) = bi (−1)i+k det Aik .
i=1 j=1 i=1

La somma alternata del lato destro dell’ultima uguaglianza è l’espansione del


determinante di Bk via la colonna k ossia,
n
X
bi (−1)i+k det Aik = det Bk ;
i=1

d’altro canto
n X
X n n X
X n
( aij (−1)i+k det Aik xj ) = ( aij (−1)i+k det Aik )xj
i=1 j=1 j=1 i=1

e n X
n n
X X
i+k
( aij (−1) det Aik )xj = δjk (det A)xj = xk det A .
j=1 i=1 j=1

Questo dimostra che xk ha la forma annunciata 4.33.


Supponiamo ora sia data una nupla (x1 , . . . , xn ) di numeri reali tali che,
per qualsiasi 1 ≤ k ≤ n,
det Bk
xk =
det A
ossia,
n
X
det Axk = (−1)i+k bi det Aik
i=1
4.5. APPENDICE A 119

. Multiplicando questa ultima uguaglianza per ajk e facendo la somma per


k otteniamo
n
X n X
X n
det A ajk xk = ( (−1)i+k ajk det Aik )bi
k=1 i=1 k=1

e perciò,
n
X n
X
det A ajk xk = δij (det A)bi
k=1 i=1

ossia, abbiamo la ima riga del sistema 4.32. 2

Torniamo ora al sistema 4.31 dei tre piani. Supponiamo che i piani π e
0
π siano paralleli e che il terzo piano tagli i primi due in due rette parallele
` = π ∩ π” e `0 = π 0 ∩ π”. Da queste condizione concludiamo che i vettori
normali ai piani π e π 0 ossia, (a, b, c) e (a0 , b0 , c0 ) sono paralleli e dunque il
determinante della matrice dei coefficienti di 4.31 è nullo (vedere il Teorema
1.5.6). In questo caso, non possiamo applicare la regola di Cramer come ci
aspettavamo, ma possiamo trovare le equazioni (parametriche) delle rette `
e `0 . Concentriamoci nel caso `. Abbiamo un sistema lineare a due equazioni
e tre variabili (
ax + by + cz = −d
(4.34)
a0 x + b0 y + c0 z = −d0
che ha soluzioni nel senso che esistono terne di numeri (x, y, z) che soddisfano
siltaneamente le due equazioni; infatti abbiamo infinite soluzioni perché i
piani si incontrano in una retta. Tramite la nostra familiarità con i vettori
reali possiamo facilmente trovare le equazioni parametriche di `; cerchiamo
però un altro metodo. La (2 × 3)−matrice del sistema
  !
a b c
a0 b0 c0

ha tre possibili (2 × 2)-sottomatrici:4


  !   !   !
a b a c b c
, e .
a0 b0 a0 c0 b0 c0

Certamente una di queste (2 × 2)-matrici ha determiante diverso da zero


(perché?); supponiamo che
  !
a b
det =
6 0.
a0 b0
4
La definizione di sottomatrice si trova più avanti nel testo.
120 CAPITOLO 4. SUPERFICI ALGEBRICHE

Ora diamo a z il valore z = m che consideriamo come un parametro e


cerchiamo la soluzione del sistema
(
ax + by = −d − cm
a0 x + b0 y = −d0 − c0 m
tramite la Regola di Cramer: abbiamo

 b0 (−d−cm)−b(−d0 −c0 m)
x= ab0 −a0 b
 y= a(−d0 −c0 m)−a0 (−d−cm)
ab0 −a0 b

e da queste otteniamo le equazioni parametrice di `:


 bd −b d 0 0 bc −b c 0 0

 x = ab 0 −a0 b + m ab0 −a0 b
0
a d−ad 0 a0 c−ac0

y = ab 0 −a0 b + m ab0 −a0 b

z=m.
Si osservi che se i tre piani del sistema 4.31 sono paralleli, questi non si
incontrano; inoltre, det A = 0 e non esiste nessuna (2 × 2)-sottomatrice di A
con determinante non nullo.
Sia A una (m × n)-matrice reale; una (p × q)-matrice B, con p ≤ m,
q ≤ n, è detta una sottomatrice di A se B è ottenuta da A eliminando m − p
righe e n − q colonne di A. Il rango di A (rango (A)) è il più grande intero
r per il quale esiste una (r × r)-sottomatrice di A con determinante diverso
da zero.
Diamo un esempio numerico esplicito. Sia A la matrice
 
−2 −3 −1 1 0
 0 1 7 1 −4 
 
  ;
 1 2 4 0 −2 
−2 −2 6 2 −4
un’analisi dei determinanti delle sottomatrici possibili ci porta alla conclu-
sione che il rango di A è 2: per esempio,
  !
0 1
det = −1 .
1 2
Per trovare questo risultato abbiamo calcolato i determinanti di tutte le
(4×4) e (3×3)-sottomatrici di A; evidentemente, un tale metodo non è ideale.
Però è possibile studiare il problema del rango di una matrice in forma più
sistematica ed in modo di ridurre la matrice ad un’altra matrice per la quale
il rango è facilmente individuato. Passiamo ad esporre queste idee. Una
trasformazione elementare di una matrice A è un modo di trasformare A in
una matrice B tramite una delle seguenti operazioni:
4.5. APPENDICE A 121

(e1) cambiare tra di loro due righe (o colonne);

(e2) multiplicare una riga o colonna per una costante 6= 0;

(e3) multiplicare una riga (o colonna) per una costante 6= 0 e sommare il


risultato ad un’altra riga (o colonna).

Il risultato seguente è essenziale:

Teorema 4.5.2 Sia A0 una matrice ottenuta da una matrice A per una
qualsiasi trasformazione elementare. Allora, rango (A0 ) = rango (A).

Dimostrazione – La dimostrazione è semplicissima per i primi due tipi


(e1), (e2) di trasformazione elementare; il terzo tipo richiede un certo lavoro.
Supponiamo che la matrice A0 sia ottenuta multiplicando la prima riga di A
per c =6 0 e sommando il risultato alla seconda riga. Sia B 0 una qualunque
(k ×k)-sottomatrice di A0 con k > rango (A). Ci sono tre casi da considerare:

1. B 0 contiene parte della prima riga di A0 ma non contiene nessun ele-


mento della seconda riga di A0 . Allora B 0 è una (k × k)-sottomatrice
di A e dunque, det B 0 = 0 perché k > rango (A).

2. B 0 contiene parte della prima e della seconda riga di A0 ; in questo caso,


det B 0 = det B + c det D con B una (k × k)-sottomatrice di A (dunque
det B = 0) e D una sottomatrice di A con due righe uguali (dunque
det D = 0). Allora det B 0 = 0.

3. B 0 contiene parte della seconda riga ma non la prima riga di A0 . Allora,


B 0 = cB con B avente due righe uguali e perciò, det B 0 = 0.

Questo argomento ci permette di concludere che

rango (A0 ) ≤ rango (A) .

D’altro canto, si capisce che da A0 possiamo tornare alla matrice A tramite


una trasformazione elementare e perciò,

rango (A) ≤ rango (A0 ) .

Le due disuguaglianze di sopra hanno come conseguenza che

rango (A0 ) = rango (A) .

2
122 CAPITOLO 4. SUPERFICI ALGEBRICHE

Il teorema anteriore permette di trasformare una (m×n)-matrice A in una


matrice A0 di medesimo rango, con A0 in forma triangolare cioè, tale che tutti
gli elementi di A0 sotto la diagonale principale (la diagonale che contiene gli
elementi di indici ii) siano nulli. Formaliziamo questo fatto come un teorema.

Teorema 4.5.3 Sia A = (aij |1 ≤ i ≤ n, 1 ≤ j ≤ m) una matrice data; per


mezzo di trasformazioni elementari la matrice A può essere trasformata in
una matrice A0 tale che

(i) rango (A0 ) = rango (A) ,


0
(ii) (∀2 ≤ i ≤ n)(∀j < i)aij =0.

Dimostrazione – La prima parte è il Teorema 4.5.2. Per la seconda, pro-


cediamo in modo sistematico come segue. Se l’elemento a11 = 6 0 usiamo
trasformazioni di tipo (e3) per trasformare in zeri tutti gli altri elementi
della prima colonna. Supponiamo che a11 = 0; al meno uno degli elementi
della prima colonna di A deve essere non nullo (altrimenti eliminiamo ques-
ta inutile colonna di zeri). Con una trasformazione (e1) mettiamo la riga
corrispondente a questo elemento non nullo nel posto della prima riga e poi
procediamo come nel caso a11 =6 0. 2

4.6 Bibliografia
Bibliografia

[1] Abate, M. Geometria, McGraw-Hill Italia, Milano 1996.

[2] Betti, R. Lezioni di Geometria, Parte seconda, Masson, Mialano 1996.

[3] Hilbert, D. The Foundations of Geometry (translation by


E.J.Townsend), The Open Court Publishing Co., La Salle, Ill.,
1950

[4] Fano, G. e Terracini, A. Lezioni di geometria analitica e proiettiva,


Paravia e Co., Milano 1948.

[5] Jeger, M. and Eckmann, B. Vector geometry and linear algebra, John
Wiley and Sons, London - New York 1967.

[6] Protter M. and Morrey, C. College calculus with analytic geometry,


Addison - Wesley Publishing Co., Reading 1965.

[7] Walker, R. Algebraic curves. Princeton University Press, Princeton 1955.

123

Potrebbero piacerti anche