Sei sulla pagina 1di 241

M*riagra*ia Bianchi

Anna GiUo
< V

Introduzione
alla matematica discreta
Copyright 2005, 2001 The McGraw-Hill Companies, srl
Publishing Group Italia
via Ripamonti, 89 - 20139 Milano
McGraw-Hill 2
\ Division o f The McGraw-Hill Companies

I diritti di traduzione, di riproduzione, di memorizzazione elettronica e di adattamento


totale e parziale con qualsiasi mezzo (compresi i microfilm e le copie fotostatiche) sono
riservati per tutti i paesi.

Nomi e marchi citati nel testo sono generalmente depositati o registrati dalle rispettive
case produttrici.

Produzione: Donatella Giuliani


Realizzazione editoriale. CompoMat s.a.s., Configm (RI)
Grafica di copertina: G & G
Stampa: Arti Grafiche Murelh, Fizzonasco di Pieve Emanuele (MI)

ISBN 88-386-6229-0
Printed in Italy
3456789AGMERR09
Indice

Prefazione IX

Elenco dei simboli XI

1 Insiemi 1
1.1 Operazioni sugli insiemi 3
1.2 Insieme delle parti 7
1.3 Prodotto cartesiano di due insiemi 8
V t

_2____Introduzione alla logica e alletecniche dimostrative 9

3 Gli interi 19
3.1 Divisione tra Interi 20
3.1.1 Massimo comun divisore (MCD) e minimo comune
multiplo (meni) 22
3.2 Numeri primi e teorema fondamentaledell'aritmetica 26
3.3 Numerazione in base n 29
3.3.1 Operazioni in base 2 31
3.4 Equazioni lineari diofantee 32
35 Relazioni ncorsive 34
3.6 Alcune applicazioni allanalisi dialgoritmi 42

4 Relazioni binarie tra insiemi 45


41 Matrici di incidenza 48
4.2 Relazioni di equivalenza 49
4.3 Relazione di congruenza in Z 51
4.4 Criteri di divisibilit 53
4.5 Congruenze lineari 54
46 Sistemi di congruenze lineari 57
4-7 Relazioni d'ordine 59
4.7.1 Rappresentazione grafica di una relazione d ordine 61
4-8 Applicazioni 62
4 9 Alcune tecniche di enumerazione 64
4.10 Prodotto di applicazioni 66
VI Indice

5 Elementi di teoria dei grafi


69
5.1 Grafi semplici orientati e non orientati
69
5.2 Alberi e arborescenze
73
5.3 Alberi sintattici
75
5.4 Algoritmo di Huffman
76
6 A lgoritm i ed elem enti di teo ria della complessit

7 Introduzione alle strutture algebriche

8 A lgebra delle matrici

8.1 Operazioni nellinsieme delle matrici 94


8.1.1 Somma di matrici 94
8.1.2 Prodotto esterno 95
8.1.3 Prodotto righe per colonne 97
8.1.4 Matrici quadrate di ordine n 100
8.2 Sistemi lineari 101
8.2.1 Matrici stocastiche e catene di Markov 103
8.3 Sistemi lineari e matrici 107
"8.4 Metodo di eliminazione di Gauss-Jordan 108
8.4.1 Algoritmo e calcolo della matrice inversa 112

9 Gruppi 115

9.1 Sottogruppi 119


9.2 Gruppi di permutazioni 120
9.3 Equivalenze in un gruppo 124
9.4 Sottogruppo generato da un sottoinsieme. Sottogruppi ciclici 126
9.4.1 Propriet dei gruppi ciclici 128
9.4.2 Periodo di un elemento di un gruppo 128

10 Anelli e Campi. Anello dei polinomi 131


10.1 Anello dei polinomi a una indeterminata 136
10.1.1 Divisione in Z 138
10.1.2 Massimo comun divisore di due polinomi 140
10.1.3 Polinomi irriducibili e teorema di fattorizzazione 143
10.1.4 Radici di un polinomio su un campo 144
10.2 Funzioni polinomiali e Schema di Horner 146
10.3 II Campo Complesso 147

11 Spazi vettoriali 153


11.1 Sottospazi di uno spazio vettoriale 155
111 1 Sottospazio generato da un sottoinsieme non vuoto 158
11.2 Dipendenza e indipendenza lineare 160
Basi di
11.3 Basi di uno
uno spazio
spazio vettoriale
vettoriale 162
11.3.1 Prodotto
Prodottoscalare
scalarecanonico
canonico 165
165
11.3.2 Ortogonalit 166
166

12 Determ inante di una matrice 169


12.1 Prime propriet dei determinanti 172
12.2 II teorema di Laplace sullo sviluppo del determinante 172
12.2.1 Matrice inversa 178
12.3 Sistemi di 11 equazioni in n incognite- teorema di Cramer 179
12.4 Caratteristica o rango di una matrice 181
12.4.1 Procedimento di Kronecker 183
12.5 Sistemi lineari di m equazioni in incognite 186
12.5.1 Ricerca delle soluzioni di un sistema lineare 187

13 Applicazioni lineari 193


13.1 Rango 201

14 Autovalori, autovettori, diagonalizzazione 205


14.1 Matrici diagonalizzabili 208

15 Reticoli, Algebre di Boote e circuiti 215


15.1 Elementi di Teoria dei Reticoli 215
15.2 Algebre di Boole 220
15.2.1 Algebre di Boole e circuiti 222

16 Elementi di criptografia 225


16.1 Terminologia 225
16.2 Codice di Vemam 230
16.3 Crittografia a chiave segreta e crittografia a chiave pubblica 230

17 Codici correttori 233


17.1 Distanza di Hamming 235
17.2 Codici lineari e codici gruppo 236
17.3 Quadrati latini 237

Appendice 239

Indice analitico
Prefazione

Chi ben comincia, a met dell'opera


Frisch begonnen, ist halb gewonnen
Well begun, is half done
Un travati bien commenc est dj moitifait
Qien bien empieza, bien acaba.

Questo libro nasce con lo scopo d colmare unesigenza didattica degli studen
ti del corso di laurea in Informatica, soprattutto in seguito alla riforma, cha ha
drasticamente ridotto il numero di ore a disposizione per svolgere 1programmi.
Si presenta come una raccolta di argomenti che sono generalmente trattati
nei corsi di Matematica Discreta. Riporta la dimostrazione di alcune propriet
fondamentali che fanno uso di tecniche spesso elementari, utili per a far acquisire
un metodo di ragionamento rigoroso.
Inoltre, propriet presentate come proposizioni, osservazioni o esempi, hanno
una dimostrazione molto dettagliata in modo che possa essere svolta dagli studenti
come esercizio.
Quando pu essere utile, alla fine del paragrafo abbiamo aggiunto esercizi,
senza soluzione, come stimolo allapplicazione delle nozioni introdotte e per ve
rificarne la comprensione. Le soluzioni saranno presentate sul sito:
http: //www. ateneonlne.it/gillio
Poich gli studenti si lamentano spesso di dover affrontare argomenti matemati
ci con un taglio astratto e avulso dalla realt' sono stati introdotti alcuni brevi
capitoli che presentano concrete applicazioni dei concetti trattati. In particolare
abbiamo trattato nozioni introduttive alla teoria dei grafi, alla teoria della com
plessit e degli algoritmi, ad algebre di Boole e circuiti, alla crittografia e ai codici
correttori.
Rispetto alledizione precedente abbiamo introdotto alcune nozioni riguar
danti: equazioni diofantee, relazioni ricorsive, matrici stocastiche e catene di Mar-
kov, funzioni polinomiali e schema di Homer, numeri complessi, prodotto scalare
e ortogonalit.
Si ringraziano ancora gli studenti e 1 colleghi per le utili osservazioni e le
proficue discussioni, che hanno stimolato la nascita e la nuova edizione d questo '

libro.
Da ultimo siamo grati anticipatamente a tutti coloro che vorranno segnalare
errori grandi e piccoli.
Gli autori
Elenco dei simboli

XyA,B* ' * (Lettera maiuscola) Indica un insieme


x,a,b, (Lettere minuscole) Indicano un elemento dellinsieme
U Insieme Universo
0 Insieme vuoto
V(X) Insieme delle parti di X

\x\ Numero degli elementi dellinsieme X, cardinalit di X


c Simbolo di inclusione
c Simbolo di inclusione stretta
n Intersezione
u Unione
G Simbolo di appartenenza
i Simbolo di non appartenenza
V Quantificatore universale (per ogni)
3 Quantificatore esistenziale (esiste)
V Oppure
A E
=> Simbolo di implicazione (allora)
Smbolo di equivalenza logica (se e solo se)
a \ b Insieme differenza
Ax B Prodotto cartesiano di A c B
N = {0 , 1, . . . Insieme dei numeri naturali
2 Anello degli interi
Q Campo dei razionali
IR Campo dei reali
C Campo dei complessi
Bercc de* sirnccii

Gruppi m oltiplicativi dei campi precedenti


0\ ' c
a m relazione con b (nella relazione H)
Relazione di congruenza
Lelemento a divide T elem ento b
a;
aj L'elemento a non divide l'elemento b
f

MCD ( a M) Massimo com un divisore tra aeb


mcm(a,b) Mimmo com une m ultiplo tra aeb
(G.*) Gruppo in notazione moltiplicativa

(G,+) Gruppo in notazione addi ti va

o(g) Periodo dellelemento g e G


H <G H sottogruppo di un gruppo G
H <G H sottogruppo normale di G
Sn Gruppo di tutte le permutazioni su ri oggetti

An Sottogruppo di S, formato dalle permutazioni pari


(a,b,c.*-) Sottogruppo generato dagli elementi a,b,c, di un gruppo
(A, + . Anello rispetto alle operazioni + ,
Zw Anello delle classi d resto modulo n
[In Classe di resto modulo n, con rappresentante a
A[x] Anello di polinomi ad una indeterminata con coefficienti in A
gr(a(x)) Grado del polinomio a(x)
A7- Matrice trasposta della matrice A
det(A) Determinante della matrice A
car(A)
rg(A) j Rango o caratteristica della matrice A

dim V' Dimensione dello spazio vettoriale V


5 r Somma diretta di due spazi vettoriali S e T
1
Insiemi

Ogni inizio contiene una magia


che ci protegge e ci aiuta a vivere
H Hesse (// gioco delle perle di vetro)

Il linguaggio degli insiemi un utile strumento per studiare collezioni, aggregati,


classi di oggetti In questa sede non abbiamo intenzione di addentrarci in delicate
questioni legate alla definizione di insieme, assumeremo pertanto la nozione come
intuitiva.
Gli insiemi sono generalmente indicati con le lettere latine maiuscole A, B.X,
Y ... , e gli elementi con lettere latine minuscole a ,b ,x,y __
Per indicare che un elemento x appartiene allinsieme X, si usa il simbolo
e e si scrive: x e X, mentre per indicare che y non appartiene allinsieme Y si
scnve y Y.
Si considera anche linsieme privo di oggetti o insieme vuoto, che si indica
con il simbolo 0 .
Ci sono diversi modi per descrivere un insieme: uno di questi consiste nelle-
lencare, se possibile, tutti gli elementi deHinsieme stesso.

Esempio 1.1 Linsieme V delle lettere dellalfabeto che compongono la parola


INSIEME
V = {I,N,S,E,M}.
Osservazione 1.1 In genere gli elementi elencati sono intesi distinti e non ha
importanza lordine in cui essi compaiono, cio
V = {I,N,S,E,M} = {N,E,M,S,I}.
Osservazione 1.2 Si considera anche linsieme "singoletto formato da un uni
co elemento {a}.
Esempio 1.2 Linsieme W dei capoluoghi di provincia della regione Liguria
W = {Genova, Savona, Imperia, La Spezia}.
2 Capitolo 1

Un altro modo per rappresentare un insieme X quello di specificare X mediante


una condizione definitrice, cio una legge che perm etta di stabilire se un oggetto
appartiene oppure no allinsieme X.

Esempio 1.3 Linsieme degli interi positivi o nulli m inori di 1000, pu essere
indicato con la scrittura

X = {0, 1, 2, . . . ,999}

oppure

X = { x e Z \ 0 < x < 999}

Le lettere N, IL, Q, R, C si usano esclusivam ente per rappresentare, rispetti


vamente, linsieme dei numeri naturali {0 , 1, 2 . . . } , linsiem e dei numeri interi
relativi { . . . , - 2 , - 1,0 , 1, 2 , . . . } , linsieme dei num eri razionali, linsieme dei
numeri reali e quello dei numeri complessi.

Gli insiemi possono anche essere rappresentati graficam ente utilizzando i dia
grammi di Venn, che traggono il loro nome da quello del matem atico londinese
J. Venn, che introdusse il loro uso sul finire del secolo diciannovesim o. Nei dia
grammi di Venn, linsieme universo U, che contiene tutti gli oggetti delle nostre
considerazioni, rappresentato da un rettangolo ove cerchi o altre figure al suo in
terno sono usate per rappresentare insiemi, m entre punti rappresentano elementi
dellinsieme stesso.

Esempio 1.4 II diagramma di Venn dellEsem pio 1.1 quello della Figura 1.1.

Figura 1.1

Definizione 1.1 Un insieme Y si dice sottoinsieme di un insieme X e si sciti


Y C X se ogni elemento di Y anche elemento di X, cio se V y e Y si ho <-'*
y e X, ove il simbolo V si legge per ogni.
_________ _________________________________________ Insiemi 3

Esempio 1.5 N c Z c Q.

Osservazione 1.3 Ogni insieme X sottoinsieme di se stesso, cio X c X


Inoltre 0 C I

Definizione 1.2 Se A e B sono due insiemi, scriveremo A B per indicare th


A C B e B C A, cio
A = B significa che x e A x G B (cio x e A se e solo se x e B).
Osservazione 1.4 Con la scrittura A C B (A sottoinsieme proprio di B) si vuole
indicare che A C B ma non A = B\ cio V a e A => a e B ma 3 h e B tale
che b A (leggasi: per ogni a appartenente ad A, si ha che a appartiene a B
ma esiste un b in B tale che b non stia in A).

Esempio 1.6 Siano


A = [2h | h e Z} e B = {6k \ k e Zj.
Allora B C A.

Esempio 1.7 Siano


C = (5 k | k e Z}, D = [d e Z | d = IO* + 15;y, x,y Z}
Allora C = D.

Dimostrazione. Mostriamo che C C D : V c e C 3 / i e Z tale che c = 5h =


(-1 0 + 15)/z = 1 0 (-/i) + 5h => c e D.
Viceversa sia d e D. Allora esistono r, 5 e Z tali che d = lOr + 15s =
5(2r + 3s) => d e C. m

1.1 Operazioni sugli insiemi


Due insiemi possono essere combinati in modi diversi per ottenere nuovi insiemi.
Sia assegnato un universo U e siano A,B C C U.

Definizione 1.3 Si definisce intersezione di A e B, l'insieme degli elementi co


muni ad A e a B e la si indica con il simbolo A i) B, cio:
A f ) B = { x e U \ x e A,* e B) = [x e U \ x e A a x e B}.
Osservazione 1.5 Lintersezione A fi B un sottoinsieme sia di A sia di B

Esempio 1.8 Siano


A = {2h | h e Z} e B = [3k | k e Zj.
Allora
A fi B = {6/ 11 e Zj.
Definizione 1.4 Due insiemi A e B si dicono disgiunti se A fi B = 0.

Propriet 1.1 Per Vintersezione insiemistica valgono le seguenti propriet:

1. A fi {B fi C) = (A H B) n C (associativa );

2. A f B = B fi A (commutativa);

3. A fi A = A (di idempotenza);

4. A O 0 = 0.

Lasciamo le dimostrazioni per esercizio.

A U fi

Figura 1.2

Definizione 1.5 Siano A i ,A2, . , An C U, scriviamo


n
Pj a, = Ai n a 2 n ... n a = {x e u \ x e A, Vi = 1,2........ }.
i=i

Definizione 1.6 Si definisce unione di A e B l insieme degli elementi che ap


partengono ad A o a B (o ad entrambi) e la si indica con il smbolo A U B, cio
AUB = { x e U \ x e A o x e B) = {x e U \ x e A v x e B}.

Osservazione 1.6 A e B sono sottoinsiemi di A U B.

Esempio 1.9 Siano

A = {2h | h e Z} e B = {6k | k e Z}.


Allora

A U B = A.
Insiemi 5

P ro p riet 1.2 Per l'unione insiemistica valgono le seguenti propriet, analoghe


a quelle dell'intersezione:

1. A U (B U C) = (A U B) U C ( propriet associativa);

2. A U S = S U A ( propriet commutativa);

3. A U A = A ( propriet di idempotenza);

4. A U 0 = A,
Lasciam o le dim ostrazioni per esercizio.

Definizione 1.7 Siano A i , A2, . . . ,A C U , scriviamo

n
A, = A\ U A i U . . . U An = [x e U | 3 i e { 1 ,2 ,... ,} p e ro ri* Aj}.
=1

Esercizio 1.1 Dimostrare che per ogni tema di sottoinsiemi A,B,C c i/ valgo
no le seguenti propriet (dette distributive):

1. A U (5 n C ) = (AUfi)n(AUC);

2. An(5UC) = (An5)U(AnC).

Esercizio 1.2 Verificare che, per ogni tema di sottoinsiemi A,B,C C i/, si ha:

1. A C : B t > A U B = B:
2. A f = A < s > A C ;

3. A fi (A U B) = A U (A fi 5 ) = A.

Il p ro b lem a d el trifo g lio

Tre categorie di utenti sono soci di un centro sportivo: quelli che praticano il
tennis (t ) sono 44, quelli che praticano nuoto (n ) sono 26, mentre 31 sono quelli
che si dedicano al golf (g).
Di questi, per, 12 si dedicano sia al tennis sia al nuoto, 5 al tennis e al golf,
6 al nuoto e al golf e 4 praticano tutti e tre gli sport. Quanti sono soci del centro
sportivo?

Ricorrendo ai diagrammi di Venn si ottiene che il numero totale degli iscritti


82 (vedi Figura 1.3)

Definizione 1.8 Per ogni A e t / si dice complemento di A in U l insieme


A' = {x e U\x< A)
Figura 1.3

Valgono le seguenti propriet:

1. U' = 0, 0' = U\

2. A U A' = i/, A H A' = 0;

3. (A')' = A;

e le seguenti Leggi di De Morgan:1

4. (A fi B)' = A' U B'\

5. (AUB)' = A'D B1.

Dimostrazione. Le propriet 1), 2) e 3) sono immediate.


Per dimostrare la 4) occorre provare la seguente doppia inclusione

(Afi B)' C A ' U B ' e (A 0 B)' 2 A' U B \

Siax (AHB)'; allora x e U, m a x A n B per cui x non appartiene ad


almeno uno dei due insiemi A o B . Ne segue che x appartiene ad almeno uno
degli insiemi A' o B' e quindi anche ad A! U B.
Viceversa se y e A'UB' si ha che y appartiene ad alm eno uno dei due insiemi
A' o B'. Pertanto y e U ma non appartiene ad almeno uno degli insiem i A o B
per cui y e (AH B)\
Si lascia per esercizio la dimostrazione della 5), che analoga a quella svolta
per il punto 4).

1AkUguslusDe Morgan U806 Madura (India), 1871 Londra).


Insiemi 7

Definizione 1.9 Siano A,B C JJ\ si dice differenza fra A e B l insieme


A \ B = {x e U \ x A, x < B}.
Osservazione 1.7 Per ogni sottoinseme A c U => A! U A

Definizione 1.10 Siano A,B C (J; si dice differenza simmetrica fra A e B


l insieme ( A \ B ) U ( B \ A ) (Figura 1.4).

Figura 1.4

O sservazione 1.8 Per la differenza di insiemi non vale la propriet commutativa.


Infatti, considenam o x ,y ,z tre elementi distinti di un insieme U e poniamo
A = {*,;y}, B {*,z}. Si ha che A \ B { y } ^ B \ A = {z}.

Esercizio 1.3 Provare che (A \ B) U (B \ A) = (A U B) \ {A fi B).

1.2 Insieme delle parti

Definizione 1.11 Fissato un insieme U, l insieme i cui elementi sono tutti e soli
i sottoinsiemi di U detto insieme delle parti di U, e lo si indica con il simbolo
V(U). In simboli
V { U ) = {X | X c U}.

Esempio 1.10 Se U = {1,2,3} allora

V{ U) = {0 , ( 1}, {2 }, {3 }, { 1, 2 }, {1,3}, (2 ,3}, {1, 2 ,3}}.

Esercizio 1.4 Sia A = {a,b,c}. Si dica se sono vere 0 false le seguenti afferma
zioni

i) {a} C A;
**-;>3
f

iii t a A;

iv) {a} V{A).

1.3 Prodotto cartesiano di due insiem i

Definizione 1.12 Dati due insiemi A .B . si dice prodotto cartesiano di A e B


linsieme
A x B = {(a,b)\a A.b B }
costituito dalle coppie ordinate degli elementi di A e di B.

Osservazione 1.9 Se A fi B si ha che A x B fi B x A .

Osservazione 1.10 Se A = B si pone A x A = A 2.

Definizione 1.13 Dati n insiemi A1.A2, . . . ,A si definisce

Ai x A2 x ... x An = {(ai,tf2, >an) I d A iy i = 1 ,2 ......... n . }

Notazione 1.1 Se Ai = A2 = . . . = An, allora si pone

Ai x A2 x . . . x An A n.

Osservazione 1.11 Se linsieme A = E (insieme dei numeri reali)

a) H2 lordinario piano cartesiano;

fi) E3 lordinario spazio cartesiano.


2
Introduzione alla logica
e alle tecniche dimostrative *lo

Cogito ergo suiti"


(R. Descartes)

Si cercher ora di fare un po' di ordine nel linguaggio matematico >m qui utiliz
zato, introducendo, in particolare, alcuni simboli logici di soUto usati negli enun
ciati e nelle dimostrazioni.
Assunti alcuni enti o concetti come primitivi cio non definibili (per esem
pio: numero naturale, zero, successivo di un numero naturale, punto, retta piano,
ecc.), vengono fissate alcune proposizioni, i postulati' enunciano propriet che ri
sultano di tale evidenza da poter essere accettate senza giustificazione Ogni altra
costruzione dedotta logicamente da postulati o da altre propriet precedentemente
stabilite si chiam a Teorema. In esso distinguiamo il soggetto, cio lente e/o gli
enti di cui si parla, lipotesi e la tesi mentre la dimostrazione il ragionamento
mediante il quale si prova che il soggetto sotto certe ipotesi d luogo a una certa
tesi.
Per esempio, Una retta e un punto fuori di essa determinano uno e un so
lo piano lenunciato di un teorema in cui retta e punto sono i soggetti, li
potesi che il punto non appartenga alla retta, la tesi 1esistenza di un unico
piano.
Vi sono teoremi, com e quello ricordato, di tipo esistenziale, che affermano,
cio, 1esistenza di un ente; mentre in altri la dimostrazione pu essere costruttiva,
in quanto si dim ostra resisten za dell ente in questione costruendolo.
Alla base di tutti questi discorsi c il concetto di proposizione semplice,
che rappresenta la pi elem entare frase di senso compiuto che pu essere vera (V)
oppure falsa (F).
Per esempio, Oggi il cielo azzurro una proposizione semplice mentre
andiamo a spasso non lo .
10 Capitolo 2

Combinando proposizioni semplici tramite i connettivi logici:

-> (non) negazione

A (e) congiunzione
V (o) disgiunzione
(segue) im plicazione
(se e solo se) equivalenza

s ottengono proposizioni composte che possono essere a loro volta vere o false.
Per stabilire ci ci avvaliamo delle tavole di verit dei connettivi logici, che qui
riportiamo.

1. Sia A una proposizione semplice, la tavola di verit di - A

A -A
V F
F V

Esempio 2.1

A := La faccia della moneta testa;


->A := La faccia della moneta croce.

Se vale A non vale-* A.

2. Siano ora A e fi due proposizioni semplici:

2.1 la tavola di verit di A a fi

A f i Aa B
V V V
V F F
F V F
F F F

Esempio 2.2
A := La sostanza solida;

fi := La sostanza colorata;

A A fi := La sostanza solida e colorata.


Se la sostanza un cristallo di ametista A(V), fi(V ) e quindi A A fi V.
Introduzione alla logica e alle tecniche dimostrative 11

2.2 La tavola di verit di A v B

A B Av B
V V V
V F V
F V V
F F F

Esempio 2.3 A v B := La sostanza solida o colorata.


Nel caso di una tazza di caff, si ha che A( F) , B{V) e quindi A v B V

2.3 La tavola di verit di A ==> B

A 5 A=> B
V V V
V F F
F V V
F F V

N. 5. Ex falso sequitur quoti libet (principio della filosofia medioevale).

Esempio 2.4
A := 1 > 3 ;
B := 4 < 8 ;
A{F) , B{V) \ A => B V.

2.4 La tavola di verit di A <=> B

A B A o B
V V V ^
V F F
F V F
F F V

Esempio 2.5

A := 1 < 3 ;
B := 4 < 8 ;
A o B V.
Una proposizione composta sempre vera quale che siano i valori di verit delle
proposizioni semplici che la compongono detta tautologia (dal greco tauts
= stesso, identico), mentre una proposizione com posta sem pre falsa, quale che
siano i valori di verit delle proposizioni semplici che la co m p o n g o n o , detta
contraddizione.

Esempio 2.6 A A (->A) una contraddizione. Infatti

A -A A A (A)
V F F
F V F

Esempio 2.7 A => (A v B) una tautologia.

A B Av 5 A = (A v B)
V V V V
V F V V
F V V V
F F F V

Definizione 2.1 Definiamofunzione proposizionale su un dominio D una espres


sione p(x) tale che per ogni a e D sia p(a) una proposizione, cio p(a) sia vera
ofalsa.

Esempio 2.8 Sia p{x) = (x | x2 - 5 > 0} : essa funzione proposizionale su R.

Notazione 2.1 Se p(x) una funzione proposizionale su un insiem e D, la frase


La proposizione p{a) vera per ogni a e D" si scrive utilizzando il sim bolo V
(leggi: per ogni) detto quantificatore universale V a e D, p(a) vera .

Notazione 2.2 Con 3 a e D tale che p{a) sia vera indichiam o la frase esiste
un a appartenente a D tale che p{a) sia vera (3: quantificatore esistenziale).

Osservazione 2.1 Negare unaffermazione del tipo V a e D , p{a) vera


equivale a garantire resistenza di almeno un b D tale che p(b) sia falsa.

Esempio 2.9 Data laffermazione: i numeri primi sono dispari , la sua nega
zione : esiste almeno un numero primo pari.
Introduzione alla logica e alle tecniche dimostrative 13

R itorniam o al concetto di teorema o proposizione ipotetica, che possiamo sche


m atizzare nella seguente form a (detta diretta):
Se S ha la propriet I allora S possiede la propriet T

Osservazione 2.2 Scam biando l ipotesi I con la tesi T si ottiene la proposizione


inversa.

Osservazione 2.3 N egando l ipotesi e la tesi si ha la proposizione contraria.

Osservazione 2.4 N egando ipotesi e tesi e scambiandole fra loro si ha la propo


sizione contronominale.

O sserviam o che, am m essa vera la proposizione diretta, vera la sua contro


nominale e su questa afferm azione si basa la tecnica dimostrativa detta dimostra
zione per assurdo, ove, appunto, negando la tesi si arriva a una contraddizione
con lipotesi. La proposizione inversa e la contraria possono invece non essere
vere.
Esempio 2.10 Un num ero naturale divisibile per 6 termina con cifra pari (pro
posizione diretta).
La sua inversa un num ero che term ina con cifra pari divisibile per 6
chiaramente falsa (basti pensare al num ero 14).
La sua contronom inale un num ero che non termina con cifra pari non divisibile
per 6 invece vera.
La sua contraria un num ero non divisibile per 6 non termina con cifra p a rr
falsa (basti pensare al num ero 2 ).

U naltra tecnica dim ostrativa basata sul cosiddetto postulato o principio


di induzione che afferm a:
Assioma 2.1 (di induzione: I form a) Sia no un intero e sia P(n) un enunciato
che ha senso per ogni n > no. Se:
i) Pino) vero;
ii) per ogni n > no, P (n 1) vero implica P(n) vero, allora P(n) vero per
tutti gli n > no.

Diamo, ora, alcuni esem pi di dim ostrazioni che fanno uso del principio di indu
zione.
Esempio 2.11 D im ostrare che la som m a dei primi n numeri interi naturali
n(n - f i )
------ - , ci P (n)

n(n 4- 1)
1 + 2 + . . . + (w 1) "f n ?

i) P( 1) vera; infatti a primo membro abbiamo 1 (solo il primo addendo) e al

secondo membro ^ = 1.
im *

ii) Supposto vero P(n - 1) dimostriamo ? {ri).

P(n - 1)
-i
(n l)n
1 -f- 2 -K .. . -\~(n 1) ' i =
= i

quindi
n
^ ^i 1 ~1~2 + ... + {n 1) 4" ri [1 2
J. . .
j(ai 1)]
|/i.
i=1

Poich la somma in parentesi quadra per ipotesi induttiva vale ^ e quindi:

1 4- 2 + ... + ( 1) I- m = [1 + 2 + . . . + (w 1) ] "4*ri =

{n \)n rr n + 2n n(n + 1)
_ ------------- f- n = ------- -------- = ------ ----- .

Pertanto la propriet vera per tutti gli n > 1.

Esempio 2.12 Dimostrare che


1
1
-:)H n

In questo caso P{n)


1
1 con n > 2.
) ( - 5) - ( - : ) - Q ( - r ) - n

1 1
i) P(2) vero: infatti il primo membro diventa 1 - - mentre il secondo
2
membro - .
2
ii) Supposto P(n 1) vero, cio
1 1
1 2K 1 3J l 1 n l n 1
Proviamo P(n).
Introduzione alla logica e alle tecniche dimostrative 15

1 1
1
2 )(
la parentesi quadra per ipotesi induttiva vale ~ da cui segue

1 n- 1 1
n 1 n n

Quindi la propriet vera per tutti gli n > 2 .

Notazione 2.3 Si indica con \X\ il numero degli elementi di un insieme X .

Esem pio 2.13 Sia X un insieme con ri oggetti. Linsieme delle parti di X pos
siede 2" elementi, cio il numero di sottoinsiemi di X 2". In questo caso P(n)
pu essere cos riscritta:
\P(X)\ =2"
i) P( 0) vero: infatti in questo caso X = 0 e qundi V( X) ha come unico
sottoinsieme 0, sicch \P(X)\ = 1 = 2 .
ii) Supposto lasserto vero per n 1, dimostriamolo per n; supponiamo cio che
un insieme dotato di 1 oggetti possieda 2n 1sottoinsiemi. Consideriamo,
ora, linsieme X con n oggetti X = {ai,a 2,3. . . a,,}. X pu essere visto
come unione dell insieme Y={ai,ci2 ,a3 .. .an-\} e del singoletto {an}. Cio
X = {a\,ci2,ci3 .. ./(-i} U {an}.

Per contare i sottoinsiemi di X dobbiamo tener conto dei sottoinsiemi di Y che


per ipotesi induttiva sono in numero di 2"~l e di quelli che si ottengono unendo
a questi sottoinsiemi il singoletto {an} e che, naturalmente, sono tutti distinti e
ancora in numero di 2n~l .
In totale si hanno: 2"_1 + 2"_1 = 2 2n~1 = 2 " . Pertanto \P(X)\ = 2" per
tutti gli n > 0.

Lasciamo provare al lettore, sulla falsariga di quanto fatto sopra, che:


n
n(n + 1)(2n -f 1)
Esercizio 2.1 ^ i2 = l 2 + 22 + . . . + (n l ) 2 + n2 =
6

Esercizio 2.2
4
n1
Esercizio 2.3 Y l j + l = n- (la somma dei primi n num eri positivi dispan).
7=0

n
Esercizio 2.4 ^ 2 j = n(n + 1) (la somma dei primi n numeri positivi pari).

n 3n+i _ j
Esercizio 2.5 ^ 31 = 1 + 3 + 32 + . . . + 3n
i=0 2
Enunciamo, ora, una seconda form ulazione del principio di induzione:
Assioma 2.2 (di induzione: Il form a) Sia no un intero e sia P(n) un enunciato
che ha senso per ogni n > no. Se :
i) P (no) vero',
ii) per ogni n > no, P{k) vero per ogni no < k < n itnplica P(n) vero; allora
P(n) vero per tutti gli n > no-

Usiamo questa formulazione del principio di induzione anche per definire insiemi
ricorsivamente.
Esempio 2.14 I numeri di Fibonacci.
A Leonardo Fibonacci, mercante e matematico italiano vissuto tra il 1170 e il
1250, fu posto il seguente quesito relativo allallevamento di conigli. Data una
coppia di conigli tale che:
a) generi una nuova coppia (maschio e femmina) ogni mese;
b) ogni coppia diventi fertile dopo un mese di vita,
in assenza di more quante coppie di conigli sono presenti dopo n mesi?
Denotato con / il numero di coppie di conigli dopo n mesi e posto
fo = ri f i = 1
alla fine deUn-esimo mese si ha che:
fu fn - + fn 2
Infatti;
1= 1
1+ 1=2
1+2 =3
2 +3 =5
3 +5 =8
5 + 8 = 13

e co* via.
Introduzione alla logica e alle tecniche dimostrative 17

Possiamo anche visualizzare questa sequenza con un diagramma. Indichiamo con


il simbolo una coppia fertile e con il simbolo una coppia non ancora
fertile. Si ha la seguente situazione (Figura 2.1):

mesi 0 1 2 3 4 5
00

/ 1 1 2 3 5

Figura 2.1
3
Gli interi

Il numero e larmonia respingono Terrore


Filolao1

Fino allinizio del xix secolo la matematica era concepita come lo studio dei nu
meri e delle figure (aritmetica e geometria). Non vogliamo in questa sede adden
trarci in una disputa filosofica sul concetto di numero, ma assumiamo come noto
che, accanto ai numeri naturali

N = { 0 ,1 ,2 ,3 ,...}
esistano numeri con segno detti interi relativi
Z = {... , - 2 , - 1,0,1,2, . . . }
e che esista una naturale identificazione dellinsieme dei numeri positivi o nulli
{0, 4 - 1, + 2, + 3 . . . } con linsieme N.

Definizione 3.1 Per ogni z Z si definisce il valore assoluto o modulo di z, e


lo si indica con il simbolo \z\
, , _ { z se z > 0
'z ' ~ | z se z < 0

Osservazione 3.1 Per ogni z u h Z, si ha che |zj zi\ \zi I ta l-

Osservazione 3.2 Non vale invece, in generale, luguaglianza

IZ1+Z2I = ta l + tal-
Per esempio se

Zi = - 5 e Z2 = 3

1Tardo Pitagorico, morto verso il 390 a.C.


allora

ki + Z2 = 2 # 8 = \z \| -f |z2|.
Supponiamo familiari le principali propriet delle operazioni sugli interi e larap
presentazione di Z sulla retta orientata (Figura 3.1)

- 3 - 2 - 1 0 1 2 3

Figura 3.1

3.1 Divisione tra Interi


Teorema 3.1 Siano a e b e Z, b ^ 0; allora esistono e sono univocamente
determ inati due interi q ed r e Z tali che:

1. a = bq 4- r;

2. 0 < r < \b\.

Dimostrazione.
Esistenza della coppia q, r e Z . D istinguiam o quattro casi:
i) a > 0, b > 0;
ii) a > 0, b < 0;
iii) a < 0, b > 0;
iv) a < 0, b < 0.

i) Procediam o per induzione su a, fissato b.


Se a 0 possiam o scrivere a b 0 4- 0, con q = 0 = r.
Se 0 < a < b ancora scriviam o a = b 0 + a, con q = 0 ed r = a. >si
Se a > b allora a > a b > 0 e, utilizzando l ipotesi di induzione (fl *r
ha che esistono q , r tali che

a b bq r con 0 < r < b


e quindi
a - b + bq + r = b ( \ + q ) 4- r ove q = q + l>r - r .
Gli interi 21

ii) a > 0, 6 < 0. Poniamo b' = - b > 0. Allora poich a > 0 e V > 0, per il
punto i) 3 q, r e Z tali che
a = b'q + 7 con 0 < 7 < b ' = \b\.
Allora
= ( - 6 )2/ + r = b ( - q ) + r, ove <7 = - q , r - 7 .

iii) a < 0, b > 0. Poniamo a! a > 0; quindi, essendo a! > 0, b > 0, ancora
per il punto i) 3 q {,rj e 7L tali che
a bqi 4- r j, 0 < r\ < b
cio
- a = hqx + n
da cui, moltiplicando membro a membro per (1), si ottiene
a = b(-qx) + ( - n ) .
Se ri = 0 allora q = q 1, r = ri = 0;
se ri > 0 allora, aggiungendo + 6 e b al secondo membro, si ottiene
a = b(- qx) + b b r\ = b ( - q { - 1) + (b - ri)
e quindi segue la tesi, ponendo q q 1 1 ed r = b rj (osservando che
0 < b ri < |6 |).
iv)fl < 0, b < 0. Poniamo b' b > 0. Allora, per il punto iii), esistono <72
r 2 e Z tali che
a = b'qi + r 2, con 0 < rj < b' = \b\
a = b{q) + r 2 , ove q = -<72, r = r2.
Unicit della coppia q, r, soggetta alla condizione 0 < r < |/?|.
Supponiamo che, accanto a q ed r, esistano 2/, r tali che
a = bq + r, a = bq + r
con le condizioni
0 < r < |6 |, 0 < r < |/?|.
Dalle relazioni precedenti, uguagliando e supponendo r > r, (senza ledere la
generalit del discorso) si ottiene
bq + r = bq 4- r
da cui
r - r = b(q - q)
e quindi

r r = \b\ |g <7 1 con 0 < r - r < \b\.


Questo implica che debba essere

0 < \ q - q \ < 1 , con q - q Z. I

Lunica soluzione quindi:

q - q = 0 => r - r = 0

da cui si ottiene

q=q r r.

Definizione 3.2 G/i interi q ed r si dicono quoziente e resto della divisione di a


per b.

Definizione 3.3 Dati a, b e Z diciamo che h | a (b divide a) se b 0 ed esiste


c e Z tale che a - b c . I

Osservazione 3.3 Se b 0, b | a & il resto della divisione di a per b 0.

Osservazione 3.4 Va e Z si ha sempre che 1, a sono divisori di a.

Propriet 3.1 Se a eh sono interi non nulli, allora b \ a e a | b & a = b.

Infatti, poich per ipotesi b | a e a 1 3 q \,q i Z tali che a = b q \,b = ag2,


da cui si ottiene:

a = bq\ - (ag 2)<7i = f l( i 2i i )


e quindi q2q\ = 1. In Z le soluzioni sono q2 = q\ = 1 .
Viceversa, poich per ipotesi a = b, si ottiene b | a , a 1 b.

Proposizione3.1 Se a,b,c sono numeri interi tali che c \ a, c \ b, allora c


divide (ax + by), Vx,y e Z.
Poich c 1a, 3 q\ e Z tale che a = cq\ \ poich c 1 b 3 q2 Z tale che b = cq2.
Allora, sostituendo, s ottiene ax + by = cgj* 4- cg2y = + /2>0 da cui
segue che c j (ax + by).

Osservazione 3.5 Dati a,b,x,y e Z, lespressione ax + by si dice combina


zione lineare di a e b.

3.1.1 Massimo cornuti divisore (M C D ) e m in im o c o m u n e


multiplo (mcm)

Definizione 3.4 Siano a, b e Z (non entrambi nulli). Si dice massimo cornuti


divisore di a e b e lo si indica con m c d (a,b ), ogni intero d tale che:
1. d \a, d \ b;
Gli interi 23

2. se 3 t e Z tale che t | a, t \ b allora t | d.

Osservazione 3.6 Si verifica facilmente che, se d = mcd (a,b) allora e pure


d = mcd ( - a , b ) = mcd (a , - b) = mcd ( - a , - b) =
= MCD (b,a) = MCD (b , - a) = mcd ( - 6 ,a) = mcd (-6 , - a)

Osservazione 3.7 mcd (0,/?) = 6 = mcd (b, 0 ).

Non si lede quindi la generalit del discorso se si prover resistenza di un massi


mo comun divisore per ogni coppia di interi a ,b > 0 .
Daremo una dimostrazione di tipo costruttivo, cio utizzeremo una procedura
detta Algoritmo euclideo delle divisioni successive, che permette leffettiva
determinazione di un mcd (a ,b ).

Teorema 3.2 Per ogni coppia a, b e Z, a > 0, b > 0, esiste un intero d,


massimo comun divisore fra a e b. Esistono inoltre due interi x e ) tali che
d = ax + by.

Dimostrazione. Si supponga a > b e si eseguano le divisioni successive

( 1) a = bq i 4- rj con 0 < ri < b

(2 ) se r.^ 0 b = r{q2 + r2 con 0 < r2 < n

(3) se r2 * 0 n = r2q3 4- r 3 con 0 < r 3 < r2

) se n -i ^ o fh-2 = rh-\qh + rh con 0 < rh < rh

(* + i) se n, # o Oi-i = ^hqii+\
Poich la sequenza dei resti delle successive divisioni strettamente decrescente e
limitata inferiormente, dopo un numero finito di divisioni si ottiene un resto nullo,
cio 3 h tale che r/,+i = 0 .
Se h = 0, cio se r\ = 0, si ha che b | a e quindi mcd (a,b) = b.
Se h > 0, ri 0, mostriamo che r/, = mcd (a,b), cio sono verificate le
condizioni 1), 2) della Definizione 3.4.

1) r/,| a e r/,| b. Infatti r/,| r*_i (dalla uguaglianza [h 4- 1)) e cos risalendo e
utilizzando ripetutamente la Proposizione 3.1, si ottiene dalla (2) e dalla (1)
che r/, | b ed r/, | a.

2) Se / | a e t \ b = > t \ rit.

Infatti dalla (1) si ha che t | r\ = a bqp, se t | r\ e t \ b, dalla (2) si ha che


t | r 2. Cos proseguendo, alla fine si ottiene che t | r^ e quindi si conclude che ri,
un mcd (a,b).
24 Capitolo 3

Quanto alla seconda parte delFenunciato del T eorem a, l eguaglianza (1) permette
di esprimere ri nella forma

ri = a + b { - q i).

Sostituendo lespressione di ri nella (2) si ha

r2 - b - riq2 = b - {a - bq\)q2 = a ( - q 2) + b( 1 4- q\q2) e cos via.

In questo modo si esprime ciascun resto com e com binazione lineare a coeffi
cienti interi di a e di b.
In particolare esisteranno *, y e IL tali che

d = mcd (a,b) = rh = xa + y b .

Esempio 3.1 Determinare un mcd (54,45).

Effettuiamo le divisioni successive:


54 = 45 1 + 9
45 = 9 5.

Poich il resto della seconda divisione 0, un mcd (54,45) 9 (ultimo resto non
nullo).
Possiamo inoltre scrivere 9 come com binazione lineare di 54 e di 45, rica
vando 9 dalla prima uguaglianza, cio 9 = 54 1 + 45 (1).

Esempio 3.2 Trovare un mcd (420,182) ed esprim erlo com e combinazione li


neare di 420 e 182.

Come poma, effettuiamo le divisioni:

420 = 182*2 + 56

182 = 56*3 + 14

56 = 1 4 .4 .

Quindi un mcd (420,182) 14. Una combinazione lineare si otterr nel modo
seguente:
Gli interi 25

Proposizione 3.2 Se mcd (a,b) = d, allora cl l unico altro massimo comun


divisore di a e b.

Dimostrazione. Per ipotesi sia d = mcd (a,b) Allora:


1. d | a e d \ b => d | a e d | b;
2. se c | a e c | b allora c | d:

infatti, per ipotesi, si pu scrivere d = ax + by, e, poich esistono ,b e Z tali


che a = c, b = cb , sostituendo si ha che
d = cax + cby = c(ax + by)
da cui
d = c{ax by) cio c | (d)
e quindi
d mcd(a,b).
Daltro canto, se d un altro massimo comun divisore di a e di b si ha d de
d | d ==> d =
Definizione 3.5 Due interi a e b s dicono relativamente primi (o primi tra loro
o coprimi) se mcd (a,b) = 1, ovvero se (e solo se) esistono due interi relativi x e
y tali che valga la seguente uguaglianza, detta identit di Bzout'
1 = ax + by.

Osservazione 3.8 Se a , b e Z e d = mcd (a,b ), posto a = d, b = db, si ha


che mcd (a , b) = 1.

Infatti, detto / = mcd (,b) si ha che / | a e t j b e quindi

td \ d = a, td | bd = b => td \ d = y t = db1.
Osservazione 3.9 Se mcd (a,b) = 1 e a | bc = > a | c.
Infatti, essendo mcd (a,b ) = 1, esistono x, y e Z tali che 1 = ax + by ; inoltre,
poich a | bc, 3 q e Z tale che bc aq. Allora si ha che c = c(ax) 4- c(by) =
= cax + (cb)y da cui, sostituendo, si ottiene c = cax + (aq)y = a{cx + qy).
Segue quindi che a | c.

Definizione 3.6 Siano a, b e Z, a j=- 0, b ^ 0. Si dice minimo comune multiplo


di a e b, e lo si indica con il simbolo man (a,b ), ogni intero m tale che
1. a | m, b | m;
2. se 3t e Z tale che a \ t, b | t allora m \ t .
Esistenza e unicit a meno del segno del mem (a,b) sono garantiti dal seguente
Teorema 3.3 Siano a t b a ^ 0r b f=- 0 (non ^
IL /a generalit supporre
a >0. b > 01 Allora, detto d = MCD (a,b), si ha che:
a i?
L m= un minimo comune multiplo fra a e b;
~d~
2. se m un minimo comune multiplo fra a e b, allora m l unico altro minimo
comune multiplo fra a e b.

Dimostrazione.

1. Posto

a = da b = db
si ha
ab dadb
ab = ab
d

quindi a | , b | ed soddisfatto il punto 1) della Definizione 3.6. Sia


d d ab
ora t e Z tale che a | t,b \ t e m ostriam o che - | t. Infatti, per opportuni
a
t\,h
t = at\ = bto Y adt i = bdt2 = > at\ = bt 2.
Per le Osservazioni 3.8 e 3.9 si deduce che a | ti , sicch ti at3 (per un
opportuno f3 e Z) e quindi
ab ab
t = bt2 = bat-i =

2. Se m = mcm(a,b) anche - m lo , in quanto soddisfa le condizionici. e 2.


della definizione. Inoltre, se si considera un qualsiasi mcm (a ,b ) = ih, si ha
che m | m e in \ m da cui segue rh = m .

3.2 Numeri primi e teorema fondam entale


dellaritmetica
Definizione 3.7 Un numero p e Z, p ^ 0 , p 1 , si dice primo se, ogni volta
che divide il prodotto di due interi a e b esso divide almeno uno dei due fattori.
In simboli:
p | ab ==> p \ a o p \ b.
Definizione 3.8 Un numero p Z, p 0, p / 1 , si dice irriducibile se e
solo se p divisibile solo per 1 e
Teorema 3.4 Sia p Z, p 0, p ^ 1 . Allora p irriducibile se e solo se p
primo. r
Gii meri 27

D im ostrazione. Assumiamo per ipotesi che p sia primo e dimostriamo e ie p e


irriducibile.
Sia q un divisore di p: allora p = qlp e quindi p j q~p. Essendo p primo allora p
divide q oppure divide ~p.
Se p | q allora, poich anche q | p, per la Propriet 3.1, segue p = q.
Se p | ~p allora ~p = p p e quindi p = q(pp) cio qp = 1, da cui si ottiene
q = p = l.
Viceversa sia p irriducibile e dimostriamo che p primo.
Supponiamo che p ( ab e che quindi 3 <? Z tale che ab = pq. Sia d =
m c d (p,b); allora d | p che irriducibile e quindi d = p oppure d 1.

Se d = p => p | b.
Se d = 1 => 3 x ,y e Z tali che si abbia 1 = px-\-by => a apx+(ab)y =
apx + (pq)y = p(ax + qy) =$> p \ a. u

Esercizio 3.1 Siano a e b e Z, se mcd (a,b) = 1 = vtCD(a b,a + b) e


{db1, 2 }.

Poich a e b non sono entrambi pari per ipotesi, i casi possibili sono due:

1. a = 2 n, b = 2m 4- 1. Allora

a b 2{n m) 1
a + b = 2(n + m) + 1
J sono entrambi dispari.

Se 3 r e Z tale che r | (a b) e r | (a 4 - b ) allora si ha che r ! 2a. r ' 2b


Essendo r dispari segue r | a ed r \ b.
Essendo poi mcd(a,b) = 1 ==> r = 1.

2. a = 2n + 1, b 2m + 1. Allora

a - b = 2(n - m) 1 9, ,
a + b = 2 (n 4 - ni + 1) j '

o v e d = m c d (a b,a + b ). Inoltre d \ (a b + a +b) e d | { a - b a - b)


cio d | 2a, d | 2 b. Poich mcd (a,b ) = 1 segue che d \ 2 e quindi d = 2.

Teorema 3.5 (fondamentale delVaritmetica): Ogni numero intero n, diverso


da 0 e da 1, pu essere scritto come prodotto di s > 1 numeri primi (non
necessariamente distinti). Tale fattorizzazione essenzialmente unica, cio se
n = PP2 Ps = q\q 2 ---qt, ove ogni p, (1 < i < s) e ogni q} (1 < j < t)
un numero primo, allora si possono ordinare i fattori in modo che sia
1. s = t;

2. p, = q u p 2 = q 2%. . . , Ps = q s.
c ,w \ jcl \ j \\\ j v o

Dimostrazione. S upponiam o n > l e p ro c e d ia m o p e r induzione (II forma) osser


vando che per n = 2 il T eo rem a v ero e s s e n d o 2 u n num ero primo.

Esistenza della fattorizzazione:


Supponiamo che il T eorem a sia v ero p e r o g n i in te ro m con 2 < m < n e provia
molo per n. Se n un num ero p rim o , il te o re m a vero; se n non primo, allora
sar n = ab con \ < a < n t l < b < n .
Per ipotesi induttiva

a = a\fl 2 * ' *Qh b = b\ 2 ' bk


ove i fattori a,- e b} sono prim i V i = 1, , h e V j = 1, , k.
Quindi n = ( a ^ **ait)(b\b 2 * fc*) e sp rim ib ile com e prodotto di un numero
finito di numeri primi.

Unicit della fattorizzazione:


Sia
n = p\p2 ps = q \ q i" - q t M
con pi e qj numeri prim i V i = 1, , s e Vy = 1, , t.
Dimostriamo che s = t e che, a m eno d e llordine in cui compaiono e del loro
segno, i fattori del primo m em bro sono uguali a quelli del secondo membro.
Poich pi primo e p i 1 q \(q 2 qt) = > P i I q\ (e allora pi = ^i),
oppure pi | (q2 " - q t)-
Se pi { q\ allora p\ 1 ^ 2(^3 q) quindi o p\ ) ^2 e allora pi = <72 oppure
Pi 1 ri/3 ***qt)'
Procedendo in questo modo, essendo finito il num ero dei fattori, esister qualche
qi tale che p\ = q , .
Allora dalla (o), semplificando, si ottiene
P i Ps q 1 *qi-\qt+ \ ' qt
e, per ipotesi induttiva, segue la tesi.
Corollario 3.1 Ogni numero intero n ha una fattorizzazione (essenzialmente
unica) come prodotto di potenze di primi distinti cio si pu scrivere
a1 ai (*r
Pi Pi~ r
ove pi # pj se i j, a, > 0 .
Osservazione 3.10 Dato un numero intero n > 1, utilizzando il teorema prece
dente, possiamo calcolare quanti sono i suoi divisori positivi (compresi 1 ed n).
Infatti, sia d un divisore di n. Per il teorem a di fattorizzazione e il suo co
rollario, se n = p f p 2 . *- pj*- allora esistono fi\ ,p 2, - - - ,p r con 0 < p, < ah
i G {1,2 , . . . ,r} tali che d = p f 1p^2 p f r . Contando i possibili valori dei p,,
abbiamo che il numero dei divisori di n
r
(i 4- l)(oi2 + 1 ) . . . (ar -f 1) = n < * + * )
/= !
Gli interi 29

Esempio 3.3 Determinare quanti sono i divisori positivi di 30.

Poich n = 30 = 2 3 5, detto d un suo divisore, sar d = 2/?l 3^ 5' con


0 < Pi < 1.
Ciascun fi pu assumere due valori e quindi i divisori di 30 saranno 2 2 2 = 8 .
Precisamente, detto D linsieme dei divisori positivi di 30, si ha

D = [d e N | d | 30} = {1,2,3,5,6,10,15,30}.
Proposizione 3.3 Esistono infiniti numeri primi.
Dimostrazione. Sia P linsieme dei numeri primi positivi. Procediamo per as
surdo e supponiamo che P sia finito, cio che P = {pi, ,p,}.
Consideriamo ora il numero m = p \p 2 pt + 1.
Esso risulta coprimo con ogni primo dellinsieme P quindi non divisibile per
nessuno di essi. Inoltre non un numero primo perch m P (infatti m > p,V/)
e quindi si ha lassurdo.

3.3 Numerazione in base ri

Teorema 3.6 Sia n un intero n > 2. Ogni intero a > 0 pu essere scritto in uno
e un sol modo nella forma:
a = rhn>l + rh- {nh~l -4----- n 1 + r0n,
con 0 < r, < n, per ogni i = 0 , 1, ,h ,h > 0.

Dimostrazione. Per dimostrare lesistenza della scrittura, si procede per induzio


ne su a .

1. Se a = 0 si ha 0 = 0 n.

2. Supposto che lasserto sia vero per ogni 0 < k < a, mostriamo che vero
anche per a. Dividiamo a per n: si ottiene
a = nq + r con 0 <r</i e 0 < q < a.
Utilizzando lipotesi di induzione, possiamo scrivere

q = sh- \n ll~x -I- 5/j_ 2/2/' 2 H-------M i/i 1 +Son


con 0 < s, < n e quindi, sostituendo,

a = nq + r = Sh-\nh -f s / , _ H -------h Si2 + so 1 + rn1' =


= r,,nh + rh~inh~l -I----- r\n { + r 0n
ove rh = sh- U rh~\ = sh- 2, = s0, r 0 = r.
Lunicit dellespressione segue dallunicit di q ed r.
30 Capitolo 3

Osservazione 3.11 ro, n , Jh sono i resti n ella seq u en za di divisioni:


a = n q + ro 0 < ro < n
q = n q \ + rx 0 < ri < n
qi = nq2 + r 2 0 < r2 n

qh-\ = nqh + rh 0 < r/, < n


Osservazione 3.12 Se indichiamo n sim boli (cifre) distinti con gli interi da 0 a
n 1, il numero
a = rhrh- i r 0 = (a)
si dice rappresentato in base n .
Osservazione 3.13 Se 10 < n < 36 si possono usare le cifre da 0 a 9 e le lettere
dellalfabeto.
Esempio 3.4 1. n 10: abbiamo lusuale rappresentazione in base 10.
Il numero (2005)10 = 2 IO3 + 0 IO2 + 0 IO 1 + 5 10.
2. n = 2 : ci serviamo dei simboli 0 e 1; rappresentiam o il num ero (2005) io in
base 2, utilizzando lOsservazione 3.11.
2005 2 1002 + 1
1002 2 501+0
501 2 250+1
250 2 125 + 0
125 2 62+1
62 2 31+0
31 2 15+1
15 2 7+1
7 2 3+ 1
3 2 1+ 1
1 2 0+1
e quindi (2005)io = (11111010101)2.
Viceversa: (11111010101)2 = 1-2 10+ l - 2 9+ l - 2 8+ l - 2 7+ l - 2 6+ 0 -2 5+ l- 2 4+
+ 0-2 3+ l '2 2+ 0 -2 1+ 1 -2 = ( 1 0 2 4 + 5 1 2 + 2 5 6 + 1 2 8 + 6 4 + 1 6 + 4 + 1)10 =
(2005) 10.
3. n 8: utilizziamo le cifre 0 ,1 ,2 ,3 ,4 ,5 , 6 ,7. Ancora, in base allOsservazio
ne 3.11 si ha:
2005 8 -2 5 0 + 5
250 8-31+2
31 8-3 + 7
3 8-0 + 3
Gli inten 31

e quindi (2005) j0 = (3725)g.


Viceversa (3725)8 = 3-8 3 + 7 - 8 2 + 2 - 8 14-5-8 = (1536+448 + 1 6 ~ 5 )10 =
(2005) 10.

4. n = 16: (base esadecimale); si utilizzano solitamente le dieci cifre da 0 a 9 e


le prime sei lettere dellalfabeto:
0 ,l,2 ,3 ,4 ,5 ,6 ,7 ,8 ,9 ,A ,fl,C ,D , ,F
In questo caso abbiamo
(2005) 10 = (7D 5) i6.

Viceversa, (7D 5 ),6 = (7 162 + 13 161 + 5 16) = (1792 + 208 + 5 )io =


(2005) 10.

3.3.1 O p e ra zio n i in b a se 2

Le operazioni in una qualsivoglia base si impostano e si risolvono in modo analo


go a quanto si fa nel caso della numerazione in base 10.
Nel caso della numerazione in base 2 molto agevole fare calcoli.
In base 10 si sa che 7 + 12 = 19 e 7 12 = 84.
In base 2 si ha: (7)io = ( 111) 2, (12)io = (1 100)2 e quindi
111+ 111x
1 1 0 0 = 1100=
10011 000
0 00
1 1 1
1 1 1
1010100

Esercizi
Verificare che (1001 1)2 = (19)io e che ( 1010100)2 = (84) iq.

Dati i seguenti numeri in base ^ 10, trasformarli in numeri in base 10:


1. ( 1111111)2
2. ( 111111)4

3. (10011011)3
4. (127)g.
Dati i seguenti numeri in base 10, scriverli in base 2:
5. (1365) 10
6. (2523).
Calcolare :

7. (1111111)2 + 00011)2

8. (1010100)2+ (lim)2
9. (1111111)2-(10011)2-

3.4 Equazioni lineari diofantee


U algoritmo della divisione nonch l1algoritmo euclideo delle divisioni successive
per la ricerca di un mcd fra interi giocano un ruolo notevole in molte applicazioni
legate alla teoria dei numeri, in particolare nella ricerca di soluzioni intere di
equazioni del tipo:
ax q- by = c, ove a ,b ,c e Z . ( )
Definizione 3.9 Unequazione del tipo F ( jci, x2, ,xn) = 0 si dice diofantea
(o diofantina) quando F ( jc, x2, ,xn) un polinomio a coefficienti interi rela
tivi
11 termine "diofantee' deriva dal nome del m atem atico greco Diofanto che
oper in Alessandria verso la met del secolo terzo. Per la verit ben poco si sa
della vita di Diofanto, se non il fatto che gli viene spesso dato lappellativo di pa
dre dellalgebra poich il trattato a noi pervenuto, V Aritmetica, dedicato quasi
esclusivamente alla soluzione di equazioni. Tra laltro si deve a Diofanto lintro
duzione di una notazione simbolica molto simile alla nostra indeterm inata x.

Prendiamo, ora, in esame alcune equazioni del tipo ( ).


Se consideriamo 33x + l y = 5 possiamo osservare che la coppia (1, 14)
soluzione dellequazione ma anche la coppia ( 3 , - 47 ) soluzione cos come la
coppia (1,19). In generale si pu verificare che soluzione dellequazione data
ogni coppia del tipo (1 + Ih, - 14 - 33 h), h e IL.
Se invece consideriamo lequazione 2x -V-4y = 5 possiamo osservare che essa
non ammette alcuna soluzione (intera): infatti se esistesse una coppia {a, fi) e
Z x Z soluzione di detta equazione, avremmo che la 4- 4/3 = 2 (a + 2 ) = 5 e
quindi otterremmo che 2 un divisore di 5, assurdo!

Diamo, pertanto, una condizione necessaria e sufficiente affinch unequazione


diofantea ammetta soluzioni e, nel caso in cui dette soluzioni esistano, diamo una
formula per scrivere la soluzione generale.
Teorema 3.7 Condizione necessaria e sufficiente affinch l equazione (diofan
tea)
ax + by = c, ove a,b,c Z
ammetta soluzioni intere che mcd (a,b ) clivida c.
Gli interi 33

D im ostrazione. Indichiamo, anzitutto, con d un MCD(a,b): per definizione d a


t d \ b quindi esistono a\,b\ e Z tali che a d a \ , b = db . Supponiamo, ora.
che lequazione ( ) am m etta soluzione, cio esista una coppia (xo,)'o) e Z x Z
tale che ax o + 6 vo = c; sostituendo ad a e b le loro espressioni in funzione di d si
ottiene:
(dai)xo + (dbi)y0 = d(aix0 + bxy0) = c
da cui si deduce che d deve dividere c.
Viceversa supponiam o che d c , cio esista cx e Z tale che c = de . Poich
d = mcd (a ,b ) esisto n o .ri,y i e Z tali che a x j + b yx = d Moltiplicando membro
a membro per c x si ha:
a{xxci) + b (yicx) = dc\ = c
e quindi la coppia (^ i Ci . ^ c i) soluzione dellequazione ( ).

Nel caso in cui lequazione ax + by c ammetta soluzione, ricerchiamo una


formula che fornisca la soluzione generale.
Proposizione 3.4 Si consideri l'equazione diofantea
( ) ax + by = c , a ,b x e Z.
Supponendo che la coppia (a,) e Z x Z sia una soluzione particolare della (*),
allora tutte e sole le soluzioni sono le coppie ordinate (jc.y) = (or + b\h, a xh)
ove d = m c d (<2,/?), a = d a i, b = d b i, d \ c (per il teorema precedente) e
h e Z.
D im ostrazione. Verifichiamo che (a + b \h , a xh) soluzione della ( ) Infatti,
sostituendo, otteniamo:
a{a -f b\h) + b( a xh) = aa + ab\h + b baxh = act + b c
(essendo (a , ) una soluzione della ( )).
Viceversa se (xo, Vo) Z x Z soluzione dellequazione ( ), da

( aa 4- b = c
ax o + by 0 = c

sottraendo membro a membro si ottiene:


ala - xo) + b{ - ,v0) = 0
e quindi, sostituendo,
d a i (or - xo) = dby{yQ- )
da cui, dividendo membro a membro per d, si ottiene luguaglianza:
a j (or - x 0) = bylyo - ). (* )
Poich a x divide il prodotto b\{ yo) ed primo con b\ (cio MCD(a\,bi) = 1),
necessariamente ai deve dividere lyo ). Sicch yo~ = a\h, per un opportuno
h e Z. Sostituendo nella ( ) e semplificando per ai si deduce che ar .xo = b\h,
da cui segue la tesi.
W jC IfJIlV JlU O

Esempio 3.5 Si dica se sono risolvibili le seguenti equazioni lineari diofante


in caso affermativo se ne determinino tutte le soluzioni: L
a] 3jc + 21> = 5
b] 3x + 5> = 7
c] 9x 4-15 v = 21
d] 3x 4- 15y = 21.

Soluzione
al Osserviamo che mcd (3 ,2 1 ) = 3 e 3 { 5 quindi l equazione non risolvibile.
b] Poich mcd(3,5) = 1 e 1 | 5 l equazione risolvibile.
Una soluzione particolare data dalla coppia (1,2), p ertan to la soluzione gene
rale (;t,)0 = (1 + 5 h, 2 3/z), ove h e Z.
c] Poich mcd(9,15) = 3 e 3 | 21, l equazione ammette soluzioni.
Dividendo membro a membro per 3 si ottiene l equazione 3x + 5y = 7 che
equivalente a quella data, le cui soluzioni sono quelle trovate al punto b].
d 1 Anche in questo caso lequazione risolvibile poich mcd(3, 15) = 3 e 3 | 21.
Una soluzione particolare dellequazione in questione data dalla coppia (2,1)
quindi la soluzione generale data da: jc = 2 + 5 h ,y = 1 h, per h e Z.

3.5 Relazioni ricorsive


Lintento di questo paragrafo quello di fornire una introduzione alla risoluzio
ne di problem i in cui intervengono relazioni ricorsive, cio successioni in cui
ln esim o elem ento sia correlato ai term ini che lo precedono.
im portante sottolineare che dette relazioni giocano un ruolo essenziale negli al
goritmi ricorsivi, cio in quegli algoritm i in cui si risolve un problem a riducendolo
ad un sottoproblem a dello stesso tipo con un input pi piccolo.
c

Ad esempio si considerino le seguenti istruzioni per generare una successione:

1. si inizi con 3
2. dato un qualsiasi term ine, si aggiunga 4 per ottenere il successivo.

Naturalmente il primo term ine a\ 3 per listruzione 1.; utilizzando V istruzio


ne 2., otteniamo il secondo term ine a 2 = <3! 4-4 = 3 + 4 = 7, poi il terzo termine
ai ai + 4 = 7 + 4 = 11; quindi il quarto aA = 15, il quinto a5 = 19 e cos via.
Le condizioni 1. e 2. non danno esplicitam ente una form ula per com putare il
termine n -esimo, m a permettono di calcolare ogni termine della sequenza proce
dendo termine per termine.
Ora, posto a\ 3 si pu sostituire listruzione 2 . ponendo
an an- 1 + 4, n > 2
( )
e in questo modo possibile determinare ogni termine della successione
zione (* ) fornisce un esempio di relazione ricorsiva. La rela-
Gli interi 35

Il lettore pu ricordare la successione di Fibonacci e rileggerla come relazione


ricorsiva:

ftt = /-1 4- fn 2t n > 3 , ponendo/i = 1, f 2 = 2.

Definizione 3.10 Una relazione ricorsiva una legge che definisce una succes
sione assegnando Un--esmo termine in funzione di termini antecedenti, una volta
fissato il valore iniziale.
V

E immediato osservare che una relazione ricorsiva, pur permettendo il calcolo del
valore del termine -esim o a per ogni n, d solo informazioni locali, in quanto
detto termine a si com puta in funzione dei precedenti termini,
Risolvere una relazione ricorsiva significa trovare una cosiddetta formula chiu
sa, cio una formula che esprima direttamente an in funzione di un numero di
operazioni ben note su n .
Ad esempio nel caso delle progressioni aritmetiche e geometriche rispettivamente
si ottiene:
an = a + (n \)d

an = aqn~l
ove q e d rappresentano la ragione, a il valore iniziale ed > 1.

Risolvere relazioni ricorsive pu essere molto complicato; ci sono tuttavia casi


per i quali la risoluzione semplice e altri per i quali esistono tecniche che ci
permettono di arrivare ad una formula chiusa.

Cominciamo, pertanto, ad affrontare le cosiddette equazioni ricorsive lineari.

Definizione 3.11 Si dice equazione ricorsiva lineare di ordine k a coefficienti


costanti una relazione ricorsiva del tipo
an = h\an- i 4- ^ 2^ - 2+ ........ ~fhkan-k 4- h
ove h,,h e E, Vi = 1,___ ,/c, ed h * 0.
Nel caso in cui h = 0. Uequazione si dice omogenea {di grado k).

Esempio 3.6 La relazione ricorsiva che definisce la successione di Fibonacci

fn = fn l + fn 2' tl > 3, ponendo f i = 1, f2= 2


lineare om ogenea di grado 2 , mentre la relazione ricorsiva

bn 3bn\bn2
non lineare om ogenea a cefficienti costanti, poich i suoi termini non sono del
tipo cbk.
Ancora, ogni relazione ricorsiva del tipo
m lineate om ogenea a coefficienti c o sta n ti, p o ic h il term in e che sta a destra
ce. segno di uguaglianza non nullo.
Noe creare om ogenea neppure u n a re laz io n e ric o rsiv a del tipo:

dn 5ndn- \

costante.

Ci proponiamo
omogenee a co

Consideriamo la seguente relazione ricorsiva lineare om ogenea:

an = h ia n-y + h2an- 2+ .........+ h kan- k ( )

e cerchiamo una soluzione del tipo an = tn, t costante.


E immediato verificare che tn sar soluzione di ( ) se e solo se

tn - h y t"-1 - h2tn- 2- .........- h kt n~k = 0


da cui, dividendo membro a m em bro per t"~k, si avr:

tk - h \tk~l - h2tk~2- ........ - h k = 0 .


Quest ultim a equazione detta equazione c a ra tte ris tic a a sso c ia ta a lla relazione
ricorsiva e le sue radici sono dette ra d ic i c a ra tte ris tic h e d ellequazione ricorsi
va

Proposizione 3.5 Si consideri la relazione lineare ricorsiva di grado k :

h\an\ + h2an2~\~........ ~\~hkank + h


ove hi,h R, Vi = 1 ,........ k , hk 0 , e sia
tk - h {tk~x - h2tk~2- ........ - h k = 0
/ equazione caratteristica ad essa associata. Se l equazione caratteristica am
mette radici t\,t2, . . . . ,tk tutte distinte, allora una successione {a,,} soluzione
della relazione ricorsiva se e solo se
an = C\t" 4- C2?2 + ........ + cktk , c\,c 2, . .. ,ck costanti, Vn > 0
e i coefficienti C\ ,c2, . .. ,ck sono determinati a partire da k valori iniziali fissati

E sem pio 3.7 Sia data la relazione ricorsiva:


an = la n- \ - \2an- i , con valori iniziali a0 = 5 ,ay = l i .

Si riconosce che la relazione ricorsiva data da


an la n-\ + \ 2a n-2 = 0
Gli interi 37

lineare om ogenea di grado 2 a coefficienti costanti.


Lequazione caratteristica ad essa associata

t 2 - l t 4 12 = 0
le cui radici sono 3 e 4 (quindi distinte). Abbiamo perci le soluzioni:

an == c i(4-3)/I 4- c2(+ 4 )n.


Imponendo le condizioni iniziali ao = 5, ai = 11 si ottengono le relazioni:

f a0 = ci3 4- c24 = 5 | c i + c2 = 5
| a\ = C131 + c 24 1 = 11 | 3ci + 4c 2 = 11

ci = 5-c 2 ( ci = 9
3(5 c2) 4- 4 c2 = 1 1 j c2 = - 4

e quindi
a = 9 (4 3 )" - 4 (4 4 )" = 3"+2 - 4"+1, 0.

Esem pio 3.8 Riprendiamo la relazione ricorsiva che porta alla successione di
Fibonacci:
fn = f i - 1 + f i li n > 3, con valori iniziali / i = 1, f 2 = 2

Essa lineare om ogenea di secondo grado sicch lequazione caratteristica ad


essa associata sar:

t2 - t - 1 = 0
le cui radici distinte sono:

1 V 5
ha =

La soluzione ha la forma
n
i * , / 1 ~V 5
/n = ---- + C2

Le condizioni iniziali impongono che siano verificate simultaneamente le equa


zioni:

, . 1 4 a/ 5 \ / 1 -V 5 . . . iW 5 \\ /1 -^ /5 '
Jl ~ c\ I ----^---- I + ^2 = 1 /2 = <4 I i I 4- c2

Risolvendo il sistem a si ottiene:

V5 ( \ 4 a/5 5 4 V5 V5/l-V5\ 5 </S


Ci = c2 = -
10 10
Da cui la formula chiusa:
5 + V5 /1 + v ^ V , 5 - 75 1- -M
/" = 1 o_ ' \ 2 / 10 \ 2

= v s ( i v i y +1_ ^ ( ^ " +1

Due sono le osservazioni da farsi: nonostante / sia un num ero intero, la formula
chiusa ottenuta evidenzia la presenza del numero irrazionale \ / 5 .
Inoltre nella stessa formula presente il numero a = , cio il cosiddetto
rapporto aureo o proporzione divina : in altre parole ci che per i G reci era con
siderato il rapporto pi armonioso tra due grandezze x e y

x : y = (x + y) : x
al punto che la facciata del Partenone stata inscritta in un rettangolo i cui lati
soddisfano queste proporzioni. Possiamo inoltre osservare che, al crescere di n,
f n si avvicina al numero irrazionale ^ .
v5
Consideriamo, ora, il caso in cui lequazione caratteristica associata ad una rela
zione ricorsiva omogenea di grado k abbia radici multiple ed esponiam o i risultati
senza fornire la dimostrazione.

Proposizione 3.6 Sia

an = h\an- \ -f h2an_2+ ........ +hica-ic


una relazione ricorsiva lineare di grado k, ove h, e R , hk ^ 0 e sia
tk - h tk- ' - h 2tk- 2 - .........hk 0
I equazione caratteristica associata. Se le radici distinte sono t\ t2 . . ,ts con
s < k e hanno molteplicit rispettivamente m u m2........,ms, ove m t > 1, per
ogni i e {1 ,2 ,........ , 5} e m 1 4- m 2+ ------ +m s = k, allora {a,,} soluzione di tale
relazione ricorsiva se e solo se
an = (cL0 + c lAn + ......... + c 1>Wl_ 1nm' - 1)if +
+ ( c 2,0 + C2, l r t + ............. + C 2.m 2- l U m2_1) f 'J +
...............................................................+
+ (G ,o + csAn + ........... +cs<ms- nm' - l)tsl

ove n e N; cttJ e K , \ < i < s, \ < j < m, \ e i coefficienti c, j sono


determinati dai valori iniziali.
Esem pio 3.9 Sia data la seguente relazione ncorsiva di secondo grado

a = - 9a - 2, ao = ai = u
Lequazione caratteristica associata :

t 2 - 6t + 9 = 0;

essa ammette radice 3 con molteplicit 2. Allora:

= (ci.o + c \ \ n ) y i.

Utilizzando le condizioni iniziali, determiniamo c\ 0 e c\ \ :

o = 1 = ci,0 3 ^.o = 1
2
i = l = (ci.o + c i,i ' 0 3 1 fu 3

e quindi otteniamo:

an = (1 - j / i )3" = 3 - 2n3 "-1

Esercizio 3.2 Dire quali delle seguenti relazioni ricorsive sono lineari omogenee
a coefficienti costanti:
1. ciu 3>nciiij
2. b = b,,_i -f- n
3. Cn 5ch_2 dn~3
4. dn ?>dn\
5. en = en- \ + 5 e_ 2.

Esercizio 3.3 Risolvere le seguenti relazioni lineari ricorsive a coefficienti co


stanti:
1. dn = SZ/ji \Sdn2
2 . bn = - 246,,_2
3. c = 4c_ i - 4tn_2
4. dn 3dni
5. = 10e_i 25e_2.

Utilizzando le relazioni lineari ricorsive omogenee si possono risolvere alcuni pro


blemi connessi con la crescita delle popolazioni nel tempo, modelli economici
ecc.
Ad esempio, data una popolazione di 1000 esemplari al tempo iniziale {n = 0),
supponendo che, passando dal tempo n 1 al tempo n essa aumenti la sua consi
stenza del 10% rispetto al tempo n 1, otteniamo la seguente relazione ricorsiva:

o = 1000
1
/I nl = H1
10
11
dn = ----- 7 1 -1
10
Da qui si deduce che
11 n n
11 n /u 11Y
a0 = 1000
io | i o a" T) a,l~2 ~ T io
cio la crescita esponenziale.

Diamo, ora, alcuni cenni sulle relazioni ricorsive lin e a ri n o n om ogenee.

Sia
ci = h\an-i + h2dn-2+ ........+hkan-k + f (n)
una relazione ricorsiva lineare non omogenea, ove ht e R , * / 0 e / ( ) non
identicamente nulla e dipende da n.
Le soluzioni an si trovano aggiungendo ad una soluzione particolare d e ir equazio
ne non omogenea, a[,no), le soluzioni della relazione om ogenea associata a, cio
le soluzioni della relazione che si ottiene ponendo f( n ) = 0. Sicch:
(0 )
an = lro) + an
Pertanto il problema si riduce a trovare una soluzione particolare dellequazione
non omogenea, giacch quelle della omogenea sono state gi studiate.

Procediamo con un esempio illustrativo. Consideriamo lequazione:


an an..\ + n ,c o n a o = 0 .
I primi casi danno

a\ = a0 + 1
2 = i + 2 *0 + 1 + 2
a 3 = a2 + 3 *o + 1 + 2 + 3
*4 = a 3 + 4 00 + 1 + 2 + 3 + 4

an = o + 1 + 2+. n

e quindi
n n(n + 1)
an a0 + y ' l =

La relazione assegnata era non omogenea del tipo:


a dn\ f (fi)
ed stata risolta poich si ottenuto:
n
a = aB + f ( ) + f( 2 ) + ..........+ / ( ) = + V /(i)
Gli interi 41

Ora la relazione om ogenea associata :

On &nl = 0

e quindi di grado 1, mentre lequazione caratteristica associata

t - 1=0

che ammette soluzione t = 1.


Pertanto an = c\ V1. Essendo a0 = 0, si ha che C\ = 0 e quindi an = 0. Sicch
lo zero della ( ) soluzione dellequazione omogenea associata, mentre
fl^n - una soluzione particolare di quella non omogenea.

Rientra in questa casistica il cosiddetto problema della Torre di Hanoi inventato


alla fine dell ottocento dal matematico Lucas, forse ispirandosi ai Brahamini, che
nel tempio di Brahm a avevano il compito di fare in continuazione trasferimenti di
64 dischi d oro posti su 3 aste d oro su basi di diamante. Nell istante stesso in
cui il trasferimento fosse terminato il mondo sarebbe terminato!

Descriviamo per bene il gioco della Torre di Hanoi: ci sono n cerchi infilati in
unasta verticale a con diametri decrescenti dal basso verso lalto. Finalit del
gioco trasferire tutti i dischi nello stesso ordine di prima, cio con diametri
decrescenti dal basso verso lalto, su unaltra asta y seguendo regole precise:
( 1) i cerchi devono essere trasferiti uno per volta, passando per unasta inter
media p
(2 ) mai un cerchio di diametro maggiore pu trovarsi su uno di diametro
minore.

E possibile individuare una formula ricorsiva che risolve il problema.


Indichiamo con a il numero di mosse necessarie a concludere il gioco.
Se n = 1 allora a i = 1. Procediamo per induzione, supponendo di sapere che per
trasferire n 1 cerchi occorrano an-\ mosse e calcoliamo an.
Trasferiamo da a a fi gli n 1 dischi superiori con an-\ mosse; muoviamo, poi,
su y, in una mossa, il cerchio rimasto di diametro pi grande.
Da ultimo rimuoviamo da p a y, in j mosse, gli n 1 cerchi che avevamo
prima trasferito. Otteniamo

an = 2a_i + 1

che una relazione lineare non omogenea di grado 1. Poich:

a = 2an- i + 1 = 2 (2 a n- 2 + 1) + 1 = 2 ~an-2 + 2 + 1
2 (2a _3 + 1) -f 2 4 - 1 = 2*cin-2 + 2 + 2 + 1 = . . . . =
= 2n- la { -F2,," 24-..............4 -2 + 1
42 Capitato 3

e poich a\ = 1 , lespressione ottenuta la som m a di una progressione geometri


ca d ragione 2 e quindi
n -1
a = 2 + 2" 2+ + 2 + 1 = V 2 ' = 2" - 1
0

3.6 Alcune applicazioni a llanalisi di algoritm i

La principale applicazione delle relazioni ricorsive nella teoria degli algoritmi


legata al com puto del tem po di esecuzione di un algoritm o. A tal fine occorre
produrre una relazione ricorsiva e fornire delle condizioni iniziali che definiscano
una sequenza a \,a i% a ^ . . . ,a . . . , ove an il tem po richiesto da un algoritmo
per eseguire un input di am piezza n . Risolvendo la relazione ricorsiva si in grado
di determ inare il tem po richiesto dallalgoritm o.

Procediam o con un esempio

Algoritmo che computa una potenza:


Input: a R , n e N \ {0}
O utput cin.
1. procedure exp(a,n)
2 . if n.ss 1 then
3. return (a)
4 m = tu
5. return (exp(a,m ) exp(a,n - m))
6 . end exp

Com e misura del tempo richiesto da questo algoritmo contiam o il num ero c di
m oltiplicazioni alla riga 5 per calcolare an. Si ottiene subito la condizione iniziale

C\ 0 .
Per ottenere la relazione ricorsiva per la sequenza C|,C2, .............. sim uliam o le
secuzione deiralgoritm o per un arbitrano input n > 1. Contiam o il numero di
m oltiplicazioni per ogni riga e poi sommiamo i numeri per ottenere il numero to
tale d moltiplicazioni. Nelle righe 1 4 non ce ne sono. Alla riga 5 ci sono n 1
m oltiplicazioni e poi basta, sicch
cn = ri - 1
che fornisce la relazione ncorsiva richiesta. Cos il tempo richiesto dalLalgoritmo
in questione 0(n).
O sserviam o che la precedente applicazione stala presentata solo per fornire
un esem pio di utilizzo del procedimento ricorsivo. Ricordiamo che, in generale,
non vantaggioso utilizzare tale procedimento nel caso esistano procedure al
ternative. Infatti programmi ricorsivi, a causa dellalto numero di volte in cui
Gli interi 43

vengono richiamati (nel caso deiresem pio n log n) e del conseguente uso di tem
po nella trasmissione dei parametri, sono pi lenti ed occupano pi memoria di
altri procedimenti.
Esistono per situazioni in cui lunica via percorribile quella della ricor-
sione, ad esempio nel calcolo della funzione di Ackerman (cfr. M. Bonecchi,
L. Zauli: Algoritmi su Teora e applicazioni degli elaboratori' Edizioni CLUP
1994).
4
Relazioni binarie tra insiemi

Il mondo infinito, luniverso inesauribile


e il cervello umano non sar mai minacciato
dalla disoccupazione
(G. Haltshuller: The Innovation Algonthm)

Definizione 4.1 Una relazione binaria fra due insiemi X e Y (non vuoti) un
sottoinsieme 1Z del prodotto cartesiano X x Y, cio un insieme 7Z di coppie
ordinate (x,y), x e X, y e Y.

1. Se X = Y si parla di relazione su X.
2. Se 7Z una relazione fra X e Y e la coppia (x,y) 1Z si scrive anche xTZ y e
si dice che v associato a v nella relazione 7Z.
3. Ogni sottoinsieme 7Z di X x Y una relazione fra X e Y\ in particolare:

3.1 7Z = 0 la relazione vuota (nessun elemento di X in relazione con


elementi di Y).
3.2 TZ = X x Y la relazione totale (ogni elemento di X in relazione
con ogni elemento di K).
Se X = Y, X x X = X2 la relazione universale su X.

4. Se X = Y, la diagonale di X 2 cio I \ {(*,-01 * X}, la relazione


identica su X.

Definizione 4.2 Data una relazione TZfra X e Y si dice relazione trasposta di


7Z la relazione 1Z1 cos definita 7ZT = {(j,*) e Y x X| ( * ,0 e IZ }<

Esempio 4.1 Sia X = {a,b,c} :


1Z = {(a,b),(b,b),(a,c),(b,c)}
7Z1 - {(b,a)Ab,b)y(c,a),(c,b )}.
Osservazione 4.1 {TZ7)1 =7Z.

Sia ora 7Z una relazione definita su un insieme X.

Definizione 4.3 7Z riflessiva se e solo se Ix ^ 7Z, cio se per ogni x e X si


ha che:
Oc,*) e 7Z (cio xTZx, V* e X ).

Definizione 4.4 7Z simmetrica se

tz7 = tz

cio se e solo se
(*,}>) 71 => (y,*) 71 (xTZy ==> y lZ x ).

Definizione 4.5 71 antisimmetrica se e solo se


71 n 7lT c ix

cio se
(*,y) e 71 e (y,x) e TZ => * = y (x7Zy A yTZx => x = y).

Definizione 4.6 7Z transitiva se e solo se


(x,y) 7Z e (y,z) e 7Z= (x,z ) e 7Z (cio xTZy a ;y7z => xTZz).

Definizione 4.7 Una relazione che sia riflessiva, simmetrica e transitiva si dice
relazione di equivalenza.

Definizione 4.8 Una relazione che sia riflessiva, antisimmetrica e transitiva si


dice relazione d'ordine.
Esempio 4.2 SiaX = {a,b,c) ed 7Z\ = {(a,a),(a,b),(b,b),(b,c),(c,b)} c X2.

1. La relazione non riflessiva perch la coppia (c,c) 7Z\ ;

2. la relazione non simmetrica perch (a,b) e 7Z\ ma (b,a) 7Z\\


3. la relazione non transitiva perch (a,b) e 7Z\, (b,c ) 7Z\ ma (a,c) 7Z\\
4. la relazione non antisimmetrica perch (b,c ), (c,b ) e 7Z\ con b ^ c.
Esempio4.3 Sia 7Z2 = {(a,a),(b,b),(c,c),(a,b),(a,c),(b,c),(c,b)} Q X ove
X = {a,b,c}.

1. La relazione riflessiva perch Ix = {(<3,a),(/?, 7?),(c,c)} C 7^25


2. la relazione non simmetrica: (a,b ) TZ-i ma (b,a) 72;
3. la relazione transitiva (verifica all* Esempio 4.8);
Relazioni binarie tra insiemi 47

4. la relazione non antisimmetrica: (b,c) e (c,b) 7l2.


Esempio 4.4 Sia 7Z3 = {(b,b)} c X x X, ove X = {a,6 ,c}.
1. La relazione 7Z3 non riflessiva perch (a,a) non appartiene a 7Z3;
2 . la relazione 73 simmetrica, antisimmetrica e transitiva.
Esercizio 4.1 S/a X = {1,2,3,4} e sia R\ la relazione su X cos definita;
K x = {(1,1),(1,2),(2,1),(2,2),(2,4),(3,3),(4,2)}.
S/ giustificando la risposta, se le seguenti affermazioni sono vere oppure
false:
1. riflessiva;
2 . 711 simmetrica;
3. 1Z\ antisimmetrica;
4. 7Z[ transitiva;
5. 7Z[ un'applicazione da X a X.
Esercizio 4.2 Sia X = {1,2,3,4,5} e sia 72 lo relazione su X cos definita.
n 2 = {(1,1),(2,1),(2,2),(2,4),(3,3),(4,2),(4,4),(5,1),(5,5)}.
Si dica, giustificando la risposta, se le seguenti affermazioni sono vere oppure
false:
1. 1Z2 riflessiva;
2 . 7Z2 simmetrica;
3. 7Z2 antisimmetrica;
4. 7Z2 transitiva;
5. 7Z2 un 'applicazione da X a X.
Esercizio 4.3 Sia X = {1,2,3,4} e sia 73 la relazione su X cosi definita:
K 3 = { ( U ) , (1,2), (1,3), (1,4), (2,2), (2,3), (2,4), (3,3), (4,3), (4,4)}.
Si dica, giustificando la risposta, se le seguenti affermazioni sono vere oppure
false:
1. 7Z3 riflessiva;
2. 7Z3 simmetrica;
3. 7Z3 antisimmetrica;
4. 7Z3 transitiva;
5. 1Z3 un 'applicazione da X a X.
48 Capitolo 4

4.1 Matrici di incidenza

Sia X un insieme finito di ordine n. Una relazione 1Z su X si pu rappresentare


mediante una tabella a doppia entrata (matrice) M n con n righe ed n colonne cos
definita
r,j = 1 se ( x ,,x j ) e 7Z
Mn = (rtj) =
r,j = 0 se (x ,x j ) t 7Z

M-jz detta matrice di incidenza della relazione 7Z (su X).

Esempio 4.5

La matrice di incidenza della relazione 1Z\ dellEsem pio 4.2

1 10
0 1 1
0 10

La matrice di incidenza della relazione TZi dellEsempio 4.3


1 1 1
0 1 1
0 1 1

Viceversa una matrice M (a,7) (a n righe ed n colonne), con at] e {0,1}


pu essere vista come la matrice di incidenza di una relazione su un insieme di
ordine n .

Esempio 4.6
La matrice
1110
0 10 0
M=
1 0 11
000 1
pu essere vista come la matrice di incidenza di una relazione TZ su un insieme X,
con |X| = 4. Se scegliamo X = avremo
1Z = {(a,a),(a, 6),(a,c),(,/?),(c,a),(c,c),(c,i/),(i/,i/)}.
Osservazione 4.2 Le propriet di una relazione si possono dedurre molto age
volmente osservando la matrice di incidenza:

a.l 7l = 0 s e r u = 0 V iJ = 1 ,2 ,... ,n;

a.2 7?. =X 2 se rtl = 1 Vi,j = 1,2.........n;


a.3 -R = / x se r = 1 Vi = 1 ,2 ,... ,n e rh = 0 Vi ^
Relazioni binarie tra insiemi 49

b .l 7Z riflessiva se rn = 1, V7 = 1 ,2 ,... ,/r,


b.2 72 simmetrica se r,y = rJt,V i ,j = 1 ,2 ,... ,/*;
b.3 72 antisimmetrica se r,j rJt = 0, / ^ y;
b.4 72 transitiva se r,* r*y < r;;, V/,y,7: = 1 ,2 ,...

Esempio 4.7 La matrice

pu essere interpretata come la matrice di incidenza di una relazione sull insieme


X = {a,b}\ tale relazione riflessiva poich verificata la (b.l), antisimmetrica
per (b.3) ma non simmetrica perch non verificata la (b.2) ed transitiva perch
verificata la (b.4).

Esempio 4.8 Riprendiamo le relazioni dellEsempio 4.5. La 72j non transitiva


perch r 2 r 23 = 1 ^ r 13 = 0 , mentre la relazione 722 transitiva perch
soddisfatta la condizione [b.4]: r,krk] < rtJ per ogni i,j,k e {1,2,3}. A tal scopo
osserviamo che tali disuguaglianze sono certamente verificate nei casi in cui y = k
e quelle in cui / = k (cio < r,k e rkkrkj < rkj). Verifichiamo le restanti
disuguaglianze: ri 2r2i = 0 < r n , r ]2r 23 = 1 = r 13, r 13r3i = 0 < r n , r 13r 32 =
1 = r{2, r23^*32 = 1 = r22, r 32r 23 = 1 = r33.

4.2 Relazioni di equivalenza


Definizione 4.9 Ricordiamo che una relazione 72 su un insieme X si dice rela
zione di equivalenza se
i) alZa Va e X (propriet riflessiva);
ii) a 72 b => bTZa (propriet simmetrica);
iii) aTZb, bTZc => a72c (propriet transitiva).

Definizione 4.10 Diremo classe di equivalenza individuata dallelemento a di


X l insieme degli elementi di X che sono equivalenti ad a nella 72; in simboli
[a]ti = {x X | x IZa).

Teorema 4.1 Siano a, b e X e sia 72 una relazione di equivalenza su X. Allora


si ha:

1- a [a]n :
2. blZ a => [b]n=[o]n (quindi una classe di equivalenza individuata da uno
qualsiasi dei suoi elementi);
50 Capitolo 4

3. b i [a]n => [b]n D [a]n = 0 (cio due classi di equivalenza distinte non
hanno elementi in comune, ovvero sono disgiunte).

Dimostrazione.
1. Immediato poich alla per la propriet riflessiva.
2. Sia x [b]Ti e quindi x1l b; poich per ipotesi lla, per la transitivit di 11
segue xTl a cio jc e [afo. Quindi

[b]n ^ [a]n-
Viceversa, sia y e [a]^, allora \11 a e, ancora per la simmetria di 71, a Ry.
Da bU a e all y segue b 71 y cio y e [bfa e quindi anche [a fo c [b]n< da
cui segue luguaglianza delle classi.
3. Per assurdo sia x e [b]n n [afo allora jc 71 b e x 71 a e, per la simmetria e la
transitivit di 71,
bTlx e x1la da cui bTla e quindi [b]n = [a]n

Definizione 4.11 Si dice partizione di un insieme X ^ 0 ogni collezione di sot


toinsiemi non vuoti A,, d X e I, tali che:
1. A, fi Aj = 0 per i ^ j

2. U Ai = X-
i/
In altre parole, ogni elemento di X appartiene a uno e un solo sottoinseme A,
della partizione.
Teorema 4.2 Ogni relazione di equivalenza 71 su un insieme X determina una
partizione di X i cui elementi sono le classi di equivalenza (rispetto ad 71).
Viceversa ogni partizione di X determina una relazione di equivalenza (su
X) le cui classi di equivalenza sono gli elementi della partizione considerata.
Dimostrazione.
1. Mostriamo che le classi di equivalenza rispetto ad una relazione 7Z sono gli
elementi di una partizione di X. Infatti ogni elemento a e X sta in una classe
poich ogni a Inoltre a appartiene ad una sola classe; infatti se
a [c]%, c 6 X, si avrebbe a lic e quindi [a fa = [ c ] tz (cfr. Teorema 4.1).
2. Viceversa, sia {A,j i /} una partizione di X e si consideri la relazione 71
cos definita:
per x,y e X poniamo xTly <&x,y A,.
Si verifica in modo immediato che R una relazione di equivalenza su X e
quindi segue la tesi.
Relazioni binane tra insiemi 51

Definizione 4.12 Introdotta una relazione di equivalenza R su un insieme X,


l insieme delle classi di equivalenza prende il nome di insieme quoziente di X
rispetto a R e lo si indica con X I ti.
Osservazione 4.3 Con la frase passare al quoziente ' si intende identificare
elementi di un insieme fra loro equivalenti rispetto ad una relazione R data.
Esempio 4.9 Sia T linsieme dei triangoli del piano euclideo. Le note relazioni
di congruenza e di similitudine sono relazioni di equivalenza (verificarlo).
Esempio 4.10 Sia X = {1,2,3,4,5,6 ,7} e sia Y = {{1,3},{2},{4},{5,6,7}}. Os
serviamo che Y una partizione dellinsieme X e individua, pertanto, la relazione
di equivalenza q su X cos definita:

6 = {(1,3),(3,1),(5, 6 ),(5,7),( 6 ,7),(6,5),(7,5),(7, 6 )} U Ix .


Esercizio 4.4 Nellinsieme N x N, si consideri la relazione q c o s definita.
(a,b)Q(c,d) <=> a + d = b + c
e si mostri che una relazione di equivalenza.

Diamo ora un esempio importante di relazione di equivalenza la relazione di


congruenza mod n in Z.

4.3 Relazione di congruenza in Z


Definizione 4.13 Sia X = Z, a.h Z ed n un intero n > 1. Si dice che a
congruo a b modulo il e lo si scrive1
a = b(modn)
se 3 h Z tale che
a b = hn.
Proposizione 4.1 La relazione di congruenza (mod/i) una relazione di equi
valenza in Z.
Dimostrazione.
Propriet riflessiva
Va Z a = a(modn) : infatti a a = 0 n.

Propriet simmetrica: sia a = b(modn) => Ih Z tale che a b = h n: ma


anche b a = (h) n , con (h) Z e quindi b = a(mod;i).

1Questa notazione dovuta a Gauss (dal suo trattato Disquisitiones Anthmeticae' - 1801-1
52 Capitolo 4

Propriet transitiva: a = b(modn) => 3/ij Z tale che a - b = h\ ,


b = c(mod/i) => 3/i 2 Z tale che b c = I12 n.
Sommando membro a membro si ottiene
a c = (/? 14- /12) n h 1 + / 2 Z
da cui segue che a = c(mod/i).
Fissato n > 1, linsieme Z pu essere ripartito in classi di congruenza ottenute
includendo in una stessa classe tutti e soli gli z Z a due a due congrui tra loro
modulo n. Quindi la classe di congruenza individuata da jc
[jc] = (x + hn\ h Z} = {y Z| > = jc(mod/i)}.
Proposizione 4.2 Fissato n > 1, si hanno esattamente n classi di equivalenza
distinte, che possono essere rappresentate dai numeri 0 , 1 , . . . ,n 1. L insieme
di queste classi di congruenza indicato con il simbolo Z e viene usualmente
chiamato insieme delle classi di resti modulo n Si ha quindi
= {[0]n, , [ r t - 1]}.

Dimostrazione. Sia jc Z; per Talgoritmo della divisione 3! q,r Z tali che


.r = nq + r, con 0 < r < n. Si ha quindi che jc = r(m odn), cio [x] = [r].
Daltro canto, due classi U],[y] con 0 < x < y < n sono sempre distinte.
Infatti se [x]n = [y]n avremmo x = y(modn) cio n sarebbe divisore di y).
Poich x e y sono entrambi minori di n lunica soluzione a: y = 0 da cui
segue x = y.

Osserviamo ora i legami che sussistono tra le operazioni di somma e di prodotto


definiti in Z e la relazione di congruenza modulo n.
Proposizione 4.3 La relazione di congruenza (mod n) compatibile con le ope
razioni di somma e di prodotto di IL, cio se a,b Z da a = b(modn) e
c = d (mod n) segue
a + c = b + d(modn)

a c = b d(modn).
Dimostrazione. Poich a = >(modn) e c = d (mod n) esistono h,k Z tali che
a - b = hn, c - d = kn. Sommando membro a membro otteniamo
(a b) 4- (c d) hn 4- kn
cio (a + c) - (b + d) = (h 4- k)n , da cui segue a 4- c == b 4- d(mod n).
Analogamente, essendo a - b + hn, c = d 4- kn, moltiplicando membro a
membro, si ottiene
ac = (b + hn)(d 4- kn) bd 4- {bk 4- hd 4- hkn)n =$ ac = bd(m odn).

Valgono anche le seguenti propriet


Relazioni binane tra insiemi 53

Proposizione 4.4 Sia n > 1 e siano a, b, t Z, t > 0

1. se a = (m o d n) allora a ' = /?'(m odn);

2. se a = b(modn) allora n \ a n\b.

Dimostrazione.

1. Per ipotesi si ha che 3h e Z tale che a b = hn. Quindi.


a1 b' (a b)(af~l 4- a~2b 4- . . . 4- b'~ l) =
= hn(a~] 4- a~2b 4 - ... 4- b '_1)

da cui a1 = bl (mod n).

2. Per ipotesi sia a b = hn ed a = <7. Allora b = a - hn = nq nh =


n{q /i), da cui si ha
Il viceversa segue sfruttando la propriet sim m etrica della relazione di congruenza
e scambiando b con a.

4.4 Criteri di divisibilit


Le congruenze modulo n sono strumenti di grande utilit nello studio delle pro
priet aritmetiche degli interi. Per esempio giocano un ruolo primario nella dimo
strazione dei cosiddetti criteri di divisibilit
Nel Capitolo 3 ci siamo occupati della scrittura di un intero in base n , in
particolare nel caso in cui n = 10. Abbiamo visto che, dato un intero a > 0, se
a= 1 . . . ri ro si pu scrivere:
a = r/, 1O^1-+r/,_j 1O^1 1 -f- . . . + ri 10 4- ro 10^\ r/, 0 h > 0.
Osserviamo ora che 10 = 0(mod2) = 0(mod5) = 0(mod 10). e quindi anche
10' = 0(mod 2) = 0(mod 5) = 0(mod 10) = 0(mod 100) Vt > 2
Possiamo quindi enunciare il seguente

Criterio 4.1 Dato un numero


a = rh IO7* + r/,_i 10/,_1 4- . . . 4- r, 10 -h r 0 * 10, rh ^ 0, h > 0
s ha che
a divisibile per 2 se e solo se 2|ro, cio se e solo se ro {0,2 4,6.8};
a divisibile per 5 se e solo se 5|r 0 cio se e solo se r 0 {0,5};
a divisibile per 10 se e solo se r 0 = 0 ;
a divisibile per 100 se e solo se r0 r{ = 0 .
Osserviamo ora che, poich 10 = l(mod3) = l(mod9), si ha il seguente
54 Capitolo 4

Criterio4.2 Dato7 = *1O^1+/*/,_!* 10/# ]-K..-fri*10-f-^o'10 , ^ 0, h > 0,


si ha che:
3 |a <31(r;, + r/,_ 1 + . . . + r\ + ro)

9\a 9|(r/, + r/,_i -f- . . . + r\ + ro)


cio 3, (rispettivamente 9), dividono un numero intero a se e solo se 3 (rispettiva
mente 9) ne dividono la somma delle cifre.

Criterio 4.3 Dato un numero intero a , nelle ipotesi dei precedenti criteri, allora
|11 se e solo se 11| o ( l) '^ , cio, come noto, un numero divisibile per 11
quando, eseguita la somma delle cifre di posto pari e la somma delle cifre di posto
dispari, la differenza un multiplo di 11.

Dimostrazione. Osserviamo che


10 ==-l(m o d 11) e quindi 102 = l ( m o d l l ) ......... 10r = (l ) r (m od 11 )
Si ha quindi che

1 se t pari
10f = ( - 1)' = 1 se t dispari

Allora a = n , ( - l ) h + r/,_i(l)'1 1 + . . . + r t (1) 4- r0(mod 11) e quindi


llla lU C rU -iy 1 + r/l_ i ( - l ) ,,_1 + . . . + n ( ~ l ) + r0).

Osservazione 4.4 Si possono enunciare molti altri criteri di divisibilit, m a que


sti presentati sono quelli pi utilizzati perch pi vantaggiosi.

Problema 4.1 Enunciare un criterio di divisibilit per 22, 23, 24, . . . ,2".
Problema 4.2 Enunciare un criterio di divisibilit per 25.
Problema 4.3 Enunciare un criterio di divisibilit per 7.

i l 4.5 Congruenze lineari


Sar capitato talvolta al lettore di porsi un quesito analogo al seguente: se nel-
Vanno 2004 il Natale caduto di sabato, in quale giorno della settimana cadr nel
2007<> Dopo aver osservato che tra il 25 Dicembre 2004 e il 25 Dicembre 2007
non cade alcun 29 Febbraio (cio tra il 2004 e il 2007 non ci sono anno bisestili)
denotiamo 1 giorni della settimana con le cifre da 0 (domenica) a 6 (sabato) e
rispondiamo al quesito determinando un intero x, 0 < x < 6 tale che
x = 6 + 3 365(mod7)

a == 1101(mod7) = 2(mod7).
Relazioni binarie tra insiemi 55

La risposta sar quindi marted. In generale, se volessimo sapere quando si


terr la -esima prima teatrale di una stagione iniziata di gioved, tenendo conto
che ogni rappresentazione in cartellone per 26 giorni, numerando come prima i
giorni della settimana con le cifre 0 , 1, . . . , 6 , vogliamo trovare un x, 0 < x < 6 .
tale che
x = 4 + ( l)26(mod7).
Per esempio la terza prima sar di domenica, poich, per = 3 si ha:
x = 4 4- 52(mod 7) = 56 = 0(mod 7).
Se volessimo sapere quante prime cadono di marted dovremo risolvere la con
gruenza in cui lincognita :
2 = 4-1- ( 1) 26(mod 7)
cio otterremmo
26 = 24(mod 7)

5 = 3(mod7)
cio
[5u ]7 s [5]7 []7 = [3]7 .
Poich 5 2 = 10 = 3(m od7) la risposta [n]7 = [2]7 , quindi la seconda, la
nona e cos via.

Abbiamo cos introdotto il concetto di congruenza lineare, che ora precisiamo

Definizione 4.14 Dati a, b e Z, n > 1, si dice congruenza lineare l'espres


sione ax = >(mod n) e ogni intero xq tale che axo = h{mod //) si dice soluzione
della congruenza.
Proposizione 4.5 Posto d = m cd (aji), la conguenza lineare ax = (m od)
ha soluzione se e solo se d\b.
Dimostrazione. Se lintero xo soluzione della congruenza ax = (mod) al
lora:
ax o = hn, h e Z.
Posto d = MCD(tf,), 3, h Z tali che a = ad, n = hd sicch, sostituendo,
dx o = hhd => = d(xo hh)
da cui si ottiene d\b.
Viceversa supponiamo che d\b cio che esista b e Z tale che = db. Essendo
d = MCD(a,n) esistono s, t Z tali che d = as 4- ut da cui si ottiene:
= db = (as -f nt)b asb 4- ntb
56 Capitolo 4

cio
a(sb) = b(modn)

e quindi sb soluzione.

Proposizione 4.6 Sia ax = b{modn) ( ) una congruenza lineare: se x una


soluzione, lune e sole le soluzioni sono della fortna x x 4 - kh ( ) con
fc Z, zi = - , e d - mcd (a,n ).
d
Si hanno quindi esattamente d soluzioni non congrue mod n .

Dimostrazione. Sia x una soluzione della congruenza (*), cio sia ax = b + hn,
con h e Z : verifichiamo che anche x = Jc + kh soluzione. Infatti:

ax = ax + akh = b + hn + akh = b + hn + kn = b + (h 4 - k)n

da cui si conclude che ax = b(mod n ).


Supponiamo ora che x' sia una soluzione della congruenza ( ) e verifichiamo
che x della forma ( *). Infatti:

ax = b(modn) = ax(modn)

quindi esiste k Z tale che

a(x' x) = kn.
Poich a = d ed n = dfi, semplificando si ottiene:

(x/ Jc) = kh.

Essendo MCD(,n) = 1 segue che a\k e quindi 3k e IL tale che k k.


Sostituendo si ottiene:

(x' x) = akh =$x' x = kh

e quindi si conclude che x' = x + kh.

Contiamo ora quante sono le soluzioni distinte.


Sicuramente jc, x + h, x + 2h,... , x + (d - 1)h, sono soluzioni distinte della
congruenza (*).
Sia ora jc = x + rii, unaltra soluzione: mostriamo che t ( 0 ,1 ,... ,d 1}.
Infatti, dati t e d esistono q ed r, con 0 < r < d tali che t = dq 4 - r.
Sostituendo si ottiene:

x = ic + (dq + r)h - x 4- dqh + ni = x + rh +qn=> x = jc -f rn(m odn)


Relazioni binane tra insiemi 57

Esempio 4.11 Risolvere la congruenza lineare 3x + 6 = 0(mod 12):


Anzitutto riscriviamo la congruenza nella forma

3x = 6 (mod 12)

e quindi

3x = 6 (mod 12).

Poich m c d (3,12) = 3 un divisore di 6 , la congruenza ha soluzioni. Una di esse


x = 2 e quindi tutte e sole le soluzioni sono

x = 2 4- h4.

Il caso precedente ci fornisce loccasione per porci il seguente problema

ac = bc(modn) implica oppure no che a = b(modn)l


Consideriamo lesempio (controesempio) seguente: n = 3, a = 5, b = c = 3. Si
ha che 3*5 = 3* 3(mod 3) ma 5 f 3(mod 3).

Si ha invece la seguente

Proposizione 4.7 Siano a , b , ce7L tali che ac = bc(modn) con m c d (c.n) = 1.


Allora a = b{modn).
Infatti, per ipotesi esiste un h e IL tale che ac bc = hn, da cui si ottiene
che (a b)c = hn ed essendo c ed n coprimi si deduce che n\(a b) e quindi
a = (mod zi)-

Esercizio 4.5 dire se sono risolubili le seguenti congruenze e, in caso affermati


vo, determinarne le soluzioni:

1. 3x = 8 (mod 4).

2. 5x = l(m o d l0 ).

3. 3x = 2(mod(5).

4. 50x = 8 (mod 7).

4.6 Sistemi di congruenze lineari


Vogliamo ora affrontare i sistemi di congruenze lineari, enunciando il cosiddetto
Teorema cinese dei resti, che probabilmente deriva il suo nome dalla pi antica
parte a noi pervenuta dellopera matematica attribuita al cinese Sun-Tse.
58 Capitolo 4

Teorema 4.3 (cinese del resto) Siano n \M2- nr interi positivi a due a due co
primi e b\.b2... br numeri interi. Allora:
1. il sistema di congruenze lineari

ammette soluzioni.
2. Sec una soluzione, ogni altra soluzione del tipo c' = c(mod n \ti2 * nr).

Dimostrazione.
1. Indichiamo con N nirt2 -**nr econ N,- = n i 2 *** nr N /n t.
Poich m c d = 1, per f ^ j , segue che N, e n, sono coprimi e quindi ha
soluzione ogni congruenza del sistema ausiliario

N\y = 1 (modni)
Njy = 1 (modn 2)

Siano yi,y2, ... , tali soluzioni. Poich V i si ha che = b,(m od,),


ponendo
r

2. Sia c' una soluzione del sistema (***). Allora d == bt(modM() = c(m odn,) V i
e quindi n,\(c - c) per ogni i. Poich mcd (n ,,n j) = 1. segue che N\(c' c).
cio c ss c(modiV).

Osservazione 4.5 II teorema cinese del resto fornisce una condizione sufficiente
affinch un sistema di congruenze lineari ammetta soluzione. Tale condizione non
e per necessaria, come mostra l'esempio seguente.
Esempio 4.12 Si consideri il sistema di congruenze lineari
x = 1 (mod)
jc = 1 (mod4).
Relazioni binarie tra insiemi 59

Dalle ipotesi si ha che esistono h, k e Z, tali che x = 1 + h6 e r = 1 - k 4


Uguagliando siottiene che h6 = k4, cio h3 = k2 e quindi 2| h e 3|k. Si pu
scrivere h = 2/z, k = 3& e quindi abbiamo le soluzioni x = 1 + 6 - 2 h y h e Z
(cio x = l(m od 12)).

Esempio 4.13 Si determinino le soluzioni del seguente sistema di congruenze


lineari
| x = 21 (mod 3)
| x = 13 (mod 7)

Poich m c d (3,7) = 1, il teorema cinese del resto garantisce che ci sono soluzioni
e le determiniamo seguendo il procedimento suggerito alla dimostrazione (che
di tipo costruttivo).
Il sistema ausiliario
i ly = 1 (mod 3)
j 3> = 1 (mod 7)
N = 3 7 = 21, N\ = 7, A^2 = 3. Soluzioni delle equazioni ausiliarie sono
jy, = 1, 3/2 = 2. Le soluzioni del sistema dato saranno pertanto
c = 27 7 - 1 + (-1 3 ) 3 (2)(mod21) =
= 189 + 78(mod 21) = 267 (mod 21) = 15(mod 21).

Esercizio 4.6 Dire se i seguenti sistemi di congruenze lineari ammettono solu


zioni e, in caso affermatico, determinarle:

| x = l(m od4)
| 3x = 2 (mod 5)

2x = l(m od5)
3x = 2 (mod 10)

[ x = 3(mod 4)
3. j 5x = 4(mod3)
( 6x = l(m od7)

j 2x = 5(mod 3)
| x = l(m od9)

4.7 Relazioni dordine


Una relazione V, su un insieme X si dice relazione d'ordine se gode cede pro
priet:

i) riflessiva: Va e X segue aV, a\


li) antisimmetnca: se a1Z b e b1Z a => a = b;

ii) transitiva: se all b e b1l c => alle.

Notazione 4.1 Una relazione 71 viene spesso indicata con il simbolo < e quindi
se all b si scrive a <b e si dice a minore od uguale a b

L'insieme X in cui sia stata introdotta una relazione d ordine < si indica con
il simbolo (X, <) e si dice insieme (parzialmente) ordinato.

Definizione 4.15 Due elementi a e b (X, < ) si dicono confrontabili se


a <b oppure b <a.

Definizione 4.16 Un insieme (X, <) si dice totalmente ordinato (oppure li


nearmente ordinato 0 catena) se, presi due elementi qualsiasi di X , essi sono
confrontabili.

Esempio 4.14 Sia N* linsieme dei numeri naturali non nulli e si introduca in N*
la relazione < cos definita
a < b <$ a \b
Tale relazione una relazione dordine; infatti valgono le propriet:

1. riflessiva: Va e N* si ha che a\ a;

2. antisimmetnca: se al b e fra 3 h,k e N* tali che ah b e bk = a, da


cui, sostituendo, si ottiene bkh = b cio kh 1 e quindi h = k \ da cui
segue a b\
3. transitiva: se a) b e fr c =} 3 r,s N* tali che ar = b c bs = c, da cui, I
sostituendo, si ottiene ars = c e quindi a\ c.

Osservazione 4.6 Linsieme (N*, <) dellesempio precedente, non totalmente


ordinato: infatti, per esempio, 2 e 5 non sono confrontabili, in quanto 2\ 5 e 5{ 2.

Definizione 4.17 Sia (X, <) un insieme parzialmente ordinato. Un elemento I


m e X si dice massimo per X se V>> X si ha y < m.

Definizione 4.18 Sia (X, <) un insieme parzialmente ordinato. Un elemento


r e X si dice minimo per X seVy e X si ha r < y.

Osservazione 4.7 Sia (X, <) un insieme parzialmente ordinato. Se Y C X,


allora Y parzialmente ordinato rispetto alla stessa relazione d ordine introdotta
in X.

Definizione 4.19 Siano (Y, <),(X, <) con Y C X . Un elemento s e X si dice


estremo superiore per Y (s = sup(Y)) se:1
1. Vy e Y si ha y < s\
Relazioni binarie tra insiemi 61

2. se c X e Vy e Y si ha che y < c allora s < c.

Definizione 4.20 Nelle ipotesi della definizione precedente un elemento j c X


si dice estremo inferiore per Y (j = inf(F)) se

1. Vy Y si ha j < y ;
2. s e d e X e V y e Y s i ha che d < y allora d < j.

Esempio 4.15 Sia A {1,2,3,5,15} C il* con f i1*, < ) come nellesempio
4.14. L'elemento 1 minimo per A, A non possiede nassimo, mentre 30 sup(A)
(si osservi che 30 A).

4.7.1 R ap presen tazione grafica di una relazione d ordine

Se (X . <) un insieme ordinato dotato di n elementi possibile rappresentare in


forma grafica la relazione dordine < nel modo seguente:

ogni elemento a X si rappresenta con un nodo (o vertice);


se a < b il nodo corrispondente ad a sta al di sotto del nodo corrispondente a b\
se a < b e non esiste alcun elemento c e X tale che a < c < b si congiungono
i nodi corrispondenti ad a e a b con uno spigolo.

Si ottengono i cosiddetti "diagram m i di Hasse 2.

Esempio 4.16 Sia X = [n e N*| az|24} = {1 2,3.4,6,8.12,24} e sia ordinato


rispetto alla relazione < definita come nellEsempio 4.14, (cio a < b <$ a b )
Abbiamo gi verificato che la relazione dordine in 11, quindi le propriet ri
flessiva, simmetrica e transitiva valgono anche se gli elementi appartengono a un
sottoinsieme di N \

Il diagramma di Hasse di (X, <) mostrato nella Figura 4 1

Figura 4.1

H Hasse (1898-1979) matematico tedesco, studioso di teoria algebrica dei numeri.


Esempio 4.17 Sia X = {1,2,3} e V{X) linsieme delle parti di X (cfr. Esem
pio 1.8). Introduciamo la relazione < cos definita
A<Bo A c B

Lasciamo al lettore verificare che (V{X), <) un insieme parzialmente ordinato.


Il suo diagramma di Hasse quello della Figura 4.2.

[a, b,c}

Figura 4.2

Esercizio 4.7 Disegnare il diagramma di Hasse dellinsieme Y = {y e N | vi 30}


rispetto alla relazione < definita (come nellEsempio 4.14) cio a < b = > a\b

Esercizio 4.8 Disegnare il diagramma di Hasse di ('P(X), <), dove la relazione


dordine ancora Vinclusione insiemistica e X = (a,b ).

4.8 Applicazioni
Siano A e B due insiemi non vuoti e sia (p una relazione binaria tra A e B .
Definizione 4.21 Diciamo che (p un applicazione (o funzione o mappa) tra A
e B se per ogni a A esiste uno e un solo b e B tale che (a,b) <p.
Di solito per indicare che <p unapplicazione tra A e B si scrive
<
p : A >B
e, invece di (a,b) e <f>si pone (p{a) = b.
A detto dominio e B codominio. Dalla definizione segue che assegnare una
applicazione vuol dire specificare anzitutto il dominio e il codominio e descrivere
poi il modo di operare di <p, cio, in altre parole, Va e A specificare (p(a).
Relazioni binarie tra insiemi 63

Definizione 4.22 Date due applicazioni 0 e \J/ esse coincidono se e solo se han
no lo stesso dominio A, lo stesso codominio B e se (pia) = xpia) Va e A.

Esempio 4.18

1. 0i : Z > Z ove 0 i = {Ce,*3))* e Z}. In questo caso 0 iU ) = jt3;

2. 02 : Z Z ove 02 = {(x,2x -f l)|x e Z}. In questo caso (p2ix) = 2x 4- 1.

Se 0 : A B unapplicazione ed a un elemento del dominio A , lelemento


(pia) detto immagine di a attraverso 0 e se consideriamo A' c A , Tinsieme
0 (A') = {(pia)| a G A '}, detta immagine di A' per 0 . Naturalmente contem
plato il caso limite in cui A' = A : in questo caso <p{A) = {(pia) a e A)
detta immagine delPapplicazione 0 .
Se, invece, consideriamo un elemento b e B , con la scrittura <p~'(b) indi
chiamo la totalit degli elementi a e A tali che (pia) = b, ovvero linsieme delle
preimmagini (o antiimmagini o controimmagini) di b.
Per esempio nel caso della 0i si ha 0i(2) = 8 , in altri termini limmagine di 2
attraverso 0 i 8 , mentre 0 2 1(5) = 2, cio 2 una preimmagine di 5 attraverso 02.
Osserviamo invece che non tutti gli interi relativi hanno preimmagine per
la 02: ad esempio lelemento 2 non ha preimmagine. Infatti J jc e Z tale che
(p2x) = 2x 4-1 2.
Preciseremo, tra poco, questa osservazione.

Definizione 4.23 Sia (p : A > B unapplicazione. Diremo che:

i) (p iniettiva se (p{a\) = (piai) implica che a\ = ai, ovvero se ogni elemento


di B ammette al pi una preimmagine;

ii) 0 suriettiva se (p{A) = B, cio seVb e B esiste almeno un a e A tale che


(pia) b, cio se ogni elemento di B ammette almeno una preimmagine;
iii) 0 bijettiva {o biunivoca) se sia iniettiva che surjettiva.

1. Consideriamo lapplicazione 0 i : Z Z definita precedentemente ((p\{x) =


*3 Vjc Z).
Essa iniettiva, infatti, se 0 i U i) = x \ = x\ = 0] {x2) si ha x 3 - x \ = 0 cio
(*i x2){x\ + x\x2 + = 0 da cui si deduce x\ = x2.
Ma 0i non suriettiva: infatti non tutti gli elementi di Z hanno retroimmagi-
ne. Basta considerare 5 Z: $z G Z tale che 0i(z) = 5 (lelemento \/5 Z).
Osserviamo che, se per dominio e codominio per 0i assumessimo R, allora
0 isarebbe biunivoca, quindi la suriettivit (e Tiniettivit) di una funzione dipen
dono dal dominio e dal codominio.
2. Lapplicazione (p2 : Z > Z definita precedentemente ( 02CO = 2.v -f 1)
ancora iniettiva ma non suriettiva.
64 Capitolo 4

3. Sia ora fa : Q > Q lapplicazione definita ponendo 0 3(x) = Essa


invece sia iniettiva che suriettiva.
a b
Infatti se <fo(a) = - = 03 (o) = - segue a = b (e quindi lapplicazione
X
iniettiva). inoltre Vv e Q esiste x Q tale che 0 3(x) = - = y. Basta prendere
x = 2) e si ha 03(2>O = y.
Osserviamo inoltre che se consideriamo il sottoinsieme K = {2x \ x e Z)
l'insieme delle immagini 03(X) = {x | x e Z] Z Q.

Definizione 4.24 Dato un insieme X, una qualsiasi funzione 0 da N a X si dice


successione di elementi di X e la si indica con il simbolo {an}eA/ ove cin fin).
Definizione 4.25 Dato un insieme X si dice che finito se esiste una applica
zione biunivoca fra X e /insieme {1,2,... m ] C N. Il numero n si dice ordine o
cardinalit di X e si scrive |X| = n.
Esercizio 4.9 Considerate le applicazioni 0 i e 02 dellesempio 4.18:
1) Determinare 0 i(-2 ), 0i(3), 02( - l ) , 02(4).
-1 -1 -1 -1
2) Determinare 0j 1(27), 0 t ( - 8), 0 21(1), 0 2 (-3 ), 0 2 (9).
3) Per ciascuno degli elementi dellinsieme A = {0,1,2,6,7,8 , 4, 5}, dire se
ammettono preimmagine {sia attraverso la (p\ che la fa) e in caso affermativo,
determinarle.
Esercizio 4.10 Si consideri lapplicazione f : Z x Z - + Z x Z definita da:
f{a,b) {la - b,?>b).
Si dica se le seguenti affermazioni sono vere oppure false:
1. f iniettiva.
2. f suriettiva.
3. /(3,4) = (2,8).
4. /-K2,0) = (l,0).

4.9 Alcune tecniche di enumerazione


Siano A e B due insiemi finiti: A = {ai,<22........an} e B = {b\,>2, . . . ,bk).
Ci proponiamo di contare quante sono le applicazioni tra A e B , quante sono
le applicazioni iniettive e quante le applicazioni biunivoche.
Da quanto detto inizialmente, per descnvere unapplicazione occorre preci
K.
sare oltre al dominio e al codominio anche il modo in cui agisce Vapplicazione su
ogni elemento del dominio.
Relazioni binarie tra insiemi 65

a) Contiamo le applicazioni. Sia f una applicazione da A a fi. Allora / (a -


pu essere scelta in k modi diversi (perch limmagine di a\ pu essere un
qualsiasi elemento di B). Analogamente f{ a 2) pu essere scelta in k modi
e cos pure limmagine di ogni altro elemento di A. Quindi per ogni scelta
di f( a x ) ,f( a 2) , . . . ,f(a) si ha unapplicazione diversa e si pu concludere
che le applicazioni tra A e B sono

k k . . . k = k".
V
n volte
Esem pio4.19 Siano A = {ax,a2,a3} e B = {b\,b2) Allora linsieme delle
applicazioni tra A e fi, spesso denotato con il simbolo fi'4, ha 8 elementi, preci
samente
f a 1 b\ a x bx ax > b 1 ( a -b x
fi = I 2 > b\ f2 a2 * bx fa a2 b2 f a - j a2 hi
[ a3 b[ a3 > b2 a3 - bx 1 a3 > b2

(tx > b2 (ax >b2 X > b 2f a x -> b2


f 5 = l a 2 > bx fa = \ 2 > b
, f i | *2 * b2 fa - \ a2 - > b2
[a 3 bx l C*3 ---- > b2 I a 3 > bx 1 a3 b2
Chiaramente, delle 8 applicazioni sopra descritte, per la natura del problema, nes
suna iniettiva, mentre la f\ e la / 8 non sono neppure sunettive

Proposizione 4.8 Siano A e B due insiemi finiti con lo stesso numero n di de


menti e sia f : A * B unapplicazione. Allora f iniettiva se e solo se f
suriettiva.
Dimostrazione. Sia / iniettiva. Allora |/(A )| = \A\ ma 4 = B quindi
|/(A )| = \B\. Poich /( A ) C B segue che f ( A) = B, cio la / suriettiva.
Sia / suriettiva. Allora f ( A ) = B da cui segue che f ( A) = B l Poich
per ipotesi | | = \A\ segue anche |/( A ) | = |A cio elementi distinti di A
hanno immagini distinte e quindi / iniettiva.

Contiamo ora il numero di applicazioni iniettive tra gli insiemi


A = {aha2.........an} e B = [b\,b2, ... ,bk}

supponendo che k > n. Il discorso analogo a quello fatto per coniare le applica
zioni tra A e fi : si deve solo tener conto del fatto che elementi distinti debbono
avere immagini distinte, quindi f(a\) pu essere scelto in k modi diversi, ma
f(a 2) dovr essere diverso da f{ax) e quindi potr essere scelto solo in A: 1
modi distinti, f{a f) potr essere scelto solo in k 2 modi e cosi via, quindi si
ottiene che
\BA\ = k(k - 1)(* - 2 ) . . . (* - n + 1) = Dk.
(disposizioni di k oggetti di classe n).
66 Capitolo 4

c) Nel caso in cui |A| = \B\ = /ri allora le applicazioni iniettive tra A e R sono
anche suriettive e quindi bijettive ed

\B\ n(n - l)(/i - 2 ) . . . 2 1 = ni

Esempio4.20 Sia A = {a\,a2,a^},B = {b\,biM )\ le 6 applicazioni bijettive


tra A e B sono
* fri fri * >2
-> bi >3 * fri
> fr2 * /?3

1 b > >3
/4 = ai * fr? f5= > fr2 /6 = * fri
l3 * i > fri

Nel caso in cui A coincida con 5 si parla di applicazioni .sullinsieme A e tra


queste c sempre lapplicazione identica (o identit) IA : A > A definita
ponendo IA(a) = a, per ogni a A.

Definizione 4.26 Se X un insieme, unapplicazione bijettiva f : X * X s


dice trasformazione su X e, se X finito, si dice permutazione. L insieme delle
trasformazioni su un insieme X si indica con Sx e, nel caso in cui \X\ = n, lo si
indica con il simbolo S. Per quanto detto precedentemente |S | = ni.

4.10 Prodotto di applicazioni


Definizione 4.27 Date due applicazioni f e g con f : A > B e g : B C ,
s definisce prodotto delle due applicazioni lapplicazione g o f : A * C cos
definita:
( g /)(<*) = g[f(a)], Va A.
Si verifica che il prodotto di applicazioni associativo, cio per ogni terna di
applicazioni / , g, li
f : A > B, g ;B C, h : C >D

( og) o / = h o (g o / ) .
Per ogni applicazione / : A B si ha che / B o / = / o /A = / , mentre
in generale il prodotto non commutativo, come si pu vedere considerando il
seguente

Esempio 4.21 Siano / : M + R e g : R * R cosi definite:


Relazioni binarie tra insiemi 67

f ( x ) = 2x, g(x) = 2x + 1
si ha che
(g o / ) ( * ) = g [ /( * ) ] = g ( 2x) = 2(2*) + 1 = 4* 4 - 1

( / o g)(*) = / [(*)] = f(2 x + 1) = 2(2* + 1) = 4* + 2.


Chiaramente le due applicazioni / e g sono diverse: infatti, considerando ad
esempio il numero reale 0 , si ha (g o / ) ( 0 ) = 1 mentre ( / o g)( 0 ) = 2
Proposizione 4.9 Siano f : A * B e g . B > C due applicazioni.
i) Se f e g sono iniettive allora g o f inettiva;
ii) Se f e g sono suriettive allora g o f suriettiva,
iii) Se f e g sono bijettive allora g o f bijettiva.

Dimostrazione. C hiaram ente baster dimostrare i) e n) perch la iii) seguir di


conseguenza.
i) Siano ai,a2 A e sia (g o / ) (a \) = (g o f ) ( a2) Allora g[f(a\)] =
g [f (^ 2)] e liniettivit di g implica che f ( a 1) = f ( a 2). Poich anche / miet
tiva, segue che a\ a2.
il) Sia c C , allora la suriettivit di g com porta lesistenza di almeno un
b e B tale che c = g{b), d altro canto anche / sunettiva, quindi esiste almeno
un a e A tale che b = f (a). Sicch
c = g(b) = g [/( )] = (g o f )(a)
e a preimmagine di c attraverso g o f. m
Corollario 4.1 Sia X un insieme. Il prodotto di trasformazioni su X ancora
una trasformazione su X, in particolare se X fiuto, il prodotto di permutazioni
ancora una permutazione.
Esempio 4.22 Sia X = {1,2,3} e siano

due permutazioni.

1 3
a or = 2 2 infatti
3 1
(o -o r)(l) = <T[r(l)] = <T(2) = 3

(c r o r)(2) = a [ r (2)] = er(3) = 2

(cr o r)(3) = o [r(3)] = cr(l) = 1


Consideriamo ora r o r = z~. Abbiamo
irr)(l'i = 3, (r o r)(2) = 1 (r o r)(3 ) = 2

Definizione 4.28 Se due applicazioni f : A > B e g : B > A sono tali che


g o f = l\ si dice che g invena sinistra di f e che f inversa destra di g . Se
f o g = /$ si dice che g invena destra di f e che f inversa sinistra di g. Se
valgono entrambe le relazioni si parla di inversa (bilatera).

Esercizio4.11 Sia / : A B unapplicazione. Provare che / ammette in


versa sinistra se e solo se / iniettiva, ammette inversa destra se e solo se /
sunettiva.

Esercizio 4.12 Data l'applicazione / : Z x Z - Z x Z definita ponendo:


f{a.b) = (a + 2b,2b), dire se f iniettiva e/o suriettiva.
Esercizio 4.13 Date le applicazioni f e g : Z x Z - ^ - Z x Z definite ponendo:
f{a,b) = (a + 2b, - b) e g(c,d) = (~c,3d), determinare le funzioni composte
f o g e g o /. Per ciascuna di esse dire se iniettiva e/o suriettiva.
Esercizio 4.14 Si consideri Vapplicazione h : Q x Q -> Q x Q, definita
ponendo h(x,y) = (x + 2>\ - x + y) :

1. verificare che h iniettiva;


2. determinare lafunzione inversa sinistra;
3. dire se lapplicazione h anche suriettiva.

Esercizio 4.15 Date le applicazioni f : Z -> Q, g : Q+ R, definite da:


zi^ + 1
fin) - g{q) = y/q per ogni n e IL e per ogni q Q+,
s detennin lafunzione composta f o g e si dica se iniettiva e/o suriettiva.
5
Elementi di teoria dei grafi

5.1 Grafi semplici orientati e non orientati


Ogni uscita un'entrata
verso qualche altro posto
(T Stopparci)

Nel linguaggio colloquiale si fa uso indiscriminato della terminologia relativa ai


grafi: per esempio quando parliamo di albero genealogico per studiare longine
e la discendenza di una famiglia o quando parliamo di radice linguistica come
elemento irriducibile presente in tutta una famiglia di parole o quando descrivia
mo una rete elettrica o rappresentiamo una molecola o descriviamo un torneo di
tennis...

Tutto questo pu essere formalizzato a partire dalla definizione di grafo

Definizione 5.1 Un grafo G una coppia ordinata (V(G),E(G)) ove V(G)


un insieme non vuoto di elementi detti vertici o nodi di G mentre E(G) una
famiglia di coppie non ordinate di elementi di V(G) detti lati o spigoli.

In questa trattazione considereremo sempre grafi finiti, cio grafi in cui Tinsieme
dei vertici V ( G) finito.
In modo naturale possibile rappresentare un grafo attraverso un diagramma
in cui i vertici sono individuati da punti e due vertici a e b sono collegati da un
segmento se e solo se (a,b) e E(G).
Osserviamo che la famiglia di spigoli E(G) formata da coppie (a.b) non
necessariamente distinte.

Esempio 5.1
V(G) = {a,b,c } E(G) = {{a,a)f(a,a),(a,c)Aa,b),(c,b),(cM
70 Capitolo 5

Figura 5.1

Se a.b sono vertici di G e v = (a,b) e E(G ) si dice che a e b sono adiacenti e


se due lati v w hanno un vertice in comune, diremo che v e w sono incidenti.
Un lato del tipo {a,a) si dice loop.

In genere un lato (a,b) si indica con la scrittura abbreviata ab.

Definizione 5.2 Un digrafo D (o grafo orientato) una coppia (V{D).A(D))


ove V{D) un insieme finito, non vuoto, di vertici e A (D ) una famiglia finita
di coppie ordinate di elementi d V(D), dette archi (ovviamente (v,w) = vw
wv = (tu,u)).
Definizione 5.3 Dato un vertice v V(G), si indica con q ( v ) il numero dei lati
incidenti av e lo si dice valenza (o grado) di v.
Un loop, per convenzione, d contnbuto 2 al grado di un vertice, un vertice
di grado 0 detto isolato mentre un vertice di grado 1 detto term inale.

p(a) 4
p(b) 3
p(c) 2
p(d) :1
Pie) :0

Figura 5.2

Lemma 5.1 (delle strette di mano) La somma dei gradi di tutti i vertici di un
grafo un numero pan, esattamente eguale al doppio dei lati.
Dimostrazione. Infatti poich ogni lato ha 2 estremi, il numero che rappresenta
gli 'estremi di lati 2 \E{G)\. Daltro canto ogni u V (G) estremo di q (v)
lati sicch
2-\E (G )\= Y . ew
^ VV(G)
Elementi di teoria dei grafi 71

Corollario 5.1 Ogni grafo ha un numero pari di vertici dipari.


Dimostrazione. Poich Jf, Q(v) un numero pari, supposto di suddividere
veV(G)

linsieme dei vertici V(G) in 2 sottoinsiem i disgiunti, quello dei vertici con grado
pari V\(G) e quello dei vertici con grado dispari Vi{G) si ha

Y Q(v) = Y G(v) - Y giv)


^eV2(G) veV,G) iV| IG)
Essendo il secondo m em bro un numero pan segue la tesi.

Definizione 5.4 Un grafo in cui ogni vertice ha la stessa valenza (o grado) r e


detto grafo regolare di grado r.
In particolare regolare il grafo che ha vertici e non ha lati, cio il grato in
cui |V(G)| = n e E{G) = 0 che detto anche grafo nullo su n vertici ed
indicato con N n

Esempio 5.2 N 3 (Figura 5.3)

. b

a
C

Figura 5.3

Esempio 5.3 Grafo regolare di grado 2 con \V(G)\ = 4 e q(v) = 2, per ogni
v V{G) (Figura 5.4)

a >------------ - b

<i------------
C *d
Figura 5.4

Definizione 5.5 Un grafo G senza loop in cui 2 qualsiansi vertici distinti siano
adiacenti detto grafo completo e indicato con Kn ove n V(G)
72 Capitolo 5

Esempio 5.4 Grafo completo K4 e K$ (Figuia 5.5)

Figura 5.5

Definizione 5.6 Sia G un grafo: si dice sequenza di spigoli una successione


finita di spigoli di G della forma
VqVi ,Vi V2........ Vr\Vr (*)
Il numero r degli spigoli detto lunghezza della sequenza.
o Se nella sequenza (*) tutti i nodi sono distinti si parla di catena aperta.
0 Se gli spigoli sono a 2 a 2 distinti si dice che (*) un cammino dal vertice
Vo al vertice vr.
0 Una catena chiusa, tale cio che il vertice iniziale e finale coincidano, di
lunghezza almeno 3, detta ciclo 0 circuito.
Definizione 5.7 Un grafo G si dice connesso se per ogni coppia di vertici v,iv
distinti esiste un cammino da v a w.
Si conviene di considerare connessi il grafo K\ N i e ogni grafo con 1 solo
nodo.
Un grafo pu essere spezzato in sottografi disgiunti detti com ponenti connesse,
definendo una relazione sull'insieme dei vertici di G che risulta essere di equi
valenza, ritenendo due vertici i> e uu equivalenti se o coincidono o se esiste un
cammino da v a w.
Definizione 5.S Un grafo G connesso si dice euleriano se esiste in G un cam
mino chiuso che contiene ogni spigolo di G.
L attributo euleriano della definizione data sopra, deriva da Leonhard E uler padre
della teoria dei grafi. Eulero (1707-17&3) inizi il suo trattato con la discussio
ne di un problema che da allora viene indicato come il problema dei ponti di
Knigsberg',
Knigsberg, citta della Prussia orientale, situata sulle sponde e sulle isole
del fiume Pregel. Le varie parti della citt erano collegate da 7 ponti. D i dome-
nica i cittadini compivano il giro della citt. 11 problema era come fare questa
Elementi di teoria dei grafi 73

Figura 5.6

passeggiata in modo tale che partendo da casa uno potesse ritornarvi dopo aver
attraversato ogni ponte una e una sola volta (*).
Naturalmente il problema ha un equivalente in termini di grafi e consiste nel
chiedersi se il seguente grafo euleriano (Figura 5 7).

Figura 5.7

La risposta al quesito negativa ed contenuta nel seguente teorema


Teorema 5.1 Sia G un grafo connesso con \ V(G) j> 1. G euleriano se e solo
se q(v) pari per ogni v G V (G), cio se e solo se ogni vertice ha grado pari.
Esercizio 5.1 facile provare che un grafo completo Kn ha lati e che un
grafo regolare di grado r su n vertici ha ~rn lati.

5.2 Alberi e arborescenze


Definizione 5.9 Un grafo semplice connesso un albero se non contiene cicli e
un grafo le cui componenti connesse sono alberi detto foresta
Esempio 5.5 Sono alberi di ordine 4 i grafi della Figura 5.8.
Figura 5.8

Il seguente Teorema caratterizza gli alberi con n vertici:

Teorema 5.2 Sia G un grafo con |V(G)| = n. Allora le seguenti affermazioni


sono equivalenti:

i) G un albero;

ii) G connesso e ha n - 1 lati.

interessante e curioso osservare che la terminologia degli alberi, in teoria dei


grafi, ha origini botaniche e genealogiche. In molti casi, un vertice particolare
pu essere designato come radice e quindi si pu assegnare una direzione ad
ogni lato a partire dalla radice.

Esempio 5.6 Cosideriamo lalbero della Figura 5.9, Se indichiamo con r la ra


dice e con a, b, c nodi, si ottiene un albero con radice.

Figura 5.9

Definizione 5.10 Un grafo semplice orientato V V (V,A) un'arborescenza


di radice r se r un vertice di T e se per ogni altro vertice x esiste un unico
cammino dar a x.
Detto T un albero, se u un vertice di T distinto dalla radice r, il genitore di
v l'unico vertice w tale che esista un arco u>u. In queste ipotesi v figlio.
Vertici con lo stesso genitore sono fratelli/fratellastri. Sono antenati di un
vertice v, oltre alla radice r, quei nodi che si trovano sul cammino da r a v. I
discendenti di u sono quei vertici che hanno v come antenato. Un vertice di un
Elementi di teoria dei grafi 75

albero chiamato foglia se non ha figli mentre detto vertice interno se ha


figli.
Osserviamo che la radice sempre un vertice interno, a meno che sia lunico
vertice del grafo, nel qual caso una foglia.

Esempio 5.7 Spesso le definizioni ricorsive possono essere illustrate da un albe


ro, eventualmente infinito.
Per esempio la successione dei numeri di Fibonacci (confronta Esempio 2.13 e
Figura 2.1).

Inoltre si possono rappresentare con alberi con radice oltre agli alberi genea
logici, Porganigramma di unazienda, lorganizzazione dei programmi e dei file
in un computer, i risultati di tornei ad eliminazione diretta, ecc.

Definizione 5.11 Si dice albero n-ario un albero con radice, in cui ogni vertice
ha al pi n figli.
L'albero detto pienamente n-ario se ogni vertice ha esattamente n figli
Se n = 2, Valbero si dice binario.

In particolare gli alberi binari hanno notevoli e varie applicazioni nel campo del
linformatica e delleconomia.

5.3 Alberi sintattici

Gli alberi sintattici ci permettono di rappresentare espressioni contenenti parentesi


e di dedurne altre senza parentesi. Per meglio comprendere ci, si pensi alla logica
delle proposizioni, al calcolo booleano, allaritmetica in S, ove, accanto ad ele
menti di un insieme, si utilizzano operazioni unarie o binarie in cui le espressioni
contenenti parentesi sono del tipo:

(-A ) ( B v C ) <=> (A A C)

[(3<2) -I- 5] x (ir 7) + 14c ecc.

Con un albero binario possibile rappresentare ciascuna delle espressioni scritte


sopra tenendo conto che:

1. gli operatori unari (negazione, complementazione, funzione potenza, . )


sono nodi con un figlio a sinistra e nessun figlio a destra;

2. gli operatori binari (addizione, moltiplicazione, .. ) sono nodi con un figlio


a sinistra e uno a destra;

3. la lettura dell'albero deve ridare la formula.


Esempio 5.8 Sia data la seguente formula:
((3 x a) + 8) x (b - 5) + c :

l'albero associato :

Figura 5.10

La scrittura senza parentesi, con operatore postposto :


3a x 8 + x>5 c+
Analogamente con loperatore preposto.

5.4 Algoritmo di Huffman

Lalgoritmo di Huffman una procedura utilizzata per la compressione dei dati di


un testo e porta alla costruzione di un albero. La procedura pu essere schematiz
zata come segue:
1. si legge il testo e si crea una lista di nodi, uno per ogni carattere del testo, con
lindicazione della frequenza con cui ciascun carattere compare;
2. si ordina la lista a partire dai caratteri meno frequenti;
3. due nodi, Ci, C2, con frequenza pi bassa (rispettivamente N\ e N2) ven
gono cancellati dalla lista e divengono figli di un nodo fittizio C\ * C2 con
frequenza data dalla somma delle frequenze N\ + N2,
Esempio 5.9 Consideriamo il testo
ARATRO
Si ha la seguente tabella di frequenza:
Elementi di teoria dei grafi 77

Carattere A R T O
Frequenza 2 2 1 1
Poich T ed O hanno le frequenze pi basse, li associamo ottenendo una nuova
tabella in cui compare il carattere fittizio T *0:
Carattere A R T *O
Frequenza 2 2 2
Poich ora tutti caratteri hanno la stessa frequenza, ne associamo due qualsiasi,
per esempio R e T *0. Otteniamo la tabella:
Carattere A R*T *O
Frequenza 2 4
Si termina associando A a R *T *0 e otteniamo:
Carattere A*R*T*0
Frequenza 6
Lalbero binario associato mostrato in Figura 5.11.

A*R*T*0

Figura 5.11

Partendo dalla radice e arrivando alla foglia corrispondente al carattere si ottiene-


Carattere A R T 0 1

Codifica 0
10 110
--------------------- .
111
e quindi la parola Aratro si scrive, in linguaggio binario
010011010111
Per riottenere la parola originaria, basta ripercorrere lalbero.
Esempio 5.10 Trovare linsieme prodotto A x B x C, ove
A = {a,b,c) B = {1,2},C = {D,V}
e disegnarne il grafico.
78 Capitolo 5

Quindi
A x B x C = {(fl,1. 0 ),(a .^ V ),(fl, 2 ,O),(i 7, 2 ,V),(/?, l , Q )>(/? j V)

(6,2,d),(^2,V),(c, l,D),(c, 1, V ),(c,2,D ),(c,2, V ) }

b
c

Esercizio 5.2 Dimostrare che


possiede 11 vertici. un albero pienamente binario con 5 vertici interni.
6
Algoritmi ed elementi di teoria
della complessit

Un tempo esistevano molte domande


per le quali non cerano risposte.
Oggi, neHera dei computer,
ci sono molte risposte per le
quali non abbiamo nemmeno
pensato alle domande
(Peter Ustinov )

Letimologia della parola algoritmo s perde nella notte dei tempi e risale al mate
matico persiano Al-Khwrizml. Questa parte del cognome indica la provenienza
della sua famiglia dalla regione di Khwarizm a sud del lago Arai e fu tradotta in
latino col vocabolo algorismus da cui algoritmo
Indica una procedura meccanica che accetta un certo numero di dati iniziali
(input) per ciascuno dei quali previsto un risultato finale (output) dopo un nu
mero finito di passi. Naturalmente per fare ci necessario assegnare un numero
finito di istruzioni. Per programma, invece, si deve intendere unespressione o
una sequenza di espressioni in un certo linguaggio che sia una concreta realizza
zione di un algontmo.
Lanalisi di un algoritmo prevede, pertanto, il riconoscimento degli input e
degli output, il listato delle istruzioni e la dimostrazione che lalgoritmo conver
ter gli input in output in un numero finito di passi.
Cominceremo con lanalizzare un famoso algontmo, quello euclideo o delle
divisioni successive per la ricerca di un Massimo Comun Divisore ( m c d ) tra due
interi, che in prima battuta considereremo positivi (per la definizione di m cd si
veda 3.4).

1. input: una coppia di interi positivi a,b con a <b\


output: mcd (a,b);
2. istruzioni:
(i) Posto a = ro e utilizzando lalgoritmo della divisione, si definisce una
80 Capitolo 6

successione di resti
b = aq\ + ri 0 < rj a

a = Q2r\ + r2 0 < ri < ri


ri = + r3 0 < r3 < r2

r2 q>i-\1 n\ T

(ii) Quando rn+i = 0, si ferma il procedimento (stop) e si pone

r = m c d ( ,/? )

(iii) 1 resti costituiscono una successione decrescente di interi non negativi


e un certo resto deve essere nullo, cio lalgoritmo term ina dopo un numero
finito di passi, perch, altrimenti, un altro resto pi piccolo sarebbe definito
dal punto (i). Per la verifica che r m c d si confronti il Teorem a 3.2.

La complessit di un algoritmo stima, sostanzialmente, il numero di passi affinch


lalgoritmo termini, in funzione della lunghezza dellinput. Come tale misurata
da funzioni / (n) ove n la lunghezza dellinput.
Sono in uso alcuni simboli di particolare espressivit per enunciare relazio
ni di confronto tra comportamenti di funzioni, tra questi ricordiamo i simboli
o,ae.

Data una funzione gin) la classe O {gin)) costituita dalle funzioni f i n ) per
le quali esistono li e t {h > 0) ed o N tali che per ogni n > /?o

0 < f i n) < hg(n)

cio il rapporto limitato superiormente.

La classe 2(g(n)) invece costituita dalle funzioni f i n) per le quali esistono


k R {k > 0) ed n i N tali che per ogni n > ni si abbia
0 5 kgin) < f i n)
fin)
cio il rapporto limitato inferiormente.
gin)
La classe B(g(n)) costituita dalle funzioni / (n) per le quali esistono /i,
k e R (fc, li > 0) ed n2 e N tali che per ogni n > n2 si abbia
0 < kgin) < fin) < hgin)
fin) v
cio il rapporto Imitato sia inferiormente, sia superiormente.
Algoritm i ed elementi di teoria della complessit 81

Esempio 6.1
/i(n) = n2 + 3 = 0 ( n 2).

/ 2(/ ) = nz 2n = Q(n2)

M n ) = t r - 2 n + 2 = 0 ( n 2).

Infatti:
n2 + 3 2 - 2/z n2 - 2n + 2
<4, - 1, 0 < < 1 (no = n\ = n2 ~
n Al ri

La complessit di un algoritmo, che si sviluppa in f(n) passi, si determina in tre


fasi successive:

1. si trova una funzione gin), i cui valori siano i pi piccoli possibili, tale che
f i n) = O igin))\
2. si descrive f i n ) usando simboli Q, ;
3. si determina la complessit media dellalgoritmo.

Osservazione 6.1 I pi comuni tipi di complessit sono


0 ( 1) costante

O (log n) logaritmica

O in) lineare

OC*) polinomiale a e R, a > 0

0 (2 ") esponenziale

Esempio 6.2 Se il k-e simo passo di un algoritmo si ottiene dopo k2 secondi, il


tempo necessario per compiere i primi n passi dato da

, , ^2 , ^2 i
1+2 +3 +...
,+ 2 = n(n + l)(2n + 1)
----------------------

che O in7').

Esempio 6.3 Nel caso dellalgoritmo euclideo per la ricerca de! vcd la sua com
plessit risulta essere logaritmica.
82 Capitolo 6

Dimostrazione. Per provare questo dobbiamo, anzitutto, studiare quante sono le


divisioni effettuate. Cominciamo con losservare che V j , vale la disuguaglianza
rj+2 < -r,. Infatti si possono presentare due casi:

1
1* Ser ;+1 < -r } si ha

1
(a) 0+2 <
1
2. Se invece o+i > - r; si ha

1
(a) o n < 0+1 < rJ
e, quindi, dividendo r} per o+ i si ottiene

0 = 1 O+i + 0+2
e quindi

1
0+2 < O +i - 2 rJ

Poich ogni 2 passi il resto pi che dimezzato e non scende m ai sotto il valore
l, si pu concludere che ci sono al pi 2[lg2 divisioni cio che lalgoritm o
logaritmico.
7
Introduzione alle strutture algebriche

Operate secondo le regole


dellAlgebra e deHAlmucabala
(Allievi di Musa al-Khowanzmi,
autore di Al-jabr wal-muqabala 1 )

Cominciamo con lintrodurre il concetto di operazione tra insiemi, tenendo conto


che abbiamo gi abusato nelluso di questa nozione ogniqualvolta abbiamo tratta
to, per esempio, laddizione o la moltiplicazione fra interi

Siano, pertanto, X , Y, Z tre insiemi.

Definizione 7.1 Si dice operazione tra X e a valori in Z una qualunque ap


plicazione g : X x Y -> Z. Se {x,y) e X x Y, l elemento z = g{x,y) detto
risultato delVoperazione sulla coppia (x,y).
Quando i tre insiemi coincidono, g si dice operazione su X o legge di com
posizione interna su X.

Esempio 7.1 In N la somma e il prodotto ^ono leggi di composizione ma lo


pure la legge che associa a ogni coppia di interi non nulli (a.b), il loro
mcd (7,b ) = ( / e N (cio loperazione a b = d).

Esempio 7.2 In Z la somma e il prodotto sono leggi di composizione ma Io


pure la legge o : (a, b ) e Z x Z - + a 2 + b2 e Z (cio a o b a2 + b2).

Le operazioni sono in genere denotate con simboli quali, per esempio, * c .


+, D, #, o , , . . .

Dora in poi, tratteremo operazioni su un insieme X e ci occuperemo delle


loro propriet.

1Libro scritto nell820 d.C Parte del nome deHautorc ha dato luogo alla parola algoritmo <ctr Capitolo 6)
mentre il titolo del libro fu dapprima corrotto in Algebra e almucabala" e infine abbreviato in Algebra
Definizione 7.2 Un 'operazione su un insieme X si dice

associativa se V a,bx e X (a * b ) * c = a * (b + c)
commutativa se Va,b X a b = b a.

Esempio 7.3 1. Le usuali operazioni di somma e prodotto in N, Z, IR, C sono


sia commutative, sia associative.
2. Loperazione definita neHesempio precedente

o : (a,b ) e Z x Z - > t r + / ? 2 e Z

commutativa: infatti a ob = a2 + b2 = b2 + a2 = b o a, ma non associativa,


come mostra la seguente scelta

(5 o 4) o 3 = (52 + 42) o 3 = (25 + 16)2 + 9 = 1681 + 9 = 1690

5 o (4 o 3) = 25 + (16 + 9 )2 = 25 + 625 = 650 1690.

Esempio 7.4 Sia Z linsieme delle classi di resti modulo n. Poich la relazione
di congruenza modulo n compatibile con la somma e il prodotto definiti in Z
(cfr. Capitolo 4), le seguenti leggi:

[Hi + [Hi = [a + Hi
[a] I H = [a H i
definiscono operazioni in Z.

Definizione 7.3 Un elemento us X si dice unit sinistra o elemento neutro a


sinistra se Va X si ha us a = a\ un elemento uj e X si dice unit destra o
elemento neutro a destra se Va e X si ha: a * uj a. Si parla di unit bilatera
riferendosi ad un elemento u e X tale che: u +a = a u a.

Inoltre se loperazione su X dotata di unit bilatera u, si ha la seguente:

Definizione 7.4 Un elemento xs X inverso sinistro per l elemento x X


se :cs * x = u; un elemento inverso destro per lelemento x X se
x* Xd = u. Si parla di inverso bilatero riferendosi a un elemento x X tale
che x *x x *x = u.
Esempio 7.5 L'operazione di somma tra interi relativi dotata di elemento neu
tro (il numero zero) e ogni intero relativo ha inverso additivo, usualmente detto
opposto.

Esempio 7.6 Loperazione di prodotto tra inten relativi dotata di elemento neu
tro (il numero 1); gli unici elementi invertibili di Z sono 1 e 1.
Introduzione alle strutture algebriche 85

Diamo, ora, alcune propriet relativamente al concetto di unit e di inversi).

Proposizione 7.1 Sia : X 2 X unoperazione rispetto alla quale u sia unita


a sinistra e Ud sia unit a destra. Allora us = Ud = u, cio unit a sinistra e unta
a destra coincidono e si ha unit hilatera. Inoltre us e Ud sono univocamente
determinate.

Dimostrazione. Poich us unit a sinistra, si ottiene us * Ud Ud, poich u


unit a destra us + Ud = us , per la transitivit delluguaglianza segue = Ud.
Se ci fossero due distinte unit a sinistra us e us si avrebbe, u * us u
poich s unit a sinistra, s us = s poich us anche unit a destra, da cui
otteniamo us s.

Proposizione 7.2 Sia : X 2 X unoperazione associativa dotata di unit


bilatera u. Se l elemento x ammette un inverso sinistro xs e un inverso destro x,/.
allora inverso sinistro e inverso destro coincidono e sono univocamente determi
nati.
Dimostrazione. Poich loperazione associativa si ha

( X 5 X ) Xd = X s * {X Xd)

cio u Xd = xs u da cui Xd = x,s. Inoltre se xs fosse un altro inverso sinistro,


ancora lassociativit di garantirebbe che
(Jc* x) x s = x s (x jcJ

cio
u xs = xs u
poich anche inverso destro per il punto precedente. Da cui i s = ,xs.
Consideriamo, ora, il caso in cui linsieme X sia finito, cio X = {ai,02. - xi !
Unoperazione

: X 2 X
pu essere descritta assegnando una tabella n x n. ove allincrocio tra la riga
/-esima e la colonna j -esima posto lelemento a, a}.

a\ tr
aj an
ai

a,
a, a,

an
86 Captolo 7

1 problemi che si possono presentare in questo caso sono di due tipi: leggere
una tavola interpretando dati (per esempio, come propriet delloperazione *
su X) e viceversa data unoperazione su un insieme finito costruire la tavola di
composizione. Vediamo alcuni esempi relativi a entram be le situazioni.

Esempio7.7 Sia X = [a,b,c] e si consideri la tavola di com posizione di X


rispetto alloperazione

1a b c
a 11 a b c
b b c a
c | c a b
Si osserva che lelemento a funge da elemento neutro rispetto a mentre le
lemento c inverso (bilatero) di b e analogamente b lo di c. Poich la tavola
simmetrica rispetto alla diagonale principale loperazione commutativa.

Esempio7.8 Sia X = (a,b,c,d } e sia:


0 a b c d
a a b c d
b b b d d
c c d c d
d d d d d

la tavola di composizione di X rispetto alloperazione o .


Anche in questo caso la simmetria della tavola rispetto alla diagonale prin
cipale garantisce la commutativit delloperazione, inoltre osserviamo che a
elemento neutro bilatero ed l'unico elemento invertibile.

Esempio 7.9 Vogliamo ora costruire la tavola di composizione delloperazione


somma di classi di resti in Z4.
Occorre ovviamente ricordare che la somma di classi cos definita:
[ah + [b]* = [a -f bl4 e che [0]4 = [414, [1]4 = [5]4 e [2]4 = [6 ]4.
Sicch
+ [014 [1]4 [2]4 [3]4
1014 [04 uu [2]4 [314
[1]4 i Ul4 [214 [314 [014
[214 [214 [314 [OI4 [114
1314 1314 [014 [1]4 [214
Definizione 7.5 Si dice struttura algebrica un insieme X su cui sono definite
delle operazioni *2 , . . . Essa viene normalmente indicata con il simbolo
(X, , *2 . .
Introduzione alle strutture algebriche 87

1. (Q ,+ ) una struttura algebrica ma anche (Q , 4 v ) lo .

2. Se X un insieme, allora (V (X ), fi) e (V (X ), U) sono strutture algebriche.

Vediamo, ora, come raffrontare due strutture algebriche, che in prima battuta sup
poniamo entrambe dotate di una sola operazione.

Definizione 7.6 Siano ( X , ) e (7,#) due strutture algebriche. Esse si dicono


isomorfe se 3 una bijezione f : X > 7 tale che Vx\ X si abbia:
fix \ * * 2) = /C x i)# /C * 2), cio tale che f preseni l operazione.

La relazione di isomorfismo nellinsieme di tutte le strutture algebriche e una


relazione di equivalenza (provarlo!) e sottolineiamo che scopo dell'Algebra e
quello di studiare le propriet delle operazioni di una struttura algebrica indipen
dentemente dalla natura degli elementi dellinsieme base.

Pii in generale, date due strutture algebriche (\*) e (7.#), una applicazione
/ : X 7 tale che f ( x \ * x 2) = / ( * i ) # / (*2) usualmente detta omomorfi
smo; se / iniettva detta m onom orfism o e se / suriettiva epimorfismo.
Osserviamo che, se / bijettiva, ritroviamo il caso dellisomorfismo definito
sopra.
Un isomorfismo di (X,*) su se stesso si dice automorfsmo, mentre un omo
morfismo di (X,*0 si dice endom orfism o.

Esempio 7.10 Consideriamo ( Z , + ) ed (IR,-) e la corrispondenza / : Z R


tale che V/i e Z sia f i n ) = 2. Mostriamo che / un monomorfismo.
Infatti / inietti va poich se n m si ha / in) = 2n 2m = f (m ).
Inoltre f i n + m) = 2n+m = 2" 2m = / ( n ) firn).
Infine / non suriettiva poich non tutti gli elementi di R hanno preimmagine:
ad esempio 3 non ha preimmagine, poich non esiste nessun intero t tale che
m = ? = 3.

Prima di entrare nello specifico di alcune strutture algebriche, che saranno


argomento dei prossimi capitoli, vogliamo precisare il comportamento di certi
sottoinsiemi dellinsieme base X , rispetto all'operazione ivi definita.

Definizione 7.7 Sia : X 2 > X un operazione su X e sia Y c X non vuoto.


Diciamo che Y chiuso rispetto alloperazione , se Vvi. y2 e Y vi * >2 7

Esempio 7.11 Consideriamo l operazione di somma tra interi relativi, cio con
sideriamo (Z ,+ ) e il suo sottoinsieme dei numeri pari, usualmente indicato con
2Z. Si verifica che 2Z chiuso rispetto alla somma.
Infatti, se 2 z i , 2 z2 sono due generici interi relativi pan

\ 2zi + 2^2 2(zi + Z2) ^ 2Z.


Esempio 7.12 Se fissiamo lattenzione sulloperazione di prodotto tra interi re
lativi, cio se consideriamo (Z,-) e il suo sottoinsieme Y = \2S \ s > 0 }, s
verifica che Y chiuso rispetto al prodotto sopra ricordato.
Infatti. V vi, V2 Y, B s\,s2 > 0 tali che y = 2S' , y2 = 2S2 e quindi si ottiene
>i >2 = 2il 252 = 2Sl+S2. che ancora una potenza di 2 con esponente positivo e
quindi appartiene a Y.

Esempio 7.13 Sia Z6 linsieme delle classi di resti modulo 6 e sia + lopera
zione di somma di classi, La tavola di composizione di (Z ,-f ) la seguente:

-1- 1 [016 [IL [2]e [3L [4L [5L


[0]6 [0]6 [IL [2L [3L [4L [5L
[IL [He [2L [31e [4L [5]e [Ole
[2]e i 12]6 [3L [4L [51e [Ole [IL
[316 [316 [4L [5]e [0L [He [21e
[4]6 [4L [5L [Ole [IL [2L [3L
[516 1 [5]6 [0]6 [IL [2L [31e [4L

Esempio 7.14 Ancora in si consideri loperazione di prodotto di classi.


La tavola di composizione di (Z ,-) la seguente:


[0L [IL [2L [3]e [4L [5L
[0L [Ole [0L [Ole [0L [0L [Ole
[IL ! [Ole [He [2L [3L [4L [5L
[2L | [0L [2L [4L [0L [2L [4L
[3L [Ole [31e [0L [3L [Ole [31e
[4L [Ole [4L [2L [0L [4L [2]e
[5L 1 [Ole [51e [4L [3L [2L [IL

Esempio 7.15 Se Y {[0L,[3L) C Z, si ha che la tavola di composizione di


(E,+) la seguente:

4- [Ole [3 ]6

[Ole [Ole [3 ]6
[3 L O le [0]s

e quindi Y chiuso rispetto all operazione + (cf r. Definizione 7.7).


Introduzione alle strutture algebriche 89

Esercizio 7.1 Nell'insieme H = Z x Z = {(x,y)\x, y Z} si consideri l ope


razione cos definita:
(x,y) * (z.t) = (x -\-z,yt).
Si stabilisca se commutativa, associativa e si determinino gli elementi inverti
bili.

Esercizio 7.2 N ellinsieme G = Q x Q = {(x,y)\x, y e Q}, ove 2 e / insieme


dei numeri razionali si consideri l operazione o cos definita:
U,;y) o { z J ) = (xz,yz + 2/).
Si stabilisca se commutativa, associativa e se ammette elemento neutro.

Esercizio 7.3 Nell'insieme C = I x R = {{a.b)\a. b e 3}, ove R l insieme


dei numeri reali, si consideri l operazione o cos definita

*3
(a,b) o (c ,d ) = (ac bd.ad 4 - bc).
Si verifichi che l operazione o associativa e commutativa. Si determini inoltre
lelemento neutro e l insieme degli elementi invertibili.
8
Algebra delle matrici

Come il ferro in disuso arrugginisce,


cos linazione sciupa lintelletto
(Leonardo da Vinci)

Il calcolo matriciale gioca un ruolo primario nellalgebra lineare, in particolare


ogniqualvolta i dati possono essere organizzati sotto forma di tabella
Questo atteggiamento mentale facilita, tra 1 altro, l 'implementazione dei da
ti stessi e la creazione di algoritmi risolutivi. Un esempio per tutti costituito
dallutilizzo delle matrici per analizzare e risolvere sistemi lineari, anche molto
complessi.
Cominciamo pertanto col definire formalmente cosa intendiamo per matrice

Definizione 8.1 Diciamo matrice di tipo (m ai ) e la indichiamo con il simbolo


Mmxn, una tabella di m x n elementi appartenenti a un campo K (in particolare
noi considereremo K = M) e ordinati secondo m righe ed n colonne. Una tabella
di questo tipo si dice a doppia entrata .

Di solito gli elementi di M = Mmxn, indicati con il simbolo m ^ono in


dividuati da un doppio ndice, ove il primo (i = 1. 2 . .. m indica la riga di
appartenenza e il secondo ( j = 1,2 ___ n) indica la colonna

m u m 12 mi*
l Z21 m i2 * fn 2n
M Mmxn = (m ij) -
_ mm\ tnm2 ** Mmn _

Osserviamo che le matrici del tipo

R = R\j = (rj i ,r i 2, ** ,r\n) [ r * r ' :


%. n.j
92 Capitolo 8

con una sola riga, s chiamano anche vettori riga, mentre quelle del tipo

Cil \ ~ Cli
C21
C = C,\ =

^Hll _ 1_

con una sola colonna, si chiamano anche vettori colonna1* .


Nel caso in cui il numero delle righe uguagli il numero delle colonne (cio
sian = m). la matrice M = Mxn, si dice quadrata di ordine n.
Accanto a ogni matrice M = Mmx possibile considerare la matrice da
essa ottenuta scambiando le righe con le colonne, detta matrice trasposta di M e
indicata con il simbolo M7 , Ovviamente M 1 di tipo (n,m ).

10
12 3
Esempio 8.1 Sia M , la sua trasposta M 7 = 2 1
0 15
3 5

immediato osservare Tidempotenza della trasposizione, cio che vale l'ugua


glianza (M7)7 = M.

Sia ora M una matrice quadrata di ordine n.

Definizione 8.2 La matrice M = Mx simmetrica se M M 1 ; si dice


emisimmetrica o antisimmetrica se M = M r .

Esempio 8.2 La matrice


"1 2 0
A = A 3x3 = 2 5 - -4
_o - -4 3 _
una matrice simmetrica, mentre la matrice
0 2 8
B = #3x3 = -2 0 -4
-8 4 0

emisimmetrica.

Osservazione 8.1 In una matrice simmetrica gli elementi sono distribuiti sim-
metncamente rispetto alla diagonale formata dagli elementi an aji, , a , det
tadiagonale principale, cio si ha che at, a ^ y i j . In una matrice emisim
metrica si ha a,} - a Jt, (1 < i < n, 1 < j < ), e gli elementi della diagonale
principale sono tutti nulli.

11vettori riga e colonna si possono trovare indicati, anche in questo lesto, sia con le parentesi tonde, sia con
le parentesi quadrate
Algebra delle matrici 93

Definizione 8.3 Una matrice M quadrata di ordine n detta triangolare supe


riore (o triangolare alta) se gli elementi al di sotto della diagonale principale
sono tutti nulli. In maniera analoga si definisce la matrice triangolare inferiore
(o triangolare bassa).

Esempio 8.3
"1 2 3
A = A3x3 = 0 5 -4
_0 0 3_

triangolare alta, mentre


1 0 0
B = #3x3 = -2 2 0
-8 4 1
triangolare bassa.

Definizione 8.4 Una matrice D = (dtJ), quadrata di ordine n . si dice diagonale


se gli unici elementi eventualmente non nulli stanno sulla diagonale principale,
cio se d,j = 0 , Vi ^ j.
V

Esempio 8.4 E diagonale la matrice


10 0
D #*3x3 = 0 0 0
0 0 3
e pu essere talvolta indicata con il simbolo D = dag( 1, 0 , 3).

Naturalmente una matrice diagonale anche triangolare bassa e triangolare


alta, ma non vero il viceversa.

Osservazione 8.2 Tra le matrici diagonali ricordiamo le matrici In. identiche di


ordine n, in cui gli elementi della diagonale principale sono uguali a 1 e gli altri
elementi sono uguali a zero. Per esempio
10 0
10
h = h = 0 10
0 1
00 1
In generale, introdotto il sim bolo di K roneker 8tJ cos definito

1 sei = j
*0 = < 0 sei ^ j

la matrice identica / pu essere indicata brevemente nella forma: In =

Introduciamo ora, poich sar utile nel seguito, la nozione di matrice a scala
94 Capitolo 8

Definizione 8.5 Una matrice (non necessariamente quadrata), si dice a scala


se le eventuali righe formate solo da zeri sono le ultime e, per ogni riga non tutta
nulla, il primo elemento diverso da zero situato su una colonna di almeno una
posizione pi a destra rispetto ai primi elementi non nulli delle righe precedenti.
Il primo elemento non nullo di ogni riga detto pivot.

Esempio 8.5

0 12 3 4
0 0 5 3 1
A=
0 0 0 12
0 0 0 0 0

una matrice a scala; pivots sono 1, 5 , 1.

Esempio 8.6

12 0 1
B= 0 0 32
0002

una matrice a scala; i pivots sono 1,3,2.

Dopo aver introdotto il concetto di matrice e prima di procedere a introdurre


operazioni, osserviamo che due matrici A = (a,j) e B = (>,7) sono uguali se

i) sono dello stesso tipo (m, n),

ii) hanno gli elementi ordinatamente uguali, nel senso che si ha atJ = b,j,
Vi = 1 ,2 ,... ,m, V j= 1 ,2 ,... ,n .

8.1 Operazioni nell'insieme delle matrici

8.1.1 Somma di matrici

Indicato con Marmxn(R) la totalit delle matrici di tipo (m,n) a coefficienti reali,
introduciamo loperazione di somma

+ : Matmxn{R) x Matmxn{R) - Matmxn(R ) :


con la seguente

Definizione8.6 Date due matrici A = (a,/), B = (btJ) e Matmxn(R), diciamo


somma di A e Bla matrice C = (c0) e M atmXn(R) ; cui elementi sono c,, =
aij + btjy i = 1,2, . . . ,m, Vj = 1,2 , . . . ,n. J
Algebra delle matrici 95

Esempio 8.7 Siano

2 3 4 -1
1 0 1 4

allora
-1 6 2
A + B = C
0 2 4

La prima osservazione che sorge spontanea, analizzando la definizione di somma


sopra riportata, che la somma matriciale ncondotta alla somma di elementi
del campo su cui sono definite le matrici (nel nostro caso il campo reale). Ne
scaturisce, pertanto, che le propriet godute dalla somma matriciale sono in stretto
rapporto con quelle della somma fra scalari.
Date le matrici

A = (ay) B = (btJ), C = (cj) e (Matmxn(R),+)

Vi = 1,2, . . . ,m Vy = 1 ,2 ,... ,n

valgono le propriet seguenti :

i) A + B = B + A (propriet commutativa): infatti

aij + b,j = b,j 4- cijj.

ii) A + (B + C) = (A + B) + C (propriet associativa): infatti

&ij 4" (b,j 4- c,j) = (d[j + b,j) -L ctj .

iii) Esiste in Matmxn(R ) una matrice, detta m atrice nulla e indicata con 0 (i
cui elementi sono tutti uguali a 0 ) tale che
A 4 -0 = 0 4 -A = A.

iv) Per ogni A = (atJ) esiste in Ma tmxn(R) una matrice, detta opposta di A e
indicata con A = (a^), tale che

A 4- (A) = (A) 4~ A = 0.

Si pu pertanto concludere che V insieme Matm(IR) delle matrici di tipo (m,n)


a coefficienti reali, rispetto alloperazione di somma sopra definita un gruppo
abeliano.

Esercizio 8.1 Sia A una matrice quadrata: verificare che la matrice S = Ar 4- A


una matrice simmetrica, mentre la matrice R = A 7 A emisimmetnca.
96 Capitolo 8

8.1.2 Prodotto esterno

Passiamo ora a considerare una nuova operazione , detta p ro d o tto esterno

: 1 x Matmxn{R) -* M atmxn{R)

Deinizione 8.7 VX 6 R e VA G Matmxn(R) si definisce prodotto esterno di


X per la matrice A, /a matrice X A dello stesso tipo di A, i ct/i elementi sono
ottenuti moltiplicando ordinatamente per X tutti gli elementi di A.

Esempio 8.8 Sia

12 4 1
A=
0 12 x = ;

allora

possibile studiare le propriet che legano la somma matriciale con il prodotto


esterno.

Proposizione 8.1 Date


A = (a,,). B = (b.j) (Afa/X(R), + ,) K e R
valgono le seguenti relazioni:

v) (X + p) - A = X A + p A;

vi) X*(A + fi) = X- A + X- Zi;

vii) (X/z) A = X (p A);

viii) 1 A = A.

Dimostrazione. Dimostriamo, come esempio, la propriet v)


(X + p.) A = (X 4- p) (,;) = ([X 4- /z]<J /) = (Xa,7 + pdij) =
= (Xa,; ) + (po,j) = X A -f- p A

Raffrontando quanto detto sopra con la definizione di spazio vettoriale (cfr. Ca


pitolo 11), possiamo concludere che Tinsieme Matmxn(R ) delle matrici di tipo
(m,) a coefficienti reali, rispetto alla somma e al prodotto esterno definiti sopra,
costituiscono uno spazio vettoriale.
Algebra delle matrici 97

Tra laltro questo ci permette di osservare che la generica matrice A (a,,), pu


essere espressa come combinazione lineare a coefficienti reali di matrici

E fik ( & i j ) ^ A i u t m XW(R ),

cos definite
e,j = 1 se h e j = k
e,j = 0 negli altri casi.
Esempio 8.9 In M at 2X3 si ha
' 10 0" "0 1 0 " o o r
11 = 0 0 0 j En = 0 0 0J E l3 = 000
1 ___ 1

1------- 1
0 0
0 0
0

'0 0 0 " ro 0 0'


21 = E 22 = 0 10 Eh 0 0 1

La generica matrice

a b c
G A/t/2x 3 W
d e f
si pu pertanto scrivere nella forma
A = a E\\ + b E \2 + cE \i + ^ 2 1 + ^22 + / 23-

8.1.3 P rodotto rig h e p er c o lo n n e

Cominciamo a considerare due particolari matrici, la matrice riga

R in = [ Hi H 2 ** fin ]
e la matrice colonna

Cn1 = [ c u C12

e consideriamo il prodotto o cos definito

c 11
R\n 0 Cn\ = [ r\\ r\2 r\n ] o
_ Cfl\ _
H i^ n + r 12C21 + + /*Icn\ R.
In particolare si vede che il risultato della composizione di un vettore di tipo (1,/iJ
(cio R\n) per uno di tipo (n ,l) (cio Cn1) una matrice di tipo 1 x 1 cio un
numero reale.
98 Capitolo 8

Esempio8.10 Verificare che, presi tre vettori R i, Cni, Dn valgono le jCo


distributive del prodotto rispetto alla somma. ^
Infatti se R[ e Ci sono definiti come sopra e

-d
%
Dn =

_di _
si ha
"cu " 'd n '
m
^ln 0 (Cnl + Dn\) = [ Tu r \2 *

+

V _C\ _ _ dn\ _
cu + d\\
= [*i r i2 r ln ]o
_ dni _
= r 11(^11 + dn) + ri 2(c2i + d 2i) + . . . + rn(cni + dn\)

- OiQi + rj2c2i + ... + rici) 4- (m dn + di2c2i + . . . + dici) =

"cn ~d\\ ~
= l r U r 12 ** f'in ] O
r

+ [ m r i2 r\n ] 0

_ci _ _ dn1 _
R[n 0 Cn\ -f R\n O Dn1

Siamo ora in grado di definire il prodotto righe per colonne tra due opportune
matrici.

Definizione 8.8 Due matrici A e B si dicono conformabili o moltiplicabili se


il numero di colonne della prima uguale al numero di righe della seconda.
Siano ora A e fi due matrici conformabili, cio
A Matn ;X*(R), fi Matm*k(R)
Consideriamo la matrice A come accostamento di m vettori riga r . r > ___ ,r
di tipo (kit) e la matrice fi ottenuta per accostamento di k vettori colonna
ci-ci ........i npo (mrI k Poniamo per definizione
r r f r o d r t oc: ri c c<
A B - | r 2 o Cj e-* o c> r 2 c c<
ZM W c e-
! : c* H ; r
L r o c : r_ c C' r* o c< J
Algebra delle matrici 99

ove il prodotto r, o c, == rn c\j -f rl2c2) + . . . r tncnjA < i < mA < j < k e


quello definito sopra (cfr. ( )).

Osservazione 8.3 Se A di tipo (m,n) e B di tipo (n,k) allora si vede che .


matrice prodotto C = A B di tipo (m,k).

Sappia il lettore che questo non lunico modo di definire un prodotto tra
matrici: si possono definire un prodotto colonne per righe, un prodotto colonne
per colonne o anche righe per righe, per, senza ultenon precisazioni quando
si parla di prodotto di matrici si intende sempre quello definito sopra righe per
colonne.

Esempio 8.11 Date le matrici

10
10 2
A= B = 0 1
1 13
1 1

calcoliamo il prodotto A B.

Osserviamo preliminarmente che A di tipo (2,3) e che B di tipo (3.2


Quindi le due matrici sono moltiplicabili La matrice prodotto A B sara di tipo
3 2
(2,2) e precisamente otteniamo A B =
4 4
Infatti
" 1 " 0

r, = [ l 0 2 ] r 2 = [1 1 3 ] c, = 0 C : = 1

1 1 .

e quindi

r t o ci = [ 1 0 2 ] o = 1 * i - uO 0 + 2- I = 3

qoe: = [10 2 o = L0 + 0*lr24=2

f : o C; = [ 1 1 3 e = M r L 0t M = 4

e infine
k t q*#fw
* * * < * i^ * J i s * A f c # * > y t f m ~
$m ^ i \ *v. $

$ %A

k <&& vout <xynvc$fc*w wn* seirie Ai $ w p fa & dta .


cmvvtan'hV kNCk&o k vnfrc* al tetWvt. ' ^ & $$oito

lYopavirionO 8.2 tatC V* mtTfiK A di Tip < m ^ ), # <fc (n j, v ^


<Er), w/ la propriet rmocativa, cio {A 8) - C = A - <# v\ f
^ p o s iz io n e 8.3\ite tre matrici: A di tipo (m ,w), S e C di tim n k) mh i
propriet distributiva {sinistra), cio vale l'uguaglianza t

A *(B + C ) = A ' B + A ' C.

Esercizio 8.2 Sotto quali condizioni sul tipo delle matrici A. #,C vale la pro
priet distributiva (destra), cio (A E B) C A C -f B C?

Esercizio 8.3 Sotto quali condizioni sul tipo delle matrici A e B possibile ef
fettuare il prodotto A B e il prodotto B * A?

8.1.4 Matrici quadrate di ordine n

Nel caso delle matrici quadrate di ordine n naturalmente valgono tutte le propriet
che abbiamo visto finora: le matrici quadrate sono dello stesso tipo (matnci in
Matmyn(R) con m = n ) e quindi costituiscono uno spazio vettoriale2.
Inoltre due matrici quadrate sono sempre moltiplicabili (prodotto righe per colon
ne) e il risultato ancora una matrice quadrata di ordine n.
Rispetto al prodotto, oltre a valere le propriet associativa e distributiva (sini
stra e destra) si ha che la matrice identica / (gi definita) funziona da elemento
neutro rispetto al prodotto, cio si ha che VA e M atnxn{R ) vale la relazione
A / = / A A.
Possiamo quindi concludere che l insiem e delle matrici quadrate di ordine
n, Matnxn(R), rispetto alla somma matriciale e al prodotto righe per colonne
un anello dotato di unit.

Vediamo ora di studiare gli elementi invertibili di Matnxn(R).

Definizione 8.9 Sia A M atnxn(R) ; una matrice B Matnxn(M) sidice


inversa di A se A B ~ B A ~ ln.

^Confronta ti Cartolo i 1.
AKjdtMa stente to t

PwqHUii nMie 8 .4 HkM 'M**VC \ % Wvl-**)|A^V '< .-'' < <*!*? V


*
VH>v ' \\t <& \v ;*'.iV W W t K t ? $WO%V-

IMmo\tu a s to n e $upfMmam |v t xswxlo che \ mMteOa due invece viofr d v


due mattivi e v # v <\ per le quali si abbia t f' H A I* <v*
Uehe A < V \ ~ , I hilzeatido la pixtpncD a v v i a t o a del
jyt colonne si a\ te b lv
C *= C * 4 = r 1A > ) * < ' A) # * l B - . che assunto.

Rmfte per aperto il problem a deH esistonza della matrice inversa, pwbk
ma che trover una risposta alla (ine del capitolo

Esercizio 8.4 Date le m atrici


1 5 i - 2 0 r -1 0 0*
A= 0 1 0 B r* -2 2 1 e C = 0 1 0
2 --1 - 1 1 -- i j 0 0 -t
J
svolgere i calcoli indicati:

1. A-B. fl-A, A - C . C - A . f l - C . C - / ?

2. A2 = A A ,B 2 = B B ,C 2 = C C

3. A -\~ B, A -H (T,3A,2B -|- 4 C

Esercizio 8.5 M ostrare che una matrice diagonale D di ordine tre pennuta con
qualsiasi matrice diagonale A e M a t^ iM ) e che il prodotto di due matrici dia
gonali D i, D2 Afai 3x 3(R ) ancora una matrice diagonale in Mat3X?(R).

8.2 Sistemi lineari

Vogliamo ora utilizzare gli strumenti matriciali precedentemente introdotti per


discutere la risolubilt dei sistemi lineari, ovvero dei sistemi di equazioni di primo
grado.
Cominciamo con il richiamare il concetto di equazione lineare.

Definizione 8.10 Un *equazione lineare (o di primo grado) nelle incognite


X\,X2, . . . ,xn a coefficienti nel campo K, un'equazione del tipo
a 1*1 + a 2*2 + . . . + anxn = b
Soluzione dell'equazione una n-upla ( i,a 2, . . . ,an) K n, che, sostituita al
posto di (x i,X2, . . . ,*), d luogo ad una identtCL

Esempio 8.12 Data lequazione 3*i + 5*2 4-*3 - 5 = 0, la tema {1. 1, - 3>
una soluzione.
102 Capitolo 8

Considerando simultaneamente m > 1 equazioni lineari nelle incognite


x\,x2. ... ,x, otteniamo il seguente sistem a
a \\X \ + *12*2 4- . . . 4 0 [nX n b\

<*2lX\+ 022X2 + . . . + a2nXn = b 2


.

.

(* )

4" &m 2 x 2 4 . . . 4" Om nX n b m

che si dice lineare, perch tutte le equazioni sono lineari (cio di primo grado).
In esso, come gi detto, x\,x 2, . . . ,xn sono le incognite, b\ b2, . . . ,bm sono i
termini noti (e appartengono a un campo K , che pu essere per esem pio il campo
reale R o il campo razionale Q), mentre gli sono i coefficienti delle incognite
(e appartengono anchessi al campo considerato).
Nel caso in cui tutti i b, siano uguali a zero, il sistem a si dice omogeneo.

Definizione 8.11 Una n-upla ordinata di scalari (a \,a 2, . . . ,a) appartenente


al campo K , che sia soluzione simultanea delle n equazioni del sistema ( *),
detta soluzione del sistema e il sistema stesso detto risolubile o compatbile.

Osservazione 8.4 Se il sistema omogeneo = 0,V/ = 1 , 2 , . . . ,n) diremo


che la n-upla (0 ,0 , . . . ,0) la soluzione banale.

Definizione 8.12 Due sistemi lineari sono equivalenti quando essi ammettono le
stesse soluzioni, ovvero quando le soluzioni dell'uno sono tutte e sole le soluzioni
dell'altro.

Naturalmente se ad alcune (o a tutte le) equazioni di un sistema si sostitui


scono un ugual numero di equazioni equivalenti, il nuovo sistema equivalente al
sistema dato. Invece si ha la seguente

Definizione 8.13 Dati due sistemi di equazioni, si dice che il secondo sistema
conseguente al primo se ogni soluzione del primo anche soluzione del secondo,
ma non vale necessariamente il viceversa.
Esempio 8.13 Dato il sistema

| 3* i + 2*2 = 5
| 4*i + 8*2 = 4

esso equivalente al sistema

| 3*i + 2*2 = 5
( *i 4- 2*2 = 1
Esempio 8.14 Dato il sistema

i 4*i + 2*2 +*3 = 5


| *i + 2*2 = i
l 4*i + 4*2 + * 3 ~ 6
Algebra delle matrici 103

esso conseguente al sistema

' 3jtj + 2*2 + * 3 = 5


*i + 2*2 = 1
. *i =3

8.2.1 M atrici s to c a s tic h e e c a te n e di M arkov

Questo capitolo ha lo scopo di illustrare alcune applicazioni di tipo probabilistico


di vettori e matrici. noto che la probabilit ha come fine lo studio di esperimenti
casuali non deterministici: storicamente essa ha inzio con lo studio dei giochi di
sorte dalle carte, alla roulette, ai dadi ecc, per arrivare, ai giorni nostri, a forni
re modelli matematici di fenomeni casuali in campo economico, finanziano, ecc.
Cominciamo col ricordare che linsieme di tutti i possibili esiti di un dato esperi
mento detto spazio campionario ed indicato usualmente con Q e un particolare
esito detto punto campionario o campione. Un evento un insieme di esiti, cio
un sottoinsieme dello spazio campionario. Si dice evento elementare, revento
{a}, a Q. Anche linsieme 0 e Q, sono eventi: 0 detto evento impossibile, 2
evento certo o sicuro.

Esempio 8.15 Si getti un dado e sia A levento: si presenta un numero pari Lo


spazio campionario Q = {1,2,3,4,5, 6 } e levento A = {2,4,6}.

Naturalmente si possono combinare eventi per formarne dei nuovi, utilizzan


do le varie operazioni sugli insiemi: unione, intersezione, complementazione ecc.
In particolare se A e fi sono due eventi tali che A fi fi 0, essi si dicono eventi
incompatibili.

ASSIOMI di PRO BA BILIT


Dato uno spazio campionario Q, sia P(2) la classe degli eventi. Una funzione
p : ViSl) detta m isura di probabilit, se valgono i seguenti assiomi:
1. VA e V ( Q ) 0 < p(A) < 1.
2. p(Q) = 1.
3. Se A e fi sono eventi incompatibili, cio se A fi fi = 0, allora
p(A U fi) = p(A ) + p(B).
4. In generale, se A i , A 2, una sequenza di eventi incompatibili, allora
p(A\ U A2 U ) p(A \) + p(A2) +

Si pu dimostrare, ma questo esula dai nostri intenti, che.


(a) p(0) = 0 .
(fi) P(AC) = 1- p(A).
(y) se A < fi allora p(A) < p(B).
104 C apitolo 8

Nel caso in cui Q sia uno spazio finito del tipo Q = {)\,a)2, . . . ,(on } si
ottiene uno spazio di probabilit finito assegnando ad ogni co, un numero reale p,
detto probabilit di co, che goda delle seguenti propriet:
(i) Pi > 0 Vi e {1,2 , . . . ,n};
n
(ii) > = 1.
= i

VETTORI di PROBABILIT e MATRICI STOCASTICHE

Definizione 8.14 Un vettore v = (v\,v2, ,v) detto vettore delle probabi


lit se le sue componenti Vi sono non negative e la loro somma 1.
Esempio 8.16 Si considerino i seguenti vettori:
v = (1, - 2,1); w = (1,2,3); t = ( 1 /2 ,1 /4 ,1 /4 ) .
Osserviamo che v non vettore delle probabilit poich ha una componente ne
gativa: w non vettore delle probabilit poich la som m a delle sue componenti
supera 1 mentre t vettore delle probabilit.

Definizione 8.15 Una matrice quadrata P ip ,,) detta matrice stocastica


se ogni elemento di P non negativo e se la somma degli elementi di ciascuna
riga L In altre parole in una matrice stocastica ogni riga un vettore delle
probabilit.
Esempio 8.17 Si dica quali delle seguenti matrici sono stocastiche
'0 11 "l" - 1 3 f i 1 ol
1-----

f ; d) =
II

a) = 1 1 ; b) = ? ? 1
.22. _ 2 2. - 3 3 3-
L

La a) stocastica perch ciascuna riga un vettore delle probabilit; la b) non


stocastica poich la somma degli elementi della prima riga non uguale a 1; la
c) non stocastica poich ci sono alcuni elementi negativi; la d) non stocastica
poich non quadrata.

Teorema 8.1 Siano A.B e Matnxn(E) due matrici stocastiche. Allora il pro
dotto AB una matrice stocastica.
Dimostrazione. Cominciamo col provare che se A = (aiy) una matrice stocasti
ca di ordine n e v = (vi,v2, ,vn) un vettore delle probabilit, allora anche
vA un vettore delle probabilit. Infatti, poich v, e a,j sono non negativi, anche
le componenti di vA sono non negative. Resta solo da provare che la somma delle
componenti di vA 1. Infatti:
v\i\ + v2a2\ -1------ b vani -f vial2 + v2a22 H-------b van2 -i------- b vria/m =

+a 12 + + 01) + v2(a2 + a22 + . - + a2n) + . . . + Vtl(a + , a ,2 + - W

= Vi 1 -b V2I -I------ b u 1 = V\ -b l>2 H-------- b Vf = 1


Algebra delle matrici 105

Dalla definizione di prodotto righe per colonne di due matrici, si pu osservare che
la riga / -esima di AB si ottiene moltiplicando la riga / -esima di A per la matrice
B e poich ogni riga di A vettore delle probabilit e B e matrice stocastica
per il ragionamento precedente, si conclude che ogni riga di AB vettore delie
probabilit e quindi A B matrice stocastica.

Corollario 8.1 Sia A una matrice stocastica: allora, per ogni n > 0, ogni po
tenza An di A una matrice stocastica.

Una classe notevole di matrici stocastiche costituita dalle matrici stocastiche


regolari .

Definizione 8.16 Una matrice stocastica A regolare se tutti gli elementi di


una generica potenza A" sono positivi.

10 0
Esempio 8.18 la matrice stocastica A 0 1 0 non mai regolare poich
0 0 1.
" i i -
"10 0 -
per ogni n An = 0 1 0 , mentre la matrice B = ? ? regolare: infatti
0 0 1
.2 2 .
i r
B2 = ?i = Bn.

L2 2J
Ricordiamo che un vettore v fissato da una matrice A se \A = v e quindi
V& G E \ 0 : {k\)A = k (\A ) = k \, cio ogni suo multiplo scalare non nullo
fissato da A.
Una matrice stocastica regolare ha un particolare comportamento rispetto al
problema delleventuale unicit dei vettori delle probabilit fissati. Infatti.

Teorema 8.2 Sia A e M atnxn(R) una matrice stocastica regolare. Allora A ha


un unico vettore v delle probabilit fissato e le componenti di v sono tutte positive

1/3 2/3
Esempio 8.19 Sia A = una matrice stocastica. Essa regolare e
1 0
ammette lunico vettore delle probabilit v = (y, 1 - y) tale che \A = v Infatti:
(y, 1 y) A = (y, 1 y) da cui si ottiene il sistema:

r
3y =
= 1-V
- y= y

3 3 2
che ammette lunica soluzione y = - , sicch v =
106 Capitolo 8

Passiamo, ora, a considerare una successione di prove i cui esiti a\ ,a2, , siano
tali che:
(*) ogni esito appartiene ad un insiem e finito di esiti {jci, jc2, ,jc) detto
spazio degli stati. Se la prova m -esim a ha esito Xj direm o che il sistema nello
stato Xj, nel periodo m o nella transazione m -esim a.
( ) Lesito di qualsiasi prova dipende al m assim o d allesito della prova pre
cedente e non da altre.

Definizione 8.17 Per ogni coppia di stati (x , ,x }) si indica con p tJ la probabilit


che si verifichi x } immediatamente dopo x,. Un tale processo detto catena
markoviana.

Definizione 8.18 Si dice matrice di transizione una matrice P ottenuta ordinan


do i valori p,j delle probabilit di transizione.

Sussiste la seguente propriet, la cui dim ostrazione im m ediata conseguenza


delle definizioni:

Proposizione 8.5 Una matrice di transizione di una catena markoviana una


matrice stocastica.

Esempio 8.20 Paolo abita a Rho e frequenta luniversit a M ilano, ove si reca
giornalmente con il treno o con la propria auto. Non prende mai lauto due giorni
di seguito ma se si reca a Milano in treno la probabilit che il giorno dopo usi
lauto uguale alla probabilit che prenda il treno. Lo spazio del sistema {a, /}
ove a = auto e t = treno, e il processo markoviano poich lesito di ogni
giorno dipende solo da ci che avvenuto il giorno prima.
La matrice di transizione :
t a
1 0
a 1/2 1/2

Dalla prima riga leggiamo che Paolo non prende mai lauto due giorni consecuti
vamente, mentre la seconda nga evidenzia come il giorno dopo aver usato lauto
avr la stessa probabilit di usare treno o auto.

Esercizio 8.6 Dire se le seguenti matrici sono stocastiche e, in caso positivo,


dire se sono regol an:

1. A =

2.
Algebra delle matrici 107

8.3 Sistemi lineari e matrici

Riprendiamo il sistema lineare

a\\X\ + *12*2 + .. + a\nxn bi


*21*1 + 22*2 + . + a2xn b2
( )

<2/nl*l 4 *m2*2 4" 4 O m n X n b m

Ad esso, possiamo associare una matrice A e Matmxn(K ), (dove m il numero


delle equazioni ed n il numero delle incognite) i cui elementi sono i coefficienti
delle incognite nelle equazioni del sistema. La matrice A detta matrice dei
coefficienti del sistema, mentre la matrice [A|b] ottenuta orlando" A con la
T
colonna (vettore colonna) dei termini noti b = [ b\ b2 . . . bm j detta matrice
T
orlata o completa. Inoltre, ponendo x = [* i x2 . . . xn ] , il sistema ( *) pu
essere scritto nella forma
*11 *12 . . . *l ~*i ~ bi
V
*21 *22 02n *2 b2
A x = b cio












t # t

_ &m1 Um2 Umn _ _*_ - -

ove il prodotto A x il prodotto righe per colonne tra la matrice A di tipo (m,n)
e il vettore x (di tipo (n, 1), che d come risultato il vettore b di tipo (m, 1)

Osservazione 8.5 Per ogni matrice di tipo (m,n + 1) esiste sempre un sistema
di m equazioni nelle n incognite x \ x 2, . . . ,xn di cui essa matrice completa.

Nel paragrafo precedente abbiamo introdotto la nozione di matrice a scala o


a gradini. In conseguenza diamo la seguente

Definizione 8.19 Un sistema di equazioni lineari nelle incognite x \x 2, . ,xn


detto a gradini (o a scala) se della forma

a n x i +*12*2 . . . #
+*1n*n b\
*22*2 # + 2nXn b2
( )

+** #
fi? mliti = bm
con *n,*22. . . ,i*mm ^ 0. Ovviamente m < n.
Mostriamo ora la seguente

Proposizione 8.6 Un sistema di equazioni lineari a gradini sempre compati


bile.
Dimostrazione. Distinguiamo due casi: n = m e m < n.
1. Sia m = n. Allora lultima equazione di (* ) a,wx n = b ed soddisfat
ta dallunica soluzione xn = a~nlbn. Sostituendo questo valore nella penultima
equazione si ricava xn-\ e cosi va risalendo, si ottengono x_2, . . . ,xi e quindi
si trova lunica soluzione per il sistema ( ).
2. Sia m < n . il sistema ( * ) equivalente al sistem a

011*1 + 012*2!' . . . + 01m*m = b\ (0 l(m+ l)*(m + l) + *** + 01*/i)


022*2+ +02/n*m = ^2 (02(m + l)*(m +l) + * * * + #2 n + *n)

amm-^rn
*m bm (0m(m+l)*(m+l) +* * * + #mn*n)
che risulta essere un sistema a gradini, di m equazioni in m incognite, qualo
ra si assegnino valori arbitrari hm+i,/im+2, . . . M ,, K alle n m incognite
xm+i,xm+2, ... ,x. Esso ammette pertanto ununica soluzione. Ne deduciamo
che il sistema (* ) ammette infinite soluzioni ottenute al variare dei parametri
^m+l>^m+2> Mn /C.
Esprimeremo il fatto che dette soluzioni sono funzioni di n tn parametri
arbitrari dicendo che il sistema ammette oo"~m soluzioni.

8.4 Metodo di eliminazione di Gauss-Jordan


Questo procedimento si propone di stabilire la compatibilit di un sistema e, nel
caso affermativo, di trovarne le effettive soluzioni, sostituendo ad esso, attraverso
una serie di operazioni sulle equazioni del sistema, dette operazioni elementari ,
un sistema a gradini equivalente.
Naturalmente, poich abbiamo visto che ogni sistema di equazioni lineari
ammette una scrittura in forma matriciale, le operazioni elementari sulle equa
zioni del sistema si traducono in operazioni elementari sulle righe della matrice
rappresentativa del sistema dato.
Sono operazioni elementari:

1. Scambiare tra loro due righe della matrice.


2. Moltiplicare una riga della matrice per uno scalare non nullo.
3. Sostituire a una riga quella ottenuta sommando ad essa un multiplo di un'altra
riga

Sia Ax = b un sistema di m equazioni lineari nelle n incognite x t 2, . . .


mostriamo come sia possibile ridurre detto sistema a un sistema a gradini. Natu
ralmente A matrice di tipo rin.n) e (A b] di tipo (m,n -f 1).
Se A = 0 (matrice nulla), non c' nulla da fare perch siamo gi di fronte a
oaa matrice a scala (banalmente).
Sia quindi 4 # 0: con eventuali operazioni di tipo 1 , facciamo in modo
* compente come prona nga quella in cui i "pivot compaiono per primi.
Algebra delle matrici 109

rispetto alla successione delle colonne. Pu succedere che la matrice sia gi a


scala, ma pu anche succedere che non lo sia, dal momento che due o pi pivot di
righe diverse possono essere sulla stessa colonna.
Sia a\k il pivot della prim a riga. Allora si calcolano 1 moltiplicatori m, =
uk poi si sottrae alla riga /-esim a la prima moltiplicata per m, Cos tutti gii
elementi sotto /,* sono nulli.
Si ripete il procedimento descritto a partire dalla seconda riga e cos via. il
procedimento ha termine dopo un numero finito di passi, quando le ultime m r
righe della matrice dei coefficienti sono tutte nulle (se r = n non si presentano
righe di zeri). Se anche i termini noti delle ultime m r righe sono nulli, il
sistema compatibile, altrimenti impossibile.
Notiamo che, essendo le istruzioni sempre le stesse, la procedura pu essere
implementata. Si noti anche che, se A e Matnxn(K), sono necessarie al pi
operazioni sulle righe di A per ridurla a scala.

Esempio 8.21 Sia dato il sistema


y +4z = 5
X + y -3 z = - 4
4x +2y + z = - 5
la matrice associata
" 0 1 4 5 '
[Albi = 1 1 -3 -4
4 2 1 .
Indichiamo con r, (/ = 1.2,3) la riga/-esim a e con c (j = 2.3 1 la colonna
j-esima: per avere un elemento non nullo nella prima riga e prima colonna, cio
in posizione ( 1, 1), scambiamo r i con r i. Si ottiene
1 1 -3 -4 "
gm
0 l 4 0
_ 4 2 1 -5
colonna possiamo
operare la sostituzione ri 4 r possiamo I :>1;
riga r 3>. Si ottiene
' I 1 - 3 - 4 1
0 I 4 5
. 0 2 13 Il j
Per avere, infine, tutti nulli gli elementi
caso sulla rx) sostituiamo alla terza risa.
r i - 3 1*-
g

0
i 4
L o 0 21 2. J
cbe in forma diagonale. I pivot sono 1. 1.21
A questo punto agevole ricavare la soluzione. Infatti il sistem a equivalente
= -4
= 5
= 21
e quindi si ricava
- y + 3z - 4
= 5 - 4z
= 1
e quindi

Esempio 8.22 Sia dato il sistema


3
-8
2
la matrice associata
r 1
3 2 3 -
[Albi 2
- 1 - 3 -8
L 0
1 1 2
Effettuiamo la sostituzione seguente: V2 *4 *2 ~ 2 ri. Otteniamo:
r 1
3 2 3
- 7 - 7 -14
0

L 0
1 1 2
-
Pur non essendo necessario, pu essere utile sostituire alla C2 la riga C2 ottenen
do

Rimane da annullare lelemento al di sotto del secondo pivot. Sostituiamo alla C3


la somma C3 + (-co). Otteniamo la matrice
r 1
3 1 3 2 1

1|2 1 1
0

L 1 J
0 0 0
0

in cui la terza riga ha tutti gli elementi nulli. In questo caso i pivot sono 1, 1, il
sistema equivalente
x + 3>' + 2z = 3
y + z ~ 2
Algebra delle matrici 111

e le oc 3 2 soluzioni sono: z = k, y = 2 - k, x = 3 - 2Jc - 3(2 - k) = - 3 + k.


ove k parametro reale.

Esempio 8.23 Sia dato il sistem a

f x +2y +3z = 6
| 3x +2y + z = 6
( j + 2z = 6
la matrice associata
" 1 2 3 6 "
[A\b] = 3 2 1 6
0 1 2 6
Effettuiamo la sostituzione seguente: T2 f 2 3rj otteniamo la matrice
" 1 2 3 6
0 -4 -8 -1 2
0 1 2 6

sostituiamo alla r 2 la - ^ r 2 ottenendo

" 1 2 3 6 '
0 1 2 3
0 1 2 6
A questo punto sostituiamo la r 2 con la r 3 r 2. Questa volta si ha la matrice
1 2 3 6 '
0 1 2 3
0 0 0 3
alla quale associato il sistema
[ x + 2v +3z = 6
{ y + 2z = 3
l 0 =6
che chiaramente non compatibile.

Definizione 8.20Si chiama rango (o caratteristica) di una matrice A di


Matmx(K) il numero dei pivot di una riduzione a scala. In ogni caso
rg(A) = r < mm(m,n)

Definizione 8.21 Una matrice quadrata A di ordine n si dice non singolare se


rg(A) = n. In caso contrario si dice singolare.

Si pu concludere enunciando:
112 Captolo 8

Teorema 8.3 Sa Ax = b un sistema di m equazioni lineari nelle n incognite


,xlvX2. ... Il sistema compatibile se e solo se, posto r = rg (A) ed, (1 <
i <n)i termini noti ottenuti con una riduzione a scala si ha che

dr+i = dr+2 = = dm = 0

Il sistema equivalente a un sistema a gradini che am m ette oo"~r soluzioni, che


dipendono da n r parametri arbitrari, se r < n\ se r = n si ha ununica solu
zione, che, nel caso di un sistema omogeneo, sempre com patibile, la soluzione
banale.

Teorema8.4 (Cramer) Se A e Matmxn(K), il sistema A x = b ammette l!


(una e una sola) soluzione se e solo se la matrice A non singolare.

Esercizio 8.7 Determinare il rango delle seguenti matrici:

2 10
1. 10 1
311

" 2 0 3"
-1 10
1 11
3 14

2 0 -3
-1 1 1

8.4.1 Algoritmo e calcolo della m atrice inversa

Abbiamo introdotto nel Paragrafo 8.1.4 il concetto di matrice inversa di una ma


trice A quadrata di ordine n; abbiamo dimostrato la sua unicit, ma era rimasto
aperto il problema della sua esistenza, problema al quale siamo ora in grado di
dare una risposta.

Proposizione 8.7 Data una matrice A e Matnxn(R), essa invertibile se e solo


se esiste ununica inversa destra, cio ununica matrice X tale che sia A X = /.
Dimostrazione. Banalmente, se la matrice A invertibile, per definizione, lin
versa destra unica.
Viceversa, se esiste ununica inversa destra, si ha AX = / e quindi AX
ln 0. Da qui, moltiplicando a destra per A e applicando le propriet distributive,
si ottiene
(AX - ln)A = AXA - InA = A(XA - /) = 0
Quindi / = AX + 0 = AX + A(XA - /) = A(X + XA - /),
Algebra delle matrici 113

Lipotesi di unicit dellinversa destra implica che X = X + XA - I da cui si


ottiene XA = /. Quindi la m atrice A invertibile.

Ora, indicati con Xj,x2, . . . ,x i vettori colonna della matrice X , risolvere il siste
ma AX = In equivalente a risolvere gli n sistemi di equazioni seguenti

Axj = e 1? A x2 = e2, . . . ,Ax = e

ove gli e, sono vettori di R" della form a e, = (0,0 ......... L . . . 0 )7 , cio i vettori
con la componente -esima uguale a 1 e tutte le altre uguali a 0. Ciascun sistema
risolubile e ammette una e una sola soluzione se e solo se la matrice A non
singolare. Si pu quindi enunciare la seguente

Proposizione 8.8 Una matrice A e M atnxn (R) invertibile se e solo se A


non singolare.

Per trovare la matrice inversa di una matrice (non singolare) data, si pu procedere
con il metodo di eliminazione di Gauss. Poich i sistemi devono essere verifica
ti contemporaneamente, costruiam o la matrice [A|/} con n righe e 2n colonne,
ottenuta affiancando ad A la matrice identica /. Operando con le operazioni ele
mentari sulle righe (con il procedimento visto, dallalto verso il basso) si ottiene
un sistema equivalente in cui la matrice dei coefficienti triangolare superiore ( T )
e termini noti sono i vettori colonna della matrice B. Con un procedimento di
riduzione, che procede dal basso verso lalto, si riduce la matrice dei coefficienti
a forma diagonale D. A questo punto, basta sostituire a ogni riga la stessa divisa
per il corrispondente pivot, per avere a sinistra la matrice identica e a destra la
matrice inversa della matrice A di partenza.
Il procedimento descritto sintetizzato nel seguente schema (eg j indica che
si utilizza il procedimento di riduzione di Gauss dallalto in basso, e analogamente
perEG t) .

[A| / ] [T\B] [In\A-'}

Esempio 8.24 Calcolare la matrice inversa della matrice


/
0 1
1 0
0 -1

Costruiamo la matrice [A\I^] e seguiamo il procedimento indicato sopra.

r 0 1 1 0
0 1
Wh] = 0 1 0 0 1 0

_ 5 0 -1 0 0 1

1 0 1 1 0 0

tri] = 0 1 0 0 1 0

L 0 0 -6 -5 0 1
r- 1 1
1 0 o 0 26
6
[D\C] = >
0 1 o 0 1 0
0 0 -6 -5 0 1
1 1 1
1 0 0 - 0
6 6
ih\A = 0 1 0 0 1 0
5 1
0 0 1 - 0
6 6 -

Esercizio 8.8 Calcolare la matrice inversa di


"1 0 01 r i o i i
D= 020 T - 0 2 4
LO 0 3_ _0 0 3_
ri 0 0~ ' 1 0 41
K= 020 S 0 2 1
Li 4 3 4 13
9
Gruppi

Se la matematica la regina delle scienze allora


lalgebra il gioiello della sua corona

Ritornando al concetto di struttura algebrica introdotto nel C apitolo 7, com incia


mo con raccostarci alle strutture dotate di una sola operazione, fissando in parti
colare lattenzione su sem igruppi e m onoidi per pervenire, infine, alla nozione di
gruppo.

Definizione 9.1 Si definisce s e m ig r u p p o una struttura algebrica (, ), ove *


operazione associativa su S .

Esempio 9.1 Denotato con N* l insiem e dei num eri naturali diversi da zero, al
lora un semigruppo.

Definizione 9.2 Sia (5,*) un semigruppo e a e S. Per ogni n > 0 si definisce la


potenza n-esima di a ponendo
1
a a,
<

a" = an~ l a, Wn > 1.

Osservazione 9.1 In notazione additiva invece na = (n \)a + a,V /2 > l e


si parla di multiplo n esim o di a.

Proposizione 9.1 Sia ( S,m) un semigruppo, a e S ed m ,n interi positivi; allora:

i) an am = an+m

ii) (an)m = a nm

Dimostrazione, i) Procediamo per induzione su n lasciando fisso m ed osservan


do che P(n) : an am = an+m.
P(l) vera, infatti a 1 am a x+m,
Supponendo vero P{n - 1) per n > 2, cio che valga 1uguaglianza

a"- 1 . am = an~+m = an+m~l

dimostriamo P{n). Infatti

a a
= (a an ') dm = a (a" 1 a m) 1 = a n+m
per ipotesi induttiva

La dimostrazione di il) lasciata come esercizio al lettore.

Proposizione 9.2 Sia (S,*) un semigruppo, a,b e S e a b = b a , allora :

i) a*bn = bn *a

ii) (a b)" = a'1 b".

Dimostrazione. Procediamo per induzione su n in entrambi i casi.

i) La propriet da dimostrare P{n) : a b" = bn *a e P( l ) vera per ipotesi.


Supponiamo vera P{n 1) per n > 2, cio supponiamo che che sia vera
Puguaglianza a bn~x = bn~l * a e dimostriamo P(/z):

a 9bn = a b n~ b = bn~l a b=bn~l b a = bn a.


per ipotesi induttiva

ii) La propriet da dimostrare P(n) : (a b)n = an bn.


Ora P{\) vera in quanto (a b)1 = a 1 b l . Supponiamo l asserto vero per
n - 1, (n > 2), e dimostriamolo per n:
(a b)n = (a b)n = a [*bn l* a * b = a n '(/?' ' a)-/?
per ipotesi induttiva

e utilizzando il punto i) si ottiene che an 1 a bn 1 b = a" b".m

Definizione 9.3 Si dice monoide un semigruppo (M , ) dotato di umici. In altre


parole un monoide un insieme M dotato di un operazione associativa in cui
esiste un elemento 1m tuie che
\ M-ka a * \ m = a, Va e M.

Esempio 9.2 (N,+) un monoide ove il numero zero lunit; (Z,-) un mo


noide ove il numero uno lunit; (X x,), linsieme di tutte le applicazioni su un
insieme X, un monoide ove lapplicazione identica Ix lunit.
Gruppi 117

Siamo, ora, pronti per introdurre il concetto di gruppo, concetto che ha importanza
non solo per s ma anche in relazione ad altre strutture quali anelli campi spa/i
vettonali, che introdurrem o in seguito.

Definizione 9.4 Sia G un insieme in cui stata introdotta la legge di composi


zione binaria, indicata con -, (G,-) un gruppo se:

1. Voperazione associativa, cio (a - b) c = a (b c), V a, b, c G

2. esiste un elemento 1g, (detto elemento neutro *) tale che

a 1g = 1g ' G.

esiste un elemento simmetrico2 per ogni elemento di G, cio 'ia G, 3* e G


tale che
a x = x a = 1e-

In altre parole un gruppo un monoide in cui ogni elemento invertibile.

Esempio 9.3
1. Linsieme Z degli interi relativi un gruppo rispetto allusuale operazione di
somma, ove lelemento neutro il numero 0 e il simmetrico di a e Z
lopposto a.

2. Analogamente (Q ,+ ) e (R ,+ ) sono gruppi.

3. Linsieme R +dei numeri reali positivi gruppo rispetto allusuale prodotto


ove lelemento neutro il numero 1 e il simmetrico d ia e R + linverso
a- = i .
a
a b
4. Linsieme G L 2(K) = a,b,c,d R, ad bc ^ 0 } un gruppo ri-
c d
spetto allusuale prodotto righe per colonne (definito nel Capitolo 8); Tele
mento neutro lunit G = * ^ ' e ogni matrice invertibile essendo
0 1
1__

1---

a b i
1

c d ad bc c a

Linsieme Z delle classi di resti modulo n gruppo rispetto alloperazione di


somma di classi ove la classe [0 ] lelemento neutro e lopposto di [a]n
[ tj]n.

'Al variare della notazione, lelemento neutro pu essere detto zero oppure unit
'Al variare della notazione relcm ento simmetrico detto anche inverso oppure opposto
118 Capriolo 9

6. L'insieme delle applicazioni bijettive di un insiem e X su se stesso ( X x )


gruppo rispetto al prodotto di applicazioni; l x : X > X V unit e Y inversa
di / : X X lapplicazione inversa / -1 : X > X a suo tempo
definita (confronta 4.23).

Definizione 9.5 Un gruppo (G, ) si dice commutativo (o abeliano 3)se per ogni
a,b e G si ha ab = ba.

Naturalmente s |G| = n, il gruppo si dice finito, in caso contrario si dir infinito.


I gruppi presentati nei punti 1, 2, 3, 5 del precedente esempio sono commu
tativi, mentre quelli dei punti 4 e 6 non lo sono.
1 gruppi dei punti 1, 2, 3, 4 sono esempi di gruppi infiniti mentre al punto 5
si danno esempi di gruppi finiti, (al variare di n con n > 1, si ottengono infiniti
gruppi finiti tutti diversi).

La formalizzazione del concetto di gruppo ha richiesto il contributo di alcune


generazioni di matematici: si comincia a tracciare nel contesto della teoria delle
equazioni algebriche grazie a Lagrange, Ruffini e Abel fino ad arrivare a Galois
nei cui lavori vengono per la prima volta usati esplicitamente il concetto e il nome
gruppo (1830). Per altre ragioni, la nozione di gruppo si afferma in geometria
verso la met dellottocento. Nel programma di Erlangen, F. Klein (1872) propose
lidea di gruppo di trasformazioni come base per classificare geometrie. Ancora,
nell'ambito della Teona dei numeri, ricordiamo i contributi di Eulero e di Gauss.
Attualmente la teona dei Gruppi una delle branche pi sviluppate dellAlgebra
e ha applicazioni in cristallografia, in meccanica quantistica e in vari altri contesti.

Definizione 9.6 Sia (G ,) un gruppo e g un suo elemento: si pu definire indut


tivamente la potenza n-esima di g,Vn e Z, ponendo:
1. g = lc
2. g" = (g,,_1) Vn > 0
3. gn = (g-lr \ V n < 0
Analogamente a quanto fatto per i semigruppi si possono dimostrare alcune pro
priet.
Proposizione 9.3 Sia (G,-) un gruppo, g e G e n,m e Z. Allora
1. g" . g * = gn+m

2. ( g T = gnm-
Inoltre, se a,b e G e ab = ba, vale l uguaglianza (ab )" = anbn.
Si lascia al lettore la dimostrazione, che lestensione al caso degli esponenti
negativi dei punti 1) e 2) della Proposizione 9.1.

311 termine abeliano deriva dal nome del matematico norvegese Niels Henrik Abel ( 1802-1829)
Gruppt 119

Osservazione 9.2 Sia (G ,-) un gruppo, per ogni a,b e G (ab) = b a


Infatti:
{ab)(b la ) = a ( b b l)a l = a lc c i = aa = ] G.

9.1 Sottogruppi

Passiamo ora a trattare particolari sottostrutture di (G .-), dette sottogruppi, ovvero


consideriamo quei sottoinsiem i H (non vuoti) di G, che risultano essere gruppi
rispetto alla medesima legge di com posizione definita in G.
Definizione 9.7 Sia (G,*) un gruppo e H un suo sottoinsieme (non vuoto). H
un sottogruppo se (e solo se) sono verificate le seguenti condizioni:
i) Va, b e H ==> ab e H (propriet di chiusura rispetto alloperazione):
ii) \G e H (lelemento neutro di G appartiene al sottoinsieme H)\
iii) Va e H ==> a~ l e H (linverso di ogni elemento di H sta in H).
Per indicare brevemente che un sottoinsiem e H un sottogruppo di un gruppo G.
useremo la notazione H < G.
Naturalmente ogni gruppo G ha alm eno due sottogruppi G stesso e il sottogrup
po {le} costituito dal solo elem ento neutro (che sono detti sottogruppi impropri).
Inoltre un sottogruppo non pu mai essere un insieme vuoto, poich deve posse
dere almeno lelemento neutro rispetto alloperazione definita in G.
Esempio 9.4
1. Sia (Z ,+ ) il gruppo additivo degli interi relativi; linsieme 2Z dei numeri pari
un sottogruppo di (Z ,+ ).

Infatti V 2z i , 2z2 2Z si ha che 2zi -f 2 zi = 2(zi + Z2) 2Z; inoltre 0 Z e


-2zi Z.
2. Nel gruppo additivo (Z 6,+ ) delle classi di resti modulo 6 si consideri il sot
toinsieme H = {[0]6,[2]6, [4]6}: verifichiamo che H sottogruppo di (Z 6,+ ).
Infatti la tavola di com posizione di ( / / , + )
+ [0]6 [2]6 [4]6
[0]6 [016 [2]6 [41e
[2]6 [2] 6 [416 [0]6
[4] 6 [4]6 [0]6 [2]6
Si verifica direttamente che H chiuso rispetto alloperazione di somma, che la
classe [0]6 lelemento neutro e che lopposto della classe [2]6 [4] mentre
lopposto della classe [4] la classe [2 ]6 (entrambe in H).
Diamo ora un criterio che consenta di verificare se un sottoinsieme H 0 di
un gruppo (G,-) un suo sottogruppo, senza ricorrere alla definizione.
Proposizione 9.4 Sia (G, ) un gruppo e sia H un suo sottoinsieme 0 ). Allora
(//,-) un sottogruppo di (G,-) se e solo se V a,b e H si ha a >-1 e H.

Dimostrazione. Sa H un sottogruppo di (G,-)- Allora V a,b e H =$ b~l e H


per il punto iii) della Definizione 9.7. Per il punto i) si conclude che a b~l e H.
Viceversa, per ogni a,b e H sia a b~{ e H. Allora, se consideriamo b - a
otteniamo che a-a 1 e H e quindi le G H (ed verificata la ii) della definizione).
Poich \ g e H,Vb e H si ha che 1G b~l = b~l e H ed verificata la iii),
Infine, poich b~{ e H ed a e H segue a (>-1 )-1 = a b e H ed quindi anche
verificata la i). Si conclude he H un sottogruppo.

Esercizio 9.1 Sia H = | q |a e R .Verificare che H un sottogruppo di

GZ,2(R).4 H commutativo?

Esercizio 9.2 Dato un gruppo abeliano G e un intero n > 1, si consideri il


sottoinsieme K = {a e G | a" = 1G} e si mostri che K un sottogruppo di G.

9.2 Gruppi di permutazioni

Nel Capitolo 4, abbiamo introdotto il concetto di applicazione bijettiva su un in


sieme X e abbiamo osservato che il prodotto (o composizione) di applicazioni
bijettive ancora unapplicazione bijettiva. Anzi, trattando il concetto di gruppo
abbiamo sottolineato (9.3.6, in esempi di gruppi) che linsieme X x delle appli
cazioni bijettive di un insieme X su se stesso gruppo rispetto al prodotto di
applicazioni e viene usualmente indicato come gruppo di trasformazioni su X.
Trattiamo, ora, il caso in cui IX1 = n. Allora il gruppo X x di solito indicato
con S, ha ordine n\ ed detto gruppo di permutazioni su n oggetti o gruppo
simmetrico su n oggetti.
Indicati con 1,2,3, . . . n gli elementi delTinsieme X, data la natura degli og
getti di Sn, una possibile notazione per una trasformazione a e Sn la seguente

_ / 1 2 3 .... n
~ \c r(l) 7 (3) . . . . o{n)
2) <

ove nella seconda riga compaiono una ed una sola volta gli interi 1, 2,3 ___n, che
rappresentano le immagini degli elementi elencati nella prima riga.

4Vedi Esempio 9 3.4


Gruppi 121

Esempio 9.5 Se n = 3, gli elem enti di S 3 sono 6 = 3! = 3 2 1 e precisamente:

12 3 12 3
/ = ^2 2 3 1
12 3
12 3 12 3
cr3 = rr4 =
3 12 13 2
1 2 3 12 3
05 or6 = 2 13
3 2 1

La tavola di composizione di ( 3,*)



I v2 V3 v4 V5 ve
I I v2 V3 v4 V5 ve
<y2 cr2
V3 I v6 V4 V5
v3 I V2 V5 ve v4
or4 cr4 V5 Ve I v2 V3
cr5 V5 ve cr4 V3 I v2
ve ve V4 ^5 v2 V3 I

Fissiamo, ora, lattenzione su particolari permutazioni.

Definizione 9.8 Sia k < n: un ciclo di lunghezza k una permutazione a e S


che permuta ciclicamente k elementi dell'insieme X = {1,2,3,........./i} e lascia
fissi i restanti n k elementi. Pi precisamente, supponiamo che esista un sot
toinsieme X = {ai,12, . . . ,ak} Q X , tale che
<7(a,) = a,+\ V / = 1 , 2,3 1);
cr(ak) = ai;
cr(b) = b , V b e X \ X
allora indichiamo il ciclo nella forma 0 = {ci\a2 . . . ak), (gli elementi fissati da
a, non vengono indicati).

Osservazione 9.3 Un ciclo di lunghezza k si pu scrivere in k modi, cio


{a[02. . ak) = (Z2C3 . . . aka\) = (a a$ ... a\02)
3 = .. = (aka\ ... ak~\).
Esempio 9.6 In S4, gruppo sim m etrico su 4 oggetti, consideriamo le trasforma-
12 3 4\ _ / 12 3 4
ziom (7 =
2 3 1 4 j e T - U 341
La a un ciclo di lunghezza 3 (o 3-ciclo) ed solitamente indicata nella forma
(123) (la lettera 4 fissata non viene scritta!), mentre la r un ciclo di lunghezza
4, indicato di solito nella form a (1234).

Osservazione 9.4 I cicli di lunghezza 2 sono detti scambi o trasposizioni per


/ 12 3\
esempio: a 4 = I ^ 0 ) e S3 uno scambio e viene indicato nella forma (23).
Lidentit considerata un ciclo di lunghezza 1.
122 Capitolo 9

Definizione 9.9 Due cidi si dicono d is g iu n ti se operano su insiemi disgiunti di


lettere.

immediato provare, come conseguenza della precedente definizione, che vale la

Proposizione 9.5 Se oq.co sono due cicli disgiunti di Sn, allora o\ cr: = 02 a\.

Ci falso, in generale, se cri,C2 non sono cicli disgiunti, come provato dal
seguente:

12 3 12 3
Esempio 9.7 Siano <r6 = , <*2 = G S 3. Allora:
2 13 2 3

12 3 12 3
<76 <72 = (23), mentre 07 05 = = (13)
132 3 2 1

Osserviamo, ora, che i cicli disgiunti possono essere considerati componenti ba


se per una generica permutazione, nel senso precisato dal seguente teorema, del
quale omettiamo la dimostrazione.

Teorema 9.1 Ogni permutazione di Sn o un ciclo o si pu scrivere come pro


dotto di cicli disgiunti e tale scrittura unica a meno dellordine dei fattori.

1234567
Esempio 9.8 Sia a G Si- Allora
2315476

12 3 \ 45
2 3 1*15 4
* l ) = (123)(45)(67).

Tra i cicli un ruolo notevole, ai fini che preciseremo in seguito, giocato dagli
scambi. Infatti
Teorema 9.2 Ogni permutazione pu essere scritta come prodotto d trasposi
zioni 0 scambi.
Esempio 9.9 Riprendiamo 0 e S7 dellesempio precedente e lo scaviamo come
prodotto di scambi: a (13)(12)(45)(67).
In generale un ciclo 0 ia \a -i. . . a d si pu scrivere nella forma
0 = ( a iiif c ) ( a ia 4_ i ) - * - (a i * -

Osserviamo che nella scrittura di una permutazione come prodotto di scambi si


perde Tunicit: verifichi, il lettore, che, sempre riferendosi alla o Sn degli
esempi precedenti, : a (13)(12)(45)(67) = (13)(12)(67)(23)(4S)(32). In
ogni caso ci che rimane inalterato la parit del numero di scambi in cui una
permutazione si decompone.
Definizione 9.19 Una permutazione a S si dice pari <disparii se si J e t ori
pone in w t numera pari i disparii di scambi.
3ruppi 123

1. La permutazione identica I Sn una permutazione pan


2. Se o Sn pari anche a ~ 1 pari .

3. La composizione di permutazioni pari d luogo ad una permutazione pan


infatti se o si decompone in 2k scambi e r si decompone in Ih scambi allora
a x si decompone in 2 k + 2 h = 2 {k + h) scambi.

Pertanto i punti 1,2,3 d ellosservazione precedente ci perm ettono di enunciare il


seguente

Teorema 9.3 L'insieme delle permutazioni p a n di Sn un sottogruppo denotato


n
con An e detto (sotto) gruppo alterno. Esso ha ordine

Esempio 9.10 In S 3 l insiem e delle sostituzioni pari costituito da L 02 ,cr? e la


tavola di composizione di A 3

I o2 03
I I 02 03
02 O3 I
cr3 03 I 02
Esercizio 9.3 Determinare le sostituzioni pari di S4.
Esercizio 9.4 Si consideri l'insieme X = {1,2 ,3 ,4 ,5 .6 7} e la permutazione a
su X cos definita:

1 2 3 4 5 6 7
a =
3 4 1 2 6 7 5

1* Si decomponga a nel prodotto di cicli disgiunti;


2. Si dica se a una sostituzione pari oppure dispari;
3* Si indichi l'immagine di 6 tramite la permutazione a.
Esercizio 9.5 Considerate le seguenti permutazioni di 5V

o / 12 3 4 5\ / 1 2 3 44 5 \
\\ 3 5 2 1 4 fi/ * y _ \\ 2 L 3 5 4 )
s<-dica se le seguenti affermazioni sono vere oppure false:
** & ha periodo 5 ;

y 1= y;
3.
= y -
4L ai'
<*'=1124 3 5 IL
124 Captolo 9

9.3 Equivalenze in un gruppo

Sia (G,*) un gruppo e H un suo sottogruppo. D efiniam o in G una relazione 1l H


ponendo

x H Hy x y -1 e H.
Mostriamo che H una relazione di equivalenza. Infatti:
a) TIh riflessiva perch Vx G G x1ZHx, in quanto x x ~ l = l g G
b) Considerati due elementi x ,y G G, tali che x'Rny* allora x y _l g H e quindi
anche (xy -1) 1 = yx -1 e //, essendo H un sottogruppo. Si ottiene quindi che
y'Rtfjt e pertanto 1Zh una relazione simmetrica.
c) Vale la propriet transitiva: infatti se x U h y e yLZnZ (x ,y ,z G G) allora
Infatti per ipotesi xy -1 e yz _1 e / / , quindi, poich He un sottogruppo,
si ha che (xy_ 1yz_1) = xz _1 G H, da cui si ottiene che x 71h Z.
Si pu quindi concludere che la 1ZH una relazione di equivalenza in G.
Osservazione 9.5 Vx e G, la classe di equivalenza individuata da x e indicata
con [x \n H coincide con Tinsieme {hx\ h G H ) .
Infatti, se y [x ]jih y'RtfX, cio y x -1 e H, quindi 3/7 e H tale che
yx -1 = h. Moltiplicando membro a membro a destra per x si ottiene y = hx, da
cui segue che [ x ^ C {hx\ h g H).
Viceversa sia z G {hx | h g H}; allora 3 h tale che z = hx da cui, moltiplican
do membro a membro a destra per x _1, si ottiene z x _1 = h e H. Da qui segue
che ziZhx ovvero z G [x]^,, e quindi {hx | h g H) c [x ]^ w.
Questo ci permette di concludere che [x]^7/ = {/ix| h G H).
Definizione 9.11 La classe di equivalenza [x]ftH vz c/zc^ laterale destro di H in
G individuato da x e lo si denota usualmente con il simbolo H x.
Osservazione 9.6 Trattandosi di classi di equivalenza, i laterali destri di // in
G sono disgiunti, H coincide con il laterale destro individuato da uno qualsiasi
dei suoi elementi (per esempio H \ q = H). Dalla definizione segue anche che
Hx = Hy xy -1 G H ovvero, con altra scrittura, x = y (m o d //).
Osservazione 9.7 Se loperazione definita in G denotata additivamente, cio
se abbiamo il gruppo (G ,+), il laterale destro di H in G, individuato da x
H + x = {h + x | h G H }.
Verifichi il lettore che, dato un gruppo (G,*) e un suo sottogruppo H possibile
definire unaltra relazione ponendo xC H y <=> x ~ ly H. Tale relazione
risulta ancora di equivalenza e le sue classi, dette laterali sinistri di H in G, sono
cos descritte
[x]cH - x H {xh\ h H)
ove x lelemento di G che individua la classe.
Gruppi 125

Osservazione 9.8 In generale i laterali destri non coincidono cori i sinistri.

Esempio 9.11 In S 3 consideriam o il sottogruppo H = { /,( 12)}: laterali sinistri


di H in G sono
H = { / , ( 12)},
( 1 3 ) // = {(13),(13)(12) = (123)},
( 2 3 ) // = {(23), (23) (12) = (132)}

mentre i laterali destri sono


H = { /,( 12)},
H (13) = {( 13), ( 12) ( 13) = (132)},
H (23) = {(23), (12) (23) = (123)}.
Proposizione 9.6 Sia (G ,-) un gruppo e sia H un suo sottogruppo. Per ogni
x e G si ha che gli insiemi x H , H x , H sono equipotenti \
Dimostrazione. Per m ostrare l equipotenza dei due insiemi H x e H basta consi
derare lapplicazione / : H >- H x definita ponendo f ( h ) = hx, Vh e H
La suriettivit di / garantita per costruzione: infatti gli elementi di Hx
sono del tipo hx e quindi una preim m agine per la / dellelemento hx h (poich
f(h) = hx).
Per liniettivit, basta osservare che se h / k e /(/z ) = f ( k ) si ha hx =
kx, da cui, moltiplicando m em bro a m em bro a destra per x ~ [ si deduce h = k,
assurdo. In modo analogo si prova che x H e H sono equipotenti.
Osserviamo che, nel caso finito, si ha che, nelle ipotesi del teorema precedente, la
tesi si esprime nella forma: \xH\ = |/ / x | = \H\.

Teorema 9.4 (noto come Teorema di L agran ge)6 Sia (G,-) un gruppo finito e
H un sottogruppo di G. Allora \H \ divide |G |.
Dimostrazione. Siano Hg\, H g 2, . . . , Hg n i laterali destri distinti di H in G;
poich {//g, Hg 2, , H g r } costituisce una partizione di G si ha:

|G | = |/ / g i | + |/ / g 2| + - . . + |/ / g . |.
Per il teorema precedente si ha che | Hg, | = \H\ e quindi si pu concludere che
|G| = r\H\ da cui segue la tesi, cio che \H \ divide |G |.

Definizione 9.12 Una relazione di equivalenza 7Z definita su un gruppo (G.o)


si dice compatibile a sinistra con Voperazione o se Vg{, g 2 G tali che g Rgi si
ha che a o g\R a o g2, Va e G. Analogamente si parla di compatibilit a destra,
se gj o a1Zg2 o a, Va e G.
Definizione 9.13 Una relazione di equivalenza R definita su un gruppo (G o)
si dice compatibile con V operazione o se Vgl , g 2, x \ , x 2 e G tali che g{Rgi, <
X\Rx2 si ha g o x \R g 2 o x 2.

sSi ricorda che due insiemi X e Y si dicono equipotenti se esiste una applicazione biunivoca da X a Y
6Joscph Louis Lagrange (1736 Torino - 1813 Parigi).
126 Capitolo 9

Definizione 9.14 Una relazione di equivalenza in (G ,o ) si dice congruenza se


compatibile con l'operazione o del gruppo.

Proposizione 9.7 Sia (G,-) un gruppo. Una relazione di equivalenza 11 in G


una congruenza se e solo se esiste un sottogruppo H di G tale che 71 = 7I h =

Definizione 9.15 Dato un gruppo (G,*)> un sottogruppo H di G si dice normale


in G, e si scrive H < G se 71h = C r (e quindi se i laterali destri e sinistri di H
in G coincidono).

Esempio 9.12

1. In un gruppo abeliano tutti i sottogruppi sono normali.

2. In un gruppo G qualsiasi, G stesso e il sottogruppo {le} sono sottogruppi


normali.

3. Dato il gruppo di sostituzioni Sn, il sottogruppo A delle sostituzioni pari


normale in Sn.

9.4 Sottogruppo generato da un sottoinsieme.


Sottogruppi ciclici
Proposizione 9.8 Dati due sottogruppi H e K di (G,-)> fi
un sottogruppo di G.
Dimostrazione. Siano h,k e H n K\ allora h ,k e H. che un sottogruppo di G
e quindi hk~l e H; inoltre h,k G K, che ancora un sottogruppo di G e quindi
hk~l e K. Pertanto hk~l e H Pi K e quindi, per la Proposizione 9.4, H fi K
un sottogruppo di G .

Osservazione 9.9 Se consideriamo una collezione di sottogruppi Ht di G, con


i /, si pu dimostrare che f ] H , un sottogruppo di G. (La dimostrazione
ie/
lasciata per esercizio).

Osservazione 9.10 In generale, dati due sottogruppi H e K di (G, ), il sottoin


sieme H U K non un sottogruppo di G .
Infatti, consideriamo H = {7,(12)}, K = {/,(13)> sottogruppi di S3: la loro
unione insiemistica H U K = {/, ( 12), ( 13)} non un sottogruppo di G perch
HDK non chiuso rispetto alloperazione, in quanto (12)(13) = (132) ^ HUK
Definizione 9.16 Sia A un sottoinsieme non vuoto di un gruppo G. L interse
zione di tutti i sottogruppi di G che contengono A, un sottogruppo di G detto
sottogruppo generato dal sottoinsieme A e viene indicato con il simbolo {A).
Esso il minimo sottogruppo di G contenente A, ovvero sono soddisfatte le con
dizioni:
G ru p p i 127

1. a c (a );
2. (A) contenuto in ogni sottogruppo di G contenente A .

Osservazione 9.11 Linsiem e A viene d etto in siem e di gen eratori per (A).

Osservazione 9.12 Ogni gruppo G ha alm en o un in siem e di g en erato ri, basta


assumere A = G.

Teorema 9.5 II sottogruppo (A) costituito da tutti gli elem enti di G esprimibili
come prodotto di un numero finito di elem enti di A e di inversi di elementi di A.
In simboli

{A) = | \r > Lfl, A,Si = \ | .

Definizione 9.17 Se A = {ci} => (A) = {a " \n e Z ] = (a). Il sottogruppo (a)


prende il nome di sottogruppo ciclico generato da a. Se p o i G = {a) allora G
detto gruppo ciclico.
Esempio 9.13 Sono ciclici i seguenti gruppi:
1. (Z,+) ed generato da l o d a 1 , cio Z = ( 1) = ( 1),

2. (ZB,+) = ([l]n).
3. In 54 il sottogruppo H = {7,(1234), (1 3 )(2 4 ), (1432)} ciclico ed generato
da (1234), cio H = <(1234)).

4. Nel campo complesso (C,-) il so tto in siem e U = {1, l , i , /} ciclico g e


nerato d a / ( o d a /).

Definizione 9.18 Dati due sottogruppi H, K di un gruppo G, si definisce unione


(gruppale) di H e K, il sottogruppo generato d a llunione insiemistica di H e .
In altri termini, l unione gruppale di H e K l intersezione d i tutti i sottogruppi
di G che contengono sia H che K . Tale sottogruppo pu essere indicato sia con
la scrittura H U K, se non c rischio di confondere unione gruppale con unione
insiemistica, oppure con la scrittura {H , K ).
Esempio9.14 Abbiamo visto n ellO sservazione 9.1 0 che l unione insiem istica
dei sottogruppi H = (7,(12)} e K (7,(13)} di S 3 non un sottogruppo di 3
Invece lunione gruppale H U K (7 ,(1 2 ),(1 3 ),(2 3 ),(1 2 3 ),(1 3 2 )} = S 3 un
gruppo.
Osservazione 9.13 Dati due sottogruppi H e K di un gruppo G , l'u n io n e in
siemistica di H e K coincide con l unione gruppale se e solo se H c A" oppure
KCH.
Esercizio 9.6 Dati i sottogruppi di Z
H = (2 h 1 h e Z} e K = (3* | k Z}
determinare i sottogruppi H U K e H n K .
128 Capitolo 9

9.4.1 Propriet dei gruppi ciclici

Teorema 9.6 Ogni sottogruppo di un gruppo ciclico {finito o infinito) ancora


un gruppo ciclico.

Dimostrazione. Sia G = (a) e sia H un sottogruppo di G , H {1G} (altrimenti


H = (1 g ))- Essendo G ciclico, ogni elemento di H si potr scrivere come potenza
di a. Consideriamo linsieme degli elementi di H che si possono esprimere come
potenze a esponente positivo di a. Questo insieme non vuoto poich, essendo H
t \-1
un sottogruppo, se af H, con t < 0 => {a1) a H con t > 0.
Tra gli elementi di H con esponente positivo, consideriamo quello con lespo
nente minimo: diciamo ak. Sia ora a s un generico elemento di H, s ^ 0,
Mostriamo che as potenza di ak.
Infatti, dividiamo s per k : si ottiene: s k q r con 0 < r < k.
Se fosse r / 0, avremmo a 5 a kq+r a kq a = {ak)q ar e quindi
a T as [(afc)9] 1 e H, contro la minimalit di r. Si deduce che r = 0, e quindi
a s =. (ak)q e pertanto si conclude che H = [ak).

Osservazione 9.14 Ogni sottogruppo proprio H di un gruppo ciclico G costi


tuito dalle potenze di un elemento or, ove a un generatore di G e k un opportuno
intero diverso da 0, -f 1 e 1, cio si ha:
H = {ak ,a 2k,a~ 2k, a3k,a 3k
}.

Esempio 9.15
1. Consideriamo il gruppo (Z,+) : si ha che il sottogruppo generato dal numero
22Z = { 0 , 2 , 4 , . . . , 2 n } = (2).
2. Consideriamo la sostituzione or dellEsempio 9.8. Il sottogruppo ciclico ge
nerato da a :
H (o) {o o 5 = (1 2 3 )(4 5 )(6 7 ), a = (7 = 0 3 2 ),

ct3 = cr = (45)(67), (T4 = a - 2 = (123),


~ 3 <r
5 = a 1 = (132)(45)(67), a6= /|.

9.4.2 Periodo di un elemento di un gruppo

Definizione 9.19 Sia a un elemento di un gruppo (G, ) Se (a ) finito di ordine


n, si dice che l elemento a ha periodo (o ordine) n e si scrive o{a) = n. Se {a)
infinito, si dice che a ha periodo infinito.
Osservazione 9.15

1* o(a) = 1 4 a = 1G.
2. o(a) = o{a~]).
Gruppi 129

Esem pio 9.16

1. Sia (Z 3,+ ) = {[0 ] 3,[1] 3,[2]3}, allora o([ 1]3) - o([2]3) = 3 .


(N otabene che [2 ]3 = [1]3).

2. Considerata a = (123)(45)(67) e 57 , si ha <?(cr) = 6 ,

3. In (E*,-) gli unici elem enti di periodo finito sono 1 e - 1 ed o(\) = 1


o (1) = 2 .

4. In (Z ,+ ), ( Q ,+ ) , (M ,+ ), (C ,-f) ogni elemento non nullo ha periodo infinito.

Teorema 9.7 Sia G un gruppo e a un suo elemento, valgono le seguenti pro


priet:

1. Se a ha periodo finito n, allora n il minimo intero positivo per cui an = \c


Inoltre si ha che:
i) gli elementi distinti di (a) sono 1G = a,a,a2. .. an~l
ii) a 1 = am l = m(modrt)-
2. Se o{a) co allora le potenze di a sono a due a due distinte.

Tralasciamo la dim ostrazione, che potr eventualmente essere svolta per esercizio.

Proposizione 9.9 Sia a e G. Allora, se o(a) = oo = o{ak) = c.Vifc e Z \{0}.


Per assurdo sia o(ak) = r < oo. A llora (ak)r = akr = 1G da cui seguirebbe
o{a) < oo, una contraddizione.

Proposizione 9.10 Siano a e G, k e Z \ {0}: se o(a) = n => o(ak) =


n
mcd (k,n)'

Poniamo d = m c d (k,r). A llora 3 A:',/?' Z tali che k = d k \ n = dn .


Dimostriamo dapprim a che o{ad) = n'.
Infatti (ad)n = a" = 1G => o(ad) = m < n . Inoltre, da (ad)m = adm 1G
segue che o{a ) n dn < dm => n' < m. Questo implica che n = m.
Verifichiamo ora che

M =(*>
Infatti si ha che

a* = a " ' = (a')*' 6 => (a*) C (a1*).


Viceversa, poich 3 e Z tali che </ = k+ n>- si ha ch
ad = - (ak)x (an)y = (ak)x( l G)y = (ak)x e (ak)

cio C Dalla doppia inclusione, segue quindi luguaglianza.


Poich (ak) = (ad) si pu concludere che o(ak) = o{ad) = n =
Proposizione9.11 Sia G un gruppo ciclico di ordine n, G = (a). Si provi che
ak un generatore di G O M C D (fc,n) = 1 .
Infatti un elemento ak un generatore di G se e solo se o( ak) = o{a ) = n. Dalla
proposizione precedente si ha che o{ak) = ^ = n O m cd (/c, h ) = 1.

Proposizione 9.12 Se G un gruppo di ordine n e t un divisore positivo di n,


allora esiste uno e un solo sottogruppo di G avente ordine t .

Sia G = (a ), e |G| = n = rt. Allora o (a r ) = t e quindi | (a) | = f .


Sia ora H un sottogruppo di G avente ordine t. Poich H un sottogruppo di un
gruppo ciclico, sar a sua volta ciclico. Indicando con a k un suo generatore, per
la proposizione 9.10, si ha che

\H\ = t = o(ak)= --- n-


MCD (k,n)

Quindi MCD(fc,n) = - = r, quindi r|/c, cio 3 s e Z tale che & = r s . Allora


a* = (flr)s e (ar) . Questo implica che (ak) c (a r ) e, poich i due insiemi hanno
lo stesso ordine, segue che essi coincidono.

Esercizio 9.7 Utilizzando i risultati dei teorem i e delle proposizioni precedenti:

1. Determinare i generatori del gruppo (Z i 2,+ ) .

2. Determinare i generatori del gruppo ( Z 16,+).

3. Determinare il periodo degli elementi di (Z g ,+ ).

4. Determinare il periodo degli elementi di (Z io ,+ ).


10
Anelli e Campi
A nello dei polinomi

Nel giardino crescono pi cose


di quante ne semini il giardiniere.
(Proverbio spagnolo)

Fino ad ora ci siam o occupati di strutture algebriche dotate di una sola legge di
composizione (sem igruppi, m onoidi, gruppi): vogliamo iniziare a esaminare quel
le strutture in cui sono coinvolte due leggi di composizione, usualmente indicate
come somma e prodotto.

Definizione 10.1 Una struttura algebrica (A, + .o) costituita da un insieme A e


da due operazioni binarie -F,o su A si dice anello se:
1. gruppo abeliano;
2. ( A ,o) un monoide;

3. Va,b,c e A valgono le leggi distributive del prodotto rispetto alla somma:


{a + b ) o c = a o c + b o c
c o (a + b) c o a A- c ob.

Nel seguito indicherem o con e leggeremo zero dellanello A lelemento neu


tro ripetto alla som m a, m entre indicherem o con 1A relem ento neutro nspetto al
prodotto che leggerem o unit dellanello A '\

Definizione 10.2 Un anello (A, + ,o) in cui V a, b a o b = b o a si dice


commutativo.
Esempio 10.1
1. Linsieme degli interi relativi, dei numeri razionali, dei numeri reali rispetto
alle usuali operazioni di som m a e di prodotto, sono esempi di anelli infiniti
commutativi.
132 Capitolo 10

2. L'insieme Z delle classi di resti modulo n, rispetto alle operazioni di somma


e prodotto di classi a suo tempo introdotte, costituisce un esempio di anello
finito di ordine n commutativo.

3 Linsieme delle matrici quadrate di ordine n, Matnxn (E) rispetto alla somma
matriciale e al prodotto righe per colonne costituisce un esempio di anello
infinito non commutativo.

Osservazione 10.1 Sia (A, + ,o) un anello. Per ogni a,b e A e per ogni n e Z
si ha:

1. 0a oa = 0a = a o Oa.
2. a o (-b) = (-a) o b = (a o b).
3. (na) ob = ao (nb) = n(a o b).

Le dimostrazioni di queste propriet elementari sono lasciate al lettore per eserci


zio.

Se andiamo con la memoria al Capitolo 7 riguardante le operazioni binarie su


un insieme e alla costruzione delle tavole di composizione di Ze (Esempio 7.14),
ci accorgiamo subito di un comportamento particolare: il prodotto delle classi
[2L e [3L d la classe [0]6 mentre ci non succede quando si moltiplicano in Z
due numeri entrambi diversi da zero.
Questo giustifica la seguente definizione:
Definizione 10.3 Dato un anello (A, + ,o), un elemento a e A, a j=. 0^, si dice
divisore dello zero, se esiste b e A, b ^ 0 Atale che a ob = 0 ^ oppure boa = 0^.
Esempio 10.2 In (Zg, 4- ,) le classi [2]g e [4]g sono divisori dello zero mentre
(Z3, + ,*) privo di divisori dello zero.
Esempio 10.3 In Mai2x2(E), cosiderate le matrici
11 10
A= B
00 -1 0
si ottiene che
00
A B = 0A = 0 0
mentre
1 1
B A
1 -1
Osservazione 10.2 Se i i ^ p (primo), lanello (Z, + ,) contiene divisori dello
zero. Infatti, posto n ~ ab con l < a < n , \ < b < n risulta \a~\ ^ TOl e
w. * = [Libi,, = [ab],, = [ni = [0]. [a]" # [0]" e
Anelli e Campi Anello dei polinomi 133

Teorema 10.1 Un anello (A, 4- ,*) privo di divisori dello zero se e solo se in
esso valgono le leggi di cancellazione rispetto al prodotto, cio se V a,x,y e A
con a ^ 0 si ha che

i) ax = ay => x = y

ii) xa = ya => x = y.

Dimostrazione. Sia per ipotesi A privo di divisori dello zero e sia ax = ay cio
ax - ay = 0A da cui, per le leggi distributive, si ottiene a(x - y) = 0A. Ma
a Oa e A privo di divisori dello zero per cui x - y = 0A cio x y.
Viceversa supponiamo che in A valgano le leggi di cancellazione e siano
x, y e A, x / 0A, y ^ 0A.
Se fosse xy = 0A, potremmo scrivere anche xy = 0A = 0A} e, cancellando y
(che 0A), dedurremmo x 0 A, in contraddizione con lipotesi.

Definizione 10.4 Sia (A, + ,) un anello: un elemento a e A, a ^ 0A si dice


unitario o invertibile se ammette inverso rispetto al prodotto, cio se esiste un b
tale che ab = ba = 1A. L inverso di un elemento a si indica usualmente con il
simbolo a~l.

Esempio 10.4 Gli unici elementi invertibili di (Z, + ,) sono 1 e - 1 . In (Zg,-f ,)


la classe [5]g invertibile e ammette come inverso se stessa. In (R, 4- ,) tutti gli
elementi diversi dallo zero sono invertibili.

Osservazione 10.3 Un elemento unitario di un anello non divisore dello zero.


Infatti sia a un elemento unitario di un anello A e supponiamo che esista b e A,
b ^ 0A tale che sia ab = 0A. Moltiplicando a sinistra per a~K otterremmo
cT'Oa = z-1 (ab) = (a~la)b b 0 A, assurdo!

Proposizione 10.1 Sia (Z, -f ,) Vanello delle classi di resti modulo n: un ele
mento [a]n unitario se e solo se mcd(a,n) = 1.

Dimostrazione. Dire che [a]n e Z unitario vuol dire che esiste [c]n e Zn tale
che [a] [c] = [1] e quindi un c e Z tale che ac = l(modn). Deve perci
esistere una soluzione della congruenza lineare ax = l(mod/i) e questo accade
se e solo se m c d (a, n) = 1 (cfr. Proposizione 4.5).

Osservazione 10.4 Se n = p, numero primo, gli elementi di (Zp, 4-,-) non


nulli sono tutti unitari, come conseguenza della proposizione precedente, e quindi
(Z* ,-) un gruppo.

In realt questa osservazione si inserisce in un discorso di pi ampio raggio con


tenuto nella seguente

Proposizione 10.2 Sia (A, + ,) un anello e sia U l insieme degli elementi uni
tati di A: allora (f/,-) un gruppo.
134 Capitolo 10

Dimostrazione. Infatti U non vuoto poich 1A, essendo elemento invertibile,


appartiene a U. Inoltre U chiuso rispetto al prodotto poich Va,/? e (J Tele-
.a ___ a a A a a 1 I a _ a

mento al? e U Infatti esistendo b~] e a~] in A, anche l elemento b~]a~[ sta in A
ed essendo {ab){b~la~l) - a segue che ab unitario e quindi appartiene a U.
Da ultimo ogni elemento a non nullo di U invertibile e l inverso sta in U poich
- h - i _
( ) a.

Esempio 10.5 Sia (Zs, + ,-) l'anello delle classi di resti m odulo 8. Il gruppo
degli elementi unitari U{Z8) = {[1]8,[3]8,[5]8,[7]8}.

Come differenziare la situazione in cui tutti gli elem enti non nulli siano invertibili
da quella in cui solo alcuni lo sono?

Definizione 10.5 Un anello commutativo (K, + ,) con almeno due elementi si


dice campo se ogni elemento di K diverso da zero unitario.
Esempio 10.6 Gli anelli (Q, + ,) e (R, 4- ,) dei num eri razionali e reali rispet
tivamente sono campi cos come gli anelli (Zp, + ,) (p prim o) delle classi di resti
modulo un primo p.

Osservazione 10.5 Un campo privo di divisori dello zero per definizione, ma


un anello pnvo di divisori dello zero non necessariam ente un campo (si veda,
per esempio, (Z, + ,)).

Tuttavia Vipotesi di finitezza garantisce che

Proposizione 10.3 Un anello A commutativofinito e privo di divisori dello zero


un campo.
Un modo differente di trovare linverso di un elemento non nullo nel campo
(Zp, + ,) ci fornito da un noto Teorema di teoria dei numeri, enunciato da Fer
mai nel 1640 e dimostrato circa quarantanni dopo da Leibniz in un manoscritto
e successivamente da Eulero (1736) con un metodo pi sem plice ed elegante.

Teorema 10.2 Per ogni primo p e per ogni intero a : ap = a(mod p).

In realt noi dimostriamo questo Teorema, conosciuto come piccolo Teorema di


Fermai, come caso particolare di un Teorema pi generale in cui coinvolta la
funzione Eulenana, detta anche indicatore di Gauss-Eulero, che ora definiamo.

Definizione 10.6 La funzione di Eulero (p : N \ {0} * Z la funzione definita


ponendo <p{\) = 1 e fin) uguale al numero degli interi positivi minori di n e
primi con n, perii > 1.
Esempio 10.7 Se n - 8 i numeri positivi minori di 8 e primi con 8 sono 1,3,5.7
per cui (pi8) = 4. Se n = l i numeri positivi minori di 7 e primi con 7 sono
l,2,3,4.5,6percui </>(7) = 6.

Al fine di computare (pin) Vn > 1, osserviamo che vale la seguente:


Anelli e Campi Anello dei polinomi 135

Proposizione 10.4 Siati > 1, allora:

1. <p(pm) = p m p m~x = p m~l(p 1), Vp primo ed m > 0 ;


2. (p(ab) = (p(a)(f){b) se a e b sono primi fra loro cio se MCD(a,b) = 1 e
r r
quindi, postoti = Y\p?> (Pi 5* Pj J 5* J) f i n ) = Y\<t>(p').
i=i i=i
Siamo, ora, in grado di provare il seguente

Teorema 10.3 (Fermat-Eulero ) Se n > 0 ed a un intero primo con n, si ha


che
a<j>(n) _ 1(mod /2

Dimostrazione. C onsideriam o (Z , + ,) l'anello delle classi di resti modulo n.


Poich m c d (a,n) = 1, la classe [a]n invertibile in Z. Poich l'ordine di U(Zn)
(gruppo degli elementi unitari di Z) <p(n), come conseguenza del Teorema
di Lagrange (cfr. Teorem a 9.4), si ottiene che [af ,{n) = [1 cio in termini di
congruenze si ha a^ yn) = 1(m od n).

Corollario 10.1 Se n p (primo) ed a un intero non divisibile per p si ha


ap~l = l(m od p).
Dimostrazione. un caso particolare del precedente risultato, dal momento che
cj)(p) = p - 1 e che m c d (p,p 1) = 1.
Esercizio 10.1 Provare che (2 /)12:' = 2(mod5).
Poich 2 = 3 (m o d 5 ), la tesi diventa dimostrare che 3 12' = 3(mod5)
Ora 3^l5) = l(m o d 5 ) per il piccolo Teorema di Fermat, sicch 34 = l(mod5)
Pertanto, elevando am bo i m em bri della congruenza alla 3 1esima potenza si ha-
(34)31 = l 31 (mod 5 ) da cui 3 124 = 1(mod 5) e, sfruttando le propriet aritmetiche
delle congruenze, si conclude che 3 i2:i = 3(mod5) (cfr Proposizioni 4 3, 4 4)

Esercizio 10.2 Dire se sono vere o false le seguenti affermazioni

1. 15355 = l(m o d 8 );

2. I l 48 = 1(mod 104);

3. ( - 5 ) 433 = 7(m od 12).

Esercizio 10.3 Sia (M ai 2x2(^ ), + ,) Panello delle matrici quadrate di ordine 2


a coefficienti reali. Gli elem enti unitari sono tutte e sole le matrici del tipo

con ad bc f 0 .

Esercizio 10.4 D eterm inare l'insiem e D dei divisori dello zero e il gruppo L
degli elementi unitari dei seguenti anelli:
1. (Z|2, -+
2. ( 9. -r

3. (Zi, + ,)

10.1 Anello dei polinomi a una indeterminata

In questa sezione del capitolo dedichiamo particolare attenzione a un anello, quel


lo dei polinomi, col quale la maggior parte dei lettori ha gi acquisito una certa
familiant, per lo meno quando si lavora sul cam po reale. Il nostro scopo in
realt quello di estendere certe considerazioni a un cam po K qualsiasi. Osser
veremo che molti dei risultati a suo tempo illustrati per gli interi (relativi) hanno
analoghi in ambito polinomiale, uno per tutti il Teorem a di fattorizzazione.
Sia, ora, A un anello commutativo; consideriam o successioni definitivamente
nulle di elementi di A del tipo (co,a\ , . . . , ,0 a ,0 a , . . . ). N ellinsieme di dette
successioni si definiscono una somma e un prodotto:

(ao.fli* ) T {b0,bi , . . . , 0 a,0a , . . . )


(flo T boMi T b \, . . , ,0A,0A,. .. )

(flo.fli*...?fiA^A*'*)(bQ,bi , . . , ,0A,0A,. )
(.C-o,^ 1* )

ove
co = ciobo, C\ = aob\ 4- \bo,
k
c2 aob2 + (2\b\ + d 2bo, . . . , Ck = Y l a ib k - i
1=0

facile verificare che, rispetto alle operazioni di somma e prodotto cos defini
te, linsieme delle successioni definitivamente nulle di elementi di A un anel
lo ove lo zero la successione (0 a,0 a , . . . ,0 a , . . . ) , lunit la successione
(1,0a,0 a, ,0A, . . . ) e gli elementi a dellanello A si identificano con le suc
cessioni del tipo (i,0A,0A, . . . ).
Usualmente si introduce un simbolo x (che si definisce indeterm inata) e si
rappresentala successione (ao,ai, ,in,0A,0A, - ) con la pi familiare espres
sione:

(a0,a i ,. . . ,a,0A,0A, . . . ) = io*0 + a i* 1 + a2x 2 + . . . + anx n = z(jt).

Si indica inoltre con il smbolo A[x], lanello delle successioni definitivamente


nulle a coefficienti in A.
Anelli e Campi. Anello oe' poiinom 137

Definizione 10.7 Una successione definitivamente nulla di elementi d. 4 - dia


polinomio e, in virt dell'osservazione fatta sopra, si pu rappresentare neia
forma
a(x) anx n + ... + a \ x 1 -f- o q X o

omettendo i termini per i quali a, = 0 .


Osservazione 10.6 Con questa rappresentazione le operazioni di somma e pro
dotto fra polinomi coincidono con quelle gi note.
Definizione 10.8 Dato un polinomio a(x) = anx n + . . . + a\ x -f ao di A[x] con
an fi 04, si dice grado del polinomio Vintero positivo n, mentre il coefficiente ar
si dice coefficiente direttivo. Se a = 1 si dice che a(x) monico.

Osservazione 10.7 Gli elementi non nulli dellanello A sono polinomi di grado
0, mentre al polinomio nullo si pu assegnare, per convenzione, grado - 1.
Notazione 10.1 Dato il polinomio a(x) anx n + . . . -f a\x + ao, con an fi 0 ,4,
indicheremo il grado n di a(x) con gr (o(x)).

Osservazione 10.8 gr (a(x) + b(x)) < max (gr (a(x)),g r( b(x))).


Si pu avere la disuguaglianza stretta: consideriamo nellanello Z[x] i polinomi
a(x) = x 2 + 3x 1, b(x) = x 2 4- 2x. Allora a(x) 4- b(x) 5.* 1 e il grado
della somma strettamente minore del grado di ciascun addendo.
Osservazione 10.9 gr (a(x) b(x)) < gr (a(x)) 4- gr (b(x)).
Anche in questo caso si pu avere la disuguaglianza stretta. Infatti per esempio in
li[x\ consideriamo i polinomi a(x) = [2]4jc3 -f [1]4 e b(x) = [2]4x. Allora
a{x) b(x) = [4]4jc4 + [2]4* = [2]4x, poich [2]4 in Z 4 divisore dello zero1.
Proposizione 10.5 Se A privo di divisori dello zero (per esempio, se A un
campo 0 A = Z) allora gr {(a(x)b(x)) = gr (u (jc)) 4- gr (b(x)).
Dimostrazione. Infatti, siano
a(x) = anx n 4- . . . 4- a\x + ao e b(x) = bmx m 4- - .. + b\x 4- bo.
Allora
a(x) b{x) = anbmx n+m + (anbm- i + an- bm)xn+m~ + . . . 4- aob0
ed
t^ n b m f i ^A Q-n f i Oa f i bm

e quindi il grado n 4 - m.
Sono importanti le seguenti

'Nel seguito per indicare 1 coefficienti di un polinomio in Zn[x], per semplicit, e quando non si generi
confusione, tralasceremo le parentesi neHindicare le classi, cio scriveremo a al posto di [a]n.
138 Capitolo 10

Proposizione 10.6 Se un anello A privo di divisori dello zero allora A[x]


privo di divisori dello zero.
Proposizione 10.7 Sia A un anello privo di disori dello zero: gli elementi uni
tari di A[x] sono tutti e soli gli elementi unitari di A.

Dimostrazione. Infatti a(x) b(x) = 1 se e solo se a{x) = ao e b{x) bo, poich


il grado del primo membro deve essere eguale al grado del secondo membro, da
cuiaofy) = 1.
Da questo momento in poi, salvo esplicito avviso, considereremo solo polinomi a
coefficienti in un campo K.

10.1.1 Divisione in Z

Teorema 10.4 Siano a{x),b{x) e K[x] con b{x) 7^ 0; 3! q(x),r(x) e K[x]


tali che sia:
1. a(x) = b(x) q(x) + r(x)
2. gr(r(x)) < gr (&(*)).
Dimostrazione.
Esistenza
Se a{x) = 0 allora q{x) = r(x) = 0. Supponiamo n > 0 e siano
a(x) = anxn + ... + aix +ao e b(x) = bmx m + . . . + b\x + bQ
quindi gr(a(x)) = n e gr (b(x)) = m.
Se m > n si pu scrivere a{x) = b(x) 0 + a(x), ciq(x) = 0 e r(x) = a(x).
Se m < n, procediamo per induzione su n. Essendo a e bm diversi da 0 poniamo
a'(x) = a(x) - ab~lx n~mb(x) (o)
e quindi
a\x ) = axn + ... 4- ao an(bmlbm)xn + . . . + (a)bmlbox" m =

= anxn + . . . + Oq anx n + . . . + ( an)bm1box"


Poich gr (a'(x)) < n - 1, per lipotesi di induzione 3 q'(x),r'(x) K[x] tali
chea'(x) = b(x) q{x) + r'(x) con gr (r\x)) < gr (b(x )). Allora, ricavando
a (a ) dalla precedente relazione (o) e sostituendo, si ottiene
a(x) = a\x) +anb~lx"-mb(x) = b(x)[q'(x) + ab~1x ,,~m] + r'(x).
Si perviene alla tesi ponendo q(x) = [q'(x) + ab~Ix n~m] e r(x) = r'(x)
Anelli e Campi Anello dei polinomi 139

Unicit
Supponiamo che esistano q(x), r ( x ) e q\{x),r{{x) tali che

a(x) = b(x) q(x) + r(x) con gr (r(x)) < gr (b{x))

a(x) = b(x) q x(x) + rx(x) con gr ( n (x)) < gr (b(x)).

Uguagliando i due membri si ottiene

b(x)q(x) + r ( x ) = b{x)q {x) + ri(* )

b(x)[(q(x) - qi(x)] = rx(x) - r(x).


Poich il polinomio al primo membro il polinomio nullo (perch altrimenti
avrebbe grado strettamente maggiore del grado del polinomio al secondo membro,
che assurdo) si pu concludere che q{x) = q\{x) e r ( x) = r ^ x ) . u

C unevidente analogia tra lalgoritmo della divisione tra polinomi (con coef
ficienti in un campo) e quello tra numeri interi. Infatti lenunciato del teorema
precedente si ottiene formalmente da quello a suo tempo visto in Z pur di sosti
tuire il valore assoluto del divisore con il grado del polinomio divisore.

Osservazione 10.10 Se nella divisione di a(x) per b(x) si ha che r(x) = 0,


diciamo che b(x) divide a(x) e scriviamo b{x)\a(x).

OsservazionelO.il Se f { x ) e K [ x ] e c e K \ {0*}, allora c f ( x ) \ f ( x ) e


c\f{x).
Infatti f ( x ) = ~{cf {x )) = c ( - f { x ) ) .
c c
Esempio 10.8 Determinare il quoziente e il resto della divisione del polinomio
a(x) = x 4 - 2x 3 + x 2 + x 1 per b(x ) = 3x 3 5 in M[jc]

Effettuiamo la divisione
x4 2 x 3 +x2 +x -1 3x3 -5
5 1 2
-x 4 -x
+r 3 _ 3
8
0 2x 3 JC2 + 3* -1
10
2x 3
3
8 13
0 *2
+ 3* 3

e otteniamo: q(x) = 2 j 9 8 13
- ed r(x) = x~ x .
140 Captolo 10

Esempio 10.9 Determinare il quoziente e il resto della divisione del polinomio


c{x) = a3 -f x2 + 3a + 1 per d(x) = x 2 - 2 in Z 5[a]:
Effettuiamo la divisione

x3 + a 2 +3 a + 1 X2 -1
m

~x 3 + 2 a X + 1

0 + x 2 +5 a + 1
x 2 + 2

0 0 3
e otteniamo q(x) = a+ 1 e r{x) = 3. (Nota bene: in Z 5 si ha che 5 = [5]s =
tOs = 0).

Esempio 10.10 Determinare il quoziente e il resto della divisione del polinomio


/ ( a) = a4 + a2 + 1 per gOx) = 3a3 2 in Z7[x].

a4 + a 2 + 1 3a3 -2
-A 4 + 10 a 5x
0 A2 +3 a + 1

e quindi q(x) = 5a, r{x) = x 2 + 3x + 1.


(Notabene: in2/7 si ha che 3 1 = [3]^ 1 = [5]7 = 5 e 10 = [10]7 = [3]7 = 3).

10.1.2 Massimo comun divisore di due polinom i

Definizione 10.9 Siano a(x) e b(x) due polinomi non nulli di K[x). Si dice
massimo comun divisore fra a(x) e b(x), e lo si indica con mcd(<z(x),b(x)),
ogni polinomio d(x) K[x] tale che:

1. d(x)| a(x) e d(x)\ b(x);

2. se esiste c(x) [ a] tale che c(a )| a(x) e c(x)\ b(x) allora c ( x ) \ d(x).

In analogia a quanto visto nellanello Z degli interi relativi diamo la dimostrazione


costruttiva dellesistenza di un mcd fra polinomi, utilizzando lalgoritmo delle
divisioni successive.

Teorema 10.5 Dati due polinomi a(x), b(x) e K[x] entrambi non nulli, esiste
un MCD{a(x)Mx)) = d(x). Esistono inoltre dei polinomi f ( x ) , g ( x ) e K[x] tali
che siad(x) = a(x) f(x) 4- b(x)g(x).
Anelli e Camp. Anello dei polinomi 141

Dimostrazione. Si supponga g r ( a ( * ) ) > g r (b{x)) e si eseguano le divisioni


successive
(1) a(x) = b ( x ) q \ ( x ) + r x(x) con g r ( n ( x ) ) < gr ( ( a ))

(2) se r\{x) ^ 0 : b(x) = r x(x)q2(x) + r2(x) con gr (r2(x)) < g r(n (A ))

(3) se r2(x) 0 : ri(A ) = r2( x )q 3(x) + r3(x) con g r ( r 3(* )) < gr (r2(x))

(k-1) s e r ^ U ) t^ O : rk- 3{x) = rk- 2(x)qk- \ ( x ) + r * - i( x )


con g r ( r A._i(A )) < g r(r* _ 2(A))

(k) se ^ 0 : r fc_ 2(^ ) = rk. x{x)qk{x).

Poich la sequenza dei resti delle successive divisioni costituita da polinom i il


cui grado strettamente decrescente, dopo un num ero finito di passi si ottiene un
resto nullo.
Se ri (a ) = 0 si ha che b(x)\a{x) e quindi MCD(a(x),b(x )) = b{ x). Se
ri (a) 0 ed r*(a ) il prim o resto u g uale a zero, m ostriam o che allora rk_\ (a ) =
mcd(u(a ),/?(a )).

Basta verificare le condizioni 1) e 2) d ella definizione.

1) r^_i(a )| a{a ) e rk- \ ( x ) \ b(x). Infatti /> _ i (a )| rk- 2(x) dalla uguaglianza (k) e
cosnsalendo si ottiene dalla (2) e d alla (1) ch e r^_ i(A )| b{x) e rk.. i (a )| a(x).

2) se c(a)| a{x) e c (a )| b(x) allora c (a )| rjti (a ). Infatti dalla ( 1 ) si ha che


c(a)| ri (a); se c(a )| ri (a ) e c (a )| b{x) d alla (2) si ha che c (a )| r 2(a ). Cos
proseguendo, alla fine si ottiene che c (a ) | r^_i (a ) e quindi si conclude che rk- i ( x )
un MCD{a(x),b{x).
Quanto alla seconda parte d e llen u n ciato del Teorem a, lequazione (1) per
mette di esprimere r\{x) nella form a: ri (a ) = a ( x ) + >(a ) ( c/ i (a )).
Sostituendo lespressione di rj (a ) nella (2) si ha:
r2(.r) = ci (a) ( q2(a )) + b{a )(1 + q\{x)q 2{x))
e cos via. In questo m odo si esprim e ciascun resto com e com binazione a coef
ficienti polinomiali di a(x) e b( a ). In particolare esisteranno f \ x), g(x) e A'[a ]
tali che sia d (a ) a ( x ) f ( x ) -f b{x)g(x).

Osserviamo, ora che mcd(<2(a ),6( a )) determinato a meno di una costante


moltiplicativa non nulla.

Teorema 10.6 Sia d( a ) = mcd(<z (a ),/?(a )). Allora un polinomio d \ x )


Mcr>((a(x),b(x)) se e solo se d'(x) = k d ( x ) con k e K* = K \ {0}.

Dimostrazione. Per ipotesi sia d'(x) = k d ( a ): essendo k un elemento invertibile


si ha che d(x) = k ~ ld'( a ).
142 Capitolo 10

Poich d(x)\ a(x) esiste a'(x) tale che a ( x ) = d ( x ) a ' ( x ) = k ~ ld' ( x ) a ' ( x ) . Si
ottiene quindi che d'(x)\a(x) e in modo analogo d ' ( x ) \ b ( x ) .
Sia, ora, c(x) un polinomio tale che c(x)| a ( x ) e c ( x ) | b { x ); allora, per defini
zione, c(x)| d ( x ), cio d ( x ) = c ( x ) q ( x ) da cui segue che d ' ( x ) = kd(x) =
kc{x)q(x) cio c ( x ) | d'(x).
Viceversa supponiamo che sia d \ x ) = MCD{a(x), b(x)). Allora d ' ( x ) | /(x)
e z/Cx)| /'( ac) cio esstono q \ ( x ) , q2(x) e [x ] tali che d ( x ) = d ' ( x ) q d x ) e
d'(x) = d{x)q2{x), quindi si hache d ( x ) = d ( x ) q 2{x)q\ (x) e, semplificando per
d(x) 0, si ottiene 1 = q2( x ) q i ( x ) da cui q 2{x) = k ^ 0 e q x(x) = k ~ l . m

Definizione 10.10 Due polinomi a ( x ) e b ( x ) si dicono rela tiv a m e n te primi (o


primi fra loro) se m c d ( u (x ),>(x ) ) = k e K, ovvero se il loro m c d monico 1*.
Esempio 10.11 Determinare in Q[x] il m cd monico tra a ( x ) = x 3 2x 4- 1 e
b{x) = x 2 - 1.

Procediamo dividendo anzitutto a ( x ) per b ( x ) si ha

-2x +1 x2 -1
- x3 +x X
0 -x +1
Dividiamo, ora, b(x) per il resto r(x ) = x 4- 1

x2 -1 -x +1
- a:2 +x x 1
0 4-x -1
x +1
0 0
Quindi un mcd(a(x),b(x)) = - x 4-1, mentre il mcd (a (x ),b (x )) monico ac - *
Esempio 10.12 Determinare in Zs[x] il mcd monico fra a(x) = x 3 4- x 2 4- ac+ 1
e b(x) = 3x2 4- 2x 4- 2.

*3 +x2 4-x +1 3x2 4-2x +2


- x 3 4x2 4x 2x -1
0 -3 x 2 -3 x +T
_____ + 3x2 +2x -1-2
x +3
Ora dividiamo b{x) per il resto r](x) = - x + 3

4-2x +2 x +3
__3x2 +9x 3x 1
+X +2
- ac +3
Anelli e Campi. Anello dei polinomi 143

Allora un mcd = x 4- 3. Quello monico (jc + 3) = x - 3 .

Esercizio 10.5 Determinare un mcd monico fra le coppie di polinomi degli esem
pi 10.8, 10.9, 10.10.

10.1.3 Polinomi irrid u c ib ili e te o re m a di fa tto riz z a z io n e

Definizione 10.11 Sia a{x) e K[x] un polinomio di grado n > 0. Si dice che
a{x) irriducibile in K[x] se a(x) divisibile solo per i polinomi di grado zero
eperi polinomi della forma Xa(x), con X e K*. In caso contrario il polinomio si
dice riducibile.

Osservazione 10.12 La nozione di irriducibilit di un polinomio dipende dal


campo K , come mostrano i seguenti esempi: f ( x ) = x 2 + x + 1 e R[x] ivi
irriducibile, mentre lo stesso polinomio riducibile in Z 3[x]. Infatti in Z 3[x ]
f(x) = x 2 - 2x -f 1 = (x l ) 2.

Osservazione 10.13 Se gr ( / ( * ) ) = 1, / ( x ) irriducibile.

Esempio 10.13 In R[x] il polinomio / ( x ) = x 4 + 1 riducibile. Infatti si pu


scrivere: x 4 4- 1 = (x 2 + \ f l x -I- l ) ( x 2 s fx -f 1).

Osservazione 10.14 Siano p ( x ) , f ( x ) , g ( x ) e K[x] ; inoltre p{x) sia irriducibi-


le e divida il prodotto f ( x) g( x) . Allora o p ( x ) \ f ( x ) o p(x)\g(x).

Teorema 10.7 {difattorizzazione unica ) Ogni polinomio f { x ) e K[x] di grado


n > 0 pu essere scritto come prodotto di s > 1 polinomi irriducibili ( non
necessariamente distinti). Tale fattorizzazione essenzialmente unica nel senso
che se: a{x) p\{x)p 2( x ) . . . p 5(x) = q\ {x)q2 x ) . . . qt {x) con i polinomi p, (x)
eqfx) irriducbili (1 < i < s, 1 < j < t), allora si possono ordinare fattori in
modochesias = t e p x{x) = /zi#i(x), p 2{x) = h 2q2{x) , . . . , ps{x) = hsqs{x),
conh, e K \ {0}.

Dimostrazione.
Esistenza della fattorizzazione. Si procede per induzione su n = gr (a(x)).
Se a{x) irriducibile non c nulla da dimostrare. Sia quindi a{x) riducibile:
allora a(x) = b(x)c(x) con g r ( 6 (x)) < n e g r(c (x )) < n Per ipotesi indutti
va b{x) = b[{x) . . . bh{x) e c(x) = c i ( x ) . . . q (x ), ove i fattori ,(x) e cy(x)
sono polinomi irriducibili (1 < / < h e 1 < j < le) . Segue che si pu scrive
re: a(x) = b\{x)... bh{x)c\{x ) . . . Ck{x) e quindi abbiamo una fattorizzazione di
a{x) in polinomi irriducibili.
Unicit della fattorizzazione. Supponiamo che esistano due fattorizzaziom
diflfx) in polinomi irriducibili, sia cio:
a(x) = p i ( x ) . . . ps(x) e a{x) = q\ (x ) . . . qt{x)
con p,{x) eqj(x) irriducibili (1 < / < s, 1 < j < t).
144 Capitolo 10

Poich qi (a ) irriducibile e divide a(x) = Pl (x ) . . . p s(x), allora qx(x) divi


de almeno un fattore p,(x ): non lede la generalit del discorso supporre che
qi(x)\ p\{x). Poich anche p {(x) irriducibile, necessariamente P (*) = hlq (n
ove /li AT*; quindi 1
a(x) = h\q\(x)p2(x) . . . ps(x) = q\(x)q 2(x ) . . . q t(x)
da cui

h\P2(x) . Psix) = q 2(x ) . . . q t (x)


e 1 ipotesi di induzione ci permette di conludere che s = t e p,(x) = h a (a ) n e r
\<<s.m

Corollario 10.2 Ogni polinomio o(x) K[x] di grado n > 0 si pu scrivere


nellafoima a(x) = ka\(x)a2(x)... a5{x) ove k K* il coefficiente direttivo di
a{x) e i polinomi a,(x) (1 < / < $) sono monici e irriducibili. Tale scrittura
unica, a meno dellordine dei fattori.

10.1.4 Radici di un polinom io su un cam p o

Definizione 10.12 Sia A un anello (in particolare un campo), sia A[x] Vanello
dei polinomi a coefficienti in A e sia a e A.
Per ogni polinomio f (x) = ao + ai* + . . . + anx" 6 A[x] si dice valutazione o
valore assunto da f(x) su a l elemento a0 + axa + . . . + ana n e A che di solito
indicato con il simbolo / ( a ) .
Dati due polinomi f ( x ), g(x) e A[x] valgono le propriet:
i) ( f + g)(a) = f(ot) + g(a)
ii) (fg)(a) = /(a )g (a ).
In altre parole possibile costruire una corrispondenza (f)a : A[x] > A
che associa a ogni polinomio f(x) la sua valutazione / (a) e che lascia fissi gli
elementi di A e porta x in a.
Lapplicazione 0 a detta sostituzione o valutazione di A[x] su a.
Definizione 10.13 Dato un anello A , un suo elemento oi si dice radice, o zero,
o soluzione del polinomio f (x) e A[x] se f (a) = 0.
Nel seguito considereremo sempre polinomi a coefficienti in un campo K.
Cominciamo con lenunciare e provare il

Teorema 10.8 (Teorema di Raffini2) Sia K un campo, f ( x ) e K[x] e a un


elemento di K. Allora a radice di f ( x) se e solo se il polinomio (x - a) divide
f(x).

2 paol Rufiini talentano (VT) 1765 - Modena 1822) matematico e medtco.


Dimostrazione. Per ipotesi (x - a) divida / ( x ) . Allora f ( x ) = (x - a)q (x)
con q(x) K[x]. Ne segue che f (a) = (oc cc)q(cc) = 0 . Da cui radice.
Viceversa sia a radice, quindi sia f (oc) = 0. Dividendo f ( x ) per (x a) si ha:
/(*) = (x - ct)q(x) 4- r(x ) con gr r(x ) < gr (x - a ) = 1.
Si ottiene quindi che f (x) (x cc)q(x) + ro, con ro K. Sostituendo oc al
posto dell indeterminata x segue che f(oc) = (a a)q(a) + ro, il che implica
ro = 0 cio (x - oc) divide / ( x ) .

Esempio 10.14 Sia / ( x ) = x 4 - 5 x 2 + 6 . Poich / ( x ) = (x 2 - 3)(x 2 - 2) =


(x -v ^ )(* + \/3 )(x V 2 ) ( x + \/2 ) e R [x], esso ammette radici V 3 , >72 e R.

Osservazione 10.15 Un polinomio / ( x ) = a 0 + a xx e K[x] di grado 1 irri


ducibile in K[x] e ammette lunica radice oc = a ^ la0 in K.

Osservazione 10.16 Se f ( x ) e K [ x ] ha grado > 1 e ammette radice, allora


f{x) riducibile per il Teorema di Ruffini, ma il viceversa non vero. Infatti
basta considerare f ( x ) = x 4 + 5x~ + 6 e R [x]: esso riducibile in quanto
f(x) = Cx2 + 3)(x 2 + 2) ma non am mette radici in R.

Proposizione 10.8 Sia f ( x ) e R [x], se f ( x ) irriducibile, allora si verifica


ma ed una sola delle due situazioni:

1. il grado di f ( x ) = 1 ( g r ( / ( x ) ) = 1),

2. oppure f ( x) = ax 2 + b x + c , con A = b 2 - 4 ac < 0.

Teorema 10.9 Un polinomio f (x) [x] di grado n > 0 a coefficienti in un


campo K ha al pi n radici distinte.

Dimostrazione. Si procede per induzione su n. Se n = 0, allora / ( x ) = k e K


e quindi non possiede radici. Supposto lasserto vero per polinomi di grado n 1
dimostriamolo per polinomi di grado n. Naturalmente se il polinomio di grado
n non ha radici lasserto vero; se, invece, possiede una radice a e K, per il
Teorema di Ruffini si ha: / ( x ) = (x - a)g(x) con g(x) e K[x]. Ma allora
gf ((*)) = - 1 e, per ipotesi induttiva, g(x) ha al pi n - 1 radici distinte Ora
un elemento fi e K radice di f ( x ) se e solo se f} = a o fi radice di g(x)
Pertanto f(x) ha al pi n radici distinte.

Definizione 10.14 Sia f ( x ) e K[x]e sia oc e K una radice di f (x). Si dice che
a radice di molteplicit n se (x - a )n \ f ( x ) ma (x - a )n+l f /(x ).

Teorema 10.10 Sia f ( x ) e A^[x] un polinomio di grado n: la somma delle


tnolteplicit delle radici non supera n.

Dimostrazione, (traccia) Si ragioni per induzione su g r ( /( x ) ) sulla falsariga di


quanto fatto nel precedente Teorema 10.9.
146 C apitolo 10

Teorema 10.11 (Principio di identit dei polinomi) Siano a 0, . . . n +1 ele


menti distinti di un campo K e siano f (x), g(x) due polinomi di ATfjc], entrambi
di grado minore o uguale a n,tali che f (,) = )
f(x) = g(x).

Dimostrazione. Basta considerare il polinomio = a(x) - b(x) di grado al


pi n. esso ammette le n 4- 1 radici o, . . Per il Teorema precedente h(x)
deve essere il polinomio nullo, pertanto f { x ) = g(x ) . u
Esercizio 10.6

1. Siano a(x) = x 4 + 3x 2 + 2x + 1 e b(x) = x 3 4 due polinomi di Z7.


Determinare il loro mcd monico ed esprmerlo come combinazione di nix) e
b(x).

2. Si considerino i polinomi f ( x ) = x 4 + 3x 3 - \2x - 36 e g(x) = x 2 - 9 di


IR[jc]: decomporre f (x) e g(x) nel prodotto di polinomi irriducibili in R[x] e
determinare un loro mcd.
3. Dati 1polinomi /(x ) = x 3 x e g(x) = x 1 x in Z 7, se ne determinino le
radici.

4. Sia K un campo e siano f ( x ) e g(x) due polinomi coprimi in K [x]. Si provi


che /(x ) e g(x) non hanno radici in comune.

10.2 Funzioni polinomiali e S chem a di Hrner

Sia /(x) = anxn+all-\x n 1-K . .-\-a\xx+aox un polinomio a coefficienti reali.

Abbiamo gi osservato che ad ogni polinomio / ( x ) e M[x] si pu associare una


funzione F : E > R definita ponendo:
F(a) = anan -|- an- ia n~l + . . . + a\a + aQ.
Tale funzione F detta funzione polinomiale associata al polinomio /( x ) e spesso
si indica lelemento F(a) con / ( a ) .

Per calcolare il valore F(a) si pu utilizzare il seguente procedimento di tipo


ncorsivo.
Poich :
/(*) = QnX'1 + Cln - [ X n 1+ . . + C 1 \X + ClQ

raccogliendo x nei primi n addendi, si ottiene:


/(* ) = [anX n 1+ d n -ix '1 + . . . + li]x T Ci

raccogliendo ancora x nei primi n 1 addendi, si ottiene:

/(*) lX" 3 + . . -p bjx 6fj]x + io]


Anelli e Campi. Anello dei polinomi 147

Iterando il procedimento, alla fine si ottiene:

/( * ) = l--[[[anx + a n- i ] x + a n_2] x + an- 3\ x H----- ]x + a0


detta scrittura di H rn e r del polinom io f { x ) .

Esempio 10.15 Considerati i polinom i / ( x ) = 4 x 5 3jc4 -f 6x 3 -f x : -f 3x - 5


e g(x) = x 4 - 5x 2 + 2, le loro scritture di Hrner sono rispettivamente:
/ ( x ) = [[[[4x - 3]x + 6 ]x + l]x + 3]x - 5

g(x) = [[[x + 0]x - 5]x + 0]x + 2.

La scrittura di Hrner permette di descrivere un efficace algoritmo , il cosiddetto


algoritmo di Hrner, che consente di calcolare il valore F(a) = f ( a) al variare
di a e R.

I N P U T : grado n di / ( x ) , coefficienti e a
R = risultato < an
per k che varia da n 1 a 0
R R * a + ak
fine
stam pa R
Sono cos necessari n passi e ogni passo consiste di due operazioni, unaddi
zione e una moltiplicazione, per un totale di 2 n operazioni.

Esempio 10.16 D a to /( x ) = 3x 5 + 0x 4 - 2 x 3 - 3 x 2 4-4x4-1, calcoliamo / ( 2 ).


/( x ) = [[[[3x + 0]x - 2]x - 3]x + 4]x + 1
/ ( 2) = [[[[3-2 + 0] . 2 - 2 ] - 2 - 3 ] . 2 + 4 ] - 2 + 1 = 7 7 .

10.3 II Campo Complesso


Nell insieme delle coppie ordinate di numeri reali

C = R x R = R2
si definiscano due operazioni, somma e prodotto, come segue:
per ogni z = (a,b), z\ = (au b\) e C
Z + Zi = (a,b) + (a x,b \ ) = (a + a x,b + bi)

z zi = (aai bb\,ab\ + aib).


Si verifica facilmente che rispetto a dette operazioni C risulta essere un campo che
chiameremo campo com plesso e definiremo suoi elementi num eri complessi.
148 C apitolo 10

L'applicazione / : R - C tale che f ( a ) = (a, 0) unapplicazione miettiva


che conserva somma e prodotto. Questo ci permette di identificare il numero
complesso della forma (u,0 ) con il numero reale a e di vedere quindi R come un
sottoinsieme di C.
L'elemento (0,1) di verr denotato con i e detto unit immaginaria. In
virt dellidentificazione operata risultai 2 = (0 , 1) - ( 0 , 1) = (1, 0 ) = - 1, sicch
<[I = i.
Pertanto ogni numero complesso ammette una scrittura cosiddetta algebrica,
che si ottiene utilizzando l'identificazione di R in C :

Z = (<a,b) = (a,0) + (0,) = (a ,0) + (7,0 ) (0,1) = a + b


ove a viene detta parte reale di z e denotata con Re z t b viene detto coefficiente
della parte immaginaria di z e denotata con Im z.

Fissato un sistema di riferimento cartesiano ortogonale su un piano, detto


piano di Argand-Gauss, si pu rapppresentare geometricamente ogni numero
complesso z = a + b come il punto P di coordinate (a,b) realizzando cos
una corrispondenza bijettiva tra i punti del piano di Argand-Gauss e i numen
complessi.

Asse immaginano '

b ...................-t (a + b)

Asse reale

Figura 10.1

Lasse delle ascisse detto asse reale mentre quello delle ordinate detto asse
immaginario.
La notazione introdotta consente inoltre di utilizzare le usuali regole del cal
colo letterale per sommare, sottrarre, moltiplicare e dividere numeri complessi,
sempre tenedo conto che i 2 = 1.

Esempio 10.17 Consideriamo i numen complessi a = 1 -f J/ 5 e ^ = 2 3/. La


loro somma a + /3, il loro prodotto a il loro quoziente a/fi sono dati da:

a + p = (1 + yfli) + (2 - 3/) = 3 + (^ 5 - 3)i


Anelli e Campi Anello dei polinomi 149

. = ( ! + V5i) (2 - 3i) = (2 + 2>V5) + - 3 )i

<* 1+^5/ ( 1 + ^ 5 0 -(2 + 30 (2 - 3^5) + (2^5 4- 3)i


(2 - 30 (2 + 30 4 - 9/ 2
P= 2-31

(2 - 3 ^ 5 ) + ( 2 ^ 5 + 3)/
13
Definizione 10.15 Si dice coniugato di un numero complesso z = a - ih il
numero complesso z a ib.
Si osserva subito che il coniugato di una somma la somma dei coniugati, che
il coniugato di un prodotto il prodotto dei coniugati e che il coniugato del
coniugato coincide con 1 elemento di partenza. Inoltre risulta:
z + z = 2 Re z

z z = 2 i Im z

Z z = a~ + b~.
Come detto precedentemente, loperazione di coniugio ha le seguenti propriet
rispetto alla somma e al prodotto:
Zi + Z2 = ZI + Zi

Z\ ' Z2 = Z \ ' Zi

Definizione 10.16 Si dice modulo di un numero complesso z = a 4- ib il nu


mero reale non negativo indicato con \z\ = Q = \/a 2 + b 2 (distanza assoluta
dell'immagine dallorigine degli assi).
Valgono le segenti propriet:

a) |z| > 0, |z| = 0 se e solo se z = 0


b) \z\ = |z|
1 1
c) k i Z2 I = k il * \z i\,
d) ki + Z2I < k il + IZ2I
e) \zi - Z2 I > llzt'l - IZ2 II-
Geometricamente |z| rappresenta, come abbiamo detto sopra, la distanza del
punto z dallorigine; \z\ Z2 I rappresenta la distanza tra i punti z\ e z i e le
150 Capitolo 10

disuguaglianze d) ed e) traducono il noto teorema sulle lunghezze dei lati di un


tnangolo per cui un lato minore della somma degli altri due e maggiore della
loro differenza.
Come noto, i punti del piano possono essere individuati anche tramite le
coordinate polari q (raggio polare) e d (angolo polare, cio 1* angolo che la retta
congiungente il punto dato con 1 origine forma con il semiasse positivo delle
ascisse, percorso in senso antiorario). Sono pertanto giustificate le seguenti.

Definizione 10.17 Sia z ^ 0: si dice argomento di z = a + ib e si denota con


argz / angolo (o uno qualsiasi degli infiniti angoli + 2kn, k Z) di cui si
deve ruotare V asse reale per sovrapporlo in direzione e verso al raggio vettore
che rappresenta z, con V usuale convenzione secondo cui un angolo positivo o
negativo a seconda che sia descritto in senso orario o antiorario.
Fissato il numero complesso z = a + ib, valgono le seguenti relazioni:
a = Re z Qcos d

b = Im z = Qsin d

q= yja2 + b2

a . b
cos d = sin 17 =
Q Q
Si ottiene cos la scrittura trigonometrica di un numero complesso:

z = q(cosi? + i sin d).


Luso della forma trigonometrica particolarmente utile quando si debbano espri
mere prodotti e quozienti di numeri complessi.
Anelli e Campi Anello dei polinomi 151

Dati due numeri complessi z\, Zi

Zi = >i (cos + i sin \) e Z2 = Q2(cos #2 4 i sin i)2)

risulta:

i Zi = Q\Q2(cos($ { + d2) + i sin(#i 4 #2)) (*)

= (cos(z?i # 2) 4 i sin(#i 2).


Z2 Ql
La (*) si generalizza, per induzione, al caso di un numero qualsiansi di fattori
Zi, Z 2, . . . , Zn e si ottiene:

Z\'Z2'"Zn = Q \Q 2 -enCcOSO?! 4 l}2 H--------- b n) 4 / S n(#i 4 H------+ $n))-

Nel caso in cui i fattori siano tutti uguali si ha:

Zn = Qn (cosini}) 4 i sin (ni})),

Definizione 10.18 Dato un numero complesso u) diremo che z radice nesima


di cose z" = 00.

Proposizione 10.9 Dato un numero complesso co = q (cos 1} 4 i sm }) e un in


tero n > 1, esistono esattamente n radici complesse n-esime di co, indicate con
Zo.Zi,............. *zn-b ove
1} 4 2kn 1} 4 2kn
Zic = yQ (cos --------------b i s in ----------- ), = 0 , 1,.......... n - 1.
n n
Le radici ai esime di un numero complesso si dispongono nel piano di Argand
Gauss come vertici di un polgono regolare di n lati inscritto nella circonferenza di
centro (0 ,0) e raggio q ove il vertice q corrisponde al punto sulla circonferenza
1}
di argomento .
n
Esempio 10.18 Si calcolino le 4 radici quarte dell unit nel campo complesso.

Esse sono i numeri Zk = a/T ( cos ()+^ t -b 1 sin = 0,1,2,3,


Si ottiene:
Zo = cos 0 4 i sin 0 = 1
2jt
Zi = cos ~ -b i sin = cos f 4 / sin | = i
Z2 = cos 4
COS f
jt 4n

4- i sin 44r = cos jt 4 i sin 7r = 1


_ 6 tt 1 : 6 t _ _ _ 3.t 3tt
Z3 = cos 4 / sm ^ = cos f - 4 / sin f = - i .i

Risultano pertanto essere i vertici di un quadrato inscritto in una circonferenza di


raggio unitario.
152 Capitolo 10

Figura 10.3

Esercizio 10.7 Scrivere in forma algebrica e trigonometrica seguenti numeri


complessi:
. i + tf5
1 i
2. (1 + z)10.
3. (2i + l)(3 - 1).

Esercizio 10.8 Calcolare le radici terze e quinte del numero complesso i.

Esercizio 10.9 Dati z = (1 - i); w = (-1 + iV 3), t = ( - 1 + i) determinare:


1- z, F, z_1, uT1, r 1;
2. z25, u>9, t25.

LJKfc?'- v
Jf .7 v <

X 1
11
Spazi vettoriali

Lim portanza del viaggio non sta tanto nel sapere dove siamo,
ma verso quale direzione stiamo andando,
senza perdere nulla di ci che troviamo lungo il percorso
(Romano Battaglia: Alle porte della vita)

Il concetto di spazio vettoriale, che introdurremo in questo capitolo, di grande


importanza per le applicazioni che esso ha in vari campi della matematica, della
fisica, delleconomia, della biologia ecc. E cosa nota che la nozione di vettore trae
ongine da problemi in cui, accanto a una valutazione quantitativa, sia necessario,
per un dato elemento, precisare una direzione e un verso. Comuni esempi di vetto-
n in questo senso sono la velocit, Faccelerazione, la forza, il campo elettrico ecc .
Si gi parlato anche di vettori com e di particolari matrici di tipo ( 1./?) o
(m, 1) (vettori riga e colonna rispettivam ente) e si osservato che, per esempio,
vetton riga dello stesso tipo si possono som m are e moltiplicare per degli scalari
(per esempio, reali) e che queste operazioni godono di certe propriet.
Anche in questo capitolo, il cam po di riferimento, che potr anche essere
sottinteso, il campo reale R. Tutte le propriet enunciate rimangono per valide
se si considera un campo qualsiasi.

Definizione 11.1 Uno spazio vettoriale su R un insieme non vuoto V di ele


menti, che diremo vettori, sul quale sono definite due operazioni, una detta somma
e laltra moltiplicazione per uno scalare (cio u n applicazione f : R x V -* V
che a ogni coppia (k,v) con k R e v e V associa uno e un solo elemento di V
che sar denotato con kv) le quali godono delle seguenti propriet

i) (V,+) un gruppo abeliano ;

ii) VA. e IR e Vu,u' e V : k(v 4 - w) = kv + kw ;

^ R e Vv e V : (k + pt)v kv + p v\
154 Capitolo 11

iv) VX. p R e Vu e V vale l uguaglianza: X(juu) = (X/x)tr,

v) Vv V : I ru = v.

Esempi

1. Sia Matmx(R) linsieme delle matrici di tipo (m ,n) a coefficienti reali. Allo
ra Matmxn(R) uno spazio vettoriale reale rispetto allusuale operazione di
somma di matrici e alla moltiplicazione per uno scalare definite nel Capitolo
8. In particolare R" uno spazio vettoriale su R. Come gi detto, geometri
camente R2 rappresenta il piano cartesiano ed R 3 lo spazio cartesiano.

2. I vetton della fisica con le note operazioni di addizione (secondo la regola


del parallelogramma) e di moltiplicazione per uno scalare, costituiscono uno
spazio vettoriale.

3. Linsieme Rfx] di tutti i polinomi in una indeterminata a coefficienti reali,


rispetto allusuale somma di polinomi e al prodotto di un polinomio per un
numero reale, uno spazio vettoriale su R.

4. Fissato un intero non negativo n, linsieme dei polinomi di R[jc] di grado


minore o uguale a n uno spazio vettoriale su R, rispetto alla somma di
polinomi e al prodotto di un polinomio per un numero reale, (Verificarlo).

5. Sia R8 1insieme di tutte le applicazioni reali di variabile reale. Allora, rispet


to alle operazioni di somma e prodotto per uno scalare, cos definite

V /, g e R-*-, VX e R e Vx e R

f + g' R -^ R tale che ( / + g)(x) = / ( * ) + g(x) e

X/ : R R (/)0c) = X/(;c)
si ottiene che R* uno spazio vettoriale (reale),

Elenchiamo, ora, una serie di propriet della moltiplicazione per uno scalare
che seguono immediatamente dagli assiomi definitori, dopo aver convenuto di
indicare con Oy Felemento neutro additivo di V e con 0 il numero zero.

Proposizione 11.1 S ia V u n o s p a z io v e tto r ia le re a le , a llo r a :

1) X0V = 0V, VX R;
2) 0i> = 0v.VueV;

3) se Xv = Oy a llo ra o X = 0 o p p u r e v = Oy ;

4) (-X)v = -X v = X(-v), Vv V e VX e R.
Spazi vettoriali 155

Dimostrazione.
1) Dagli assiomi che definiscono uno spazio vettoriale (essendo 0 V lelemento
neutro rispetto alla somma di vettori e valendo la ii) della Definizione 11.1) si ha
che:

XOy = X(0y -f- Oy) = XOy 4" XOy

e, aggiungendo ad ambo i membri XOy segue la tesi.


2) Sempre dagli assiomi definitori si ha che:

Or = (0 + 0 )r = Ou -F Ou

e, sommando ad ambo i membri Or, segue la tesi.


3) Supponiamo, dapprima, che Xr = Oy e che X ^ 0. Allora X ha inverso molti
plicativo X-1 e quindi:

V = V = ( X ~ ' X ) r = X - 1(Xv) = X ~ '0 y = Oy.

4) Dal punto 2) e dagli assiomi definitori si ha:

Oy = Or = [X + (X)]r = Xr -f (X)v

e, sommando membro a membro Xv, si ha (X)v = Xv,


Dal punto 1) e dai soliti assiomi infine Oy = Xfr -f (i1)] = Xv + X(-v)
da cui si ottiene Xi> = X(v).

11.1 Sottospazi di uno spazio vettoriale


Analogamente a quanto fatto nel Capitolo 9, quando abbiamo considerato sot
togruppi di un gruppo (Definizione 9.7), siamo ora interessati a quei sottoinsiemi
non vuoti d uno spazio vettoriale V su un campo, che a loro volta siano spazi
vettoriali sullo stesso campo, rispetto alle medesime operazioni definite in \

Definizione 11.2 Dato uno spazio vettoriale V su M, un suo sottoinsieme V ^ 0


un sottospazio di V se U spazio vettoriale su H rispetto alla somma e al
prodotto per uno scalare definiti in V.

Per verificare se un sottoinsieme un sottospazio, utile la seguente

Proposizione 11.2 Un sottoinsieme U f 0 di uno spazio vettoriale V un sot


tospazio se e solo se VX e M e V u \ , w2 e U si ha:

a) i + 2 e U\
b) Xu j U.
1 5 6 Capitolo 11

Dimostrazione. Se U un sottospazio le condizioni a) e b) sono verificate per


definizione.
Viceversa, poich le condizioni ii) v) della Definizione 11.1 sono soddi-
sfatte da tutti gli elementi di V e quindi, in particolare, dagli elementi di U, resta
da verificare la i), cio che U un sottogruppo additivo di V .
Verifichiamo quindi che V u\,u2 e U si ha che u\ u2 e U, che , additivamente
parlando, la condizione affinch U sia sottogruppo di (V \+ ). Infatti, per la b) si
hache ( - 1)<2 = -2 U, Vm2 e i / e quindi per la a) si ottiene che W]-f(w2) =
1 - 2 i/,V n i ,2 G / da cui segue la tesi.
Esempi

1. Ogni spazio vettoriale V ha come sottospazi (impropri) V stesso e il sottospa


zio ridotto al solo Oy indicato con il simbolo {Oy }
2. Sia V2(R) = R 2 lo spazio vettoriale delle coppie di numen reali e sia
Wi = {(*,0 ) 1* g E}.
Ufi sottospazio vettoriale di E 2: infatti siano
w 1 = (*i, 0) w2 = (*2, 0 )
due generici elementi di W e sia G E, allora
U)\ + w2 = ( * 1 ,0) + ( * 2 , 0 ) = (*1 + * 2 , 0 ) G W

Xw\ = (j : i , 0 ) = ( .* i,0 ) G W,

3. Analogamente a quanto visto nel caso precedente si verifica che il sottoinsie


me W2 = {(0,)0l>! R) c l 2 un sottospazio di E 2.
4. Il sottoinsieme W costituito dalle matrici del tipo
0 a
~ b a+b
un sottospazio vettoriale dello spazio vettoriale Mat2x2(IR) delle matrici
quadrate di ordine due a coefficienti reali.
Infatti, se
0 a
b a -f b
allora
Spazi vettoriali 157

e, VA R si ha
0 Xa
A.b X{a 4- b) e W.

5. Nello spazio vettoriale V costituito dai polinomi di grado < 3. verifichiamo


che il sottoinsieme

W = {ax 2 + bx\a,b e IR}


un sottospazio. Infatti, siano

v = ax 4- b x , w = e x " 4- d x

due genenci elementi di W. Allora si ha che:

v + w = (a 4- c)x2 + (b + d)x e W e Xv = Xax2 4- Xbx e W.

Proposizione 11.3 Siano V uno spazio vettoriale ed S e T due suoi sottospazi.


Allora Vintersezione insiemistica S C\T di S e T un sottospazio di V.

Dimostrazione. Siano 5 , t due vettori di SC\T: per definizione s e t appartengono


sa ad S che a T. Poich per ipotesi S un sottospazio, allora s + t e S e X s e S .
VX e R. Analogamente, poich anche T un sottospazio, segue che 5 4- 1 T e
Xs e T,WX e IR.
Per definizione di intersezione segue che s 4- 1 e S H T e Xs e S fi T. V/ ?
e quindi s conclude che S D T un sottospazio di V.

Osservazione 11.1 Lunione insiemistica di due sottospazi non in generale un


sottospazio, come provato dal seguente controesempio.
Sia E 2 lo spazio vettoriale delle coppie di numeri reali e siano
Wi = {(u>i,0)|iti e E} e W2 = {(0,u'2)|it2 e E}
due suoi sottoinsiemi. Abbiamo verificato che entrambi sono sottospazi (efr
Esempio 11.2 , punti 2 e 3), ma, presi (1,0) e H j e (0.1) e W, nsulta che la
loro somma ( 1, 0 ) 4- ( 0 . 1) = ( 1, 1), non appartenendo n a W\ n a W2, non pu
appartenere W \\J W2.

Definizione 11.3 Sia V uno spazio vettoriale e siano S e T due suoi sottospazi.

dagli elementi del tipo s + t al variare di s e t rispettivamente in S e T

Proposizione 11.4 La somma S 4- T di due sottospazi di uno spazio vettoriale


V un sottospazio di V.
La dimostrazione lasciata per esercizio.
158 Capitolo 11

Esercizio 11.1 Nello spazio cartesiano R 2, ogni retta passante per lorigine pu
essere descritta come un particolare sottoinsieme di R 2 della forma

L = {(x,y)\ax 4- py = 0}
Si verifichi che L un sottospazio di R 2.

Esercizio 11.2 Nello spazio vettoriale Mat2K2(R). verificare che il sottoinsieme


costituito dalle matrici diagonali costituisce un sottospazio.

Esercizio 11.3 Nello spazio vettoriale R r di tutte le applicazioni da R a M si


considen il sottoinsieme delle funzioni continue e si mostri che esso costituisce
un sottospazio di RA

11.1.1 Sottospazio generato da un so tto in siem e non vuoto

Definizione 11.4 Sia n un intero (n > 1 ) , siano vi,V2, . . . ,v, n vettori di uno
spazio vettoriale su R e i,2. ,A., n scalari di R. Allora il vettore
li 4" X2U2 4 " . . . 4 Xnv
si dice combinazione lineare di V\,V2, . . . ,vn e k\,X 2, . . . ,X sono detti coeffi
cienti della combinazione.
Esempio 11.1 Sia R 2 lo spazio vettoriale delle coppie di numeri reali e siano
vi = (1,0), v2 = (0,1). Allora il vettore v = (5, - 7) si pu esprimere come
combinazione lineare di i>i,V2 nel seguente modo
v = (5, - 7) = 5(1 ,0) 4- ( 7)(0, 1) = 5 w - lv 2.
dove 5 , - 7 sono coefficienti della combinazione.

Definizione 11.5 Sia S un sottoinsieme non vuoto di uno spazio vettoriale V


sul campo reale. Si dice sottospazio generato da S, e lo si indica con {S), il
sottoinsieme di V costituito da tutti e soli i vettori che sono combinazione lineare
di un numero finito di vettori di S.
Linsieme S detto sistema di generatori per (S).
Osservazione 11.2 Se W un qualsiasi sottospazo di V, W pu essere pensato
come sottospazio generato da un conveniente sistema di generatori, per esempio
W = (S), ove S = W.

Il problema stabilire se accanto a sistemi infiniti di generatori se ne possano


determinare altri, formati da un numero finito di vettori e in questo caso quale sia
il mimmo numero di vettori necessari a generare lintero spazio in questione.

Definizione 11.6 Si dice che uno spazio vettoriale finitamente generato se


esso ammette un sistema finito di generatori.
Spazi vettoriali 159

Esempio 11.2 La coppia di vettori e\ ( 1,0), e2 = (0.1) costituisce un sistema


finito di generatori per lo spazio vettoriale delle coppie di numeri reali. Infatti
V v = (x,y)

v = (x,y) = * ( 1, 0) + > ( 0 , 1).

Esempio 11.3 Le matrici E/,k (cfr. Esempio 8.9):

1 ____ 1

1------------ 1
0 0
0 0

0
" 1 0 0 ' 0 1 0"
11 = 12 = 13 =
0 0 0 0 0 0

' 0 0 0" "0 0 0 ' "0 0 0 '


21 = 22 = 23 =
10 0 0 1 0 00 1

sono un sistema di generatori per lo spazio vettoriale

Esempio 11.4 Si consideri lo spazio vettoriale V+R) delle quaterne reali e i


suoi sottospazi S = (CI,1,1,1),(1, 1,1, 1)) e T = ((1,0,1.0),(1,2.0.2)) Si
determini la forma dei vettori dello spazio S fi 7 e se ne indichi un generatore.

I vettori s di S e t di T hanno la forma, rispettivamente

s = a{\, 1, 1, 1) + ( 1, L I, - 1) = (a + b,a - b,a + b,a - b), a,b e R

t = c ( l , 0 , 1, 0 ) + d{ 1, 2 , 0 , 2 ) = (c + d , 2t/,c, 2d), c,d e M


e quindi

S = {(a + b,a b,a + b,a b)\a,b e R}

T = {(c + d,2d,c,2d)\c,d e R},


#

Poich un elemento h di S n T appartiene per definizione sia ad S che a T dovr


essere del tipo:

h = (a + b,a b,a + b,a b) = (c + d,2dx,2d).


Quindi uguagliando componente per componente, si ottiene il sistema

I a+ b = c+ d
a b 2d

a+b = c
a b = 2d e
le cui soluzioni sono d = 0 , b a, c = 2a.
I vettori dellintersezione sono gli elementi h = (2a , 0 ,2tf ,0) = ( 2,0, 2,
quindi S ri 7 = (( 2 , 0 , 2 ,0 )).
160 Capitolo 11

11.2 Dipendenza e indipendenza lin eare

Sia V uno spazio vettoriale sul campo reale, e siano uj ,t2, . . . ,v, n vettori di V,
con n > 1.
Definizione 11.7 Si dice che n vettori ui,V2, . . . ,vn sono linearmente dipen
denti se esistono n scalari, non tutti nulli, [,2, . . . ,X tali che sia
+ X2V2 + . . . + = 0 y.
In caso contrario i vettori si dicono linearmente indipendenti.
Esempio 11.5 Sia
S = {t/i = (2,4, - 6),t >2 = (1,2,3), u3 = (0 , 0 . 1)) C E 3;
esso un insieme di vettori linearmente dipendenti in E 3. Infatti:
(2,4, - 6) - 2(1,2,3) + 12(0,0,1) = (0,0,0).
Proposizione 11.5 Per ogni intero n > 1, n vettori i'i,v2......... vn sono linear
mente dipendenti se e solo se almeno uno di essi pu essere espresso come com
binazione lineare dei restanti.
Dimostrazione. Siano t>i,V2........ v, n vettori linearmente dipendenti; allora
esistono n scalari ori,ce2, ... non tutti nulli, tali che
ori Vi + u2v2 4" . + &nv,, = 0 y.
Non lede la generalit del discorso supporre che sia oc,, ^ 0 e pertanto un elemento
invertibile di R. Sicch
ori Vi + 012 V2 + . . . + o r _ 1vw_ 1 ov
da cui
vn = - o n a n 1vi - . . . - Ctn-\Oln l vn- \

quindi vn combinazione lineare di i>i,. . . ,v_i.


Viceversa si supponga che vn sia combinazione lineare dei restanti vettori
vi,V2 ... ,v-i, cio che esistano
x\,x 2, . .. ,xn-\ E
tali che
V X\V\ + - . + Xn-iVn-i
Allora si ha che
X] V\ 4- X2V2 + . . + (l)u Oy
che una combinazione lineare dei vettori v\,v 2, . . . ,v in cui i coefficienti non
sono tutti nulli (infatti x = 1 ^ 0), da cui segue la dipendenza lineare dei
vettori in questione.
Spazi vettoriali 161

Osservazione 11.3

1. Un vettore t> e V linearmente dipendente se e solo se il vettore nullo,


2. Un sottoinsieme T di un insieme S di vettori linearmente indipendenti anche
esso costituito da vettori linearmente indipendenti.

Esempio 11.6 Dati i vettori


u = (0,2,2), v = (1,2,3), w = (1,0,0) e R 3
dire se sono linearmente dipendenti o indipendenti.

Consideriamo, al variare di a,b,c e M, la combinazione lineare:


( 0 , 2 , 2 ) + 6 ( 1, 2 ,3) + c ( l , 0 , 0) = (0 , 0 , 0)
cio
(0,2,2) + (6,26,36) + (c,0,0) = (6 + c,2a + 26,2 4- 36) = (0,0,0).
Si ottiene il sistema
r 6 -f c = 0
| 2 + 26 = 0
l 2 + 36 = 0
che, risolto, d solo la soluzione banale = 0 , 6 = 0 , c = 0 .
Si pu concludere che i tre vettori sono linearmente indipendenti
Esempio 11.7 Dire per quali valori del parametro reale k, il vettore
v ~ (2,1 ,k) e M3
appartiene al sottospazio W = {u,u>), dove u = (1,1,0), tu = (2,6,1).
Dobbiamo trovare dei coefficienti ,6 e R tali che valga luguaglianza:
( - 2, 1,6) = ( 1, 1,0) + 6(2,6, 1)
cio
(2,1,6) = ( + 26, + 66,6).
Si ottiene il sistema
f + 26 = -2
| + 66 = 1
l 6 = 6
che equivalente a

+ 26 = - 2

{ + 62 = 1
6 =6
162 Capitolo 11

e anche al sistema
( a + 2k = - 2
\ k 2 - 2k = 3
[ b =k

da cui si ottiene k 3 , - 1 .
Per k = 3 si ottiene a = - 8,fc = 3 e quindi si ha

(2,1,3) = 8 ( 1, 1,0 ) + 3 (2 ,3 , 1).

Per k = - 1 si ha a = 0 .b 1 e quindi
( - 2 , 1, - 1) = 0 ( 1, 1, 0 ) - 1(2 , - 1, 1).

11.3 Basi di uno spazio vettoriale


Definizione 11.8 Un sistema S di vettori di uno spazio vettoriale V una base
di V se S un sistema di generatori linearmente indipendenti.

Esempio 11.8 Sia V3(R) = R3 lo spazio vettoriale delle teme di numeri reali'
vettori

e\ = ( 1,0 ,0 ), e2 = (0 , 1, 0 ), <?3 = (0 , 0 , 1)
costituiscono una base per R 3.

Infatti V (atb,c) e R 3 si ha
(a,b,c ) = ae\ + be2 + ce2
e quindi

sono un sistema di generatori.


Sono inoltre linearmente indipendenti; infatti, presi x,y,z e R, considenamo
una loro combinazione lineare:
xe\ + ye2 + ze3 = U , 0 ,0) + (0 ,^ , 0) + (0 , 0 , z) = (jc,y,z) = (0 , 0 , 0)
otteniamo che x = y = z = 0 , e quindi segue lindipendenza lineare.

Esempio 11.9 Nello spazio vettoriale Mat2x2(R ), le matrici:


ri o- "o r
E 2= 0 0 r o oi
e 3= 1 0 4 = "0 ol
[o 0 0 1
costituiscono una base
Spazi vettoriali 163

a b
Infatti V A = si ha che A = aE\ -f bE2 + cE3 -f d 4 e quindi i vettori
c d
dati sono un sistema di generatori.
Che siano indipendenti si verifica, come nellesempio precedente, considerando
una combinazione lineare che dia il vettore nullo e deducendo che i coefficienti
della combinazione debbono essere tutti uguali a zero. Siano perci x y : J e ?.
e sia

"1 0 ' '0 r '0 0 " 0 0


xE\ + yE 2 + z E 3 + tE 4 = x + z 10 +t 0 1
0 0 + > 0 0
*

1_____1
1

1------- 1
1 ___ 1
1

1------- 1

0 0
0
x 0 0 0

^ 0
0 0
+ + +
0 0

I
1
1------- 1

1
l
1____ 1
^ **

0 0
0 0

=
1
1

Si deduce immediatamente che deve essere

x = y = z = t = 0.

Esercizio 11.4 Nello spazio vettoriale dei polinomi di grado < n a coefficienti
reali, linsieme 6 = { \,x ,x 2, . . . una base.

Diamo, ora, senza dimostrarle, alcune proposizioni riguardanti propriet delle basi
di uno spazio vettoriale.

Proposizione 11.6 Se uno spazio vettoriale ha una base formata da n vettori


allora n + 1 vettori sono sempre linearmente dipendenti.

Teorema 11.1 (della base) Se uno spazio vettoriale V possiede una base forma
ta da n vettori, ogni altra base costituita da n vettori.

Siamo, ora, in grado di attribuire a uno spazio vettoriale V un invariante


legato al concetto di base.

Definizione 11.9 Si dice dimensione di uno spazio vettoriale finitamente gene


rato il numero di vettori che costituiscono una base.

Esempio 11.10 Ritornando agli esempi fomiti per illustrare il concetto di base,
si pu notare che la dimensione di V3OR) = R 3 tre; la dimensione di Mat2x2(&)
quattro; nel caso dello spazio vettoriale dei polinomi di grado < n a coefficienti
reali la dimensione n + 1.

Osservazione 11.4 Nello spazio R ", come del resto in ogni spazio di dimensio
ne n, n + 1 vettori, comunque scelti, sono sempre linearmente dipendenti.
164 Captolo 11

Sappia il lettore che esistono spazi vettoriali di dimensione infinita, che tuttavia
noi non tratteremo.
Per gli spazi vettoriali di dimensione finita, gioca un ruolo fondamentale il
seguente teorema, di cui ometteremo la dimostrazione.

Teorema 11.2 (completamento della base) Sia V uno spazio vettoriale non nul
lo, finitamente generato, di dimensione n : se iq,i>2, . . . ,vs sono s vettori linear
mente indipendenti di V allora o s = n oppure s < n ed esistono n s vettori
di V, indicati con u + u q , . . . ,tu_s, tali che v\,v 2, . . . , i q , t o i , . . . ,wn- s sia una
base di V.
Dopo aver osservato che sottospazi di uno spazio vettoriale di dimensione
finita n hanno dimensione finita m con in < n , concludiamo enunciando una
propriet che lega le dimensioni degli spazi somma U + W e intersezione U fi W
a quelle degli spazi U e W
Proposizione 11.7 (formula di Grassmann) Siano U e W due sottospaz di di
mensione finita uno spazio vettoriale V. Allora
dim[U + W) + dim (U fi W) = dim U + dim W.
Definizione 11.10 Siano U e W due sottospazi di uno spazio vettoriale V d
dimensione finita. Si dice che V somma diretta di U e W e si scrive V = U(&W,
seU + W = V eU n W = {0V},
Esempio 11.11 R 2 = W\ W2 (confronta Osservazione 11.1).
Esempio 11.12 Riprendendo lEsempio 11.4 in cui dim S = 2, diruT = 2.
dim S H T = 1 si pu concludere che dim(S + 71) = 2 + 2 1 = 3.
Esercizio 11.5 Dati 1 seguenti vettori in R 3, dire, senza fare calcoli, se sono
linearmente indipendenti

1. l'j = (1,4, - 1),W2 = (0, - 1,1),1* = ( l , 0 , l ) ft>4 = (-1 .1 .0 )


2. 1U! = ( 1,0 , - l),u-2 = (0 , - 1,1),u/3 = (1, - 1,0)

3. m = (1,0, - 1 ) , 2 = (0,1*2)
Esercizio 11.6 Si determini per quali valori di h e k sono linearmente indipen
denti 1vettori: v\ = (h, 1,0),U2 = (k,h, l )+3 = (2 , 0 , 2 ).
Esercizio 11.7 Dati i vettori:
a) v = (8,2,*,-10) e iq = (3 ,1 ,2 ,-3 ), v2 = (0,0,0,1), u3 = (1,0,1,0),
b ) v = (l, 2,fc) e vi (0 , 1, 2), v2 ( 1, 1, 1), u3 = ( 1, 0 , - 3 ) .
determinare, in ciascun caso, 1 valori del parametro reale k per quali il vettore
r (ui,u2,u3).
Esercizio 11.8 Sia R 3 = V3(R) lo spazio vettoriale delle teme di numen reali e
siano S = ((1,1,2),(1,1.1)) e T ((1,2,3),(2,1,2)) due sottospaz.
Determinare dim S, dim T, dim S fi T, dim(S + T).
Spazi vettoriali 165

Esercizio 11.9 Analogamente al punto precedente si considerino i sottospa/i

S = ( ( 1, - 1,2),(0,1,1)) e T = ((1,2, - 1),(0,3,1))


e si determinino dim S, dim T, dim S Pi T, dim(S + T).

11.3.1 Prodotto s c a la re c a n o n ic o

Con tecniche di algebra lineare si possono trattare questioni metriche come calco
lare distanze o ampiezze di angoli. Introduciamo, a tal fine, la nozione di prodotto
scalare e di ortogonalit.

Definizione 11.11 Sia V uno spazio vettoriale sul campo reale. Si chiama pro
dotto scalare su V una funzione

f : V x V -* R

che si denoter con f( u ,v ) = ( , v) e si legger prodotto scalare di u per i\ la


quale gode delle seguenti propriet:

1. Vw,u e V (u ,v ) = ( v,u ) (propriet di simmetria)

2. V u,v,w e V e V a, f e R valgono le uguaglianze:

(au + pv,w ) = a (u ,w ) + p (v ,w ) . . ......


(w,au + M = a(w,u) + f}(w. v)di

3. (,w) > 0 anzi (u,u) = 0 u=0

Definizione 11.12 Uno spazio vettoriale dotato di prodotto scalare su 3 detto


spazio euclideo.

Esempio 11.13 E" uno spazio euclideo qualora per ogni coppia di vettori

( v\ \ wl \
V-i w~>
V= e w=

\Vn/ U1J
ri definisca il seguente prodotto scalare (detto prodotto scalare canonico >
n
(v.w ) = ^ ViWi.
1= 1
Esempio 11.14 Nello spazio ordinario riferito ad una terna cartesiana ortogona
le, siano .v e y due vettori spiccati dallorigine:

x = (*i,*2x3) e = (y .y .y )-
y 1 2 3

Posto (x,y) = |*| \y\ cos(*y), ove (xy) langolo convesso formato da x e y,
si verifica che definito un prodotto scalare.

Definizione 11.13 Dato un vettore v e V, si definisce norma di v Io scalare


|!u|| = f(v,v), ove il radicale da intendersi in senso aritmetico.
In base alle propriet del prodotto scalare segue che:

1. ||u|| > 0 anzi ||u|| = 0 v = 0.


2. ||u|| = |A| ||u|| per ogni v e V e per ogni X e E.

3. ||u + w ||2 = ||u ||2 -1- 2 (v,w) + ||w ||2 per ogni v,w e V.
4. |(iun)| < ||u|| M || (disuguaglianza di Cauchy-Schwarz): vale il segno di
uguaglianza se e solo se v e w sono linearmente indipendenti.
5. |||u|| - ||w||| < ||v + w\\ < ||u|| -f ||tu|| (disuguaglianza triangolare).

Nota bene: il nome disuguaglianza triangolare deriva dal fatto che pu


essere interpretata come laffermazione seguente: in un triangolo di vertici 0,u e
v + tu, la lunghezza di un lato minore della somma e maggiore della differenza
delle lunghezze degli altri due.

11.3.2 Ortogonalit

La nozione di prodotto interno nello spazio ordinario definita attraverso la no


zione di coseno dellangolo fra due vettori. In uno spazio vettoriale generico con
prodotto scalare non cos naturale la nozione di angolo. Tuttavia la disugua
glianza di Cauchy-Schwarz ci permette di definire il coseno dellangolo tra due
vettori u e v, non nulli.
Poich dalla 4. segue che
(u,v)
-1 < < 1,
~ IMI IMI -
esiste un unico numero reale 1?, 0 < $ < jt tale che
(u,v)
cos
IMI IMI
Definizione 11.14 Diremo che due vettori u e v non nulli sono ortogonali se
(u,v) = 0, cio se cos # = 0 .
Spazi vettoriali 167

Definizione 11.15 Un sistema S di vettori di uno spazio euclideo V si dira o r


togonale se ogni coppia di vettori distinti di S ortogonale .

Se poi Si ed Si sono due sottoinsiem i tali che tutti gli elementi di Si sono
ortogonali a tutti i vettori di S 2, direm o che Si ortogonale ad S2 e scriveremo
5,152-
Definizione 11.16 Un sistema S di vettori di uno spazio euclideo V si dir
ortonormale se S ortogonale ed ogni vettore di S ha norma unitaria (cio
Vv S => ||v|| = 1).

Osservazione 11.5 Un sistem a ortogonale S = {w,}l6/ che non contenga il vet


tore nullo formato da vettori linearm ente indipendenti.
Infatti, sia X X m = Oy.

Poich 0 = (0vMj) = (XXw,,y) = X X /(wi My) = kj uj e inoltre, poich

uj fi 0, deve essere kj 0 .
Teorema 11.3 Ogni spazio vettoriale euclideo di dimensione finita ammette una
base ortonormale.

Osservazione 11.6 Nello spazio R", i vettori della base canonica costituiscono
una base ortonormale.

Esempio 11.15 Nello lo spazio euclideo delle tem e di numeri reali R 3 si con
siderino i due vettori u = ( e v = ( 0 ,-* = ,- 4 = ) e si determini un
\3 3 3 / V V2 /
vettore w tale che B = {u,v,w} sia una base ortonormale.
Siaic = U,;y,z) e R 3. Poich deve essere wA-u e wA.v, imponiamo le condi
zioni (iu,w) = 0 e (w,v) = 0. Otteniamo il sistema
1 2 2
= 0
5* 3 y +
1 1
y H z 0
VX VX 2 _
* z + >2 + Zz = 1
che equivalente al sistema

[ X - 2y + 2z = 0 \ x = 2y 2z = 4z [ x = -4 z
y+z = 0 => j rr
y = -z => | y
x2 + y2 + z2 = \ [ 16z2 + z2 + z 2 = 1 | 18z2 = 1.

1Le soluzioni sono quindi: 2( ------,


V X +-------
V X , --------
V X ), 2 VX VX VX
w\ = W2
( r - ' i T T
168 Capitolo 11

Esercizio 11.10 Si provi che la funzione da / : R" x R" R, definita da


f(u yv) = uTv un prodotto scalare.
Esercizio 11.11 Si consideri lo spazio euclideo R 3 (dotato del prodotto scalare
canonico, definito nellEsempio 11.14). Si dica se i seguenti insiemi sono ortogo
nali:

1. A = {a,b), = (1,2,2), b = (2,1, - 2 ) .

2. C = {a , b , c) con a = (1,2,2), b = (2,1, - 2), c = (0,1,0).

3. X = (a, )>, z } con .x = (0 ,2 , 1), y = (2 , 0 , 0 ), z = (0 , - 1, 2).

Esercizio 11.12 Nello spazio euclideo R 3 (dotato del prodotto scalare canonico)
si determini:

1
l.a linsieme S dei vettori ortogonali al vettore u = ( 1
1

l.b si verifichi che S un sottospazio di R 3;


0
2.a linsieme T dei vettori ortogonali ai vettori w = O l e r i I;
o

2.b si verifichi che T un sottospazio di R 3.


12
D eterm in an te di una m atrice

Se non riuscite a eccellere con il talento,


trionfate con lo sforzo.
(Dave W einbaum)

La nozione di determinante, fondam entale n ellalgebra lineare, si fa risalire a


Leibniz1, in relazione alla risoluzione dei sistem i lineari. Il nom e determ inan
te sembra sia dovuto a G auss2*, m a nella trattazione di questi concetti ci sono
stati i contributi di molti m atem atici, da Laplace a Binet, da K ronecker a Cayley \
mentre la forma con cui nota oggi la teoria dovuta a Jacobi4.
Il lettore pu aver incontrato nelle scuole m edie superiori la nozione di de

terminante di una matrice quadrata A = a ^ e Afat 2* 2<K definito come


c d
det k - a d - bc. Si vede che

det : M a t 2x 2 (M) > K

unapplicazione che a ogni m atrice di tipo ( 2 , 2 ) associa uno e un solo numero


reale.
Si pone, ora, il problema di estendere la definizione di funzione det per una
generica matrice quadrata di ordine n qualsiasi.
Si osserva che il caso n 1 banale in quanto se A = [a] si pu porre
det(A) = a. Sia quindi n > 2.

Definizione 12.1 Dato l insieme M atnxn(R), si definisce

det : M atnxn(\R) > R

'Gottfried Wilhelm Von Leibniz (Lipsia 1646-Hannover 1716)


2Karl Friedrich Gauss (Brunswick 1777-Gttingen 1855)
-Arthur Cayley (Richmond, Surrey, 1821-Cambridge 1895)
4Karl Gustav Jacob Jacobi (Postdam 1804-Berlino 1851)
170 Capitolo 12

lafunzione che a ogni matrice A e M atnxn(R ) associa il numero reale

det(A) = E (<7) l t r ( l ) 2 c r ( 2 ) &na(r)


aeSn

ove Sn il gruppo di tutte le permutazioni su { 1 , 2 , . . . ,n) ed e(o) = 1 se o una


permutazione pari, e(cr) = 1 se o una permutazione dispari.

Naturalmente salta subito allocchio che la somma che compare nella defini
zione consta di n ! addendi, essendo |S | = n !. Inoltre in ciascun addendo compare
uno e un solo elemento per ogni riga e per ogni colonna.
Notando che la definizione di determinante simmetrica rispetto alle righe e
alle colonne segue immediatamente la seguente

Osservazione 12.1 Per ogni matrice quadrata si ha che det(A) = det(Ar ).

Notazione 12.1 Per ogni A e Mat,lxn(IR), limmagine tramite la funzione det


a ii a\
si indicher con det A. Sono simboli usati anche | A| e
o,i i ann

Dalla definizione di determinante, seguono le seguenti

Propriet 12.1

" b\i +c\, b\x . . . C\i



1. det ' = det * + det
_ *** bm + cni * ' _ L um J L Lni J

X d \i Cl\/

2. det

= A.det *
_ Xcinl _ _ . . . a,,, _

a \ ' 9*ci\j Cl[ j * (l{i


3. det t #


= det # *
_ a,n ' - a nj _ _ * o nj a , u _

4. det [/ ] = 1

Le propriet 1. e 2. affermano che la funzione det lineare sulla /-esima colon


na, per ogni i = 1,2,... ,n, e quindi multilineare, mentre la 3. esprime il fatto
che la funzione alternante, cio che, scambiando tra loro due colonne, il det(A )
cambia segno.

Esempio 12.1 Calcoliamo ora, in base alla definizione, il determinante delle ge


neriche matrici quadrate di ordine 2 e 3.
Determinante di una matrice 171

n a i2 ; in base alla definizione


1. Sia n = 2 e A =
<321 22

a 11 12
det(A) = ]e(<r)iff(i) 2<r<2) =
21 22
o.S2

Ricordando che = {/,(12)} e che uno scambio una permutazione dispan, si


ottiene: det(A) = 11022 i 2 2i, che lespressione ricordata precedentemente

2. Per n = 3 |S3| = 3! = 6 e S3 = {/,(123),(132),(12),(13),(23)}, ove


lidentit e i 3-cicli sono permutazioni pari mentre gli scambi sono permuta-
1 1 1 2 13
zioni dispari. Quindi se A = 2 1 2 2 23
_ 31 32 33 _

det(A) = ( )lor(l)2i7(2)3cr(3)
creSi
= I l 2233 + 122331 + 132132

122133 132231 ~ H 2332-

Osservazione 12.2 Calcolare il determinante di una matrice utilizzando la defi


nizione diventa molto laborioso gi a partire dal caso n 4 : infatti si tratta di
calcolare la somma (algebrica) di 4! = 24 addendi, ciascuno dei quali il prodotto
di quattro fattori.

Per scrivere lo sviluppo del determinante di una matrice (quadrata) di ordine


3 si pu seguire la cosiddetta Regola di S arru s 5. Si accostano alla matrice data
le prime due colonne della stessa, ottenendo cos una matrice d tipo (5,3). Si
scrivono con il segno + i tre termini che sono prodotti di elementi situati sulla
diagonale principale e sulle due ad essa parallele, mentre si scrivono con il segno
i tre termini che sono prodotti di elementi situati sulla diagonale secondaria
che su quelle ad essa parallele secondo il seguente schema:

11 12 13 11 12
I l 12 13 \ \ / /
se A allora 21 22 23 21 22
21 22 23
/ \ /\ /\
_ 31 32 33- -
31 32 33 31 32
_ / / \ \ _
e quindi si ottiene

det(A) = an<22233 + 122331 + 1321 32 132231 H 2 3 3 2 122133

45D i
Pierre Sarrus (1798-1861), Professore alla Facolt di Scienze di Strasburgo.
172 Capitolo 12

12.1 Prime propriet dei determinanti


Riportiamo alcune propriet che seguono immediatamente dalla definizione e dal
le propriet di linearit e di alternanza enunciate nella Propriet 12.1, e che saran
no molto utili nel seguito. Una riflessione sulla simmetria rispetto alle righe e alle
colonne della matrice A Matnx{R), suggerisce immediatamente che ognuna
delle propriet qui di seguito riportate rimane valida se nellenunciato si scambia
il termine riga con il termine colonna.

1. Se una riga di A tutta costituita da zeri det(A) = 0.

2. Se la matrice A moltiplicata per X si ha che det(A) = " det(A).

3. Se due righe di A sono fra loro proporzionali allora det(A) = 0.

4. In particolare, se la matrice A ha due righe uguali allora det(A) = 0.

5. Se una riga di A combinazione lineare delle altre il determinante di A


nullo.

1 3 0"
Esempio 12.2 Sia A = 3 6 0 y allora det(A) = 21 .
-5 4 7
"1 3-51
Se invece vogliamo calcolare det (fi) ove B = 3 6 4 y basta osservare
0 0 7
che si tratta del determinante della matrice trasposta di A per concludere che
det(fi) = det(A) = 21.

Esempio 12.3 Senza sviluppare il determinante, dimostrare che risulta


" 0 1 1
det(A) = det 2(a b ) 2 b le
b a b c

0 1 1 "
Basta osservare che det(A) = 2 det (b a ) b c - 2 -0 = 0, avendo
[b a) b c _
la matrice due righe uguali.

12.2 II teorema di Laplace sullo sviluppo


del determinante
Definizione 12.2 Sia A (aj ) e A/a/xn(R). Si chiama minore complementa
re di a,j il determinante della matrice ottenuta da A sopprimendo la riga i-esma
e la colonna j-esima. Esso sar indicato con il simbolo A,,.
Determ inante di una matrice 173

Esempio 12.4 Sia


14 9
A = 2 5 1
3 6 4

il minore complementare di a 13

2 5
A 13 = det = -3
3 6

4 9
mentre quello di 21 : ^21 = det = -3 8
6 4

Definizione 12.3 57 chiama complemento algebrico (o cofattore) di atJ Vele


mento (-1 ),+J A,j.

Esempio 12.5 II complemento algebrico di a 13

2 5
(1)1+3 d e t M o ) = (l ) 4 det = -3
3 6

mentre il complemento algebrico di 21

4 9
(1)2+1 det(y421) = (l )3 det = 38
6 4

Ricordando il significato del simbolo di Kronecker introdotto al Capitolo 8, siamo


in grado di enunciare il

Teorema 12.1 {di Laplace6) Sia A = (<al}) e M atn*n{R)\ comunque fissato


lndice i (1 < i < n), V/c, 1 < k < n :

$ik det(A) = j : a tJ{ - \ y +jAkj


7=i

8lkdct(A) = t a A - l ) i+JAjk.
7=1

Tali formule per i = k forniscono lo sviluppo del determinante di A secondo,


rispettivamente, la i-esima riga e la i-esima colonna.

In altre parole il det( A) uguale alla somma dei prodotti degli elementi di
una qualunque riga (o colonna) moltiplicati per i rispettivi complementi algebrici.
Il procedimento riduce il calcolo del det(4) di ordine n al determinante di una
matrice di ordine n l e cos via, iterando il procedimento.

6Pierre Simon de Laplace (Beaumont-en-Auge 1749-Pans 1827)


174 Capitolo 12

Osservazione 12.3 Per i ^ j nulla la somma dei prodotti degli elementi di


una qualunque riga r, (o colonna c, ) moltiplicati per i complementi algebrici di
una qualunque altra riga r y (o colonna cy) parallela (con / j=- j).

Esempio 12.6 Data

' 3 5 - 1
A= 2 4 0 M a 3 x 3 ( 0
-8 0 1

calcoliamo il det(A), utilizzando il teorema di Laplace.

Scegliamo, per esempio, la terza riga (r 3 = [ 8 0 1 ]) e procediamo calcolando


i complementi algebrici di a 31 = 8, <332 = 0 e di 333 = 1. Essi sono

5 -1
A31 = (1)3+1 det = 4
4 0

3 -1
A32 = (1)3+2 det = -2
2 0

3 5
A33 = (1)3+3 det = ( 1 2 - 10) = 2 ,
2 4

Si conclude che
det(A) = <231^31 + <332^32 + 33^33 =

= - 8 4 + 0 ( - 2 ) + 1 2 = - 3 2 + 2 = -3 0 .

Osserviamo che la scelta della riga rispetto alla quale sviluppare stata operata te
nendo conto che ovviamente sempre vantaggioso utilizzare la riga, o la colonna,
in cui compare il maggior numero di zeri.

Esempio 12.7 Sia


"1 2 3 4
0 1 5 -1
B= 0 e Mat4x4(R).
0 6 3
1 2 0 2
Per calcolare det(#), usando lo sviluppo di Laplace, scegliamo la prima colonna,
in cui a2i = z/31 = 0 ; sicch

ri 5 -1 " ~2 3 4-
____ 1

5 -1
O <N

det (fi) = a u (1)1+1 det 6 3 + a 4i(l)4+l det 1


0 2 0 6 3
= 54 - 57 = - 3
D eterm inante di una m atrice 175

Infatti
"1 5 - 1
det 0 6 3 = 12 + 3 0 + 1 2 = 54
2 0 2

2 3 4
det 1 5 -1 = 2(15 + 6 ) - (9 - 24) = 42 + 15 = 57.
06 3

Esempio 12.8 Determinare per quali valori del param etro reale k si annulla il
determinante della matrice A (o equivalentem ente per quali valori di k l
singolare la matrice A) ove

(-1-*) 0 3
A = -1 (2 k) 1
-2 0 (4 - k)

Naturalmente si pu pervenire alla soluzione d ellesercizio in vari modi. Volendo


utilizzare il teorema di Laplace, poich lo sviluppo del determ inante, rispetto alla
seconda colonna,

(-1-*) 3
det(A) = (2 - k) det = (2 ~ k ) [ ( - l - * ) ( 4 - * ) + 6 ] =
-2 (4 - k)

= (2 - k)(k2- 3* + 2) = (2 - k ) ( k - 2 - 1)
si ha che det(A) = 0 se e solo se k = 2 o k = 1.

Definizione 12.4 Si dice determinante delle differenze (o di Vandermonde 7) il


determinante della seguente matrice
n-l
1 a a f . . . a } 1

n-l
1 a 2 2 a2
V

_ 1 an a 2
n . . . a% 1 _

Esercizio 12.1 Provare che il determ inante delle differenze si annulla se e solo
se a, = aj per qualche i ^ j.

7Alexandre Thophile Vandermonde (Parigi 1735-1796) fu matematico, fisico, econom ist


Infatti
n - 1 -I
1 a\ a\ . . . a
n- 1
1 a2 a\ a
det

n
_ l a n a . . . a

= (a2 - i)( 3 - ^i) ( tf 1X 03 a2) (;i_ i 2)( a2) ...


(a_i - an- 2)(an - an- 2) (an - a_!) = 0

se e solo se uno dei fattori si annulla e quindi se e solo se a, = a} per qualche



Formuleremo, ora, nella sua accezione pi semplice il classico

Teorema 12.2 (di Binefi) Siano A e B due matrici quadrate dello stesso ordine
n e sia C = AB. Allora det(C) = det(A) det(Z?).

Osservazione 12.4 Nota bene che lanaloga propriet non vale per la somma.

Consideriamo infatti il seguente controesempio: siano

10 2 0
A= B= G M at2x2(R)
11 2 1

Allora

det(A) + det() = 1 + 2 = 3

mentre
3 0
det(A + B) = det = 6
3 2

Quanto sin qui discusso, a proposito di determinanti, ci consente di stabilire ra


pidamente se n vettori a\,a2, . . . ,an e M" siano (o no) linearmente indipendenti.
Sussiste, infatti, la seguente

Proposizione 12.1 Siano ai , a 2, . . . ,a, n vettori di RM; essi sono linearmente


indipendenti se e solo se det [ a t a 2 | * * a ] ^ 0 .

*Jacquc-Philippc-Mane Binet (Rennes 1786 - Paris 1856)


A

Determinante di una matrice 177

Dimostrazione. I vettori a j , a 2, . . . ,a R" siano linearmente ndipendem; per


ipotesi e quindi, essendo in numero di n - dimR", costituiscono una base. Per
tanto i vettori fondamentali ei,e2, .. . ew si possono esprimere come loro com bi
nazione lineare cio si ha che
n
e, = ^ 6 ,(a7, (/ = 1, 2 ...).
j =i

Posto quindi A = [ ai | a 2
a ] e B = (bJt) :

1 0 .0
0 1 .0
AB = [ ej | e 2
, ]=
0 0 .1

e, poich det(/) = 1, dal teorema di Binet segue che det(A) ^ 0.


Il viceversa banale.

Esercizio 12.2 Siano

a i a2 b\ b2
<22 - b 2 bi Mat2x2(R).

Dimostrare che vale luguaglianza:

(tfj + a2)(b\ + 2) = (ci\b\ a2b2)~ -f 0*2^1 + # 1^2)-

Esercizio 12.3 Determinare il valore del parametro reale * per il quale singo
lare la matrice A ottenuta come prodotto delle matrici

e C=

Esercizio 12.4 Mostrare che sono linearmente dipendenti i vettori:

i = (1.2,3), v2 = (-2 .1 . - 5), u = (0.5.1) R3.

Esercizio 12.5 Determinare il valore del parametro reale k per cui i vettori

V = (1,2,*,* - 1), v2 = (0.1, - 1,*), t'3 = (1,0,0,1), 14 = (*.0.0.0) Ri

sono linearmente indipendenti.


178 Capitolo 12

12.2.1 Matrice inversa

Ricordiamo che, data una matrice A e Matxn(R), si dice inversa di A una ma


trice B (se esiste) tale che A B = B A = /.
Affrontiamo, ora, il problema dellesistenza della matrice inversa, utilizzando
gli strumenti che abbiamo introdotto in questo capitolo.
Supponiamo che, data una matrice A, esista la sua inversa B. Poich per
definizione si ha che AB - BA = /, passando ai determinanti e tenendo conto
del teorema di Binet si ha:
det(Afl) = det(A) det(fl) = det(/) = 1
da cui si ricava che deve essere det(A) ^ 0 .
Si deduce inoltre che
1
det(fi) = det(A-1) =
det(A)
Si pu mostrare che A 1 = (a,k) ove
Ah
u,k =
det(A)
e At, il complemento algebrico dellelemento cik, della matrice trasposta A

10 1
Esempio 12.9 Calcolare la matnce inversa di A = 2 10
0 1 1

Procediamo per passi successivi:

1. Calcoliamo det(A), det(A) = 3 ^ 0 , quindi la matrice A invertibile.


12 0
2. Scnviamo la trasposta di A. E: A7 = 0 1 1
10 1

3. Costruiamo la matrice dei complementi algebrici di A 1, detta matrice ag


giunta (di A), nel seguente modo

i r '0 f '0 r
det -det det
01 11 L! 0
1

1____ 1

1 1 -1
--det 2 0 '1 0
o to

aggi A) = '
det -2 1 2
_ 1 1 1 det
2 -1 1
1

det 2 0 ' "l 0 " "1 2"


1 1 -d e t 0 1 det
0 1
D eterm inante di una m atrice 179

4, In base a quanto sopra osservato

agg(A) 1 1 1 -1
A" 1 = -2 1 2
det(A) 3 2 -1 1

Esercizio 12.6 Nel caso in cui esistano, scrivere le matrici inverse di


10 0 -2 1 -1
A= 0 10 H= 0 1 0
4 0 1 2 -1 1

1 1 -1 111
C = -2 1 2 D= 0 11
2 -1 1 00 1

12.3 Sistemi di n equazioni in ri incognite: teorema


di Cramer
Ritorniamo, ora, ad analizzare il generico sistema lineare di n equazioni in n
incognite

011*1 + 012*2 + + 01* b\


021*1 + 0 2 2 * 2 + . . + 02* b2

01*1 4" 02*2 4 4" 0* bfi


che, come gi visto, in forma matriciale, si rappresenta nel seguente modo:

0 n 012 01 *1 " b\ '


021 022 - 02 *2 b2


cio Ax = b

_ 01 02 0 _ * _ _K _

011 012 01 "


021 022 02 JC2
ove A = * la matrice dei coefficienti, x = il vettore

_^/il &n2 ^ i _ - _
b\
b->
(colonna) delle incognite e b il vettore (colonna) dei termini noti.

_bn _
180 Capitolo 12

Teorema 12.3 (di Cramer9) Un sistema lineare Ax b di n equazioni in n


incognite con det(A) ^ 0 ammette una e una sola soluzione.
Dimostrazione. L'ipotesi det(A) ^ 0 garantisce, in virt di quanto visto prece
dentemente. 1'esistenza (e unicit) della matrice inversa A -1. Allora una soluzio
ne w del sistema soddisfa luguaglianza Aw = b Moltiplicando, quindi, ambo i
membn per A-1 si ottiene: A-1 Aw = /w = w = A- I b.
D'altra parte, poich A(A- 1b) = (AA_1)b = 7b = b, segue che A- I b solu
zione del sistema.
Quindi la soluzione esiste ed unica poich unica linversa di A.

Dalla dimostrazione del teorema di Cramer si deduce la seguente:


Osservazione 12.5 (Regola di Cramer) Se il sistema Ax = b ammette una ed
una sola soluzione, essa della forma
det(A,)
w = (xi,x2........*n) ove Xi =
det(A)
e la matrice A, si ottiene da A sostituendo alla sua i -esima colonna, la colonna
b dei termini noti.
Esempio 12.10 Risolvere, se possibile, il sistema
[ x+ y = -2
j x + 3y + z = 2
l 3jc + 7y z = 5.
Il sistema scritto in forma matriciale
'1 1 0 ~X " - _ 2"
Ax = 1 3 1 y 2
3 7 -l 5.
Poich det(A) = - 6. il sistema ammette una e una sola soluzione e precisamente
si ottiene:
i 2 1 0 1 _9L 0 j 1 1 2 f
! 2 3 1 1 2 1 1 3
1 5 7 -1 9 3 5 -1 5 3 7 51
6 2 6 2 6

la soluzione cercata.

,G * W** 17B4- B agnoles 1752)


Determinante di una matrice 181

Esempio 12.11 Per quali valori del parametro reale k il sistema:

x+ y = 1
| kx 4- 2y -3

ammette una e una sola soluzione?

Scritto il sistema in forma matriciale:

basta imporre che la matnce A sia non singolare, cio che det(4) = 2 - k 0. e
quindi k ^ 2.

Esercizio 12.7 Risolvere, usando il metodo di Cramer, i seguenti sistemi lineari:



y 4-4 z = 5
1) X -3 z = -4
4x + 2 y + z = -5

+3 V 4-2 z 3
i *
2) 2x -y - 3 z = - 8
l y 4- z = 2

| x +2y +3z = 1
3) | 3x A-2y +z = 0
l x 4-v 4-Z = 1.

12.4 Caratteristica o rango di una matrice


Definizione 12.5 Sia M e \fa tm , r.<.E si dice caratteristica rango de. a irui-
trice, e viene indicato con car M o con rg( M ). il massimo ordine di un mmont non
nullo estraibile da M.

Osservazione 12.6 immediato osser- are eie >e ' e ? e


0 < car M < minfm.n}.
In particolare car Ai = 0 se e solo se ogni elemento di ./ uguale a zero eroe >e
e solo se M la matrice nulla.
Se M Matnxn{R > car Si = n s e e solo se dei- Si # 0.

:USi confronti la Definizione 8.20


182 Capitolo 12

In base alla definizione che abbiamo dato, una matrice M ha caratteristica r,


quando esiste un suo minore di ordine r non nullo, mentre tutti i minori di ordine
r+ 1, r + 2 ,. . (qualoraesistano) sono nulli. Poich ogni minore di ordine r + 2,
in base al teorema di Laplace, si esprime come combinazione lineare di minori di
ordine r + 1, si deduce che una matrice M ha caratteristica r se esiste un minore
non nullo di ordine r mentre sono nulli tutti minori di ordine r + 1.

Osservazione 12.7 Sia M e Matmxn(R) allora car M = car M r .


\

E evidente che la caratteristica di una matrice non cam bia se:

i) si aggiunge o si toglie una riga tutta di zeri;

ii) si permutano le righe (o le colonne);

iii) si aggiunge una riga (o una colonna) che sia combinazione lineare delle righe
(o delle colonne) della matrice.
Interpretiamo, ora, il concetto di caratteristica (o rango) in term ini di dimen
sioni di opportuni spazi vettoriali:

Proposizione 12.2 Sia A e Matmxn(R ): poich A pu essere ottenuta per


accostamento d n vettori colonna o di m vettori riga, cio s pu scrivere:
ci
C2
A = [ ai | a2 a 3 =

allora
car (A) = dim < ai,a2....... a > = dim < cj , c2, . . . ,c, > .

Quindi, se una matrice ha caratteristica r, risultano linearmente dipendenti r + 1


righe o colonne, comunque scelte.

Dimostrazione. (Traccia) Sia car (4) = r. Non lede la genericit del discorso
supporre che il minore di ordine r non nullo sia quello formato dalle prime r righe
ed r colonne della matrice, cio sia
Il Ir l(r+l) 1
*
t

ar\ r r r(r+1) arn


(r+l)l (r+l)r
&(r+l)ti


m 9
% 9


t

(lm\ . .
amr #
Qmn
a\\ ** a\r
ove det
Determinante di una matrice 183

Dopo aver m ostrato che le prim e r righe (o r colonne) sono linearmente indipen
denti, si prova che ogni altra riga (o colonna) loro combinazione lineare

Dalla precedente proposizione, si ricava una regola per la detenni nazione


della caratteristica.

12.4.1 P ro ced im en to di Kronecker

Sia Mr un m inore di ordine r della matrice M = (mtJ) e Matmxn(E); se r < m


ed r < n, esistono m inori di ordine r 4- 1.

Definizione 12.6 Si dicono m in ori orlati di M, quei minori di ordine r + 1di M


che contengono M r come minore di ordine r.

Illustriamo, ora, il procedim ento (costruttivo) di Kroneckeri1 Se ogni ele


mento m,j di M nullo si ha car M = 0; in caso contrario esiste almeno un
elemento non nullo m rk, e poniam o M\ = mrk. Se tutti gli (m - 1)(n - 1) minori
di ordine 2, orlati di M i, sono nulli, la caratteristica di M e 1 In caso contrario
esiste almeno un m inore di ordine 2, M 2 , diverso da 0. Se tutti gli (in - 2 )(n 2)
minori orlati di M i sono nulli, la caratteristica di M 2, in caso contrano esiste
almeno un minore non nullo di ordine 3, A/3, e cosi procedendo si determina la
caratteristica di M .

Esempio 12.12 D eterm inare la caratteristica di


12 3
2 3 4
3 5 7

Anzitutto osserviam o che, essendo M e M at 3, 3(^1 si hacar(M ) < 3, Inoltre


car(Af) / 3 poich d e t (M ) = 0, essendo Tultima riga combinazione lineare
delle pnme due. Posto M\ = m \\ = 1 esiste almeno un minore di ordine 2 non
nullo che lo contiene, per esem pio

quindi car ( M) = 2.

Esempio 12.13 Determ inare la caratteristica di

1 2 3
E M cit2x3$0-
-4 0 5

Poich B non la m atrice nulla si ha che 0 < car \B) < 2 e, poich

1 2
e car ( B ) =
-4 0

Leopokl Kronecker (Liegrutz 1823- Berlino 1891)


Esempio 12.14 Determinare la caratteristica della m atrice
023
C= 046
069

Poich C Mfl/3X3(R) ed esistono in C elementi non nulli 0 < car (C) < 3;
ma det(C) = 0, essendoci una colonna di zeri. Inoltre non esiste alcun minore
di ordine 2 non nullo (perch le righe, e le colonne, sono proporzionali), quindi
car(C) = 1.

Osservazione 12.8 II metodo dellorlatura di Kronecker tanto pi vantaggioso


quanto pi crescono i valori n ed m, cio il numero di righe e di colonne.

Esempio 12.15 Data una matrice A g Mai 3X4 determ inare il num ero delle sot
tomatrici (quadrate) di ordine 3 e di ordine 2.

Sia

'<*11 <*12 <*13 <*14 ri


A = <*21 <*22 <*23 <*24 = [ c. c2 I c3 | c4 ] = r2
_<*31 <*32 <*33 <*34. T3

Le sottomatrici di ordine 3 s ottengono togliendo una colonna alla matrice A, e


quindi se ne ottengono 4, precisamente

c4 ]
U
U

C3
cn

A l = [ ci

c2 | c4 ] A i = l ci 1 C2 <3 ]
Le sottomatrici di ordine 2 si ottengono togliendo due colonne e una riga alla
matrice A. Per ogni scelta della riga r, (da togliere) si hanno 6 possibili scelte per
le colonne. In totale 18 possibilit.
Scrivere le 18 matrici di ordine 2 che possibile estrarre dalla matrice A.

Esempio 12.16 Determinare al variare del parametro reale k la caratteristica del


la matrice
1 1 0 -k
A= 1 (k + l) 1 2
L3 (2k + 3) (1 - k) 5

Essendo A una matrice non nulla di tipo (3,4) 1 < car (A) < 3.
Poich esiste un minore di ordine 2 non nullo non contenente il parametro k
precisamente

A-) = 1 0 = 1 car (A) > 2 V k.


11
Determinante di una matrice 185

Si considerano quindi 1 due minori orlati di A 2 precisamente

1 1 0
A, = 1 (* + l) 1 = [( 1 2) (2k 4- 3)] [fi - k) - 3 ]
L3 (2k + 3) (1 - k ) J
1 k 2 2 k 3 + 2 + k = k 2 k = - k ( k + 1)

1 0 -k
3 1 1 2 = 5 2(1 k) k(\ - k 3) =
3 1-* 5
k~ + 4 k -f- 3 {k -j- 3)(* + !)

Se k = 1 sono entram bi nulli e quindi car (A) = 2. Per ogni altro valore di k
car (A) = 3.

Esempio 12.17 Dati i vettori

1 3 T
V = 2 , w = 1 , u = 0
3 1 0

dire se sono dipendenti o indipendenti.

Utilizzando la Prosizione 12.2, basta considerare il rango della matrice ottenuta


accostando i vettori dati, per ottenere la dimensione del sottospazio generato dai
vettori stessi. Se la dim ensione (e quindi il rango della matrice) uguale al numero
dei vettori dati, essi sono linearm ente indipendenti, altrimenti (se la dimensione
minore) saranno dipendenti.
Nel caso in esam e si ha che

13 1
det 2 10 = -l #o
3 10

e quindi si pu concludere che la caratteristica della matrice 3 e quindi i vettori


v, w, u sono linearm ente indipendenti.

Esercizio 12.8 Stabilire, al variare del parametro reale k il rango delle matrici
seguenti

"3* 0 k ~ f 0 0 1k l
"1 * 0 - 1 2 2k 0 111
0 2 0 -1 2kk0
1 -5 1
* 0 * 0 0 1 * 1J
0 1 -2
186 C a p ito lo 12

12.5 Sistemi lineari di m equazioni in n incognite


Riprendiamo in considerazione un sistema lineare di m equazioni in n incognite

flll*! + #12*2 + . . . + 0 \ nX n = b\
21^1 + i?22*2 + . . . + O 2nX n = k>2
(**)

<3ml*l + (lm 2x 2 + + ^tilt] ^ i l = bm


che pu essere rappresentato nella forma matriciale Ax = b, ove A e Matmxn (M)
la matrice dei coefficienti, x il vettore colonna delle incognite e b il vettore
colonna dei termini noti.

Definizione 12.7 Dato un sistema lineare Ax = b, si dice sistema omogeneo


associato il sistema Ax = 0.
Proposizione 12.3 Dato un sistema omogeneo Ax = 0, l insieme W d e lle s o lu
zioni costituisce un sottospazio vettoriale di E" (se x E").
Dimostrazione. Siano v, w e W < E", due soluzioni del sistema Ax = 0.
Verifichiamo che
1) v -w W
2) Ave WVAeE.
Infatti
A(v - w) = Av Aw = 0 0 = 0
e quindi (v - w) soluzione, cio sta in W ;
A(Av) = A(Av) = A0 = 0
e anche Av soluzione e quindi sta in W, che pertanto risulta essere sottospazio.

Teorema 12.4 Linsieme S delle soluzioni del sistema Ax b, con b ^ 0


e costituito da tutti e soli i vettori del tipo u = c + w, ove c una soluzione
particolare del sistema e w una soluzione del sistema omogeneo associato.
Dimostrazione. Anzitutto mostriamo che u una soluzione del sistema Ax = b.
Infatti risulta: Au = A(c 4- w) = Ac 4- Aw = b 4- 0 = b.
Viceversa supponiamo che u sia una soluzione del sistema cio che Au = b e
verifichiamo che w = u - c soluzione del sistema omogeneo associato. Infatti:
Aw= A(u - c) = Au - Ac = b - b = 0.

Osservazione 12.9 Uinsieme S delle soluzioni del sistema Ax = b, b ^ 0 non


un sottospazio vettoriale, perch, per esempio, il vettore nullo non appartiene a
S. Invece, con la terminologia introdotta nel capitolo 9, S un laterale di W in
W,(W come nella Proposizione 12.3).
Determinante di una matrice 187

Rimane, ora, da affrontare il problema di vedere sotto quali condizioni il sistema


Ax = b sia risolubile. Una risposta offerta dal seguente;

Teorema 12.5 (Rouch-Capelli12) Un sistema lineare Ax = b di m equa-ioni


in n incognite ammette soluzioni se e solo se car A = car[A|b], essendo A la
matrice dei coefficienti e [A|b] la matrice completa.

Dimostrazione. Per ipotesi sia car A = car[A|bj.


Allora b combinazione lineare delle colonne di A; detta [ a j a 2 , . . x, j la
/z-upla dei coefficienti di questa combinazione, essa soluzione del sistema, che
risulta pertanto compatibile.
Viceversa supponiamo che il sistema sia risolubile quindi che esista un
A]
x =
*2
t

tale che;
*1 " bi

a *2 b2
[ a, | a2 ] #
MH

*#t

* _ _ bm _

Allora;
ai ai + A2a2 4- ... + Aa = b.
sicch car A = c a r[A |b ].

12.5.1 R ice rca d e lle s o lu zio n i di un sistema lineare

Considerato il sistema
*11*1 + # 12*2 + . . . + a !,,* = b\
*21*1 + *22*2 + . - f a 2nXn = b?
(**)
*wl*l + *w2*2 + . - . + UtnnXn

vediamo come procedere per la ricerca effettiva delle sue eventuali soluzioni
Per il teorema di Rouch-Capelli, il sistema ammette soluzioni se e solo se
car A = car [A |b ].

I9-Alfredo Capelli (Milano1855-Napoli 1910)Professore airUmversit di Palermo e di Napoli II teorema fu


formulato, indipendentemente, anche dal Matematico francese Eugnc Rouch (Sommieres 1832-Lunel 1910)
L'enunciato che abbiamo presentato, corrisponde, sostanzialmente, a quello di Capelli, mentre quello di Rouch
di tipo costruttivo.
Dire che
tfu #12 * #1
#21 #22 * * #2
car (A) = car = r

_ fini 1 Ami t
a inn _
significa dire che esattamente r righe (o colonne) di A sono linearm ente indi
pendenti. Senza ledere la generalit del discorso, supponiam o che siano le prime
r righe corrispondenti alle prime r equazioni. Consideriam o la (r -f l)-esima:
essa ottenibile come combinazione lineare delle r precedenti con coefficien
ti ki,k2< X - Se anche br+\ si pu scrivere come com binazione lineare di
b\,bi .. X con gli stessi coefficienti cio

br+\ = k \b \+ k2b2 + . . . + krbr


allora tutte e sole le soluzioni del sistema formato dalle prime r equazioni (sistema
ridotto) sono soluzioni anche di questa (/- -I- l)-esim a equazione che sovrabbon
dante e quindi eliminabile.
Se invece br+\ ^ k\b\ 4 k2b2 4 . . . 4 krbr , lequazione incompatibile, ed
car A < car[A|b].
Ripetendo questo ragionamento per ognuna delle restanti righe, nellipotesi
in cui

br+j k\b\ 4 k2bi 4 . . . 4 i) j 1, . . . ,tn r,


si possono presentare due casi
se n - r, il sistema ridotto ha una e una sola soluzione, ottenibile con Cramer.
se n > r, detta B una sottomatrice quadrata di ordine r a determ inante diverso da
zero (noi abbiamo supposto essere quella formata dale prime r righe e colonne) si
ha che
#11 #12 # lr
#21 #22 * ' # 2r
det(fi) = det 7^0
%

_ # r 1 # r2 * ' # r r _

e quindi il sistema (**) equivalente al sistema

#11*1 4- #12A'2 4 . . 4 # lr* r b\ Ur+D^r+l


fi\n^n
#21*1 + #22*2 4 . . . 4 #2r*/i = b2 # 2 (r-H )* r+ l
4
4

#r 1*1 4 #r2*2 4 ... 4 arrxn = br - ar(r+1)xr+i - V

finirli

che ammette soluzioni. Si otterranno le prime r incognite in funzione delle rima


nenti (n - r), scritte al secondo membro, che possono variare in tutto R. Con
D eterm inante di una matrice 189

la terminologia gi usata nel Capitolo 8, si dice che il sistema ammette % '


soluzioni.
Esempio 12.18 Dato il seguente sistema lineare, dire se ammette soluzioni e. in I
t *
caso affermativo, determinarle.
x 4 -2y + 3 z 0
2x + y + 4 z 1
.
x -- V + 3 = 1
S

La matrice dei coefficienti


'1 2 3-
A= 2 1 4
_1 - 1 1_
mentre la matrice completa
1 2 3 0
[A\b] = 2 1 4 1
1 --1 1 1
Poich la matrice A non ha tutti gli elementi nulli, car A ^ 0
Consideriamo la sottomatrice
12
2 1
Si ha che
12
Ai = - 3^0
21
per cui car A > 2.
Poich
det A = 1 4-8 6 3 4 -4 4 = 0
la caratteristica non 3, quindi si pu concludere che car A = 2. Dobbiamo
12
determinare car [A|b]: orliamo la sottomatrice con la colonna dei termini
2 1 4

noti, si ottiene
1 2 0
A' = 2 1 1
1 -1 1
e, poich det zi' = 0 , si pu concludere che car[4|b] = 2, e quindi il sistema
ammette soluzioni; precisamente avremo oc 3-2 = oc 1soluzioni.
Il sistema iniziale quindi equivalente al sistema
x +2 y = 0 3z
2x 4- v = 1 - 4 z
190 Capitolo 12

In questo caso la matrice dei coefficienti

12
2 1

e. non essendo singolare, il sistema equivalente ammette soluzione, in virt del


teorema di Cramer.
Ricaviamo tale soluzione (che dipende dal parametro reale z h), con la regola
esposta nell'Osservazione 12.5

-3 h 2
( 1 - 4 h) 1 3h 2 4 - 8h 5 /? -2
* =
12 -3 -3
2 1

1 -3/2
2 (1 -4 /2 ) 1 4/2 + 6/2 2/2 + 1
v=
12 -3 -3
2 1
Le infinite soluzioni (al variare di h E ) sono
5 /2 - 2 2/2 + 1
x= v= Z= h
-3 -3

Esempio 12.19 Determinare le soluzioni del seguente sistema (omogeneo).

x +2 v 0
2x 4- j 0 .
x - y 0

In forma matriciale il sistema si pu scrivere nel seguente modo


1 2 0
x
Ax = 2 1 0 = b.
1 -1 > 0
Poich car A = 2 (verificarlo!), il sistema ridotto equivalente

x +2y = 0
2x -f j = 0
che ammette la sola soluzione banale x = 0 , y = 0 .

Esempio 12.20 Dato il seguente sistema lineare, dire se ammette soluzioni

x + y 0
x + y +z o
. 3x + 3 y +z 5
Determinante di una matrice 191

La matrice dei coefficienti


1 10
A= 111
33 1
mentre la matrice completa

110 0
[A |b] = 1112
3 3 15
Poich
10
Ai = 1/0
11
la caratteristica di A (e anche di [A |b]) > 2
Poich det(/4) = 0 (verificarlo!) si ha che car A = 2
Considerando la sottomatrice
r 1 0 0 1
A= 1 1 2
L 3 1 5

10
di [/4|b] ottenuta orlando la con la colonna dei termini noti, si vede che
1 1
det(/4) = 3 ^ 0 , per cui car [A |b] = 3 > 2 e quindi non ci sono soluzioni.

Esempio 12.21 Determinare 1 valori del parametro reale k per i quali ammette
soluzione il seguente sistema:
kx + y 1
x + ky 1
x + y k
La matrice dei coefficienti e la matrice completa associate al sistema sono nspet-
tivamente:
~k 1 ~k 1 r
A = 1k e [A\b] = 1 k 1
1 1 1 1k
Poich A non la matrice nulla la sua caratteristica sar > 1.
Poich ha solo due colonne car (A) <2.
Consideriamo il minore
I k
A? = = 1 k 0 per k j 1.
II
Poich per k 1 nessun altro minore di ordine 2 diverso da 0, si pu concludere
che car (A) = 2 Vk yf= 1.
192 Capitolo 12

La matrice orlata di ordine 3 pu essere solo [A\b]. Calcoliamo


k 11
3 = 1 k 1 = *(*2 - ! ) - ( * - 1) + (1 - k ) =
1 1k
= k(k - \)(k -1- 1) - {k - 1) - (k - 1) = (k 1) [k2 + k 2 ) =
= f t - l ) ( * + 2) ( * - l ) .
Quindi se k / 1, k ^ 2, car([A|b]) = 3 e in tal caso non ci sono soluzioni
perch
car (A) < 2 ^ car([A |b]) = 3.
Se invece k = - 2 si ha che car([A|b]) = car (A) = 2 e quindi ci sono solu
zioni, anzi c una e una sola soluzione perch car (A) uguale al numero delle
incognite.
Se infine /c = 1, car (A) = 1 = car ([A |b]) e quindi ci sono infinite soluzioni.
Determiniamo le soluzioni in corrispondenza dei valori di k:
1) k = - 2: il sistema si riduce al sistema
x 2y = 1
x+ y = - 2
che, in forma matriciale
'1 - 2 ' X 1 "
1 1 - 2

La soluzione
1 -2
-2 1 -3 1 -2 -3
x= = -l, y= = - 1.
T -2 1 -2
1 1 1 1
le
2) k = 1 : il sistema si riduce allequazione x + y = 1, da cui y = 1 x e
infinite soluzioni sono x = h, y = 1 h, al variare di h e R.
Esercizio 12.9 Determinare gli eventuali valori del parametro reale k per i Qua*'
ammettono soluzione i seguenti sistemi:

2x + ky k 1
1) \ x + (* + 2)ky = 1
* + y = 2
x +y -k
2) ^ +(7c + l)> +z = 2
, 3jc +(2k + 3)_y +(1 k)z = 5
x+(k-\)y +3z +2 1 = 2
3) U +2y +(1 + k)z + 4/ = 2 + k
z +2t = 3
13
Applicazioni lineari

Patet omnibus ventas


La venta accessibile a tutti
(Seneca)

Vogliamo, ora, misurare la correlazione tra due spazi vettoriali, cio il modo
con cui essi si relazionano mediante funzioni che rispettino la struttura algebri
ca, usualmente indicate con il termine applicazioni lineari o omomorfismi (dal
greco homs = uguale, simile e morph = forma).

Definizione 13.1 Dati due spazi vettoriali V e W su un campo K, una applica


zione f : V -> W detta lineare se:

i) f( v + w) = f ( v ) 4- /(io ), Vv,w e V

ii) v) = Xf(v), Vu g g K

In altre parole, / lineare se preserva le operazioni di somma e di prodotto ester


no.

Osservazione 13.1 Nel seguito considereremo sempre K = R, cio spazi vet-


tortali sul campo reale.

Proposizione 13.1 & / un appi,canone lineare da V a W, valgono le se-


guenti propriet:

1. / (Oy) = 0 ;y.

infatti poich V e V si ha che 0 , + = segue che / ( 0 , + ) = da cut


perla lmeanta d, / , si ottiene /< 0 ) + / ( ) = f(v) c 'o2

2. f ( - v ) = ~ f ( v ) , Vu <E V.
Poich Ov = -i> + v, ancora per la linearit di / , segue f ( 0 y ) = / ( r + v \
Utilizzando il punto 1. si ottiene / ( 0V) = f ( - v + v) = f ( - v ) + f ( v ) = o w
da cui segue / ( v) = - f ( v) .

Proposizione 13.2 L'immagine di una combinazione lineare di vettori di V la


combinazione lineare delle immagini, in simboli:

Infatti

/ (tf^i + 02 V2 + ...) = J (a 1Vi) + f (0 2 0 2 ) + ... =

= a\f(.v\) + a2f { v 2) . . . = ^ ai f ( Vi ).

Proposizione 13.3 Sia V7i un sottospazio di V. L'immagine W\ = / ( V i ) di V]


tramite l applicazione lineare f , un sottospazio di W. In particolare l'immagine
f(V) dello spazio V un sottospazio d W indicato con Im f .

Dimostrazione. Siano wie w2 Wi e k R. Per provare che W\ un sotto-


e
spazio di W dobbiamo mostrare che w\ + w2 VVi e che kw\ e W\. Poich
per ipotesi esistono vi E V e v2 V tali che w\ = f { v \ ) e w2 = f { v 2), per la
linearit di / risulta che

u>i + W2 = / ( i'i) + f {v 2) = f ( v 1 + v2)

kwi = kf{v 1) = f ( k v 1).


Essendo V! un sottospazio di V7, gli elementi v\ + v2 e kv\ apartengono a V\ , e
quindi w\ + uh e wi sono elementi di Wi,

Proposizione 13.4 Sia W un sottospazio di W: la sua immagine inversa


= V1 un sottospazio di V.

Dimostrazione. Siano infatti uj , v2 e V1e k e R. Occorre al solito provare che


1/, + V e kv[ e V. Posto w\ = f ( v\ ) e w'2 = / ( i.\), per ipotesi essi
appartengono a W\ sottospazio di W, e quindi w\ + w'2 e W' e fcu/ e Inoltre
w\+w2= /()+/(vJ) = /(tij+ u j) e/cu;', = k f{ v \) = f [ kv\ ) . Questo mostra
che v'j + 1/2e taj sono elementi di V ' in quanto preimmagini rispettivamente di
ui'j + ujj e uJ, elementi di W".

Definizione 13.2 II sottoinsieme di V costituito da tutte le preimmagini dello


zero diW detto nucleo dellomomorfismo f ed indicato con il simbolo ker /
[ker deriva dallinglese kernel-nocciolo, nucleo).
Ovviamente ker / non mai vuoto, contenendo almeno lo zero di V.
Appiicazior linear 195

Esempi 13.1
1. Sia : V W Vapplicazione che associa a ogni vettore di l , re *
nullo di W, cio l'applicazione ft(v) = 0 (detta anche applicazione nuda
Essa lineare infatti:
+ ^2) = 0w = # ( ti) + &(v2) e &(kvi) = 0w = ktiU ,), per ogni
V\,i>2 6 V e per ogni k e R.
2. Per ogni spazio vettoriale V l'applicazione 1 V V che manda ogni
vettore in se stesso, cio l'applicazione i(v) = u.Vi e V (detta anche appli
cazione identica) lineare.

3. Sia / : R 3 * R 2 la legge che associa a ogni vettore v = b 1 di R? il

a
vettore w = di R 2. Mostriamo che l'applicazione / (proiezione su R2)
b
lineare. Siano infatti:

t'i =

generici vettori di R 3 e k un qualsiasi numero reale allora:


a1+ a 2 ci\ + a2 1
>) f(.vl + v2) = f ( by + b 2
b[ 4- b2 b[
C\ + c 2

ii) f{kv\) = f { k b x \ =
l i ) = * ( 11 1 = */< >>
0
0
Ora ker f = {v e R 3 | f ( v) = 0j : = c e R) mentre
0 } = {v = ( 0
Im / = R2.
a
h- 1
4. Sia / : R 3 > R 2 lapplicazione definita ponendo f \ b ) = a

Determinare per quali valori di h R detta applicazione lineare


h- 1 0 da cui
Anzitutto deve essere / ^ ( H = | j quindi 0 0
h = 1, sicch si ottiene
a 0
f \ bc a
Verifichiamo che / lineare.

Siano.ora,r, = j * 2 = j due vettorl dl R3 e * e E. :

/( i+ K 2 )= /^i + ^ j = ( a + a 1) = ( 2) + ( r , ) = /( i) + /(n 2);

f { k v > ) = f (s ) =( i ) = k U) =
Pertanto / lineare per h = 1.

Con la nomenclatura precedentemente introdotta si osserva che

Proposizione 13.5 Data unapplicazione lineare f : V W si ha:

a) f iniettiva <$=>ker / = {Oy};

b) / surettiva <=> Im / = W.

Dimostrazione, a) Sia / : V W iniettiva: allora elementi distinti di V hanno


immagini distinte in W. Se 3u ^ Oy, v e ker / allora f ( v ) = Ow, ma anche
/ (Ov) = 0w, assurdo! Viceversa sia ker / = {Oy} e siano V\,V2 V, iq ^ v2
con /(t?0 = /(U2). Per la linearit di / f ( v\ i>2) = 0W e quindi lelemento
vi - u2 fi Ov appartiene a ker / , ancora assurdo,
il punto b) segue dalla definizione di applicazione surettiva,

Proposizione 13.6 Sia f : V > W un'applicazione lineare: se V finitamen


te generato, allora /immagine f(V) C W finitamente generata.
Dimostrazione. La Proposizione 13.3 ha provato che f ( V) un sottospazio di
W Sia {vi,V2,...u n} un sistema finito di generatori per V; mostriamo che un
sistema finito di generatori per /(V ) costituito dai vettori
{ /(u i),/(v 2) , . . .
Infatti sia w un generico elemento di f(V), allora 3 v e V tale che /( v ) = u>;
poich (vi,V2, . .. u] un sistema di generatori per V si ha che
v = aji>i + aivi H------ anvn ove a, e E
e quindi

U - f(v ) = f(a[Vj + + anvn) = af(v O + a 2f ( v 2) -4------- h af(v)


'1che prova che /( V) finitamente generato.
Applicazioni linean 197

Siamo, ora, in grado di enunciare e dimostrare il seguente


Teorema 13.1 (Nulitei + Rango) Sia V uno spazio di dimensione finita e )IU
f i V * W un applicazione lineare, allora dimfker f ) + dimilm f) = dim V
Dimostrazione. Poich V finitamente generato, anche / ( V) lo , per la Pro
posizione 13.6 e ker / finitamente generato in quanto sottospazio di V. Posto
r = dim f ( V ) e s = dim k e r / , siano {101, 102, . .. ufi} e [t\, /2, .. .fi} due basi
rispettivamente di f ( V ) e di ker / . Naturalmente w, = f{v,) per opportuni
vi e V. Mostriamo che B = {v\,v2, .. vr,t\,t 2,. . .fi} una base per V
Anzitutto proviamo che B un sistema di generatori per V Sia v e V.
poich f ( v ) e f ( V ) si ha che f ( v ) = V a,w,.
/= !
Presi pertanto due vettori x e y di V cos definiti

y = J 2 ' v e x v y
1=1
per la linearit d / risulta
f t

f ( y ) = / ( * ) = J 2 aiW =
1=1 i=i

f ( x ) = f ( v - y) = f ( v) - /(>) = f(y) - f(y) = 0w


quindi x e ker / . Si ottiene quindi che
'
* = A fi v = x + y = '* T b it,+ Y ^ aiVb
e
'=1 1=1 1=1
Pertanto B un sistema di generatori per V .
Per quanto riguarda lindipendenza lineare dei vettori di B, considenamo la
combinazione lineare
s r

v = X A fi + X v> con ai -A e R .
1=1 =1
Dalla linearit di / segue che /
5 r r
f (Ov) = X A ) + X a>/ ) = Oiv + X a ' wi
1=1 1=1 =1
essendo i ti elementi d ker / .
Poich {ioi,ui2, . - ior) una base per / ( V ) e quindi in particolare un si
stema di vettori indipendenti, segue che a, = 0,V/ e {12,. ,r] da cui si
5

ottiene Ov = fi,fi e ancora, essendo {fi,fi>.... ,fi} una base per ker j ,
A = 0,Vi e { 1 ,2 ,... ,s).
198 Capitolo 13

Lasciamo per esercizio la dimostrazione della

Proposizione 13.7 Sia f un'applicazione lineare tra due spazi vettoriali V e W,


con V spazio vettonale di dimensione finita, allora
a) f suriettiva dim f (V) = dim IV;
b) / iniettiva< dim ker / = 0.

Definizione 13.3 Siano V e W due spazi vettoriali, f e g due applicazioni li


neari di V in W e X uno scalare (X e R)

f :V -+ W, g :V W.
Si definiscono le applicazioni di somma f 4- g e di prodotto per uno scalare Xf
nel seguente modo

( / + )(v) = f (v) +g( v)

(Xf){v) = Xf(v) VveV.

Le applicazioni / 4 g e Xf sono ancora lineari. Infatti, Vt>i,i>2 e V.p. e R si ha:

( / + )(*>! + ^ 2) = f (Vl + V2)+g(Vi+V2) = fi o 1) + f ( v 2) 4- g(ui) 4- g{ v2) =


= f(V\) + g(V) + f ( v 2) + g(V2) = ( f + g){Vi) + ( f + g)( V2)

( / + g)(pv) = f(liv) + g(pv) = p,f(v) + pigio) = j l ( f 4- g)(v)

Xf(v\ + U2) = fiMv 14-v2)) = /(A.u 1 4- Xv2) = f (X( ti)) 4- f(X(v 2).) =
= V U i) + Xf(v 2)

{Xf)ipv) = XiJijiv)) = X(pf(v )) = pi{Xf{v)) = /z (Xf ) (v)


Sia Homi V.W) linsieme delle applicazioni lineari da V a IV; con le operazioni
di somma e di prodotto per uno scalare definite sopra, Hom ( V, W) diviene uno
spazio vettoriale (lasciamo al lettore la verifica degli assiomi).

Definizione 13.4 Dati due spazi vettoriali V e W, essi si dicono isomorfi e si


scrive V - W, se esiste una applicazione lineare bijettiva (isomorfismo) tra
V e W.

Esempio 13.1 Lo spazio vettoriale Matmxn(R) isomorfo allo spazio vettoriale


Matnxm(R) via l'applicazione lineare di trasposizione che associa a ogni matrice
A e Matmxn(R) la sua trasposta AJ e Matnxm(R).

In particolare si pu dimostrare il seguente

Teorema 13.2 Dati due spazi vettoriali V e W, con dim V n dim W = m,


alloralospazio vettoriale Hom(V, W), isomorfo allo spazio vettoriale Matmxn(R)
Inparticolare dim Hom( V. W) = n m.
Applicazioni linean 199

Diamo qui di seguito una traccia di dimostrazione.


Per ipotesi V e W sono finitamente generati, in particolare siano
6 = {vi v2, . . . ,u)
e
C = {W] W2, . -.
due basi arbitrarie, rispettivamente per V7 e W
Consideriamo una matrice X e Mat,
'rii r i 2 ri
*
* *

_ Xm1 2
Servendosi delle basi di V e di W si pu costruire unapplicazione lineare
f x : V -+ W tale che a ogni v e V , v = J2'=i av* associ lelemento
m n

xn wi = X , H xiaiWi-
M i=1
Poich C una base, per Vunicit di scrittura di v come combinazione lineare dei
Wj, si ha che
m n
Y ^ Y l Xua,w,
j=> '=1

e quindi
-ft
1

1 "
______

n X\\ X\n ~


bj = J 2 x j ' a e


Z= 1
_ bm _ _ 1 ' Xmn_

Definizione 13.5 Gli elementi a, e R si dicono coordinate di v nella base


B {ui,U2, . . , vn } e gli elementi b , e M, si dicono coordinate di \ nella base
C = { wi w2, . . . , wm} .
La corrispondenza f x lineare, come si pu facilmente verificare utilizzando le /
propriet del prodotto matriciale.
Viceversa, se / : V > W un'applicazione lineare, utilizzando le basi 8 e
C, possiamo costruire una m atrice A . detta matrice rappresentativa dell'appli
cazione lineare / , nel modo seguente:
per ogni j = 1, 2 , . . . ,n, consideriamo l'immagine f d , ) e U'dei vettori della
base B di V; questa si potr esprimere in modo unico come combinazione lineare
dei vettori della base C e quindi sar:
ni

f (.,) = ' , ijU'i


1=1
200 Capitolo 13

La matrice A - [dj,] di tipo (m,n) e V j = 1 ,2 ,... ,n, la j -e s im a colonna


costituita dalle coordinate del traformato del j -esimo vettore della base 3 espresso
come combinazione lineare dei vettori della base C.

Esempio 13.2 Sia / : R3 * R 2 Vapplicazione cos definita

0
a+ b+ c

Costruiamo la matrice rappresentativa di / rispetto alle basi canoniche di R 3


e di R2.

Ricordando che la base canonica di R 3 costituita dai vettori


0
*2 = I 1 e3 =
0
e che quella di R2 costituta da i vettori

e\

consideriamo le immagini dei vettori e\,e2,e3 ed esprimiamoli come combinazio


ne lineare di \ ed i.
0 0
/(<?i) = 0 [ + 1 2\
1 +0 + 0 1

0 0
M ) 1 = 0 - 1 + l - e 2;
0 + 1+0

0 0
f(e3) = = 0 \ + 1 2
0+ 0 + 1 1
La matrice rappresentativa, rispetto a questa scelta delle basi, quindi
000
M= 111

Costruiamo ora la matnce rappresentativa dellapplicazione / rispetto alle


basi
1 5
B' = lo 1 2 di R- C = di M
0 0 3 IO '(VI
Applicazioni linean 201

Consideriamo le im m agini dei vettori della base B' di R 3 #

0
= 0-
1 M fi

0
10 - 0 l J) + 5( 2

Quindi la matrice rappresentativa sar:

0 00
M' =
1/2 1 5

13.1 Rango
Mostriamo, ora, alcuni rilevanti legami tra la matrice A e lapplicazione lineare
/ a ad essa associata.

Sia A = (ciij) una m atrice di tipo (m,n) a elementi in K.

Proposizione 13.8 / vettori colonna d A sono i generatori dello spazio Im f A


La dimostrazione im m ediata, ricordando che V.r e V

f a (x) = Ax
e che il prodotto Ax d una com binazione lineare dei vettori colonna di A.

A suo tempo abbiam o definito rango di una matrice A di tipo m x // il


numero dei pivots di una sua riduzione a scala S , ottenuta con il metodo di eli
minazione di Gauss.
Siano ora si,S2, . . . ,5r le colonne di 5 su cui si trovano i pivots. Allora /
possibile provare le seguenti

Proposizione 13.9 I vettori colonna aS],as,. .. ,aSr di A sono linearmente in


dipendenti e costituiscono una base per lo spazio generato dai vettori colonna
di A.
Proposizione 13.10 II rango di A ( indicato con rg (A)) il numero massimo di
vettori colonna linearmente indipendenti.
Osservazione 13.2 Le precedenti propriet rimangono valide se n e ll enunciato
si sostituisce il termine colonna con il termine riga,
202 Capitolo 13

Esercizio 13.1 Date le seguenti applicazioni, dire quali sono lineari:

a a -f- b
1. / : R 3 * R 3 tale che / | b b ?
c b

a
2. g : R2 R 3 tale che g ( C
! ) = ci -f- b
ci b -f~ 2

a
3. h : R 2 > R tale che h = 2a + b\

a a 1
4. / : R 2 > R 2 tale che /
a + b

Esercizio 13.2 D eterm inare la m atrice associata alle seguenti applicazioni linea
ri da R 3 > R 3, rispetto alla base canonica:

a a
1. f [ b 0
b

a 2a
2. g b a
c Q -\r b

a 0
3. h b b
c c

a 3a
4. t b a b
c b -c

Esercizio 13.3 Sa g : R 3 R 4 Vapplicazione definita da.

x
g 1y

a) Verificare che G lineare.


b) Determinare la matrice associata all applicazione g.

c) Determinare ker g e Im g .
Applicazioni linean 203

Esercizio 13.4 Sia / : R 2 IR3, lapplicazione definita da


a
a
/ b
a+b
Verificare che / lineare, determinare ker / e Im /.

Esercizio 13.5 Considerate le applicazioni dellesercizio 13.2, per cmcma //


esse
0
a) determinare Vimmagine del vettore ( 0
1
b) determinare, quando esistono, le preimmagini dei vettori

c) determinare la matrice associata.


14
Autovalori, autovettori,
diagonalizzazione

An investment in knowledge pays th best interest


(B. Franklin 1750)

Nel precedente capitolo abbiamo trattato la correlazione tra due spazi vettonali
V e W attraverso il concetto di applicazione lineare o omomorfismo. Nel caso
particolare in cui i due spazi V e W coincidano e / : V V sia unapplicazione
lineare, si parla pi semplicemente di endomorfismo dello spazio V. Indichiamo
con A la matrice rappresentativa di detto endomorfismo rispetto a una scelta della
base per V. Risulta spesso comodo cercare una base rispetto alla quale A assuma
una forma determinata. In particolare vedremo che se A una matrice diagonale
risulta molto facile risolvere il sistema per la ricerca di eventuali controimmagini
di un dato vettore.
Procediamo, pertanto, a individuare una base aspetto alla quale A diagonale.
Definizione 14.1 Sia f : V V un endomorfismo dello spazio V e X un ele
mento del campo IR. Un vettore x ^ 0y detto autovettore relativo allautovalore
X se f(x) = Xx.
Osservazione 14.1 Ogni autovettore jc associato a un solo autovalore. Infatti
se fosse f ( x ) = r e / ( x ) = p x si avrebbe Xx = px cio (X - p)x = 0y e per /
le propriet degli spazi vettoriali seguirebbe X = p.
Osservazione 14.2 Lauto vettore x sempre non nullo altrimenti luguaglianza
f(x) = Xx sarebbe verificata per ogni X e E.
Osservazione 14.3 Lautovalore A. pu essere nullo. Nel caso in cui X = 0 si ha
che / ( x) = O.r = Oy e quindi x e ker /.
Esempio 14.1 Sia / : R 3 R 3 lendomorfismo cos definito:
Poich risulta

allora = 1 un autovalore per / e il vettore v un autovettore relativo

allautovalore = 1.

Osservazione 14.4 Se x\,x2 sono autovettori relativi allo stesso auto valore per
un endomorfismo / di V, allora V a\,a2 e R il vettore a\X\ + a2x2, se non il
vettore nullo, ancora un autovettore per / , relativo allauto valore X.
Infatti f{ci\X\ a2x2) = ci\f(x\) ~)~a2f { x 2) = a\Xx\ -\-a2Xx2 = X{a\X\ -\-a2X2).
Possiamo quindi concludere che Vinsieme Vk( f ) = {u G V \ f ( v ) = Xv) degli
autovettori relativi allautovalore X con il vettore nullo un sottospazio vettoriale

Definizione 14.2 II sottospazio V\ ( f ) detto autospazio relativo alVautovalo


re X (n.b.: nel sottospazio V, {f) contenuto anche il vettore nullo).
Definizione 14.3 Linsieme degli autovaio ri di un endomorfismo f di V detto
spettro di f e viene spesso indicato con spf.
Poich noto che a unapplicazione lineare / si pu associare una matrice
rappresentativa A = Af, vediamo come possibile procedere in pratica nella
ricerca degli autovalori di un endomorfismo / .

Proposizione 14.1 Sia V uno spazio vettoriale sul campo R con di m V = n e sia
/ 6 End{V). Uno scalare X e R autovalore di f se e solo se l'endomorfismo
( / - XI V) definito ponendo ( / - X l v )(v) = / ( v ) - Xv , Vv e V non isomorfismo.

Dimostrazione. Lapplicazione ( f Xly ) e End( V) non isomorfismo se e solo


se Ker ( / - XIV) ^ {Oy} cio se 3v e V,v ^ Oy, tale che valga luguaglianza:
(*) ( f - X I v ) ( v ) = Oy
cio tale che f(v) = Xv. In altre parole se e solo se / possiede un autovettore v
relativo allautovalore X. m
Considerando, ora, la matrice A , quadrata di ordine n, rappresentativa di /
rispetto a unopportuna scelta di base, lequazione ( ) diventa:
(A - XIn)v = (A - XI)v = Oy
che pu essere letta come un sistema lineare omogeneo di n equazioni in n inco
gnite del quale si cercano le soluzioni non banali. Ricordando che un tale sistema
ha soluzioni non banali se e solo se il determinante della matrice dei coefficienti
nullo (cfr. Teorema di Cramer), deduciamo che gli autovalori di f (o, equivalen
temente, di A) sono tutte e sole le radici X, dellequazione det( A XI) = 0.
Autovalori, autovettori, diagonalizzazione 207

Definizione 14.4 Sia f : V V un endomorfismo dello spazio vettoriale V. Il


polinomio p{X) e /?[] definito ponendo p(X) = det(A - XI ) e detto polinomio
caratteristico.
Osservazione 14.5 Se A e M atnxn{R), il polinomio caratteristico ha grado n e
il termine noto di detto polinomio det A.

Esempio 14.2 Sia / : R 3 -+ IR3 lendomorfismo la cui matrice rappresentativa


la seguente:
3 2 3
A = 14 3
12 5
Per trovare gli autovalori e gli autovettori di f , determiniamo, anzitutto, la matnce
A- XI
"3 2 3 10 0 "3 A. 2 3
1 4 3 X 0 1 0 1 4- X 3
Il

-
1

12 5 0 0 1 1 2 5 - X_
e calcoliamone il determinante
det(A - XI) = (3 - X)[(4 A.)(5 X) - 6 ] 2(5 - X - 3) + 3(2 - 4 + X) =

= (3 - )(20 - 9X 4- X2 - 6 ) - 2(2 - ) + 3( - 2) =

= (3 - X)(X2 - 9 X + 14) + 5(X - 2) =

= (X 2)[(3 X)(X 7) + 5] =

= (X 2) ( 2) ( 8).
Quindi gli autovalori di / sono X = 2 con molteplicit due e X - 8. Cerchiamo,
ora, gli autovettori relativi allauto valore X = 2: si tratta di risolvere il sistema
Ax = 2x ovvero il sistema Ax 21 x = Oy, cio
3 - 2 2 3 ~X "0
1 4-2 3 y 0
1 2 5-2 0

1 2 3 " -V 0
1 2 3 y
0
1 2 3 _z _ 0
Poich le tre righe della matrice A coincidono, il sistema si riduce all'unica equa
zione: x + 2y + 3z = 0 e ammette pertanto oo2 soluzioni del tipo
" 2h - 3k - _ 2 - 3
h = h 1 +k 0 ove h,k M.
k _ 0 _ 1
208 Capitolo 14 _________________________________________ __________________

Quindi Tautospazio relativo allautovalore 2

- - 2 " -3
V2( / ) = 1 9 0
0 1

Procedendo in maniera analoga per X = 8 si ottiene il sistema

3 -8 2 3 ~x "0
1 4 - 8 3 y 0
1 2 5-8 _z _ 0

cio

-5 2 3 "x " "0 "


1 -4 3 y 0
1 2 -3 _z _ 0

Poich il rango della matrice in questione 2 il sistema ammette oo 1 soluzioni


cos ottenute


-3 h 2
- 3 /i - 4 12 h + 6/i
X h
18 18
-5x + 2y = - 3 z
- 5 3 h
x-4y = -3 z
1 3 h 15/2+3/2
y =h
18 18
z =h

Pertanto lautospazio relativo allauto valore 8

1
Vi ( / ) = 1
1

14.1 Matrici diagonalizzabili

Ricordiamo, anzitutto, la seguente

Definizione 14.5 Due matrici A,B e Matnxn(R) si dicono simili se esiste una
matrice invertibile P e Matnxn(R) tale che A = P ~l B P .
Autovalori, autovettori, diagonalizzazione 209

In Matnxn(R ) la relazione di similitudine una relazione di equivalenza, come si


pu facilmente verificare.
Osserviamo che due matrici simili hanno lo stesso determinante: infatti, applican
do il teorema di Binet si ha

det(/4) = d e t(P - 1Z?/) = d et(/>~ 1)det(B )det(/) =

1
det(Z?) det(70 =det(Z?)
d etfP )
Inoltre due matrici simili hanno lo stesso rango (o caratteristica) e hanno anche
gli stessi auto valori.
Ricordando che una matrice quadrata B = (bl}) diagonale se btJ = 0, per ogni
i ^ j , diamo la seguente

Definizione 14.6 Una matrice quadrata A si dice diagonalizzabile se simile a


una matrice diagonale. In altre parole se 3 una matrice P e Matnxn(R) tale che
P~[AP sia diagonale.

Proposizione 14.2 Sia V uno spazio vettoriale ed f e End[V). Se V ha dimen


sione finita n e se f ha esattamente n autovalori distinti, allora V ha una base
costituita da autovettori di f e, rispetto a tale base, la matrice rappresentativa
di f diagonale.

Dimostrazione. Indichiamo con X\,X2, . . . , gli n autovalori distinti di /. Per


ogni / G { 1 ,2 ,... } sia v, un autovettore relativo allautovalore X,. Mostriamo
che5 = {t>i,V2___ ,u} u n a b a s e d i V.
Anzitutto verifichiamo che i vettori V\,V2, . ,vn sono linearmente indipen
denti, procedendo per induzione su n.
Per n = 1, lasserto vero poich v\ Ov e quindi linearmente indipen
dente.
Supporre lasserto vero per n 1, vuol dire, senza ledere la generalit del
discorso, supporre lindipendenza lineare di Vi,V2, . . . ,u_i, cio supporre che,
n1
ogniqualvolta J2aivi = allora necessariamente a, = 0. V7 = 1,2,.. ,// - 1
is si
Proviamo, quindi, lindipendenza lineare di vi,V2, . . . ,v.
n
Sia = Ov una loro combinazione lineare che d il vettore nullo.
i= l
Allora

Qv = / ( Ov) = f ( I M ) = l b J M = t bkv'
\f =1 / 1= 1

Ov = K, Ov = K, T.b,v, = U b,v,
210 Capitolo M

poich
"
T V / i=
w =1

si ha
/I
]P(A( - A)M; = Oy
/=i
cio
-i
D/ (A, A,,)/?, v, Oy
i=i
Facendo intervenire l'ipotesi induttiva, si ha
(A, - A,,)/?, = 0 V Vi = 1,2... ( - 1).
Inoltre, poich gli autovalori sono distinti per ipotesi, la differenza A, - X
diversa da zero e quindi b, = 0 Vi G {1,2... ,n 1}. Allora bnvn = Oy e, poich
u ^ Oy, si ha = 0. Dato che V ha dimensione n , gli n vettori ui,t>2, . . . vn,
linearmente indipendenti, costituiscono una base per V.
Poich /(v j = A,v,, Vz e {1,2... ,}, la matrice rappresentativa dellendo-
morfismo / nspetto a questa base di autovetton :
Ai 0 0 0 4 4
"

0 a2 0 0 0
0 0 A3 0 0

* t 4 9

0 0
0 Xn
e quindi diagonale.

Possiamo ora enunciare la versione matriciale delle precedente proposizione;

Proposizione 14.3 Se una matrice quadrata A di ordine n ha n autovalori di


stinti allora diagonalizzabile.
Rimane da affrontare il caso in cui un autovalore (o alcuni autovalon) abbiano
molteplicit maggiore di 1, cio siano radici del polinomio caratteristico con
molteplicit maggiore di 1. Si ha la seguente

Proposizione 14.4 Sia A un autovalore di f EtuH V). Allora, indicato con


\f l'autospazio relativo a questo autovalore, vale la relazione:
dim VK= n car (A A/),
essendo V, lo spazio delle soluzioni del sistema omogeneo (A XI)x = 0\
Autovalori, autovettori, diagonalizzazione 211

Definizione 14.7 La dimensione di V, detta molteplicit geometrica dellau


tovalore X.

Studiamo, ora, in che modo si legano tra loro la molteplicit algebrica e la molte
plicit geometrica di un autovalore, dimostrando la seguente diseguaglianza

Proposizione 14.5 Indicata con n,, (n, > \) la molteplicit algebrica dellau
tovalore X, si ha che
dim V>.( = n car (A X-, /) < tij

cio la molteplicit geometrica di un autovalore non mai maggiore della sua


molteplicit algebrica.

Dimostrazione. (Traccia) Ragioniamo per assurdo supponendo che sia

n car ( A X, I) > n,
Allora possibile costruire una base per Tautospazio V, formato da t autovetton
con t = n - car (A X,I). Completando questa base a una base di V, si ha che A
X,I M
simile a una matrice (a blocchi) del tipo B ove / la matrice
0 N
identica di ordine t = n car (A X, /). Il polinomio caratteristico di B (che
uguale a quello di A) ps(X) = (X Xl)n~car(A~x/>p^(X), assurdo, poich la
molteplicit algebrica di X, n car {A - X, I) > n,. u

Definizione 14.8 Si dice che un autovalore X di A regolare se le sue moltepli


cit algebrica e geometrica coincidono.

Abbiamo gi notato che se gli autovalori sono tutti distinti questi sono tutti re
golari, cosi se la matrice A quadrata di ordine n ammette n autovalon distinti
diagonalizzabile. Se gli autovalori non sono distinti affinch A sia diagonalizza-
bile devono essere regolari. Sussiste, infatti, il seguente

Teorema 14.1 Sia A e Matnxn(R) : A diagonalizzabile se e solo se i suoi


autovalori sono regolari e la somma delle loro molteplicit n.

Osservazione 14.6 Si pu dimostrare che ogni matrice simmetrica diagonaliz


zabile.

Esempio 14.3 Stabilire se diagonalizzabile la matrice

113
023
. 0 0 1.

e in caso affermativo trovare la matrice diagonale B a cui simile e la matnce


diagonalizzante.
212 Capitolo 14

Cominciamo col calcolare il polinomio caratteristico di A:

1- X 1 3
det(A - XI) = det 0 2 -X 3 = (1 - a.)(2 - X)(l k ) = (1 )2(2 - X).
0 0 1-X

L'quazione caratteristica ottenuta eguagliando a zero il polinomio caratteristico


ha come soluzioni
X\ = 2 e A.2 = 1 (questultimo con molteplicit 2).
Affinch A sia diagonalizzabile deve risultare car (A j7) = 3 1 = 2 e
car (.4 X2/) = 3 - 2 = 1.
Ora sostituendo al posto di X una volta 2 e una volta 1 in A XI si ottengono
le matrici
-1 1 3
A - 2 /3 = 0 0 3
0 0-1
che ha caratteristica 2 e
0 13
A -h = 0 13
000
che ha caratteristica 1, quindi A diagonalizzabile e una matrice diagonale simile
ad A
200
B= 0 10
00 1
Per determinare la matrice diagonalizzante, cio per trovare una matrice C ta
le che sia B = C-1 AC, bisogna individuare gli autovettori dellendomorfismo
rappresentato da A e risolvere pertanto i seguenti sistemi matriciali
-1 1 3 - X -o~
(A - 2/)x = 0 0 3 V 0
0 0 -1 0
da cui l e x 1soluzioni
~h~ " 1
h = h 1 , V/i R e
0 _0 _

0 1 x 0
(A - I)\ ~ 0 13 0
y
000 rr 0
Autovalori, autovettori, diagonalizzazione 213

da cui le oo2 soluzioni


k ~ \- - 0
-3 h = k 0 + h - 3 V/i, k e R.
h 0 1
Pertanto si ottiene
"1 1 0
1 0 -3
0 0 1

Esercizio 14.1 Si considerino le seguenti applicazioni f, : R 3 - R3. Per ognu


na di esse dire se lineare. In caso affermativo determinare la matrice A, associata
a /,. Stabilire quindi se A, diagonalizzabile e, in caso affermativo, trovare la
matrice diagonale associata.

a
2. a + b 4- c
c a

3.

0
4.
a+b+c
c b

/
15
Reticoli, Algebre di Boote e circuiti

Un metodo per significare le proprie idee


a qualunque distanza
per mezzo di oggetti
che siano visibili o invisibili,
ma capaci di due possibilit,
come fuochi dartificio, campane, cannoni
(Francis Bacon)

15.1 Elementi di Teoria dei Reticoli


La teoria dei reticoli ha avuto inizio nel 1897 con la pubblicazione, da parte di
Richard Dedekind, del lavoro ber Zerlegungen von Zahlen durch ihre grssten
gemeinensamen T eiler' ed ha assunto via via sempre maggiore importanza in
ambito informatico per le sue applicazioni nei linguaggi di programmazione.
Definizione 15.1 Una struttura algebrica (H , v , a ) costituita da un insieme 11
e da due operazioni binarie V,A su 7Z si dice reticolo1 se, Va, b,c e l i valgono
i seguenti assiomi:
\avb = bva . v
/. a aA bi = b, A. a propriet commutativa
*
, , (a v b ) v c = a v ( b v c)
2-1 (a A b) A c = a A (b A c) propneta assoaat>va
a V (a A b ) = a
3. legge di assorbimento
a A (a v b) = a
Le operazioni V, A si dicono unione e intersezione.
Esempio 15.1 Sia S un insieme e V{S) Finsieme delle parti di S. Rispetto alle
operazioni di unione ed intersezione insiemistica (V(S), U ,fl) un reticolo.

Lattice ( inglese), treilli (francese)


rViKnow 15J Sia (H ,V, A) un reticolo. Un sottonsieme non vuoto T di R
i K'X'.recolo, se T chiuso rispetto a V e A.

Osk"- :;~>o che le propriet delle operazioni v e A compaiono in modo simme-


Ci d luogo al seguente:

Teoremi 15.1 Principio di dualit) Sia P l enunciato di un teorema in teoria


-'.v;':. in cui intervengano soltanto le operazioni V, a e sia P* Venunciato
.'Tiene da P scambiando fra loro, dove compaiono, i smboli di unione e
T -uzkmt. Adora anche P* lenunciato di un teorema della teoria dei reticoli.
dice duale di P).

lustrazione. Basta osservare che linsieme degli assiomi 1, 2, 3 della defini-


.5 i resta invariato se si scambiano fra loro i simboli di v , A. Se dunque
3Ear.se P una conseguenza degli assiomi di reticolo, lo necessariamente
r.

Tvxemz. 15J Sia CR. v , a ) un reticolo, Va e R valgono le uguaglianze: :


1- a . a = a
1 aAa-a.
lJK*3raajoae. 1. Daa a (a vb) = a, ponendo b a si ottiene a A {a v a ) = a.
' : &ZK che a . a = a v (a a (a v a)) = a, ancora per le leggi di assorbimento.
2 tessa? per dualit.
&MEBk 15.1 Sia (72,, v ,A) un retcolo e a,b e R. Si ha:
a A b = a & a v b = b.
Sia a = a A b. Allora: a v = (a A b) v = b v (b A a) = b.
- .et -ersi segue per per dualit3scambiando a con b. u
qci i legami tra i reticoli e gli insiemi parzialmente ordinati, introdotti
zmalio 4.
' '47-1 y pu introdurre in modo naturale una relazione dordine, infatti
temerne:

**xvm 153 Sia (R / , a ) m/i reticolo. Per a,b e 7Z si ponga:


a <b a A b a.
(T9V
j e un insieme ordinato nel quale per ogni a, b R si ha:
sup(a,b) a V b
inUa,b) = a a b.

A
Wd
* ,h/a 'b) A a =sAb Va) a a =
Reticoli, Algebre di Boote e circuiti 217

Dimostrazione. Anzitutto si verifica che < una relazione dordine in 71


Valgono, infatti, le propriet:
riflessiva : Va e R a < a poich a A a = a (propriet di idempotenza);
antisim m etrica : siano a ,b e R e sia a < b, b < a allora a Ab - a ebr a = 6
da cui, per la propriet commutativa, segue a = b;
transitiva: siano a, b, c e R e a < b. b < c, dobbiamo provare che a < c
Poich, per ipotesi, si ha che a / \ b = a e b / \ c b, segue
a A c = (a A b) A c = a A (b A c) = a A b = a.
Proviamo, ora, che Va,b e R sup(a,Z?) = a v b.
1. Infatti a A { a v b ) = a < $ > a < a v b e b A ( a v b ) = b A ( b v a ) b & b <avb
2. Sia, ora, c e R, con a < c e b < c. Poich
a Ac a e b ac b & a v c = c e bv c = c

segue che:
{a v b) v c = a v (b v c) = a v c = c,

cio a V b < c e, per il lemma 15.1 si conclude che a v b - sup{a,b).


Per provare che a A b inf ( a, b) basta osservare che esso lenunciato duale di
sup(a,fr) = a v b e usare il principio di dualit.
La relazione dordine <, appena introdotta, la relazione dordine associata al
reticolo 71.
S

coppia di elem enti am m ette sup e inf: vale, infatti, il seguente

Teorema 15.4 Sia (1Z, <) un insieme ordinato tale che per ogni a b e II
esistano sup{a,b) e \nf(a,b). Si definiscano su 71 le operazioni v,A ponendo
Va, b e 7Z:
a V b = sup (a,b), a A b = inf (a,b).

Allora (7,v , a ) risulta essere un reticolo, e la relazione d'ordine associata a


(7Zy,A) coincide con <.
Dimostrazione. C onsideriam o le applicazioni a,fi da 71 x 71 a 71, tali che :

a : ( a , b ,) - a v b, : (a ,b ) a Ab.

Esse sono operazioni binarie su R per lunicit di sup e inf


Inoltre valgono le propriet:
1. Commutativa:
a a b = b A a , poich inf ia.b) = inf(b,a)

av b= V a, poich sup(a,6) = sup(/>,tf)


218 Capitolo 15

2. Associativa:
(a A b) A c = a A (b A c) cio inf[inf(a,/?),c] = inf[a, inf(6,c)]

(a v b) v c = a V (b v c) cio sup[sup(a,i?),c] = sup[a, sup(b,c)].


Proviamo la seconda propriet ponendo x = sup(a.b) e y = sup(6,c), sicch la
tesi diventa: sup(.v,c) = sup(a,y). Cominciamo con losservare che in base alla
definizione di estremo superiore :

a < x < sup(x,c) = a < sup(jc,c)


Inoltre valgono contemporaneamente le condizioni:

b < x < supU\c), c < supOc.c)


da cui si ottiene:
y = sup(i?,c) < sup(x.c) = sup(a,>') < sup(jc,c) ( )
Inoltre:
a < sup(a,>)
;t = sup (a,b) < sup(a,y)
b <y < sup(a,y)
e. poich c < y < supia, y), si ha:

c < sup(a,)0 sup(;c,c) < sup (a,y).


jc < sup(a,y)

Da (*) e (* ) segue quindi sup(x,c) = sup(a,y), come volevasi dimostrare.


3. Assorbimento:
a v (a A b) = a cio sup[a, inf (a.b)] a

a A (a v b) = a cio infja, sup(a,6)l = a .


Basta osservare che nf(a,b) < a < sup(a,b).

Sia, ora. c la relazione dordine associata al reticolo (JZ ,v, a ). Allora


aQb & a Ab = a & inf (a,b) = a & a < b,
quindi C coincide con <.

Sia (71 ,v , a ) un reticolo:

Definizione 15.3 Se esiste un elemento neutro rispetto all 'unione, tale elemento
si dice zero del reticolo e viene indicato con 0, ci significa che per ogni elemento
a 6 HI a V0 =a, cio 0 < a. In altre parole lo zero, se esiste, elemento
mimmo del reticolo (71 visto come struttura ordinata).
R e tic o li, A lg e b re di Boole e arcuiti 219

Definizione 15.4 Se esiste un elemento neutro rispetto allintersezione tale, eU.


mento si dice unit del reticolo e viene indicato con 1, ci significa che per ogni
a Ti a A l = a, cio a < 1. In altre parole l unita, se esiste, elemento
massimo del reticolo (71 visto come struttura ordinata).
Definizione 15.5 Sia 7Z un reticolo dotato di zero e unit e sia a e 71. in
elemento a' 7Z si dice com plem ento di a se a A a' = 0 e a / a = 1
Osservazione 15.1 1 = 0 , 0 = 1 e (a')' = a.

Definizione 15.6 Un reticolo (71 , v , A ) si dice modulare (o di Dedekind) se


Va, b, c Ti tali che a < c risulta:
(a V b) A c = a v (b A c).
Definizione 15.7 Un reticolo (71, v, a ) si dice distributivo se Va b. c e 71
a v (b A c) = (a \c b) A (a V c)
a A (7? V c) = (a A b) V (a A c).
Osservazione 15.2 Se un retcolo (7i , v , a ) distributivo allora modulare
Infatti siano a,c 7i con a < c; allora
(a V b) A c = (a A c) v (b A c) = a V (b A c).
Il seguente esempio mostra che il viceversa non sempre vero (Figura 15.1):

Figura 15.1

Infatti il reticolo modulare ma non distributivo poich sussiste il seguente.

Teorema 15.5 Sia (7Z, V , a ) un reticolo distributivo dotato di 0 e 1 se un ele


mento a Ti ammette complemento, questo unico.
Dimostrazione. Siano a' e a" due complementi di a , cio due elementi che
verificano le uguaglianze:
a A a! = 0, a V a! 1, a A a ' 0, a V a" = 1.
Allora :
d = af A = a A(flV a') =
per la propriet distributiva:
= (a' a a) v {a a a ) = 0 v (a' A a") = (a A a") = ( 'A a ') =

= 0 v (a a a) = (a" A a) v (a" A a') =


ancora per la propriet distributiva
= a" A (a v a ) = a" A 1 = a"
e quindi a - a
Esempi
1. Sia ?((/) Tinsieme delle parti di un insieme / e siano v , a le usuali
operazioni di unione e intersezione di sottoinsiemi di U, allora (V(U), U ,f)
un reticolo avente come zero linsieme vuoto 0 e come unit linsieme U. La
relazione dordine associata la relazione dinclusione. V{U) reticolo distri
butivo e ogni A 6 V(U) ammette come complemento linsieme complementare
A' = U\ A.
2. Sia R linsieme dei numen reali e < lusuale ordinamento per cui
(R ,<) insieme totalmente ordinato. Quindi Va, b e E
a v b = sup(a,b) = ma\(a,b)
a Ab = inf(a,b) = min(a,b).
Pertanto (R, v , a ) un reticolo (senza zero e senza unit):
3. Sia N* linsieme dei numeri naturali diversi da zero e < la relazione per
cui a < b <=> a\b, ove a, b e N. In questo caso la relazione < una relazione
dordine parziale in cui, per ogni coppia esistono
inf{a,b) - a K b - mcd (a,b), sup (a,b) = a v b = mcm (a,b).
Quindi (N*. v ,a) un reticolo, ove lo zero il numero 1, ma non c unit.

15.2 Algebre di Boole


Il nome del matematico inglese George Boole (1815-1864) legato a numerose
definizioni alcune delle quali riguardanti la formalizzazione e la meccanizzazione
del processo logico del pensiero; famoso il suo trattato dal titolo The Laws
of Thought scritto nel 1854. Lidea di Boole quella di sviluppare un processo
logico attraverso simboli anzich attraverso parole: si definiscono, in tal senso,
le algebre, gli anelli, le funzioni, le espressioni Booleane. Nel 1938 Shannon ha
osservato che le algebre booleane potevano essere utilizzate per analizzare circuiti
elettrici, discorso che verr sviluppato nel paragrafo sucessivo.
Cominciamo, pertanto, col definire le Algebre di Boole.
Reticoli, Algebre di Boole e arcuiti 221

Definizione 15.8 Un 'algebra di Boole un reticolo (11. / .A) distributivo, do


tato di zero e unit, in cui ogni elemento ha complemento.
Osservazione 15.3 II complemento a di un elemento a e 1Z unico icfr Teo
rema 15.5).
Proposizione 15.1 In un 'algebra (o in un reticolo) di Boole 11 valgono le Leggi
di De Morgan, cio Va, b e 1Z :
1. (a v b)' = a' A b
2. (a A b)' = a' v b'.
Dimostrazione.
1. Per la distributivit del reticolo abbiamo:
(a v b) v (a' A &') = [(a V b) v a'] A [(a v b) v '1 =
per le propriet commutativa ed associativa delFunione e dellintersezione:
= [(a v a') v b] A [a v (6 v b')] = (1 v b) A (a v 1) = 1 A 1 = 1.
Inoltre :
(a v b) A (a' A /) = [a A (a' A //)} v [b A (a' A /?')] =

= [(a A a ') A /] v [(7 A b') A a'] = (0 A b') V (0 A a') = 0 v 0 = 0.


Per definizione di complemento possiamo concludere che
a' a b' (a v b)r.
2. Segue per dualit dal punto 1.

La classe delle Algebre di Boole legata ad una particolare classe di anelli,


detti anelli di Boole.
Definizione 15.9 Un anello (/?, + ,) con unit detto anello di Boole se per
ogni a e R si ha a2 = a, cio se ogni elemento di R idempotente.
Osservazione 15.4 Se (R, + ,-) un anello di Boole Va e R si ha:
a = a.
Dimostrazione. Infatti, considerati a,b e R, per definizione (a + b): = (a + b)
ma
(a + b)2 = (a + b) (a + b) = a2 + ab + ba + b~ = a +ab + ba + b
quindi
a + a b + ba + b = a + b cio ab = -ba,
ponendo b a si ottiene a2 = a2 da cui si pu concludere che a a
222 Capriolo 15

Osservazione 15.5 Un anello di Boole commutativo.

Dimostrazione. Da quanto sopra visto ab = ba ba

Esempio 15.2 L anello ( I o , + ,) delle classi di resti modulo 2 un anello di


Boole.

Infatti: |0g = [0]2e [1]| = [1]2.

Il legame fra le Algebre d Boole e gli anelli di Boole espresso dal seguente:

Teorema 15.6 Sia (Jl, v , a ) unalgebra di Boole. Ponendo Va,b e 11

a + b = (a A b ) V (a' A b)
a - b = a Ab

sono definite su 11 due operazioni binarie +, tali che (il, + ,) un anello di


Boole.
Inversamente sia (11, 4- ,) un anello di Boole. Ponendo Va,b e H

a v b = a + b + a- b
a Ab = a b

sonodefinite su K due operazioni binarie V, A tali che (11, V , A) un algebra di


Boole.

15.2.1 Algebre di Boole e circuiti

Vogliamo ora presentare unimportante applicazione del concetto di Algebra di


Boole allalgebra dei circuiti, insistendo sul fatto che tale applicazione fu resa
possibile grazie ad alcune osservazioni di Shannon nel 1938, che fece s che lal
gebra di Boole divenisse uno strumento indispensabile per lanalisi ed il disegno
sia di circuiti elettnci sia telefonici.
Infatti lalgebra dei cncuiti si inserisce nella teoria generale dellalgebra boo-
leana come unalgebra con due elementi (0 e 1).
Al momento limitiamoci a considerare circuiti molto semplici che coinvolgo
no solo interruttori denotati in genere con lettere singole: a, b, c ...
Se due interruttori aprono e chiudono contemporaneamente un circuito, sa
ranno designati con la stessa lettera, nel caso in cui uno sia aperto quando laltro
chiuso e vicersa saranno indicati luno per esempio con la lettera a e laltro con
la lettera a'.
Reticoli, Algebre di Boole e circuiti 223

La connessione in parallelo sar indicata con a + b - a v b (Figura 15.2)

---------- a ---------

- .r " - ri*f i{w

Figura 15.2

mentre la connessione in serie sar indicata con ab = a a b (Figura 15.3).

a b

Figura 15.3

Cos ad ogni circuito in serie o in parallelo corrisponde unespressione algebri


ca e viceversa ad ogni espressione algebrica contenente solo gli operatori '
corrisponde un circuito.

Esempio 15.3 Descrivere un circuito che realizza la funzione booleana (Figu


ra 15.4):
a b c -I- a (b + c ) = (a A b A c') V (a A (b V c')).

a ---------- b ----------- c

Figura 15.4

Assegnamo il valore 1 ad una lettera se essa rappresenta un interruttore chiuso,


0 se aperto. Sicch le lettere giuocano il ruolo d variabili che possono assumere
valore 0 oppure 1.
Quindi due espressioni algebriche sono uguali se e solo se i corrispondenti
circuiti sono equivalenti.
Ricordiamo che due circuiti sono equivalenti se le condizioni di chiusura dei
due circuiti sono le stesse per ogni posizionamento degli interruttori
Esempio 15.4 Costruire una tabella delle propriet di chiusura del circuito cor
rispondente alla funzione:
g = a b + c{a -F b') (a' A b) v (c A (a v b')).
Una tabella di propriet di chiusura per una funzione identica (tranne che nel
linterpretazione) ad una tavola di verit di una proposizione funzionale (vedi Ca
pitolo 2) (vedi tabella seguente).
a b c a' Ab aVb' c A (a v b') (a' A b) v (c A (a V b '))
1 1 1 0 1 1 1
1 1 0 0 1 0 0
1 0 1 0 1 1 1
1 0 0 0 1 0 0
0 1 1 1 0 0 1
0 1 0 1 0 0 1
0 0 1 0 1 1 1
0 0 0 0 1 0 0

Semplificazione di circuiti
Senza addentrarci neHargomento in questione e invitando il lettore interessato al-
fargomento ad approfondire metodi formali, possiamo dire che un metodo gene
rale per semplificare un circuito anzitutto quello di trovare la funzione booleana
che rappresenta il circuito stesso, quindi semplificare detta espressione e infine
ridisegnare il circuito corrispondente allespressione semplificata.
Esempio 15.5 Semplificare il circuito in figura 15.5:

Figura 15.5

Il circuito rappresentato dalla funzione booleana:

/ = (x14- y') - (jc' + >0 (a + y) = (a' v / ) a (a-' v y) A (a v >)


che pu essere cos semplificato:
Oc' V/ ) A ( a 7 V )) A (A V >0 = (a ' V/ ) A [ ( a V V) A ( a ' V >>.)] =

(*' V y) A >- = (a' A y) v ( / A y) = (a ' a y).


Quindi il circuito equivalente al circuito semplificato (Figura 15.6):

Figura 15.6
16
Elementi di criptografa'

s A T 0 R
A R E P 0
T E N E T
0 P E R A
R 0 T A S

16.1 Term inologia

Che cos la criptografia? La sua etimologia, dal greco krypts = nascosto,


coperto e graphia da graphein = scrivere, suggerisce la risposta: si tratta di una
scrittura in forma cifrata di messaggi, in maniera tale che essi possano essere
letti o decrittati solo da chi riceve il messaggio. usata fin dallantichit per
documenti top secret in campo militare, diplomatico e governativo. La diffusione
di nuovi sistemi di comunicazione e dei computer negli anni 60 portarono molte
istituzioni sia in campo economico sia finanziano a ricercare nuovi sistemi per
proteggere linformazione digitale.
La criptografia spesso confusa con la steganografia' che . invece, la di
sciplina delloccultamento dei messaggi: narra, per esempio, Erodoto che istaio
e Aristagora, residenti in due paesi in guerra tra loro per comunicare usassero
radere i capelli di uno schiavo, sul cranio di questi disegnavano alcuni simboli e
gli facevano attraversare il confine solo quando i capelli fossero ricresciuti Al
destinatario non restava che tagliare i capelli allo schiavo e leggere il messaggio.
La criptografia (o crittografia), invece, non mira a nascondere il messaggio in
s ma il suo significato, in modo che questo possa essere recuperato al momento
opportuno.1

1Si ringrazia il do. Lambrugo per le utili discussioni


226 Capitolo 16

II messaggio originario inviato dal mittente detto testo chiaro. Un codice (o


cifratura) un metodo per alterare un messaggio in chiaro e ottenere un testo
cifrato (ocrittato). Per codificare un messaggio necessaria una trasformazione,
in altre parole un algoritmo matematico, che cambi le lettere del testo chiaro. La
chiave determina la particolare trasformazione usata.
Colui che nceve il messaggio, essendo a conoscenza della trasformazione e
della chiave usata per codificare, in grado di ripristinare il testo chiaro.
La crittanalisi la scienza che si occupa di studiare i metodi di ricostruzione
di un testo chiaro crittato senza conoscere la chiave.
Cominciamo con il definire la trasformazione cifrante.

Definizione 16.1 Una trasformazione cifrante una corrispondenza biunivoca


f che associa a ogni messaggio unitario del testo chiaro P un messaggio unitario
del testo cifrato C
f :P C tale che f ( P ) = C
Osservazione 16.1 La trasformazione decifrante la funzione inversa:
f ~ l : C - P
Definizione 16.2 (/, P, C) detto criptosistema.

Il passo iniziale per costruire un crptosistema quello di etichettare tutti i


messaggi, del testo chiaro e di quello cifrato, con oggetti matematici nei quali si
possono costruire funzioni; per esempio Yalfabeto inglese A, B, C, . . . ,X, Y, Z
pu essere etichettato con 0, 1, 2, ... , 23, 24, 25 utilizzando messaggi unitari
costituiti da una lettera.
a !b c D E F G H I J K L M N 0 P Q R S T U V W X Y Z
? 3 4 5 6 7 8 9 10 II 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Al
Cosi un sistema per cifrare un messaggio quello di utilizzare una cifratura per
sostituzione monoalfabetica, cio ogni lettera del testo chiaro sostituita da una
lettera dellalfabeto cifrante secondo una comspondenza biunivoca.

Esempio 16.1 Nel codice di Giulio Cesare ogni lettera sostituita da quella k
posti avanti nellalfabeto, quindi
C = /(/>) = P + k (mod 26)
Per esempio alla parola GAG (testo chiaro ) corrisponde FLDR se k = 3.

Definizione 163 Dato un a lfa b eto d i N le tte r e c o n e q u iv a le n ti n u m e rie ' .2.


V - l e dato un intero b si dice trasformazione traslante la f u n z i o n e f tale i t e
C = f i P) = P b (mod M)
Elementi di criptografa 227

Osservazione 16.2 Per decodificare un messaggio unitario si computa


P = f~\C) = C - b (mod N)

Definizione 16.4 II parametro b detto chiave del sistema.


Supposta nota al crittoanalista la struttura del sistema crittografico, il numeri >
di possibili chiavi misura la sicurezza del sistema stesso Nel caso della trasforma
zione traslante ci sono 25 possibili chiavi per recuperare il messaggio originario

Definizione 16.5 Dato un alfabeto di N lettere con equivalenti numerici 0,1 2,


N l e dato un intero b si dice mappa affine la funzione f tale che
C = f { P ) = aP + b (mod N) af eZ
Esempio 16.2 Supponiamo a = 2, b = 3 e quindi C = 2P 4- 3 (mod 26). Sia
ecco il messaggio chiaro
E C C 0 L F F B
4 2 2 12 11 7 7 1
Per decodificare occorre operare computando
P = a'C -f b' (mod N)
Se m c d (a,N) = 1 => a' = a~[ (mod N) e b' = - a b (mod N). Naturalmente
se m c d (a,N) 7^ 1, / non biunivoca e quindi non trasformazione codificante

Altri esempi di sostituzione monoalfabetica riguardano casi in cui ogni lettera


rimpiazzata da unaltra in base a una chiave e la chiave l'alfabeto cifrante, ecc.
Gi nel IX secolo gli Arabi scoprirono un metodo per violare questi cnttosistemi
analizzando le frequenze con cui ogni singola lettera compare in un alfabeto per
esempio, in italiano la lettera "a" rappresenta circa 1*11% delle lettere nei testi
chiari.

Consideriamo messaggi unitari formati da blocchi di 2 lettere: se il testo


chiaro consta di un numero di lettere dispari si aggiunge alla fine una lettera che
non crei confusione (per esempio, X o Q). Ogni blocco di 2 lettere viene pensato
come intero di 2 cifre in base N e si costruisce cos una corrispondenza biunn oca
tra linsieme di tutti 1 di grafi su un alfabeto di V lettere e l'insieme degli interi
non negativi minori di /V: .
Posto
C = aP 4 - b (mod N1)
con mcd = l
P = aC -b b
ove a a -1 (m o c V ~ b = a b m od -
228 Capitolo 16

Esempio 16.3 Sia N = 26.N2 = 576 e C = 59 P + 53 (mod 576). Poich S


? ! hanno come equivalente numerico rispettivamente 18 e 8, il messaggio s ha
equivalente numerico 18 26 + 8 = 476 quindi
C = 59 476 + 53 (mod 576) cio C = 421 = 41 (mod 576)
per tradurre C in un blocco di due lettere scriviamo
C = jc'-2 6 + / = 16-26 + 5
il testo cifrato sar qf \

Famoso in questo ordine di idee il codice di Vigenre del xvi secolo, basato sulla
considerazione di blocchi di k lettere come vettori di (Z^)* e codifica secondo la
trasformazione traslante
C = P + b ove b (ZN)k
Rompere il crittosistema possibile conoscendo o indovinando N e k e con una
nalisi delle frequenze delle prime lettere di ogni blocco per individuare b.

Un altro cnttosistema fa uso di matrici. Supposto di inviare come messaggi


unitari dei digraf su un alfabeto di N lettere, una trasformazione codificante
unabijezione tra Z# xZN e se stesso. Descriviamo detta trasformazione con una
matrice A e M u rili) tale che mcd (det A , N) = 1.

Ogni messaggio unitario P = (*) trasformato in testo cifrato C = (' ) dalla


legge
C = A Pdnod N)

cio
ab
(mod N)
cd

Poich mcd (det4,A0 = 1, esiste la matrice A l. Quindi si pu decifrare e si


ottiene
P = A~[C (mod N).

1 2
Esempio 16.4 Se N = 26 e A = si ha det A = 3, mcd (3,26) = 1
5 13
e quindi A invertibile. Vogliamo codificare la parola ecco: dividiamola in 2
blocchi ecv e co e trasformiamoli nei loro equivalenti numerici:
ec d luogo a 4,2 mentre co a 2, 14 e calcoliamo il primo blocco cifrato
8
(mod 26)
20
Elementi di criptografa 229

il secondo

(mod 26)

il testo cifrato sar I U E K.

Per decrittare necessario calcolare A 1 (mod 26)

13 8
7 9

da cui

(mod 26)

e cos via.

Naturalmente per violare questo tipo di codici occorre procedere analizzando


le frequenze dei blocchi di lettere.
Dopo la crisi della criptografia dovuta alla violazione della cifratura di Vi-
genre da parte di Babbage e Kasiski, bisogna arrivare alla prima guerra mondiale
per avere un codice ADFGVX la cui forza stava nella sua natura contorta in quan
to risultante da procedimenti sia di sostituzione, sia di trasposizione di lettere del
testo chiaro in posizioni diverse da quelle originarie. La disposizione delle lettere
e dei numeri la seguente ed nota sia al mittente che al destinatario

A D F G V X
A 8 P 3 d i n
D / t 4 0 a h
F 7 k b c 5 z

G J u 6 w g m
V X s V l r 2
X 9 e
y 0 f q

Il secondo passo una trasposizione che dipende da una parola dordine parte
della chiave.
La scelta delle lettere ADFGVX dipende dal fatto che il crittotesto era tra
smesso con lalfabeto Morse e si utilizzarono, pertanto, come sole lettere dellal
fabeto cifrante quelle che danno luogo alle sequenze di punti e linee pi dissimili
le une dalle altre.
230 Capitolo 16

16.2 Codice di Vernam

Nel primo ventennio dello scorso secolo Vernam propose un codice polialfabetico
sul tipo di quello di Vigenre con chiave generata casualmente di lunghezza pari
al testo chiaro. Inizialmente Vernam prese un nastro (detto verme), sul quale
aveva perforato una successione casuale di caratteri della stessa lunghezza del
testo da cifrare. Anche il testo da cifrare fu riportato su di un nastro perforato
e i due tabulati furono inseriti in due lettori diversi tra loro, collegati e regolati
dalla funzione o esclusivo al fine di ottenere un nuovo nastro contenente un
messaggio inintellegibile.
Shannon, padre della teoria matematica della comunicazione, dimostr
(1949) che un codice teoricamente sicuro se e solo se un codice di Vernam.

La debolezza del codice di Vernam sta nel fatto che la chiave lunga come
il testo deve essere comunicata al destinatario in modo sicuro. Nonostante tutto
il codice di Vernam pare sia stato utilizzato dai servizi segreti dellEst europeo
durante la guerra fredda, per il telefono rosso tra Mosca e Washington e pare sia
stato trovato tra gli effetti personali di Che Guevara.
noto che nel secolo XX sono state prodotte macchine per rendere sempre
pi complesse le cifrature, come la macchina Enigma, usata dai tedeschi durante
la seconda guerra mondiale. La decrittazione dei messaggi emessi da Enigma
costrinse Alan Turing a inventare la sua macchina.

16.3 Crittografia a chiave segreta e crittografia


a chiave pubblica
Ancora ricordiamo che nel 1977 la ibm pubblic un algoritmo completo a uso crit
tografico che risult uno dei crittosistemi pi usati: il Data Encryption Standard
(des). Il des un codice che opera su blocchi di 64 = 26 bit, ognuno dei quali
diviso in 8 blocchi di 8 bit ciascuno (lultimo simbolo un carattere di controllo).
Alternando disposizioni e sostituzioni per 16 volte, questo codice ha 256 chiavi
possibili. Il Bancomat e tutte le carte a banda magnetica utilizzano il des.
La crittografia a chiave pubblica nasce, invece, a seguito d un articolo d
Diffie e Hellman del 1976 e si basa sul fatto che possibile rendere pubblico un
certo algontmo a chiave, ma non trovarne linverso senza una proibitiva lunghez
za computazionale. Una tale trasformazione detta unidirezionale. La ragione
di una tale scelta da ricercarsi nella necessit di usare un sistema crittografi-
co tra persone site in localit geograficamente distanti, di costruire protocolli di
identificazione e di firma e di depositare le password dei computer.
La ricerca di funzioni unidirezionali su cui fondare cifrature a chiave pubblica
conduce, naturalmente, a problemi che la complessit computazionale classifica
come NP. Per esempio, il problema della fattorizzazione di un intero grande
un problema N P,
E lem enti di criptografa 231

Esempio 16.5 II sistema rsa (dai cognomi dei ricercatori Rivest. Shamir. Adle
man) basato su una funzione unidirezionale. Ciascun utente sceglie a caso due
numeri primi p e q molto grandi (di almeno 100 cifre) e un esponente k coprirne
con il prodotto (p \){q 1) = (p{n) = (p(p)(p(q) e 1 < k < (p(n).

1. Si trasforma il messaggio in una sequenza di interi, usando un qualsiasi codi


ficatore.
2. Gli interi ottenuti si raggruppano a formare interi pi grandi, ognuno dei quali
rappresenta un blocco di lettere.

3. Si procede alla codifica, trasformando ognuno dei numeri a ottenuti al punto


2) nella sua k-t sima potenza mod n, cio si calcola b = ak (mod n).
4. Si invia il messaggio.
5. Chi riceve il messaggio cerca linverso della classe k modulo (p - \){q - \ )
cio [A:]( 1_i)(t/_ 1). Tale inverso esiste perch mcd (k,(p-\){q-\))= 1. Inoltre
(cfr. Capitolo 3) esistono due interi h,y tali che kh + y{p - 1)(q - 1)= 1.

Allora
bh = (ak)h = akh = a l- y{p~lKq~l)
Dal Piccolo Teorema di Fermat 2 si ottiene che a<p~1>= 1 (mod p), aiq~l) =
1 (mod q), da cui segue che

bh = a(ap~l)y(q~l) = a{ mod p)
e bh = a{aq~l)y(p~l) = a (mod q). Poich p e q sono primi distinti e quindi mcd
(p,q) = 1 si pu concludere che bh = a (mod pq) e cos si ritrova a e quindi il
messaggio originale.

Teorema 10.3 Se MCD (a.n) = 1 =a ^ n>= 1 (mod )


17
Codici correttori

Errare umanum est,


perseverare autem diabolicum

La trasmissione di messaggi attraverso canali di trasmissione, siano essi unidi


mensionali (una frase) o bidimensionali (unimmagine), pu introdurre errori. Se
si trattasse di una frase sarebbe abbastanza semplice trovare gli errori ma, in ge
nere, si tratta di messaggi criptati quindi di sequenze di numeri o di lettere e un
errore, difficile da individuare, potrebbe alterare il significato del messaggio. Per
rimediare a questo inconveniente, necessario costruire dei meccanismi di co
difica che rendano possibile la loro correzione. Naturalmente ci comporta un
allungamento del messaggio.

Schematizziamo un sistema di comunicazione:


trasmissione
informazione h-> codifica decodifica > informazione

ove la trasmissione pu avvenire attraverso fibre ottiche o per registrazione su


bande magnetiche o su CD o via etere ecc.

Il primo passo nella codifica di un messaggio la sua trasposizione in un


alfabeto adatto al canale usato per la trasmissione. Attualmente si affermata la
notazione binaria che permette di convertire facilmente 1simboli 1 e 0 nel passag
gio o meno di impulsi elettrici.
Assumiamo quindi come alfabeto linsieme Z 2 = (0,1}, chiamiamo bit gli
elementi dellalfabeto e indichiamo il messaggio da trasmettere con una -pia di
bit x = (^ 1,^ 2, . . . ,Xk) ovvero con la parola di k bit x = x\x2 ** e diciamo k
la lunghezza di questa parola.
La codifica di x consiste nellassociare alle 2k parole di k bit, una parola-
codice di n bit con n > k.
Indicati con K2k e K2n gli insiemi delle parole di lunghezza k e di lunghezza
n rispettivamente, consideriamo x K2k, m e K2 e una funzione / imettiva
234 Capitolo 17

(detta funzione di codifica o codice)


/ : K2i. -> K2n tale che:

/ : x m.

Poich si scelta una codifica iniettiva, lm f = { / ( je)| jc e K2k), che linsieme


delle parole-codice, ha esattamente 2k elementi.

Indichiamo con con T la trasmissione. Si avr


T : m -+ m ' = m + e
ove e leventuale errore di trasmissione.
Se m! e Im / non si pu fare altro che porre m = m \ senza avere la certezza
assoluta che il messaggio ricevuto sia x : in tal caso bisogna che il codice abbia la
minor probabilit possibile di trasmettere errori. Se m' Im / si ha la certezza
che si verificato un errore in fase di trasmissione.
Dalla Teoria dei grafi noto che il grafo cubico (Figura 17.1):

Figura 17.1

pu essere utilizzato per rappresentare un codice binario.


Sia / la funzione di codifica cos definita:
se il numero dei bi t dispari
f(x) = xp ove
se il numero dei bit pari.

Allora si ha la seguente tabella:


X /(* )
00 000
01 011
10 101
11 1 10

Se ncevessimo la parola Oli questa appartiene a Im / e non siamo in grado di


rilevare errori, anche se non sappiamo con certezza se la parola inviata era 01
Codici correttori 235

oppure 00 con errore. Di contro se ricevessimo la parola 100, poich 100 Im / .


la trasmissione presenta sicuramente un errore ed pertanto necessario chiedere
di ritrasmettere il dato.

Siamo quindi interessati ad occuparci dei cosiddetti codici correttori ' Se


un codice in grado di trovare gli errori si parla di codice error detecting se
in grado anche di correggerli si parla di codice error correcting', Abbiamo
precedentemente osservato che ogni parola-codice

( 1, ?21 )
pu essere associata ad un vettore appartenente allo spazio VF ove l'alfabeto F
un campo finito con q elementi e lo spazio vettoriale V ha dimensione n.

Definizione 17.1 Un codice formato da q cifre detto codice <?-ario (se q 2


si parla di codice binario).

17.1 Distanza di Hamming

Definizione 17.2 Date due parole a e b di lunghezza n, definiamo, nello spazio


vettoriale Vf, una distanza d(a,b), detta distanza di Hamming, come il numero
di posti in cui le due parole differiscono, cio d(a,b) = {/11 < i < n,a, f=- b,}se
a {a\,a2, - )Gn) e b tb\,b2, . ,b,).

Esempio 17.1 Siano a = (1,2,3,4,5) e b = (4,2,3,4,5) d(a,b) = 1.

Abbiamo visto che nei codici binari le parole-codice di lunghezza n possono


essere rappresentate dagli spigoli di un cubo dimensionale.
La distanza di Hamming uguale al numero di spigoli che bisogna percorrere
per andare dallo spigolo rappresentante la prima parola allo spigolo rappresentante
la seconda parola (vedi Esempio 17.1).

Definizione 17.3 L insieme S delle parole w di VF la cui distanza di Hamming


da a minore o uguale ad h detto sfera di Hamming di centro a e raggio h.
Cio S = {w e Vf\d(a,w ) < h }.

Il minimo delle distanze di Hamming permette di utilizzare differenti error


detecting codes e error correcting codes. Infatti se il minimo delle distanze di
Hamming 2, si avr un single error detecting code: ogni parola che viene tra
smessa con un singolo errore recepita come parola priva di significato, mentre un
duplice errore non rilevato; se il minimo 3 si avr o un single error correcting
code o un doubl error detecting code. Ogni parola trasmessa con un singolo
errore un vettore la cui distanza di Hamming dalloriginale minore di ogni
altra, quindi si individua e si corregge ogni errore singolo di trasmissione, mentre
un errore duplice pu essere individuato ma non corretto.
236 Capitolo 17

Definizione 17.4 Se la distanza minima tra ogni coppia di parole h si parla di


un (h - \)-error detecdng code o di un ( ^ ) - e r r o r corecting code.

Pertanto per aumentare il minimo delle distanze di Hamming, ad ogni parola


contenente r cifre di informazione se ne aggiungono ulteriori k di controllo. Si
ritiene buono un codice per il quale il numero di parole disponibili il pi grande
possibile, una volta assegnato il minimo delle distanze di Hamming h e la lun
ghezza n delle parole-codice. Ci sono varie lim itazioni superiori per tale numero
e solo per amore di completezza ricordiamo tra esse lo Joshibound.

Teorema 17.1 II numero massimo di parole di lunghezza n in un codice q aro


con distanza minima h q n~h+.

17.2 Codici lineari e codici gruppo

Definizione 17.5 Un codice C detto lineare se C un 'applicazione lineare tra


gli spazi vettoriali Vjt(Zp) e Vn(Zp) (in particolare tra e V/(Z 2)j.

Se A = (atJ) la matrice rappresentativa di C, rispetto alle basi canoniche


degli spazi vettoriali in questione, A e MatnxkC^i)- S e r V*(Z2) la sua cifratu
ra tramite C M = Ax. Naturalmente Im C un sottospazio vettoriale di V,,(Z2)
ed essendo C iniettivo segue che d im lm C = k. Osserviamo che il messaggio
nullo (0,0,............ 0) = 0vk{Zz) codificato nello 0Vn(z2)-
Indicata con h la distanza di Hamming minimale di un codice lineare, diremo che
il codice C di tipo (n,k,h) per dire che il messaggio codificato di lunghezza n,
quello iniziale di lunghezza k e che la distanza di Hamming h .

Definizione 17.6 Sia Qn lo spazio vettoriale delle n-uple a coefficienti in Zp e


f Qm -> Qn una funzione codificante. Il codice f definisce un codice-gruppo
se Im f un sottogruppo di (<2",+).
I codici-gruppo sono vantaggiosi per la facilit con cui si trova la minima
distanza tra le parole-codice.
Vale infatti il seguente
Teorema 17.2 Sia f : Qm -> Qn una funzione codificante tale che I m f sia un
gruppo. La minima distanza tra le parole-codice data dal peso minimo tra i pesi
delle parole-codice non nulle (il peso co d una parola x la sua distanza dallo 0,
cio co{x) = d{xr0)).
Poniamo Q = Z2, allora il processo di rilevamento e correzione dei messaggi
ncevuti per codici-gruppo, permette di osservare che se una parola-codice w
stata inviata con un errore nellultimo simbolo e v la parola ricevuta, si ha che
i = w 4- en ove en una parola che ha tutti i simboli nulli tranne Tultimo. Sicch
la totalit delle parole ricevute con un errore nell ultimo simbolo costituiscono il
laterale w e, di w in Z i.
Codici correttori 237

17.3 Quadrati latini

Definizione 17.7 Un quadrato latino una matrice quadrata di ordine n i cui


elementi appartengono ad un insieme S di n simboli, con la propriet che ogni
simbolo di S compare esattamente una ed una sola volta in ogni riga ed in ogni
colonna.
Esempio 17.2 Sia S = {1,2,3}: un quadrato latino la matrice:
" 1 2 3"
3 12
_2 3 1_
Il primo a formulare la definizione di quadrato latino fu Eulero e solo pi tardi
grazie a Cayley si scopr lesistenza di un legame fra quadrati latini e gruppi o
meglio tra quadrati latini e quasi gruppi 1, nel senso che un quadrato latino' la
tavola di moltiplicazione di un quasi gruppo.
Definizione 17.8 Siano A = (atJ) e B = (btJ), 1 < i, j < n, due quadrati latini
di ordine n. A e B si dicono ortogonali se ogni coppia ordinata di simboli (a,j
bl}) (i = 1 , . . . ,n\ j = 1 , . . . ,n) appare una ed una sola volta fra le n2 coppie
iij, bij).
In altre parole, chiedere che due quadrati latini dello stesso ordine e basati sugli
stessi simboli siano ortogonali, significa domandare che, sovrapposti, la stessa
coppia di elementi non compaia due volte.
Esempio 17.3
" 1 2 3" "2 1 3 "
A = 3 1 2 ,B = 1 3 2
2 3 1 3 2 l
i = l : (1,1),(1,2),(1,3)
i = 2 : (2,1),(2,2),(2,3)
= 3 : (3,1),(3,2),(3,3).
E possibile costruire una corrispondenza tra quadrati latini di ordine q e insiemi
di q2 parole-codice. Sia A = 0atJ) un quadrato latino di ordine q , le q2 triplette
^ /y

(ii.j.aij ) possono essere interpretate come insieme di q~ parole-codice definito su


un alfabeto di q simboli 1 ,2 .... ,q .
pio 17.4 Dato il quadrato latino
f i 2 3
3 I 2
2 3 1

1Un quasi gruppo Q e una struttura ( Q .*) ;n cui per ogni a. (2 e equazioni u t tr
ammettono una ed una sola soluzione.
238 Capitolo 17

le parole-codice sono le seguenti: (1,1,1); (1,2,2); (1,3,3); (2,1,3); (2,2,1); (2,3,2);


(3,1,2); (3,2,3);(3,3,1).
Essendo gli elementi di un quadrato latino, il minimo delle distanze di
Hamming tra due parole 2.

I quadrati latini risultano particolarmente utili nella costruzione di error de-


tecting codes binari. Il seguente Teorema presenta un algoritmo per operare alcune
di queste costruzioni.

Teorema 17.3 Sia A = (atJ) un quadrato latino d ordine q. L'insieme delle


parole i = \ , ... ,q\ j = 1___ ,q 1 costituisce un codice
q-ario di lunghezza 4 e distanza di Hamming 3.

I quadrati latini ortogonali sono invece particolarmente utili per costruire er


ror correcting codes. Storicamente Olderogge nel 1963 diede un primo esempio di
codice costruito a partire da quadrati latini ortogonali la cui particolarit quella
di essere in grado di correggere errori singoli e doppi.
In seguito Golomb e Posner stabilirono legami tra resistenza di quadrati la
tini di ordine q e resistenza di codici g-ari, in termini di dominio delle torri,
concetto suggento loro dal gioco degli scacchi.
Concludiamo questo capitolo illustrando un esempio di costruzione di codice
di Olderogge nel caso n 5 (n.b. Olderogge us coppie di quadrati latini orto
gonali di ordine n dispari per costruire codici, le cui parole avessero lunghezza
n2 -1- 4n + 1, ove n2 sono cifre di informazione).
Sia
0101101110011110101010100
il messaggio da spedire, contenente n2 = 25 = 52 cifre di informazione. Al fine
di ottenere le 4/i + 1 = 4 x 5 + 1 cifre di controllo, si divide il messaggio in
componenti di lunghezza 5
01011 0111001111 01010 10100
Questo suggerisce di considerare ciascuna componente come riga di una matrice
quadrata di ordine 5 su un campo Z 2 = {0,1}. Otteniamo cos la matrice:
"0 1 0 1 1
0 11 10
A= 0 1 1 1 1
0 10 10
1

10 10
0

N ulla mai la fine


e nulla lo sar mai
(K. Vonnegut)
Appendice

Nel corso dei van capitoli abbiamo cercato di dare qualche riferimento storico e
biografico, necessariamente molto ridotto, nella speranza di suscitare curiosit per
una materia che generalmente ritenuta conclusa e definita e non suscettibile di
evoluzione.
Per chi fosse interessato ad avere pi informazioni sulla matematica e 1 suoi
protagonisti in tempi antichi, moderni e contemporanei, possiamo consigliare di
consultare i seguenti siti:
w w w -g ro u p s . d c s . s t - a n d . a c . u k / ~ h i s t o r y /
(sito dellUniversit di St. Andrews in Gran Bretagna), oppure entrare in
www. m a t . u n i m i . i t
scegliere lopzione : Matematica & internet Archivi Matematici
e leggere le varie rubriche, tra cui quella segnalata precedentemente,
Inoltre se si usa un buon motore di ricerca e si digita numeri primi si ot
tengono informazioni ed esempi (anche divertenti e curiosi) che riguardano ed
utilizzano una buona parte degli argomenti algebrici presentati nel testo, mentre
digitando sistemi lineari o teoria dei grafi o teoria della complessit si ot
tengono informazioni e qualche volta esempi ed esercizi riguardanti gli argomenii
selezionati.
Per comodit del lettore, riportiamo qui 1dati biografici essenziali della mag
gior parte dei matematici che abbiamo incontrato nel corso del testo, in ordine
cronologico.

430 (circa) A.C. Filolao


300 (circa) A.C. Euclide
1170/1250 Fibonacci , Leonardo
(Probabilmente nato e morto a Pisa)
1523/1596 Vigenre , Blaise de (Francia)
1596/1650 Descartes , Rn
(La Haye (Francia)/Stoccolma)
1601/1665 Ferm t , Pierre
(Beaumont-de-Lomagne/Castres)
1646/1716 Leibniz , Gottfried Wilhelm de
(Lipsia/Hannover)
1704/1752 Cram er , Gabriel
(Ginevra/Bagnoles)
1707/1783 E u ler , Leonhard
(Basel (Svizzera)/San Pietroburgo)