Sei sulla pagina 1di 108

Matematica

La matematica è la disciplina che studia i numeri, lo spazio, le strutture e i calcoli. Viene definita
regina delle scienze perché molte altre materie (fisica, chimica, ingegneria, informatica, economia
ecc.) non possono farne a meno.
Il termine “matematico” indica colui che è “incline ad apprendere” ed è abbastanza facile mostrare
che chi, nella popolazione, non ama questa materia, è spesso portato ad apprezzare solo l’aspetto
qualitativo della realtà, dimenticando quello quantitativo.
I motivi per cui la matematica risulta molto ostica nella popolazione sono principalmente due:
1. Esistono concetti e addirittura settori della materia che non entrano nella vita di tutti i giorni,
ma sono specificamente studiati dagli addetti ai lavori. Per esempio, il teorema di Talete ci
dice che “segmenti compresi fra rette parallele tagliate da due trasversali formano due classi
di grandezze proporzionali”. Si tratta di uno dei teoremi fondamentali della geometria che
serve per dedurne altri, ma è veramente lontano dalla realtà pratica.
2. Nella trattazione didattica della materia i matematici mischiano le dimostrazioni agli
enunciati; a volte capita che a enunciati molto semplici corrispondano dimostrazioni
veramente complesse che disincentivano dallo studio della materia. Va da sé che chi non
insegna matematica per professione tende a ricordare facilmente gli enunciati, ma non ha
nessun senso che gli venga richiesta la dimostrazione!
Suddivideremo lo studio della matematica nelle seguenti branche:

Aritmetica
L’aritmetica è la più antica branca della matematica, quella che studia le proprietà elementari delle
operazioni aritmeche sui numeri (il termine in greco significa appunto “numero”), specialmente i
numeri interi.

I numeri interi
I numeri naturali sono i numeri 1, 2, 3 ecc. Di ogni numero si può trovare il successivo fino
all’infinito (indicato normalmente con ∞). Alla successione si premette usualmente lo zero (0).
I numeri naturali sono l’esempio più semplice di necessità degli assiomi in una teoria matematica.
Un assioma è una proposizione o un principio che è assunto come vero in quanto evidente o perché
crea il punto di partenza di una teoria. Per i numeri naturali valgono gli assiomi di Peano:
1. Esiste un numero naturale, lo zero.
2. Ogni numero naturale ha un numero naturale successore.
3. Numeri diversi hanno successori diversi.
4. Lo zero non è il successore di alcun numero naturale.
5. Ogni sottoinsieme di numeri naturali che contenga lo zero e il successore di ogni proprio
elemento coincide con l’intero insieme dei numeri naturali (assioma dell’induzione).
I primi quattro sono evidenti, mentre l’ultimo introduce un principio molto usato in matematica, il
principio di induzione. L’idea intuitiva che ne sta alla base è quella dell’effetto domino: affinché le
tessere allineate del domino cadano tutte è sufficiente che:
• cada la prima tessera;
• ogni tessera sia posizionata in modo tale che cadendo provochi la caduta della successiva.
In matematica, tale principio viene utilizzato al positivo:
se P è una proprietà che vale per il numero 0 e se dalla verità di P(n) discende quella di P(n+1),
allora la proprietà P vale per ogni n.

Numeri negativi
La necessità di spostarsi a sinistra dello zero porta alla definizione di numero negativo. Per
esempio, se su un conto bancario ci sono 100 euro e si stacca un assegno di 150 euro, il conto andrà
a -50 euro con il segno meno che indica un conto in rosso, il debito verso la banca. Per definire i
numeri negativi basta replicare specularmente attorno allo zero i numeri naturali:
…, -3, -2, -1, 0, 1, 2, 3 …
L’insieme così definito (numeri naturali, zero e numeri negativi) costituisce l’insieme dei numeri
interi. -3 è l’opposto di 3. Per maggiore chiarezza, i numeri naturali possono essere preceduti dal
segno +, indicando che essi sono numeri positivi.

Le operazioni
I numeri sono soggetti a operazioni (come vedremo, non solo gli interi e non solo i numeri si
possono sottoporre a operazioni come somma, moltiplicazione ecc.). Un’operazione su due
oggetti (operandi) li trasforma in un terzo oggetto; se è interna (per esempio, la
moltiplicazione fra due numeri naturali) l’oggetto è dello stesso tipo dei due operandi,
altrimenti (come nel caso della somma di due quadrati che origina un rettangolo) è detta
esterna.
Per distinguere il segno del numero intero dal simbolo dell’operazione si può ricorrere a parentesi.
Come vedremo, le parentesi stabiliscono anche la precedenza delle varie operazioni. Se, per
esempio, voglio sommare il numero positivo 2 al numero negativo -3, posso scrivere:
(+2)+(-3).

Addizione e sottrazione
Addizione
Con la notazione m+n si indica la somma dei due numeri (addendi) m ed n. Il risultato si ottiene
partendo da m e spostandosi a destra o a sinistra di n posizioni a seconda che n sia positivo o
negativo. Per esempio:
(-3)+(+4)=+1.
L’addizione gode di alcune importanti proprietà.
Commutativa – Cambiando l’ordine dei fattori la somma non cambia: 5+4=4+5.
Associativa – Non ha importanza l’ordine con cui vengono eseguite le operazioni se queste
coinvolgono solo somme: (5+4)+3=5+(4+3).
Come vedremo, vale anche la proprietà distributiva della moltiplicazione rispetto all’addizione.
Infine, lo zero è un elemento neutro rispetto all’addizione: a+0=a.
Per eseguire velocemente un’addizione fra numeri interi, si possono incolonnare gli addendi con la
regola “unità sotto unità, decine sotto decine, centinaia sotto centinaia ecc.”. Poi si sommano le
cifre di una stessa colonna, partendo da destra, cioè dalle unità e, nell’eventualità che il risultato
della somma su di una qualsiasi di queste colonne sia maggiore o pari a 10, riportando le decine di
questo risultato come ulteriore addendo sulla colonna immediatamente a sinistra a quella appena
calcolata. Per esempio, 24+37 in colonna dà (4+7) -> 1 con il riporto di 1; il riporto sommato alle
decine 2 e 3 dà 6. Per cui il risultato è 61.

Sottrazione
Con la notazione m-n si indica la sottrazione del numero n (sottraendo) dal numero m (minuendo);
il risultato è detto differenza. Matematicamente è utile vedere la sottrazione come addizione
dell’opposto del sottraendo. Quindi (-8)-(+4) si può vedere come (-8)+(-4), cioè -12.
La sottrazione non è né commutativa né associativa.

Moltiplicazione
Con la notazione mxn (oppure m·n oppure nei linguaggi di programmazione m*n) si indica la
somma n volte del numero m. Il risultato è detto prodotto, i due termini fattori (il primo
moltiplicando, il secondo moltiplicatore.
La moltiplicazione si usa anche per entità non numeriche (come le matrici) e, in tal caso, ha
proprietà a sé.
Nelle espressioni in cui i due operandi non siano entrambi cifre, la x o il puntino si possono
omettere e scrivere, per esempio, 4y.
La moltiplicazione gode di alcune importanti proprietà.
Commutativa – Cambiando l’ordine dei fattori il prodotto non cambia: 5×4=4×5.
Associativa – Non ha importanza l’ordine con cui vengono eseguite le operazioni se queste
coinvolgono solo le moltiplicazioni: (5×4)×3=5×(4×3).
Distributiva – La moltiplicazione può essere distribuita fra i vari elementi di una somma:
5×(4+3)=5×4+5×3.
Ogni numero moltiplicato per 1 dà il numero stesso.
Ogni numero moltiplicato per 0 dà 0.
Nel caso in cui i fattori siano numeri dotati di segno (positivo o negativo), vale la regola che il
prodotto è positivo se i due fattori hanno segno uguale, altrimenti è negativo, per cui il prodotto
di due numeri negativi è positivo. Un esempio di numero negativo sono, per esempio, le perdite
finanziarie o i periodi temporali rispetto al presente: se negli ultimi 2 anni ho perso 1000 euro, due
anni fa avevo (-2)×(-1000)=2000 euro in più di ora.

Tavola pitagorica
La tavola pitagorica è una matrice di numeri caratterizzata dal fatto che il valore alla colonna
j-esima della riga i-esima è il prodotto di i per j. Essa dà il risultato della moltiplicazione dei
numeri dall’1 al 10 e deve essere necessariamente memorizzata per poter gestire facilmente le
moltiplicazioni.

Attualmente, il risultato della moltiplicazione si ottiene molto facilmente con le calcolatrici


tascabili, ma con carta e penna si può usare l’algoritmo che fa uso della tavola pitagorica e
delle proprietà della moltiplicazione:

Come si vede, si ottiene il risultato utilizzando le proprietà della moltiplicazione:


127×54=127×(4+50)=127×4+127×50=508+6350=6858.

Divisione e modulo
Divisione
La divisione è l’operazione inversa della moltiplicazione.
Più specificamente, se a×b=c  (con b diverso da zero), allora a=c:b; a è il quoziente, b è il divisore
(cioè la quantità che divide) mentre c è il dividendo (cioè la quantità da dividere).
La divisione per zero non viene definita.
In realtà, se consideriamo due interi generici, non è detto che esista un numero intero a che sia la
divisione esatta fra c e b, cioè che a×b=c. Allora si introduce il concetto di resto, cioè, dati due
numeri interi a e b, con b≠0, si deve trovare una coppia di interi q ed r (quoziente e resto) tali che
a=b×q+r. Quando r=0, il risultato della divisione q viene talvolta detto quoto.
Per esempio, 7:3=2 con resto 1, infatti 7=3×2+1.
La divisione gode della proprietà invariantiva: il quoziente non cambia se dividendo e divisore
sono moltiplicati per una stessa quantità diversa da zero (il resto invece risulta moltiplicato per
quella quantità).
Supponiamo di dividere 653 (dividendo) per 18 (divisore). Cominciamo con il vedere quante volte
il 18 sta nel 6 (la prima cifra di 653). Siccome 6 è più piccolo di 18, prendiamo le prime due cifre e
vediamo quante volte 18 sta in 65. Per intuito si scopre che 18×3 fa 54 mentre 18×4 fa 72 quindi il
18 in 65 ci sta 3 volte con il resto di (65-54)=11. Ora scriviamo 3 a destra dell’uguale e 11 sotto a
65 e facciamo scendere la cifra successiva, ottenendo 113. Il 18 quante volte sta nel 113? Sempre
procedendo per intuito (o per prove successive) otteniamo 6 con il resto si 5 (6×18 fa 108). La
divisione è finita, il risultato è 36 con il resto di 5.
653:18=36
113
5
Come si può comprendere, fare le divisioni velocemente è tanto più facile quanto più si conoscono
le moltiplicazioni e la tavola pitagorica.

Modulo
Si definisce modulo di a e si scrive |a|, il numero a se a è positivo e (-a), cioè a cambiato di segno,
se a è negativo. Il modulo risulta pertanto un numero sempre positivo.

I numeri primi
Abbiamo visto che, se un numero è divisibile per un altro, il resto della divisione è zero. Per
esempio, 42 è divisibile per 1, per 2, per 3, per 7, per 6, per 14, per 21, per 42. 42 è un numero
composto (ammette più divisori oltre a sé stesso e all’unità).
Si dicono invece primi i numeri che possono essere divisi solo per 1 e per sé stessi.
Non esiste un metodo per sapere se un numero è primo oppure no, se non provando con strategie
comunque empiriche. Per esempio, sappiamo che i numeri pari (che non sono primi) perché
divisibili per 2 terminano per 0, 2, 4, 6 od 8. I numeri divisibili per 3 sono tali per cui la somma
delle loro cifre è divisibile per 3 (per esempio, 9201 lo è). I numeri divisibili per 5 terminano per 5 o
per 0. Quindi possiamo già dire che
condizione necessaria per cui un numero sia primo è che termini con 1, 3, 7 o 9 e la somma delle
sue cifre non sia divisibile per 3.
Esistono altri criteri di divisibilità; per esempio:
• un numero con più di due cifre è divisibile per 7 se la differenza del numero ottenuto
escludendo la cifra delle unità e il doppio della cifra delle unità è 0, 7 o un multiplo di 7;
• un numero è divisibile per 11 se la differenza (presa in valore assoluto) tra la somma delle
sue cifre di posto dispari e la somma delle sue cifre di posto pari è uguale a 0, a 11 o a un
multiplo di 11;
• un numero con più di due cifre è divisibile per 13 se la somma del quadruplo della cifra delle
unità con il numero formato dalle rimanenti cifre è 0, 13 o un multiplo di 13;
• un numero con più di due cifre è divisibile per 17 se la differenza (presa in valore assoluto),
fra il numero ottenuto eliminando la cifra delle unità e il quintuplo della cifra delle unità è 0,
17 o un multiplo di 17.
Come si vede, i criteri diventano sempre più complessi e, attualmente, le tabelle dei numeri primi
vengono generate automaticamente con programmi che verificano semplicemente la divisibilità,
un’evoluzione del crivello di Eratostene che ottiene i numeri primi da 1 a 100 semplicemente
eliminando via via i numeri divisibili per 2, per 3 ecc.
Poiché ogni numero composto può essere visto come il prodotto di più numeri primi (42=2×3×7),
per scomporre un numero a nei suoi fattori primi si usa un procedimento iterativo:
• si divide il numero per il più piccolo numero primo per cui è divisibile;
• il quoziente così ottenuto si divide a sua volta per il più piccolo numero primo per cui è
divisibile;
• e così via finché si arriva a un numero primo.
• il numero a è pertanto uguale al prodotto dei numeri primi che sono serviti per le divisioni,
compreso il numero primo ultimo risultato.
Per esempio, se consideriamo 42, il primo passo dà 2 con quoziente 21; il secondo (considerando
21) dà 3 con quoziente 7 che è primo, per cui 42=2×3×7.
Dati due numeri a e b, il loro massimo comun divisore (MCD) è dato dal prodotto dei fattori primi
comuni ai due numeri; per esempio, il MCD di 568 (23×71) e 1470 (2×3×5×72) è incredibilmente
solo il numero 2.

Le potenze
In aritmetica si incontrano altre operazioni come, per esempio, l’elevamento a potenza e il
fattoriale.
Elevare un numero a (base) a una certa potenza n (esponente) significa ottenere un prodotto dato
dalla moltiplicazione di n fattori uguali ad a. Si scrive an; per esempio: 33=3×3×3=27.

Se l’esponente è negativo vale l’uguaglianza: a-n=1/an.


Poiché, come vedremo, useremo il sistema decimale per rappresentare i numeri, sono
particolarmente importanti le potenze di 10: 10, 100, 1000, 10000 dove l’esponente è rappresentato
dal numero di zeri del numero, per esempio: 104=10000.

Proprietà delle potenze


Per convenzione, la potenza di un qualunque numero diverso da zero elevato a zero vale 1: a0=1
con a diverso (≠) da 0.
Il prodotto di due o più potenze aventi la stessa base è una potenza della stessa base con esponente
uguale alla somma degli esponenti: am·an=a m+n.
Se m>n, il quoziente di due o più potenze aventi la stessa base è una potenza della stessa base con
esponente uguale alla differenza degli esponenti: am:an=am-n.
La potenza di una potenza è una potenza che ha per base la stessa base e per esponente il prodotto
degli esponenti: (am)n=amxn.
Il prodotto tra due o più potenze aventi gli stessi esponenti è uguale a una potenza che ha per base il
prodotto delle basi e per esponente lo stesso esponente: am·bm = (a·b)m.
Il quoziente tra due potenze aventi gli stessi esponenti è uguale a una potenza che ha per base il
quoziente delle basi e per esponente lo stesso esponente: am:bm=(a:b)m.

Radici e fattoriale
Radici
Come la divisione è l’operazione inversa della moltiplicazione, la radice (o radicale) è l’inverso
dell’elevamento a potenza. Particolare importanza riveste la radice quadrata che è l’inverso
dell’elevamento all’esponente 2. Per esempio, se 42=16 la radice quadrata di 16 (indicata con √16) è
4. Analogamente 3√125 è uguale a 5 perché 53=125. In realtà, per la regola dei segni anche (-4)2 fa
16, per cui si scrive che √16=±4, cioè sia +4 sia -4.
Se n è pari, bisogna in realtà distinguere tra due tipologie di radici: la radice algebrica e la radice 
aritmetica.  La radice algebrica definisce una relazione che non risulta essere una funzione, perché
a  ogni numero reale positivo associa due radici opposte, come abbiamo visto per la radice quadrata
di 16. La radice aritmetica definisce invece una funzione perché a ogni numero reale positivo
associa un’unica radice positiva; quindi la radice aritmetica di 16 è 4.
Vedremo più avanti che la radice non è un’operazione interna all’insieme dei numeri interi (e
nemmeno dei razionali o dei reali) perché, per esempio, fare la radice quadrata di (-36) non è
possibile perché sia 6×6 sia (-6)×(-6) fanno +36, non -36!

Dato un radicale m√a, m è detto indice del radicale e a è detto radicando.

Fattoriale
Il fattoriale di un numero a (indicato con a!) è il prodotto dei primi a numeri interi. Per esempio, 4!
=1x2x3x4=24.
Ordine delle operazioni
In aritmetica, algebra, logica booleana, teoria degli insiemi, linguaggi di programmazione
ecc., sono definite opportune convenzioni per stabilire l’ordine in cui le operazioni di
un’espressione devono essere svolte.
Dapprima devono essere svolte le operazioni raggruppate fra parentesi (prima le tonde, poi le
quadre e infine le graffe. Se si usano solo le parentesi tonde, si svolgono prima le operazioni
dentro le parentesi più interne, poi le altre fino a quelle più esterne.
All’interno di una coppia di parentesi – Dapprima vengono svolte le operazioni unarie (cioè che
coinvolgono un solo operando); a queste operazioni viene assegnata priorità maggiore di tutte le
altre operazioni. Nel caso di potenze composte, il calcolo viene eseguito dall’alto verso il basso.
Successivamente si svolgono moltiplicazioni e divisioni, da sinistra verso destra. Da ultime somme
e sottrazioni.
Nel caso in cui la stessa operazione (non associativa) venga ripetuta (per esempio, a/b/c),
l’espressione viene valutata da sinistra a destra (quindi come (a/b)/c), tranne nel caso
dell’elevamento a potenza detto sopra.
Per esempio:

((3!+2)2-10)/2=((6+2) 2-11)/2=(82-10)/2=(64-10)/2=54/2=27.

I numeri razionali
La divisione ha introdotto la difficoltà del resto. 3:2 non si risolve riconducendosi a un
numero intero e l’operazione risulta esterna; certo possiamo dire che fa 1 con il resto di 1, ma
dobbiamo introdurre un quarto elemento.
Se abbiamo 3 mele e vogliamo dividerle fra due persone, ecco che a tutti sarà chiaro che a ogni
persona toccherà una mela e mezzo.
Se torniamo alla rappresentazione degli interi come punti equispaziati di una retta, possiamo capire
che fra due numeri possa esserci “qualcosa”, altri numeri. Riempiamo lo spazio esistente fra i
numeri interi degli infiniti risultati che si ottengono dalle possibili divisioni fra numeri interi.
Un numero razionale è un numero ottenibile come rapporto (frazione) tra due numeri interi, il
secondo dei quali diverso da 0. Ogni numero razionale, quindi, può essere espresso mediante una
frazione a/b, di cui a è detto numeratore e b è detto denominatore.

Equivalenza
Dividendo due mele in quattro persone o una mela in due si arriva sempre a mezza mela a
testa, quindi 2/4 equivale a 1/2.
Due frazioni si dicono equivalenti se è possibile trasformarle l’una nell’altra moltiplicando e
dividendo numeratore e denominatore per lo stesso numero; per esempio, 3/7 è equivalente a 12/28.
Ridurre la frazione ai minimi termini vuol dire scriverla nella forma più semplice possibile
dividendo numeratore e denominatore per lo stesso numero. 12/28 ridotta ai minimi termini si
scrive 3/7.

Addizione e sottrazione
Addizione
Per eseguire l’addizione fra numeri frazionari:
1. Se le due frazioni hanno lo stesso denominatore, si fa la somma dei termini sopra
(numeratori).
2. Se le due frazioni non hanno lo stesso denominatore, si trasformano in due frazioni
equivalenti che abbiano lo stesso denominatore, poi si procede come in 1.
Per esempio: 15/98+7/30. Considerando i due denominatori, 98 e 30, è necessario trovare un
numero che sia multiplo dei due denominatori e, per facilitare i calcoli, scegliamo il più piccolo
(minimo comune multiplo, m.c.m.). Per trovare il minimo comune multiplo di due numeri a e b si
scompongono i due numeri in fattori primi e si moltiplicano i fattori primi comuni e non comuni,
ciascuno preso una sola volta con il massimo esponente. Per esempio, il m.c.m. di 98 e 30 è 1470
(infatti, 98=2×72 e 30=2x3x5, quindi si devono moltiplicare 2, 72, 3 e 5).
Pertanto le due frazioni equivalenti di 15/98 e 7/30 sono 225/1470 e 343/1470, quindi la somma
sarà 568/1470 che, ridotta ai minimi termini (il MCD di 568 e 1470 è 2), è equivalente a
284/735.

Sottrazione
Valgono le stesse regole citate per l’addizione, con l’avvertenza che si fa la differenza fra i
numeratori. Per esempio, 7/18-3/10=35/90-27/90=8/90=4/45, visto che il m.c.m. di 18 e 10 è 90 e il
MCD di 8 e 90 è 2.

Moltiplicazione, divisione ed elevamento a


potenza
Moltiplicazione
Il prodotto fra numeri frazionari si ottiene moltiplicando il numeratore con il numeratore e il
denominatore con il denominatore. Per esempio, (3/4)×(2/7)=6/28=3/14.

Divisione
La divisione fra numeri frazioni si ottiene moltiplicando la prima frazione per l’inverso della
seconda. Per esempio, (3/4):(2/7)=(3/4)×(7/2)=21/8.

Elevamento a potenza
L’elevamento a potenza di una frazione si ottiene elevando a potenza sia il numeratore sia il
denominatore. Per esempio, (3/4)2=9/16.
Poiché stiamo considerando numeri razionali, dobbiamo esaminare anche il caso in cui l’esponente
sia un numero razionale; cosa significa am/n? Significa calcolare la radice n-esima di am, cioè
am/n=n√am.

Grandezze incommensurabili
I numeri razionali possono essere usati in molte applicazioni pratiche, ma già da diversi secoli
avanti Cristo si conoscevano grandezze che non potevano essere misurate con un numero
razionale come, per esempio, la misura della diagonale di un quadrato rispetto al suo lato
oppure la misura della circonferenza rispetto al suo raggio.
Solo verso la fine del XIX sec. Dedekind risolse il problema formalizzando i numeri reali. Infatti,
in modo pratico possiamo definire i numeri reali come numeri ai quali si può attribuire uno sviluppo
decimale finito o infinito. Per esempio, il numero razionale 1/2 siamo soliti indicarlo come 0,5.
Formalmente, per i matematici, le cose sono più complesse e ai numeri reali essi arrivano in modo
più preciso (oltre alla soluzione proposta da Dedekind, un’altra molto nota è quella proposta da
Cauchy). Un modo per farlo è utilizzare semplici concetti geometrici.
Quando consideriamo un segmento geometrico possiamo definire i concetti di uguaglianza e di
somma; i segmenti sono una classe di grandezze perché sono un insieme di enti per cui è possibile
definire l’uguaglianza (congruenza) e la somma, ottenendo un risultato che fa parte ancora
dell’insieme (in questo caso, un segmento). Per esempio, i quadrati non sono una classe perché la
somma di due quadrati origina un rettangolo.
Nella vita quotidiana, tutti sappiamo misurare un segmento (e diciamo, per esempio, che un
armadio è alto 2 m), ma cosa si intende per misura di un segmento AB (la misura si indica con AB
soprasegnato)? In realtà, quando misuriamo l’altezza dell’armadio noi ci riferiamo a un secondo
segmento della lunghezza convenzionalmente definita in 1 m.
Pertanto, la misura di una grandezza rispetto a un’altra è il numero di volte che la prima grandezza
contiene la seconda. La prima grandezza può contenere la seconda un numero intero di volte oppure
no; nel secondo caso si cerca una terza grandezza che è contenuta un numero intero di volte nelle
prime due: la misura sarà il rapporto fra le misure della prima grandezza rispetto alla terza e le
misure della seconda grandezza rispetto alla terza. Possiamo dire, per esempio, che la misura di A
rispetto a B è 23/12.
Due grandezze si dicono commensurabili se è possibile definire la misura di una grandezza rispetto
all’altra. Altrimenti si dicono incommensurabili. Per esempio, è possibile dimostrare che la
diagonale di un quadrato è incommensurabile con il lato. Per esprimere la sua misura non potremo
avvalerci dei numeri razionali (e dire, per esempio, che il lato è i 5/7 della diagonale), ma dovremo
utilizzare i numeri reali.

I numeri reali
I numeri razionali formano una classe; se consideriamo due insiemi di numeri razionali,
diremo che essi formano due classi contigue se:
• ogni elemento della prima classe è sempre inferiore a ogni elemento della seconda classe
(separazione);
• si può scegliere un elemento del primo insieme e un elemento del secondo insieme in modo
che la loro differenza sia minore di un qualunque numero piccolo a piacere (avvicinamento
indefinito).
Si può dimostrare che due classi contigue ammettono uno e un solo elemento separatore.
Si può visualizzare quanto appena detto facendo convergere le due serie di numeri verso il numero
separatore. Per esempio, il primo insieme costituito da 3, 3,14, 3,141, 3,1415, 3,14159 ecc. (sono le
approssimazioni successive del pi greco, il rapporto tra la misura della lunghezza della
circonferenza e la misura della lunghezza del diametro di un cerchio; qui utilizziamo la nozione
decimale, ma ovviamente potremmo scrivere i numeri come numeri razionali, per esempio:
3,14=314/100), mentre il secondo insieme lo otteniamo aggiungendo via via 1, 0,1, 0,01, 0,001 ecc.:
4, 3,15, 3,142, 3,1416, 3,14160. Le due classi sono contigue e il numero separatore che si ottiene è
proprio il pi greco.
Si definisce numero reale l’elemento separatore di due classi contigue di numeri razionali.
Per quanto detto sopra, l’insieme dei numeri reali contiene quello dei razionali che a sua volta
contiene quello degli interi che contiene quello dei numeri naturali.
Un numero reale non razionale è detto irrazionale (come, per esempio, la radice quadrata del
numero 2).
Una volta definito il concetto di numero reale si può stabilire una relazione fra l’aritmetica e
l’analisi e la geometria associando ai numeri reali i punti della retta reale (e viceversa) sulla quale i
numeri negativi stanno a sinistra dell’origine (lo zero) e quelli positivi a destra.

Rappresentazione decimale
Abbiamo visto che, praticamente, i numeri reali possono essere descritti come numeri ai quali è
possibile attribuire uno sviluppo decimale finito o infinito, cioè utilizzando 10 cifre (per questo la
numerazione decimale è detta in base 10).
Un numero decimale è un numero formato da due parti divise da una virgola: la parte a sinistra della
virgola è la parte intera, mentre la parte a destra è la parte decimale.
Dato un numero reale, per esempio 154,82, esso può essere rappresentato come:
1×100+5×10+4×1+8×0,1+2×0,01. Nel numero preso a esempio avremo 1 che rappresenta le
centinaia, 3 le decine, 4 le unità, 8 i decimi e 2 i centesimi.
Dati due numeri reali a e b, è maggiore quello che ha parte intera maggiore; se la parte intera è
uguale, si confrontano le cifre della parte decimale a partire da quella più vicina alla virgola.
Quando si incontrano due cifre (nella stessa posizione) diverse, a quella più grande corrisponderà il
numero più grande; per esempio, 53,24 è maggiore di 53,2398.
Operazioni fra reali
Anche per i numeri reali si definiscono le operazioni che abbiamo visto per gli interi. Con la
notazione decimale, l’unica difficoltà consiste nel porre correttamente la virgola del risultato.
Addizione e sottrazione – Si devono scrivere i due numeri come se avessero lo stesso numero di
cifre decimali, riempiendo eventualmente di zeri la parte decimale del numero che ha meno cifre
decimali. Per esempio: 12,43-11,7=12,43-11,70. Poi si trasformano in interi (equivale a moltiplicare
per 10, 100, 1000 ecc. a seconda di quante sono le cifre decimali) e si fa l’operazione fra interi:
1243-1170=73. Si aggiunge poi la virgola per quante posizioni avevano gli operandi. Nel nostro
caso due posizioni, per cui ,73 o, meglio, per specificare che non c’è parte intera, 0,73.
Moltiplicazione – Si moltiplicano i due numeri come se fossero interi e poi si inserisce la virgola
sommando le posizioni decimali dei due numeri. Per esempio, nel caso di 12,4×3,52, il prodotto fra
interi fa 43648 e, poiché abbiamo come somma delle posizioni decimali 3, il risultato sarà 43,648.
Divisione – Vale sempre che il numero reale c risultato della divisione fra a e b è tale per cui a=b×c.
Vediamo un metodo generale per la divisione dei reali con rappresentazione decimale. Supponiamo
di dividere due numeri a e b. Se b non è intero, si moltiplicano entrambi per la potenza di 10 che ha
come esponente il numero di cifre decimali del numero che ne ha di più. Alcuni esempi:
352: 2,4 -> 3520:24
34,76:12,1 -> 3476:1210
43,18:6-> 4318:600
Iniziamo a svolgere l’operazione normalmente, scrivendo quante volte il divisore intero sta nel
dividendo. Se non otterremo un resto pari a 0, potremo essere più o meno precisi o approssimati a
seconda di quanti decimali vogliamo attribuire al nostro quoziente. Per esempio, nell’ultimo caso
600 sta nel 4318 7 volte con resto 118. Dopo il 7 si inserisce la virgola e si moltiplica il resto per
100; a questo punto 600 sta nel 1180 una sola volta (quindi la prima cifra decimale è 1 e finora ho
7,1) con resto 580. Rimoltiplico il resto per 10 e trovo che 600 sta in 5800 9 volte (quindi la
seconda cifra decimale è 9 e finora ho 7,19) e così di seguito finché trovo come resto zero o
l’approssimazione desiderata (per esempio, 4 cifre decimali) è raggiunta.
Elevamento a potenza – Praticamente ha senso considerare solo casi in cui l’esponente è razionale;
per tali casi valgono le stesse regole che valgono per la base reale; in particolare se r è un numero
reale qualunque: 1r=1 e r0=1 (con r≠0).
Per il segno del risultato delle operazioni fra reali appena viste, valgono le stesse regole introdotte
per gli interi e per i razionali.
In particolare, permane il problema che non è definibile internamente ai reali la radice di un numero
negativo. Per poterne dare una definizione è necessario ampliare ancora l’insieme introducendo i
numeri complessi.
I numeri periodici
Se provo a dividere 10 per 3 in rappresentazione decimale ottengo 3,33… Ben presto mi accorgo
che ogni volta devo dividere 10 per 3 ottenendo una cifra decimale 3, ma senza che il procedimento
possa avere fine.
Un numero decimale periodico è un numero razionale che espresso in notazione decimale ha una
stringa (finita) di cifre dopo la virgola che, da un certo punto in poi, si ripete all’infinito. Questa
stringa ripetuta è il periodo del numero. Se il numero periodico ha una stringa (finita) di cifre che
non si ripete, prima che inizi il periodo, tale stringa non ripetuta è detta antiperiodo. Nel numero

5 è il periodo e 2 l’antiperiodo.
Il periodo si indica sovrascrivendo a esso una barra: 3,3333… si scrive
Poiché ogni numero periodico ha la propria frazione generatrice, per trovarla bastano tre passi; per
esempio:

1. scrivere il numero senza virgola: 425


2. sottrarre dal numero tutto ciò che precede il periodo: 425-42=383
3. dividere il risultato trovato per un numero formato da tanti 9 quante sono le cifre del periodo
seguiti da tanti 0 per ogni eventuale cifra dell’antiperiodo: 383/90.

I numeri complessi
Affrontiamo ora il problema di trovare la radice di un numero negativo. Sappiamo che la radice di
16 sono due numeri reali, +4 e -4, ma la radice di -16?
Partiamo considerando la radice quadrata di -1. Si definisce il valore i, chiamato anche unità
immaginaria, che gode della seguente proprietà:

i2=-1.
I numeri complessi sono formati da due parti, una parte reale e una parte immaginaria, e sono
rappresentati dall’espressione a+ib, dove a e b sono numeri reali, mentre i è l’unità immaginaria.
La radice di -16 si esprimerà quindi come ±4i; non ha parte reale (cioè manca a) ed è rappresentata
dal numero immaginario 4i (positivo e negativo).
Due numeri complessi che hanno la stessa parte reale, ma parte immaginaria di segno opposto si
dicono coniugati. Per esempio, 2+3i è coniugato di 2-3i.
Come i numeri reali sono in corrispondenza biunivoca con i punti di una retta, quelli complessi
sono in corrispondenza con i punti del piano (piano complesso o di Argand-Gauss): al numero
complesso a+ib si associa il punto di coordinate cartesiane (a,b).
I numeri complessi sono molto utili non solo in matematica, ma soprattutto in fisica, in ingegneria,
in elettronica ecc.; per esempio, il concetto di resistenza elettrica può essere generalizzato in
quello di impedenza, dove la parte reale è la resistenza R, associata a fenomeno di tipo dissipativo,
e quella immaginaria rappresenta la reattanza X, associata a fenomeni elettrici di accumulo:
Z=R+jX (in fisica l’unità immaginaria si rappresenta con j).

I logaritmi
Il logaritmo è l’esponente della potenza al quale bisogna elevare un numero costante (base) per
ottenere un determinato numero (argomento). Per essere definito, la base deve essere un numero
reale positivo diverso da 1 e l’argomento deve essere un numero reale positivo. Per esempio, il
logaritmo in base 2 di 8 è 3 perché 23=8. Viene indicato con l’espressione log28 e, come detto, il
valore dell’espressione è 3. In questo caso, 2 è la base e 8 è l’argomento del logaritmo.
Dalle proprietà delle potenze si deduce che:

• loga1=0 perché qualunque sia la base a, a0=1


• logaa=1 perché qualunque sia la base a, a1=a
• loga(1/a)=-1 perché qualunque sia la base a, a-1=1/a.

Due sono le basi molto importanti nella matematica, la base 10 e la base e, dove e è il numero di
Nepero, un numero irrazionale le cui prime cifre sono 2,71828.
Dalle definizioni sopra esposte, si deduce che:
• se la base è maggiore di 1 (il caso più frequente, visto che di solito si ragiona in base 10 o in
base e), se l’argomento è maggiore di 1, il logaritmo è positivo e crescente al crescere
dell’argomento. Se l’argomento è minore di 1, il logaritmo è negativo e decrescente quanto
più l’argomento si avvicina allo zero. Per esempio, log10100=2, log101000=3, log100,1=-1
ecc.
• se la base è minore di 1, se l’argomento è minore di 1, il logaritmo è positivo e crescente con
l’avvicinarsi dell’argomento a zero. Se l’argomento è maggiore di 1, il logaritmo è negativo
e crescente al crescere dell’argomento.
I logaritmi furono introdotti da Nepero e la loro utilità consiste nel fatto che con essi
è possibile trasformare prodotti in somme, quozienti in differenze, elevamenti a potenza in prodotti
e calcoli di radici in quozienti; tutte le operazioni vengono molto semplificate.
Infatti:
loga(x·y)=logax+logay -> loga(2·8)=loga2+loga8

loga(x/y)=logax-logay -> loga(3/8)=loga3-loga8

loga(xn)=nlogax -> loga(24)=4loga2

loga(n√x)=logax/n.
Scala logaritmica
Molti strumenti sono tarati in scala logaritmica perché le grandezze da rappresentare possono
crescere molto rapidamente. Se, per esempio, i dati che abbiamo vanno da 0 a 10000, in una scala
lineare risulterebbero troppo sparsi, mentre in una scala logaritmica gli intervalli di suddivisione
sarebbero, per esempio, 10, 100, 1000, 10000 con il valore 1000 corrispondente alla terza tacca e il
valore 10000 alla quarta.
Un esempio è rappresentato dalla scala Richter per i terremoti. Nella scala Richter il valore di
magnitudo 0 è stabilito come quello di un terremoto che sul sismografo standard, posto a 100 km
di distanza dall’epicentro, produce un sismogramma con un’ampiezza massima di 0,001 mm. Ogni
volta che l’ampiezza massima registrata cresce 10 volte rispetto al valore precedente, il valore di
magnitudo sale di una unità. Quindi:
M= logA
dove M è la magnitudine, il logaritmo è in base 10 e A è l’altezza massima della sinusoide da 0 fino
al picco in micron (µ). Un terremoto di magnitudo 5 è 100.000 più forte di un terremoto di
magnitudo 0 e produce un sismogramma di ampiezza 100 mm, cioè 10 cm.

Le successioni
Una successione è un insieme di numeri ordinato e numerabile; ordinato significa che dati due
numeri si può dire quale dei due precede l’altro e numerabile vuol dire che è possibile mettere in
corrispondenza biunivoca gli elementi della successione con i numeri naturali.
Gli elementi della successione (detti termini) vengono pertanto indicati con a1, a2, …, an.

Si possono definire innumerevoli successioni semplicemente basandosi sulle operazioni


fondamentali. Per esempio:
1, 1/2, 1/3, …, 1/n.
A titolo di curiosità, una particolare successione è quella di Fibonacci che si compone di una
sequenza di numeri in cui ogni termine è la somma dei due precedenti, tranne i primi due che sono
uguali all’unità:
1, 1, 2, 3, 5, 8, 13, 21, 34…
Tale sequenza ha molte proprietà (ved. quella sulla sezione aurea); dal punto di vista biologico, essa
indica l’evoluzione della popolazione formata da una coppia di conigli lasciati liberi di riprodursi
quando le risorse sono infinite. I numeri di Fibonacci anche nel numero delle spirali dei semi del
girasole, dei petali di alcuni fiori, delle scaglie dell’ananas.

Progressioni
Una progressione è una successione di numeri governata da una legge ben precisa:
• in una progressione aritmetica la differenza tra ciascun termine e il precedente è costante;
• in una progressione geometrica il rapporto tra ciascun termine e il precedente è costante.
Si definisce ragione il fattore che permette di passare da un termine all’altro (attraverso la somma o
il prodotto).
Se d è la ragione, in una progressione aritmetica il k-esimo termine vale ak=a1+d·(k-1), mentre in
una geometrica vale ak=a1· d(k-1).

Le progressioni sono esempi particolari di serie. Una serie è una successione data dalla somma dei
termini di una successione; in particolare, una serie non si costruisce solo con l’operatore somma,
ma anche con altri operatori (per esempio, per la serie geometrica l’operatore è il prodotto).

Algebra
L’algebra elementare è un’evoluzione dell’aritmetica: oltre ai numeri e alle operazioni su di essi, in
algebra si fa uso di simboli letterali che (a seconda del contesto) possono essere considerati numeri
costanti o variabili.
Il calcolo letterale permette di passare dal particolare all’universale. Per esempio, è vero che
(3+5)2=32+2×3×5+52, ma generalizzando è possibile arrivare alla conclusione che
(a+b)2=a2+2ab+b2 dove a e b sono numeri qualunque.

I monomi
Un monomio è un’espressione algebrica costituita da un coefficiente e da una parte letterale dove
non compaiono somme o addizioni. Sono monomi: 3x, -2x2y, 2x2y-3.
A volte il coefficiente può contenere delle costanti non numeriche, indicate anch’esse con lettere.
Per esempio, 4ax3 può indicare un monomio con coefficiente 4a e parte letterale x3. In queste
soluzioni miste si usano in genere le prime lettere dell’alfabeto per indicare delle costanti e le ultime
per indicare le variabili.
Un monomio senza parte letterale è detto costante.
Il grado di un monomio è la somma algebrica degli esponenti della parte letterale; per esempio,
5x2y ha grado 3 (esponente 2 per x e 1 per y).
I monomi aventi la stessa parte letterale, con gli stessi esponenti, si dicono monomi simili.

Operazioni
Addizione e sottrazione – Si possono sommare (sottrarre) due monomi se sono simili e in tal caso
si fa la somma (sottrazione) dei coefficienti numerici senza modificare la parte letterale. Per
esempio, 5x+3x=8x.
Moltiplicazione – Il segno del risultato si ottiene seguendo le regole dei segni della moltiplicazione
fra i numeri interi; se il segno è omesso si intende un segno positivo)
Il numero (coefficiente numerico) va moltiplicato con il numero secondo le regole del prodotto dei
numeri razionali; se il numero è omesso si sottintende 1.
Le lettere vanno moltiplicate con le lettere secondo le regole delle potenze; se una lettera in un
monomio è omessa si sottintende un esponente nullo.
Alcuni esempi (in algebra il segno della moltiplicazione può essere omesso):

(3x2)(4xy2z)= 12x3y2z

(6xy4z2)(5x2z)=30x3y4z3.
Divisione – In teoria valgono le stesse regole della moltiplicazione (solo che si divide anziché
moltiplicare), ma occorre notare che non sempre la divisione è possibile. Lo è solo se il grado del
monomio dividendo è maggiore di (o uguale a) quello del monomio divisore e quando le lettere che
compaiono nel divisore si trovano, con grado maggiore o uguale, anche nel dividendo. Per esempio,
4x2y non è divisibile per 4xz, mentre (-4x2y)/(2x) dà come risultato -2xy.
Elevamento a potenza – Anche per i monomi, elevare a potenza n-esima significa moltiplicare n
volte il monomio base. La potenza di un monomio è il monomio che ha per coefficiente la potenza
del coefficiente e per parte letterale la potenza di ciascun fattore letterale del monomio. Si noti che
se il segno è positivo resta ovviamente positivo, mentre se è negativo resta negativo solo se
l’esponente è dispari. Per esempio, (-3x2y) 3 è uguale a -27x6y3.
Minimo comune multiplo – Il minimo comune multiplo (m.c.m.) tra due monomi è il monomio di
grado minimo che è divisibile per i due dati.
La parte letterale del m.c.m. è data da tutte le lettere, comuni e non comuni, dei monomi con il loro
massimo esponente. Il coefficiente invece è il m.c.m. dei coefficienti quando è possibile calcolarlo,
altrimenti 1 (se, per esempio, un coefficiente è frazionario).

Per esempio, il m.c.m. di (6x2y, 4xy2) è 12x2y2.


Massimo comun divisore – Il massimo comune divisore (M.C.D.) tra due monomi è definito come
quel monomio di grado massimo che divide i due dati.
La parte letterale del M.C.D. è data dalle lettere comuni prese con l’esponente minimo; il
coefficiente è il M.C.D. dei coefficienti, se è possibile calcolarlo, altrimenti è 1.

Per esempio, il M.C.D. di 12x2y4z3 e 4xy5z2 è 4xy4z2.

I polinomi
Un polinomio è la somma algebrica di monomi non simili tra loro, vale a dire con parti letterali
diverse. Esempi di polinomi sono per esempio:
3x+y

4x2y3-3xz

10x3y-7y2.
A seconda del numero di monomi, si parla di binomi (2 monomi), trinomi (3), quadrinomi (4).
Un polinomio è ridotto in forma normale se è stato semplificato, sono stati accorpati i suoi termini
simili, sono stati eliminati gli eventuali monomi nulli, Per esempio, 3x+8y2+2x-4y+y2 ridotto in
forma normale diventa 5x-4y+9y2.
Un polinomio è detto omogeneo se è la somma di monomi dello stesso grado.
Il grado di un polinomio è uguale al grado del suo monomio di grado più alto. Negli esempi
sopraccitati il grado è rispettivamente 1, 5, 4.
Un polinomio si dice completo rispetto a una variabile, se osservando tutti i termini del polinomio
di quella variabile e partendo dal termine di grado più elevato rispetto a quella variabile, il
polinomio contiene tutti i termini di grado inferiore fino a zero. Per esempio, 4x2-2x-1 è completo,
mentre 5y2-2y2+3 no (manca la potenza a esponente uno di y).
Il termine noto di un polinomio ridotto in forma normale è l’unico monomio (se esiste) di grado
zero, cioè non contenente variabili. Per esempio, nel polinomio 5y2-2y2+3 il termine noto è 3.

Operazioni
Addizione e sottrazione – Si fanno normalmente sommando e sottraendo i monomi simili,
lasciando cadere prima le parentesi (ricordando che il segno meno davanti alla parentesi
cambia, per la regola dei segni, il segno ai monomi contenuti nella parentesi). Per esempio,
2x2+xy-y2-(-3x2+4x-2y2-5y) fa 5x2-4x+xy+y2+5y.
Moltiplicazione – Se si fa il prodotto di un monomio per un polinomio basta applicare la proprietà
distributiva: 3x2(4x+y) fa 12x3+3x2y. Se si fa il prodotto di due polinomi basterà moltiplicare tutti i
monomi del primo polinomio per ogni termine del secondo polinomio e poi fare la somma. Per
esempio:

(2x+y)(3x2+2x+xy+y)=6x3+4x2+2x2y+2xy+3x2y+2xy+xy2+y2=6x3+4x2+5x2y+4xy+xy2+y2.
Esistono dei prodotti (denominati notevoli) che semplificano molto l’approccio al calcolo
polinomiale.

(x+y)(x-y)=x2-y2

(x-y)( x2+xy+y2)=x3-y3

(x+y)2=x2+2xy+y2

(x-y)2= x2-2xy+y2

(x+y+z)2=x2+y2+z2+2xy+2xz+2yz

(x+y)3=x3+3x2y+3xy2+y3

(x-y)3=x3-3x2y+3xy2-y3

(x+a)(x+b)= x2+(a+b)x+ab.
Divisione di polinomi – Per eseguire la divisione fra un polinomio e un monomio basterebbe
dividere tutti i termini del polinomio per il monomio. In realtà, come nel caso dei monomi, non
sempre la divisione è possibile. Se poi si considerano due polinomi, anche se la divisione è possibile
come nel caso di (2x2+3x+4)/(2x+1), i metodi (metodo canonico, triangolo di Tartaglia, metodo
di Ruffini) sono molto complessi e raramente vengono impiegati in applicazioni pratiche.

Operazioni fra numeri complessi


Una volta conosciute le operazioni fra polinomi, è possibile eseguire facilmente operazioni fra
numeri complessi.
Addizione e sottrazione – Si sommano (sottraggono) rispettivamente la parte reale e quella
immaginaria; (3+3i)+(4-2i) fa 7+i.
Prodotto – Il prodotto fra due numeri complessi si ottiene considerando il numero complesso
come polinomio di cui i è la parte letterale e ricordando che i2=-1. Per esempio, (3-2i)
(4+2i)=12+6i-8i+4 (ricordando che -4i2=4)=16-2i.
Quoziente – Il quoziente fra due numeri complessi si ottiene considerando il numero complesso
come polinomio di cui i è la parte letterale e ricordando che i2=-1. Per esempio, (3-2i)/(4+2i) non
sarebbe ulteriormente semplificabile considerando numeratore e denominatore come polinomi, ma
se razionalizzo (cioè moltiplico sopra e sotto per 4-2i, il denominatore con la parte immaginaria
cambiata), ecco che ottengo (3-2i)(4-2i)/(4+2i)(4-2i)=(3-2i)(4-2i)/20=(8-14i)/20=0,4-0,7i.

Scomposizione di polinomi
I polinomi possono essere molto complessi per cui è utile sempre rappresentarli nella forma
più semplice possibile, cioè scomporli in entità più facilmente maneggiabili. Ciò risulta molto
utile quando, per esempio, i polinomi si presentano come frazioni. Per esempio, (x2-
6xy+9y2)/(x-3y) si può semplificare notando che il numeratore si può scrivere come (x-3y)2 e
quindi (x-3y)2/(x-3y)=x-3y che è una forma molto più gestibile della frazione di partenza.
Il raccoglimento a fattori comuni è un’operazione matematica che consente di mettere in evidenza
una parte letterale o una serie di numeri che moltiplica tutto ciò che la segue. Si divide in totale e
parziale. Nella pratica è l’equivalente della scomposizione in fattori primi di un numero.
Se la parte comune è evidente, il tutto è abbastanza immediato, per esempio, xy+xz può essere
scritto come x(y+z).
Il raccoglimento parziale si ha quando non tutti i termini di un polinomio hanno dei fattori comuni,
per esempio: ax+bx+ay+by=x(a+b)+y(a+b)=(x+y)(a+b).
I casi visti sono intuitivamente facili, ma per un polinomio qualunque la scomposizione si avvale di
metodi complicati che sono utilizzati in ambito prettamente matematico. Da un punto di vista
pratico, la scomposizione dei polinomi avviene per:
• raccoglimento a fattore comune;
• uso dei prodotti notevoli.
Un esempio del secondo caso è, per esempio, il polinomio x3-6x2y+12xy2-8y3. Ricordando che ha
la forma di un prodotto notevole, è immediato scomporlo come (x-2y)3.

Per esempio, usando il trinomio notevole (x+a)(x+b)= x2+(a+b)x+ab dove come coefficienti ho la
somma e il prodotto di due numeri, si ottiene subito la scomposizione di un polinomio come
x2+5x+6 in (x+2)(x+3). Analogamente, nel polinomio x2+2x-8 i due numeri coinvolti sono 4 e -2,
quindi sarà scomposto in (x+4)(x-2). Nel caso di x2+12x+20, possiamo prendere come numeri 2 e
10 (la loro somma è 12), pertanto possiamo scrivere: x2+12x+20=(x+2)(x+10).

Le frazioni algebriche
Le frazioni algebriche sono frazioni con polinomi al numeratore e al denominatore.
Per studiare le frazioni algebriche è innanzitutto necessario semplificarle. Per farlo si devono
scomporre numeratore e denominatore; se si sono ottenuti due fattori uguali si eliminano e si scrive
la frazione con i termini rimanenti.

Per esempio: (x2-x-6)/(x2+6x+8)=(x-3)(x+2)/(x+2)(x+4)=(x-3)/(x+4).


Addizione e sottrazione – La procedura sembra complessa, ma in realtà è piuttosto automatica:
• si scompongono i denominatori;
• si trova il minimo comune multiplo che diventa il denominatore della frazione risultato;
• si divide il minimo comune multiplo per i denominatori e si moltiplica il risultato per i
numeratori;
• si eseguono le moltiplicazioni ai numeratori;
• si sommano (sottraggono; ovviamente occorre cambiare di segno tutti i termini al
numeratore) i termini simili;
• si scompone, se possibile, il numeratore per semplificarlo con il denominatore;
• si scrive la frazione risultato.
Per esempi consideriamo::

Il m.c.m. dei denominatori è (x-3)(x+2)(x+4), quindi si moltiplica il primo numeratore per (x+4) e il
secondo per (x-3) e si fa la somma dei risultati ottenendo 2x2+4x-23 che non è scomponibile; quindi
il risultato è:

Moltiplicazione e divisione – Si scompongono i numeratori e i denominatori e si eliminano i


termini uguali; poi si moltiplicano numeratore con numeratore e denominatore con denominatore.
Per esempio:
si scrive:

Il risultato sarà:

Per la divisione basta riscrivere la prima frazione moltiplicata per l’inverso della seconda e poi
procedere come per la moltiplicazione.
Elevamento a potenza – Si elevano a potenza sia il numeratore sia il denominatore.

I radicali
Nella sezione Aritmetica abbiamo definito il radicale (radice) di un numero (intero, razionale
ecc.). In algebra, i radicali possono essere parti di espressioni algebriche e quindi è importante
comprendere come si gestiscono le operazioni che li contengono. Ricordiamo che si definisce
radice ennesima di un numero a quel numero b che elevato a potenza n dà a; l’indice del
radicale è n mentre a è il radicando. Per maggiore chiarezza gli esempi che faremo sono per lo
più numerici, ma in algebra il radicando può essere letterale come nell’espressione del tipo
3√a+3√a2.

Equivalenza – Due radicali si dicono equivalenti se, moltiplicando o dividendo sia l’indice di
radice che l’esponente del radicando per uno stesso numero, si trasformano l’uno nell’altro.
Così 4√252 è equivalente a 2√25 perché si passa dal primo al secondo dividendo indice ed
esponente per 2.
Somma e differenza – Si può solo sommare (sottrarre) termini con radicali uguali (con
procedimento simile a quello della somma di monomi). Per cui

3 3√8 + 4 3√4+ 5 3√8 fa 8 3√8+ 4 3√4.


Prodotto – Se i radicandi hanno lo stesso indice, si moltiplicano fra loro i coefficienti e fra loro i
radicandi mentre l’indice resta invariato:

3 3√7 . 5 3√9=15 3√63.


Se gli indici sono diversi, occorre prima trasformarli nello stesso indice utilizzando il minimo
comune multiplo degli indici. Per esempio, 3√13 e 4√18, poiché 3 e 4 hanno come minimo comune
multiplo 12, diventano 12√134 e 12√183.
Quoziente – Funziona come il prodotto, con la necessità di trasformare i radicali nello stesso indice
se hanno originariamente indice diverso.
Elevamento a potenza – Si eleva a potenza il radicando. Per esempio:

(5√2)3=5√8.
Estrazione dalla radice – In algebra è un’operazione molto utile e serve per semplificare le
espressioni. Si consideri, per esempio, che il risultato di un’operazione sia 4√147. Come si vede,
l’esponente del radicando è superiore alla radice. Si fa la divisione fra l’esponente e l’indice. Il resto
della divisione è il nuovo esponente, mentre il risultato della divisione viene “portato fuori”. Poiché
7/4 fa 1 con il resto di 3, avremo: 14·4√143 dove il coefficiente 14 deve intendersi elevato a 1 (che
quindi viene omesso) perché 1 era il risultato della divisione fra 7 e 4.

Le equazioni
Un’equazione (il termine risale a Fibonacci) è un’uguaglianza tra due espressioni contenenti
una o più variabili, dette incognite.
Per arrivare a comprendere l’utilità delle equazioni si deve partire dal concetto di uguaglianza; per
esempio, 3+2 è uguale a 4+1. Analogamente potremo scrivere un’uguaglianza dove compaiono
delle lettere (identità); per esempio, 3a+a=4a è un’identità perché, per qualunque valore io
attribuisca ad a, l’uguaglianza è sempre soddisfatta.
Si passa poi a un’equazione quando l’uguaglianza non è soddisfatta per qualunque valore
attribuibile alla lettera.
Spesso, nella realtà, si sa che due condizioni sono uguali, ma senza conoscere i valori di tutti gli
attori in gioco. Per esempio, posso chiedermi che stipendio mensile devo avere per risparmiare a
fine anno 9000 euro considerando che il mio tenore di vita richiede una spesa mensile di 1200 euro.
Lo stipendio è la variabile incognita, ma con il mio ragionamento ho stabilito la seguente
uguaglianza:
12(x-1200)=9000,
cioè il risparmio finale di fine anno deve essere uguale ai 12 risparmi mensili ottenuti sottraendo
dallo stipendio le spese mensili.
La parte a sinistra si dice primo membro, quella a destra secondo membro; x (che rappresenta lo
stipendio mensile) è l’incognita.

Grado di un'equazione
Il grado di un’equazione algebrica è il grado del polinomio uguagliato a zero a cui è
riconducibile l’equazione. Per il teorema fondamentale dell’algebra è anche il numero di
soluzioni (reali e complesse) dell’equazione.

Per esempio, l’equazione x5+x3+x2+24=0 è un’equazione di quinto grado che ammette 5 soluzioni.
Ovviamente se si restringe il dominio (il dominio è l’insieme degli elementi per cui le espressioni
ad ambo i membri dell’equazione sono definite; per esempio, si potrebbero considerare solo
soluzioni intere: le equazioni diofantee sono equazioni in cui si ricercano solo le soluzioni intere)
cui devono appartenere le soluzioni, il teorema fondamentale dell’algebra può non essere vero. Per
esempio, non esistono numeri interi che risolvono la semplicissima equazione 2x-3=0 (infatti la
soluzione è 1,5).

Parti letterali
Spesso in un’equazione compaiono, oltre alle incognite, coefficienti noti, che, se non sono
esplicitati nel loro valore numerico, sono indicati in genere con le lettere a, b, c… mentre alle
variabili incognite sono convenzionalmente attribuite le ultime lettere dell’alfabeto (x, y, z…).
In fisica, per esempio, invece di scrivere in un’equazione il valore dell’accelerazione di gravità
si può scrivere la lettera g.

Nomenclatura
Rispetto alle soluzioni, un’equazione si dice:
• determinata se ammette un numero finito di soluzioni (come nell’esempio visto in
precedenza dove lo stipendio era l’incognita);
• impossibile se non ammette soluzioni; per esempio, l’equazione x+5=x (cioè sommando 5 a
un numero ottengo lo stesso numero; applicando i principi di equivalenza l’incognita
scompare e si ottiene 0=-5);
• indeterminata se il numero delle soluzioni è infinito, ma non coincide con tutto il dominio,
(se vi è coincidenza è più corretto parlare di identità se l’equazione si riduce a un’identità,
per esempio: x+3=x+3).
Rispetto all’incognita, un’equazione si dice:
• algebrica, se è riconducibile a polinomi;
• trascendente, se non è riconducibile a polinomi; le equazioni trascendenti coinvolgono
almeno un’incognita come argomento di una funzione non polinomiale; le più comuni sono
le equazioni trigonometriche (almeno un’incognita è presente come argomento di funzioni
trigonometriche), le equazioni esponenziali (almeno un’incognita è presente come
argomento di funzioni esponenziali) e le equazioni logaritmiche (almeno un’incognita è
presente come argomento di logaritmi);
• funzionale, in cui le incognite sono funzioni. Le più comuni categorie di equazioni
funzionali sono le equazioni differenziali (contengono derivate della funzione incognita) e le
equazioni integrali (contengono integrali della funzione incognita) tipiche dell’analisi
matematica.

Risoluzione
Prima di risolvere l’equazione vediamo alcune proprietà.
Primo principio di equivalenza – Aggiungendo o sottraendo a entrambi i membri di un’equazione
una stessa quantità, l’equazione resta equivalente alla data.
Questo principio è utile perché permette di separare i termini con l’incognita dai termini noti (senza
incognita). Nel nostro esempio posso scrivere:
12x-14400=9000.
Sommando 14440 a entrambi i membri ottengo la forma semplificata: 12x=23400.
In altri termini, si può portare un termine da una parte all’altra dell’uguale, cambiandogli il segno
(il -14400 diventa +14400). Dalla regola del trasporto si desume la regola di cancellazione: data
un’equazione, se ci sono termini uguali presenti in entrambi i membri, essi possono essere cancellati
ottenendo un’equazione equivalente.
Secondo principio di equivalenza – Moltiplicando o dividendo entrambi i membri di un’equazione
per una stessa quantità diversa da zero, l’equazione resta equivalente alla data. Come caso
particolare (equivale a moltiplicare per -1) si ha la regola del cambiamento di segno: data
un’equazione, cambiando segno a tutti i termini di entrambi i membri si ottiene un’equazione
equivalente.
Nel nostro caso, applicando il secondo principio a 12x=23400, si dividono per 12 i due membri e si
ottiene x=1950, l’equazione è risolta. Si può verificare l’equazione sostituendo nell’equazione
originaria il valore trovato: 12(1950-1200)=9000; effettivamente si tratta di un’uguaglianza.

Le proporzioni
La familiarità con le equazioni permette di gestire le proporzioni.
Una proporzione è un’uguaglianza tra il rapporto di due grandezze e il rapporto di altre due
grandezze; di solito si scrive come
a:b=c:d
Nella vita di tutti i giorni troviamo spesso grandezze proporzionali fra loro. In particolare, se due
grandezze sono proporzionali e conosciamo un loro rapporto per due valori di esse, riusciamo a
scoprire altre coppie di valori. Si supponga, per esempio, che in una certa zona una casa di 40 metri
quadrati costi 75.000 euro; poiché nella zona si può supporre costante il costo al metro quadrato di
case di eguale finitura, quanto costerà una casa analoga alla prima di 110 metri quadrati? Basta
impostare la proporzione:
40:75=110:x
Scritto in altri termini:
40/75=110/x cioè x=110·75/40=206.250 euro.

Le equazioni di secondo grado


Sono di gran lunga le più importanti perché consentono una risoluzione indipendente da
tecniche particolari. La forma generale è:

ax2+bx+c=0.
Si può dimostrare che le radici di tale equazione sono:
Fra le equazioni di secondo grado si possono considerare quelle pure, dove manca il termine di
primo grado, cioè b=0, e quelle spurie, dove manca il termine noto c. Mettendo rispettivamente b e
c =0 la formula risolutiva ovviamente si semplifica.
L’espressione sotto radice è detta discriminante; si arriva subito a concludere che un’equazione di
secondo grado ammette sempre due soluzioni che potranno essere:
• reali e distinte se il discriminante è maggiore di zero (radice di un numero positivo);
• reali coincidenti (-b/2a) se il discriminante è uguale a zero;
• complesse e coniugate se il discriminante è minore di zero.

Risoluzione di equazioni di grado superiore al


primo
Per il teorema di Abel-Ruffini, non esiste una formula generale per esprimere le radici delle
equazioni polinomiali di grado 5 o superiore. Viceversa, le equazioni di primo grado, secondo
grado, terzo grado e quarto grado ammettono una formula risolutiva. Casi particolari di
equazioni di grado superiore al quarto possono comunque ammettere una formula risolutiva.
Esistono particolari accorgimenti per risolvere particolari equazioni di grado superiore al secondo.
Per esempio, un’equazione del tipo 16x4=1 si può scrivere come (4x2)2=1 e, indicando x2 come y,
4y2=1, di fatto riconducendola a un’equazione di secondo grado. Trovate le soluzioni y1 e y2 di
quest’ultima, si pone poi x2=y1 e x2=y2 e si trovano altre due coppie di soluzioni, arrivando a
trovare le 4 soluzioni dell’equazione di quarto grado di partenza. Altri metodi di procedimento
consentono di trovare in casi particolari le radici di equazioni di grado superiore al secondo.

Le disequazioni
Una disequazione è una diseguaglianza verificata per certi intervalli di valori.
Per esempio, la disequazione x-12 >0 è verificata per tutti i valori della x maggiori di 12.
Il grado di una disequazione è dato dal grado massimo cui intervengono le incognite (che
ovviamente possono essere più di una).
Particolarmente interessanti sono le disequazioni di primo grado in un’incognita; esse vengono
risolte come le normali equazioni con la differenza che se moltiplico entrambi i membri per un
numero negativo devo cambiare il verso della disequazione. Per esempio:
x-8>2x+4 ho -x>12 per cui moltiplicando per -1 e cambiando il verso ho la soluzione x<-12.
Vediamo un problema pratico. Se le tasse aumentano dell’x%, di quanto deve aumentare il reddito
per non perderci? In termini matematici, se x è la frazione attuale delle tasse, y è la frazione di cui
aumenta il reddito e t la frazione di aumento delle tasse, per un reddito unitario si ha: y-y(t+1)x
[cioè il nuovo netto dopo le nuove tasse]>1-x [cioè il vecchio netto]. Si ricava che y deve essere
maggiore di (1-x)/(1-(t+1)x). Se, per esempio, le tasse sono originariamente il 30% (x=0,3) e
l’aumento è del 20% (cioè t=0,2), si trova che y deve essere maggiore di 0,7/0,64, cioè di circa il
9,4%.

Le equazioni esponenziali
Particolarmente complesse sono le equazioni esponenziali, quelle in cui le incognite
compaiono all’esponente.
Ricordando la definizione di logaritmo, chiameremo funzione esponenziale il suo inverso, cioè se
logax=y, y=ax sarà la funzione esponenziale. Molto spesso può capitare che si debba trovare y a
partire da relazioni in cui l’incognita x è all’esponente. Per esempio, vediamo come risolvere
l’equazione

3x+1=4x+3.

Mettiamo entrambi i termini alla stessa potenza: 3·3x=43·4x.

Se ora si prende il logaritmo di entrambi i membri, avremo log(3·3x)=log(43·4x), cioè per le regole
dei logaritmi: log3+xlog3=3log4+xlog4. Da cui: x(log4-log3)=log3-3log4. La soluzione sarà:
x=(log3-3log4)/log4-log3).

I sistemi di equazioni
Un sistema di equazioni è un insieme di equazioni contemporaneamente valide. In genere, le
equazioni che compongono il sistema vengono indicate con una grande parentesi graffa sulla
sinistra.
Il grado di un sistema di equazioni è il prodotto dei gradi delle singole equazioni.
Risolvere un sistema significa determinare l’insieme S dei valori che, sostituiti alle variabili,
verificano tutte le equazioni. Ciascuno degli elementi di S è una soluzione del sistema.
Esistono metodi generali per i sistemi di equazioni lineari (cioè equazioni di primo grado), ma ne
esistono anche molto semplici che si basano su passi facilmente intuibili. Illustriamo i due più
utilizzati.
Partiamo dal sistema formato da due equazioni.

Il metodo di sostituzione – Si trova una variabile da una delle due equazioni (in genere quella più
semplice) e si sostituisce nell’altra equazione che diventa a un’incognita. La si risolve e, una volta
trovato il valore dell’incognita, si sostituisce nella prima equazione e si trova il valore dell’altra
incognita.
Nel nostro caso dalla seconda equazione si ottiene subito y=3x-1 che fa diventare la prima 2x+(3x-
1)=4, cioè 5x=5 da cui x=1. Sostituita nella y=3x-1 dà y=2. Le soluzioni sono dunque x=1 e y=2.
Il metodo di confronto – Si trova da entrambe le equazioni la x (oppure la y, la più facile da
trovare); si uguagliano le espressioni trovate ottenendo un’equazione in un’incognita che si risolve.
Trovata una variabile, si sostituisce il risultato nella seconda equazione e trovo il valore dell’altra
variabile.
Nel nostro caso ho y=4-2x e y=3x-1; uguaglio 4-2x a 3x-1 ottenendo 4-2x=3x-1 che risolta in x dà
x=1. Sostituisco in una delle due espressioni che mi davano la y (per esempio in y=4-2x) e ottengo
y=2.
Se il sistema è di primo grado in tre equazioni e tre incognite si può utilizzare il metodo di
sostituzione ripetendolo due volte, prima ricavando la variabile z in x e y e risolvendo il sistema in
due equazioni e due incognite (x e y) che si è ottenuto sostituendo l’espressione ricavata per z.
Da notare che un sistema di equazioni lineari può ammettere soluzioni, essere impossibile o
indeterminato (infinite soluzioni). Per esempio, il sistema:

è ovviamente impossibile perché non è possibile che la somma di due numeri (qualsiasi essi siano)
possa dare risultati differenti! Se, per esempio, si cercasse di applicare il metodo di sostituzione si
otterrebbe 7=2 (e la variabile y scomparirebbe).

Sistemi a più equazioni in più incognite


Aumentando il numero di equazioni e il numero di incognite, la complessità di soluzione
aumenta, come pure aumenta la difficoltà di determinare velocemente se il sistema ammette
soluzioni, è impossibile o è indeterminato. Se, per esempio, si considera un sistema dove il
numero di equazioni k è inferiore al numero delle incognite, non avremo abbastanza
informazioni per determinare univocamente il valore di tutte le incognite; analogamente, se si
considera un sistema di 3 equazioni in 3 incognite, ma due equazioni sono equivalenti (per
esempio: 3x+1=2 e 6x+2=4; la seconda si ottiene dalla prima semplicemente moltiplicando per
2 tutti i termini) o addirittura uguali, in realtà è come se avessi solo 2 equazioni in 3 incognite
e il sistema risulterà indeterminato.

Matrici e determinanti
Una matrice mxn è una tabella ordinata di elementi disposti su m righe ed n colonne. Per
esempio:

Gli elementi della matrice sono indicati con la lettera a e due pedici, il primo indica la riga e il
secondo la colonna. Così il termine a36 indica il termine che compare nella terza riga sesta colonna.
Le matrici possono essere racchiuse da linee dritte o doppie oppure racchiuse da grandi parentesi
curve o quadre (come sopra), secondo varie modalità di rappresentazione.
Una matrice costituita da una sola riga (a1, a2, …, an) si dice vettore (con m elementi).

Se la matrice ha lo stesso numero (n) di righe e di colonne si dice matrice quadrata di ordine n.
La matrice trasposta si ottiene scambiando tra loro le righe e le colonne.
Particolare importanza ha il determinante di una matrice quadrata, un numero che descrive alcune
proprietà algebriche e geometriche della matrice. In genere viene indicato con una singola linea
dritta:

dove gli elementi aij sono numeri reali.

Il calcolo del determinante di una matrice può essere molto difficile all’aumentare del numero di
righe e di colonne e vengono usati metodi (sviluppo di Laplace, algoritmo di Gauss) piuttosto
complessi. In genere, limitandosi a matrici di ordine 2×2 si ha che:

cioè è la differenza delle due diagonali. Come proprietà generali di facile memorizzazione:
• il determinante di una matrice e quello della sua trasposta sono uguali;
• se tutti gli elementi di una riga (o di una colonna) sono nulli, allora il determinante è nullo
(la matrice a determinante nullo è detta singolare);
• se la matrice ha due righe (o colonne) eguali, o proporzionali, allora il determinante è nullo.

Studio dei sistemi con matrici e determinanti


Una delle applicazioni delle matrici e dei determinanti è lo studio dei sistemi di equazioni.
Abbiamo già visto che un sistema può essere impossibile o indeterminato con semplici esempi
basati unicamente su considerazioni particolari relative all’esempio in questione. In realtà, è
possibile estendere tali considerazioni introducendo il rango di una matrice.
Il rango (o caratteristica) di una matrice è il massimo numero di righe (o colonne) linearmente
indipendenti. Verificare l’indipendenza delle righe di una matrice può essere facile e può essere
fatto (come sopra) con la semplice osservazione dei valori dei coefficienti; in realtà, non sempre
questa osservazione dà risultati attendibili, soprattutto se il numero delle righe aumenta. Esistono
pertanto metodi piuttosto complessi per trovare il rango della matrice esaminata e quindi risalire alla
caratteristica del sistema associato (per esempio, impossibile o indeterminato).
A partire dal sistema è poi possibile definire due matrici che hanno un’importanza fondamentale per
la soluzione del sistema. La matrice incompleta è semplicemente la matrice dei coefficienti delle
incognite, mentre quella completa è un’ulteriore matrice ottenuta da quella incompleta
aggiungendo a destra la colonna dei termini noti.
Per cui il sistema

avrà come matrice incompleta

e come matrice completa

Il rango gioca un ruolo fondamentale nel teorema di Rouché-Capelli che afferma che esistono
soluzioni per il sistema se e solo se il rango della matrice completa è uguale al rango della matrice
incompleta.
Quando il sistema ha una sola soluzione, questa può essere esplicitata usando il determinante,
mediante la regola di Cramer. In generale, la regola ci dice che per l’incognita i-esima vale:
xi=det(Ai)/det(A)

dove Ai è la matrice formata sostituendo la i-esima colonna di A con il vettore c dei termini noti.

Vediamo come funziona la regola per un sistema di tre equazioni in tre incognite. Innanzitutto
occorre sapere quanto vale il determinante di una matrice 3×3. Come per la matrice 2×2, non è
necessario ricorrere a complessi metodi di calcolo, basta usare la regola di Sarrus che, seppur
complessa, è di facile e immediata applicazione. Tale regola dice che il determinante della matrice

è dato da aei+bfg+cdh-afh-bdi-ceg.
Mnemonicamente il tutto si riduce a replicare la matrice
ABCABC
DEFDEF
GHIGHI
e considerare le diagonali (la prima è indicata in grassetto, le altre sono parallele) da sinistra verso
destra per i tre termini positivi e da destra verso sinistra per i tre termini negativi, sempre partendo
dal valore a.
Con la regola di Sarrus otteniamo che il valore del determinante della matrice incompleta (quella
dei coefficienti delle incognite) del precedente esempio di 3 equazioni in 3 incognite è -99. Per la
variabile y (la seconda) si deve calcolare il determinante della matrice

dove abbiamo sostituito la seconda colonna con quella dei termini noti. Usando la regola di Sarrus
si ottiene che il determinante è -99. Quindi, applicando la regola di Cramer, il rapporto per
l’incognita y sarà -99/-99=1. Analogamente si trovano i valori di x e z, rispettivamente 2 e 3.

Geometria del piano euclideo


La geometria è quella parte della matematica che studia le forme nel piano e nello spazio e le
loro mutue relazioni.
In realtà, esistono diverse geometrie, ognuna delle quali descrive la realtà partendo dal proprio
punto di vista.
Tradizionalmente, fino all’inizio del XIX secolo, esisteva solo la geometria euclidea. Essa ha
concetti primitivi come il punto, la retta e il piano; i suoi assiomi sono gli assiomi di Euclide,
dai quali si deducono teoremi come il teorema di Pitagora e i teoremi della geometria
proiettiva.
La geometria analitica (cartesiana) amplia l’orizzonte della geometria euclidea, utilizzando altre
discipline della matematica: l’algebra e l’analisi. Il piano e lo spazio sono rappresentati con
coordinate cartesiane. In questo modo, ogni figura geometrica è descrivibile tramite una o più
equazioni (o disequazioni).
Geometria euclidea e geometria analitica restano le forme più conosciute di geometria. Dal XIX
secolo in poi, dal pesante utilizzo dell’algebra (soprattutto quella commutativa) nello studio della
geometria nasce la geometria algebrica. Vengono aggiunti i “punti all’infinito” (creando così la
geometria proiettiva) e si considerano le coordinate di un punto anche nei numeri complessi.
Oggetto principale della geometria algebrica sono le varietà algebriche, oggetti geometrici che
sono soluzioni di equazioni algebriche, gli insiemi dello spazio proiettivo, affine o euclideo definiti
come luoghi di zeri di polinomi.
Ancora più recente, la geometria differenziale studia gli oggetti geometrici tramite l’analisi. Gli
oggetti geometrici non sono necessariamente definiti da polinomi (come nella geometria algebrica),
ma sono, per esempio, curve e superfici, oggetti cioè “senza spessore” e dotati di curvatura (per
esempio, la superficie terrestre che sembra piatta, ma non lo è).
Nella geometria euclidea valgono tutti i postulati di Euclide, tranne il quinto, quello delle parallele
(fissati una retta r e un punto P non contenuto in r, esiste un’unica retta s parallela a r e passante per
P); nascono le geometrie non euclidee. Nelle geometrie non euclidee si modifica il concetto di
piano; nel piano di Klein, per esempio, i punti si addensano man mano ci avviciniamo al bordo,
nella geometria di Lobacewskij-Bolyai, due rette sono parallele se hanno in comune un punto
all’infinito, nella geometria di Riemann si considera come piano la superficie di una sfera ecc.).
Infine, la topologia è lo studio delle forme e delle proprietà degli enti geometrici che non cambiano
quando questi vengono deformati in modo continuo, senza strappi.

Gli oggetti fondamentali e i postulati


Gli oggetti fondamentali della geometria euclidea sono il punto, la retta e il piano.
Da essi si desumono altri oggetti; per esempio, una semiretta è ciascuna delle due parti in cui una
retta risulta divisa da un suo punto. Il semipiano è ciascuna delle due parti in cui un piano resta
diviso da una sua retta.
Viene definito luogo geometrico l’insieme di tutti e soli i punti che possiedono una certa
proprietà.
I postulati sono regole iniziali a cui tutti gli oggetti geometrici debbono obbedire. Euclide ne definì
5; la formulazione dei primi 4 è la seguente:
1. Tra due punti qualsiasi è possibile tracciare una e una sola retta.
2. Un segmento può essere indefinitamente prolungato oltre i due estremi.
3. Dato un punto e una lunghezza, è possibile descrivere un cerchio.
4. Tutti gli angoli retti sono congruenti tra loro.
Circa il quinto, Euclide propose una versione molto complessa, tanto che oggi si preferisce
enunciarlo così:
Per un punto passa una e una sola parallela a una retta data.
Tale postulato non vale, per esempio, nelle geometrie non euclidee.
Circa il quarto postulato, due figure si dicono congruenti quando con un movimento rigido è
possibile sovrapporle in modo che coincidano punto per punto. La congruenza differisce
dall’uguaglianza perché due figure con forma simile sono uguali se occupano lo stesso spazio nello
stesso tempo, mentre per essere congruenti possono occupare spazi diversi nello stesso tempo.
Tutti i punti sono fra loro congruenti; tutte le rette sono fra loro congruenti.
Convenzionalmente, i punti vengono indicati con lettere maiuscole, le rette con lettere minuscole,
gli angoli con lettere greche minuscole oppure con i punti dei segmenti che delimitano l’angolo con
il vertice sovrastato da un accento circonflesso, per esempio BÂC.

I segmenti
Il segmento è la parte di retta delimitata da due suoi punti.
Due segmenti saranno congruenti se con un movimento rigido possiamo sovrapporli punto per
punto (cioè intuitivamente se hanno la stessa lunghezza); si dicono consecutivi se hanno un estremo
in comune; si dicono adiacenti se sono consecutivi e se giacciono sulla stessa retta.
Grazie a queste definizioni si possono definire la somma (si rendono i segmenti adiacenti e si
considera il segmento totale) e la differenza (si sovrappongono e si toglie la parte comune).
L’asse di un segmento è la perpendicolare condotta nel punto di mezzo del segmento; come luogo
geometrico esso è l’insieme dei punti del piano equidistanti dagli estremi del segmento.

La sezione aurea
Si definisce sezione aurea di un segmento AB la parte di segmento che è media proporzionale
fra tutto il segmento e la parte che resta.
Nella figura sottostante la sezione aurea è rappresentata dal segmento AC di lunghezza a; per la
definizione:
AB : AC = AC : CB

Più precisamente, un segmento è diviso in due parti


secondo la sezione aurea se il rapporto tra le lunghezze delle parti è Φ (dalla lettera iniziale del
nome greco dello scultore Fidia), cioè:
Φ=(a+b)/a=a/b
La sezione aurea (anche rapporto aureo o costante di Fidia) è un numero irrazionale le cui prime
cifre sono 1,61803…
Il rapporto aureo fu introdotto dai pitagorici (il pentagono stellato era il loro simbolo) come
rapporto tra la diagonale e il lato del pentagono regolare.

Il termine “aurea” deriva da sue notevoli proprietà anche in altre discipline. In architettura sembra
essere il rapporto più estetico fra i lati di un rettangolo; il rapporto si ritrova nello studio delle
dimensioni della piramide di Cheope e analoghe proporzioni si trovano anche sul Partenone di
Atene e su archi classici. Molti riscontri anche nella pittura soprattutto rinascimentale (in un
panorama l’orizzonte dovrebbe dividere il quadro secondo la sezione aurea): Leonardo nel suo
celebre uomo vitruviano ritenne perfette le dimensioni umane quando l’ombelico divide il corpo
secondo un rapporto aureo; nella pittura moderna il rapporto aureo fu usato da Mondrian.
La sezione aurea è strettamente legata alla successione di Fibonacci. Curioso il fatto che il rapporto
tra due termini successivi tenda al valore della sezione aurea.

Gli angoli
L’angolo è una delle due parti in cui il piano viene suddiviso da due semirette aventi la stessa
origine. Anche per gli angoli si possono definire la congruenza, la consecutività (quando
hanno un lato in comune) e l’adiacenza (quando oltre a essere consecutivi hanno come somma
un semipiano).
Analogamente al segmento, si definiscono la somma e la differenza di due angoli.
Per gli angoli si introduce un nuovo concetto, la convessità.
Un angolo è concavo se contiene al suo interno il prolungamento dei suoi lati, mentre sarà convesso
se ciò non avviene. I due angoli determinati da due semirette aventi la stessa origine sono uno
concavo e l’altro convesso (nella figura, in rosso l’angolo convesso, in azzurro quello concavo).

Il concetto può essere esteso alle figure piane: una figura si dice convessa se contiene ogni
segmento di cui contenga gli estremi; in caso contrario la figura si dice concava (per esempio, una
ciambella piana è una figura concava perché è immediato trovare due punti estremi di un segmento
che non appartiene interamente a essa.
Due angoli si dicono opposti al vertice se i lati dell’uno sono sui prolungamenti dei lati dell’altro.
Due angoli opposti al vertice sono uguali.
La bisettrice di un angolo è la retta che divide l’angolo in due parti congruenti; come luogo
geometrico essa è l’insieme dei punti del piano equidistanti dai lati dell’angolo.

Misurazione degli angoli


La misurazione degli angoli non può essere fatta a partire dall’area racchiusa che è
evidentemente infinita. Considerando la nozione di convessità e quella di bisettrice, si possono,
per esempio, definire l’angolo giro (come l’angolo concavo corrispondente a uno convesso di
ampiezza nulla) e l’angolo piatto (la metà dell’angolo giro, corrispondente a un semipiano).
Analogamente si può definire l’angolo retto come un angolo convesso che ha i suoi due lati
ortogonali, ovvero un angolo retto è la metà di un angolo piatto.
Un angolo convesso si dice acuto se è contenuto in un angolo retto avente il suo stesso vertice. Un
angolo convesso contenente un angolo retto avente lo stesso vertice si dice invece angolo ottuso.
Queste definizioni sono però ancora qualitative e molto distanti da una misurazione numerica.
Il problema si risolve non considerando la misura dell’angolo in sé, ma quella dell’ampiezza
del movimento che porta una delle semirette a sovrapporsi all’altra.
Nel sistema sessagesimale l’angolo completo (angolo giro) è suddiviso in 360 spicchi, equivalenti
all’unità di misura convenzionale denominata grado sessagesimale, indicata col simbolo °.
La suddivisione in 360 parti dell’angolo giro ha origine astronomiche in quanto i babilonesi
identificarono il giro del Sole sulla volta celeste nell’allora stimato tempo di 360 giorni.
L’aggettivo “sessagesimale” deriva dal fatto che le sottounità del grado, il minuto e il secondo, sono
divise in sessantesimi; perciò, come nell’orologio, ogni grado è diviso in 60 minuti primi indicati
col simbolo ‘, e ogni minuto è diviso in 60 minuti secondi indicati col simbolo ”. Ulteriori
suddivisioni del secondo seguono il normale sistema decimale. Pertanto un angolo può avere
un’ampiezza espressa come 24°12’34,4″.
Sono stati proposti altri sistemi di misurazione, ma l’unico veramente alternativo al sistema
sessagesimale è il sistema radiante (o sistema matematico). Il radiante, inteso come rapporto tra la
lunghezza di un arco di circonferenza e il raggio della circonferenza stessa, in quanto questo
rapporto non dipende dal raggio, ma solo dall’angolo compreso. In tal modo, l’angolo giro misura
2π, cioè il rapporto tra la lunghezza della circonferenza e il suo raggio.
La relazione che lega il sistema radiante e il sistema sessagesimale e permette il passaggio da uno
all’altro è:
180°/α=π/x
dove α è la misura dell’ampiezza dell’angolo espresso in gradi, e x è la misura espressa in radianti.

Perpendicolarità
Due rette sono perpendicolari se incontrandosi formano quattro angoli uguali; gli angoli sono
un quarto dell’angolo giro, quindi sono angoli retti.
Si può dimostrare che, dati una retta e un punto, esiste una e una sola retta perpendicolare alla
retta data passante per il punto dato.
Il concetto di perpendicolarità è collegato al concetto di proiezione. Proiettare un punto o un
segmento su di una retta vuol dire andare dal punto o dal segmento alla retta perpendicolarmente.

Parallelismo
Due rette si dicono parallele se non hanno nessun punto in comune.
Si può dimostrare che, dati una retta e un punto fuori di essa, da quel punto si può tracciare solo una
retta parallela alla retta data.

I triangoli
La nozione di triangolo è a tutti nota; formalmente, un triangolo può essere definito come
parte di piano comune a tre angoli aventi due a due un lato in comune.
Anche per i triangoli è importante il concetto di congruenza.
• Due triangoli sono congruenti se è possibile sovrapporli con un movimento rigido facendoli
coincidere punto per punto.
• Due triangoli sono congruenti se hanno congruenti due lati e l’angolo compreso.
• Due triangoli sono congruenti se hanno congruenti due angoli e il lato compreso.
I due criteri di congruenza altro non esprimono il fatto che, se fisso due lati (angoli) e l’angolo (e il
lato) compreso, automaticamente restano fissati e unici gli altri elementi (lati e angoli).
In un triangolo è possibile definire la mediana come il segmento che congiunge un vertice al punto
medio del lato opposto. Si definisce altezza il segmento più breve (quindi perpendicolare) che
unisce un vertice alla retta contenente il lato opposto.
In ogni triangolo la somma delle misure degli angoli interni è uguale a un angolo piatto, cioè a
180°.
Il circocentro è il punto di incontro degli assi dei suoi lati; esso è il centro della circonferenza
circoscritta al triangolo.
L’incentro è il punto di incontro delle bisettrici dei suoi angoli; esso è il centro della circonferenza
inscritta nel triangolo.
L’ortocentro è il punto di incontro delle sue altezze.
Il baricentro è il punto di incontro delle sue mediane. Il concetto di baricentro è molto importante
in fisica perché, praticamente, il baricentro è il centro di massa del triangolo: se consideriamo una
lamina triangolare composta da una sostanza omogenea e la sospendessimo per il baricentro, la
lamina non ruoterebbe e, anche ruotando la lamina, questa resterebbe fissa nella nuova posizione.

Triangolo isoscele
Si definisce triangolo isoscele un triangolo che possiede due lati congruenti.
Vale il seguente teorema: un triangolo è isoscele se e solo se ha due angoli congruenti.
Da un punto di vista pratico, un triangolo è isoscele quando ha due lati di uguali lunghezza, lati che
hanno in comune il vertice del triangolo.
In un triangolo isoscele la bisettrice relativa all’angolo al vertice coincide con la mediana e
l’altezza relative alla base.
Triangolo equilatero
Particolari triangoli isosceli sono i triangoli equilateri. Un triangolo equilatero è un triangolo
avente i suoi tre lati congruenti tra loro. Si dimostra che i suoi angoli sono tutti congruenti e pari
a 60°, cioè a π/3 radianti. Per caratterizzare un triangolo equilatero basta un solo parametro e di
solito si usa la lunghezza del lato. Nei triangoli equilateri, le bisettrici, le mediane, le altezze e gli
assi si sovrappongono e ortocentro, baricentro, incentro e circocentro coincidono.

Triangolo rettangolo
Un triangolo rettangolo è un triangolo che possiede un angolo retto. Poiché la somma delle misure
degli angoli di un triangolo è di 180°, la somma delle misure degli altri due angoli di un triangolo
rettangolo deve essere di 90°.
Se due triangoli sono rettangoli e hanno congruenti due lati allora i due triangoli sono congruenti.
Se due triangoli sono rettangoli e hanno congruenti un lato e un angolo allora i due triangoli sono
congruenti.
Se il triangolo rettangolo è anche isoscele, avrà i due angoli di 45° e sarà la metà di un quadrato.
Per i triangoli rettangoli si possono dimostrare due importanti teoremi.
Primo teorema di Euclide – In ogni triangolo rettangolo, il quadrato costruito su un cateto è
equivalente al rettangolo che ha per dimensioni l’ipotenusa e la proiezione di quel cateto
sull’ipotenusa.
Nell’immagine, i rettangoli rosa e azzurro hanno come dimensione maggiore quella dell’ipotenusa
del triangolo rettangolo.
Teorema di Pitagora – In ogni triangolo rettangolo la somma dei quadrati costruiti sui cateti è
equivalente al quadrato costruito sull’ipotenusa
Il famosissimo teorema si esprime anche dicendo che la somma delle aree dei quadrati costruiti sui
cateti è uguale all’area del quadrato costruito sull’ipotenusa. Si noti il differente impiego del
termine (equivalente o uguale) a seconda che si parli delle figure geometriche o delle loro aree.

Nella figura soprastante vale quindi la relazione


Da questa relazione è ovviamente possibile ricavare la misura di un lato quando si conoscano quelle
degli altri due; per esempio, per trovare la lunghezza del cateto AB (a), note quelle del cateto AC (b)

e dell’ipotenusa BC (c), avremo:

Le misure del triangolo


Il triangolo è la più semplice figura piana.
Una prima misura che possiamo introdurre è il perimetro; termine che in geometria indica la
misura della lunghezza del contorno di una figura piana.
Nel caso del triangolo il perimetro è la somma delle misure dei suoi lati. Se il triangolo è equilatero
basta moltiplicare la misura di un lato per 3.
Nasce spontanea la domanda di misurare l’estensione della sua superficie, cioè di misurare l’area.
Nel parlare comune si tende spesso a confondere la misura dell’estensione (l’area, appunto) con
l’insieme di punti cui fa riferimento, cioè c’è confusione fra il termine area e il termine superficie.
Ovviamente, per determinare l’area dobbiamo utilizzare un’unità di misura; a seconda degli ambiti,
esistono diverse unità di misura; in fisica, per esempio, si può usare il metro quadrato (m2), ma, per
esempio, in agraria si può usare l’ettaro (corrispondente a 10.000 metri quadrati).
Senza entrare nei complessi formalismi della teoria della misura, è importante che tutte le grandezze
che mettiamo in relazione abbiano la stessa unità di misura; in altri termini, se consideriamo un
triangolo non possiamo misurare un lato in centimetri e un’altezza in metri.
Se le grandezze sono espresse nella stessa unità di misura è possibile esprimere le aree delle varie
superfici mediante formule, spesso molto semplici.
Per un triangolo, l’area è il semiprodotto della base per l’altezza:
A=b·h/2.
Meno conosciuta è la formula di Erone, che permette di calcolare l’area di un triangolo, conosciute
le lunghezze dei lati. Se tali lunghezze sono date da a, b e c, l’area A è data da
dove p è il semiperimetro: p=(a+b+c)/2
La formula può anche scriversi come:

che ha il vantaggio di non usare il semiperimetro, ma è meno immediata da memorizzare.


Per esempio, se i lati sono lunghi 8, 7 e 11, l’area sarà la radice quadrata di 780, cioè circa 27,93.

I poligoni
Ora possiamo passare alle figure con più di 3 lati.
Un poligono è una figura geometrica piana delimitata da una linea spezzata chiusa (poligonale). I
segmenti che compongono la spezzata chiusa si dicono lati del poligono e i punti in comune a due
lati consecutivi si dicono vertici del poligono.

Se i lati del poligono non si intersecano, il poligono è detto semplice, se si intersecano è detto
complesso (o intrecciato). I poligoni usualmente studiati sono poligoni semplici.
Un poligono semplice è convesso se ogni angolo interno è minore o uguale a un angolo piatto; è
concavo se anche un solo angolo interno è maggiore di un angolo piatto.
In base alla simmetria, un poligono è equilatero se tutti i suoi lati sono uguali; è equiangolo se tutti
i suoi angoli sono uguali. Un poligono è regolare se è convesso, equilatero ed equiangolo;
irregolare se non è regolare.
Si può dimostrare che la somma degli angoli interni di un poligono è uguale a tanti angoli piatti
quanti sono i lati meno due; quindi, per un esagono, la somma sarà uguale a quattro angoli piatti.

Nomi dei poligoni


A partire da 3 fino a 10 lati, i poligoni assumono i seguenti nomi: triangolo, quadrilatero,
pentagono, esagono, ettagono, ottagono, ennagono, decagono.

I quadrilateri
Genericamente, un quadrilatero è un poligono con 4 lati; si possono studiare particolari
quadrilateri. Nella figura sottostante è rappresentata la famiglia dei quadrilateri con le figure che
andremo a studiare.
Trapezi
Un trapezio è un quadrilatero con due lati paralleli; si dirà isoscele se ha due lati non consecutivi
congruenti; si dirà rettangolo se ha due angoli retti.

Nell’immagine soprastante, AB è la base minore (b), DC la base maggiore (B), AH e BK le altezze


(h), AD e BC i lati obliqui.
L’area del trapezio è uguale alla somma delle basi per l’altezza diviso due:
A= (B+b)·h/2.
Parallelogrammi
Un parallelogramma è un quadrilatero con i lati due a due paralleli.

AC e BD sono le diagonali (uguali come lunghezza; da notare che entrambe si tagliano a metà) del
parallelogramma. Parallelogrammi particolari sono i rettangoli, i rombi e i quadrati.
I lati AB e CD sono uguali in lunghezza, come pure AD e BC.

Rettangoli
Un rettangolo è un parallelogramma con 4 angoli retti. La lunghezza dei due lati opposti più lunghi
viene chiamata lunghezza o base del rettangolo, mentre la lunghezza dei due lati più corti viene
chiamata larghezza o altezza.

Il perimetro del rettangolo è il doppio della somma della base e dell’altezza.


Nel rettangolo l’area è uguale al prodotto della base per l’altezza:
A=b·h
Utilizzando il teorema di Pitagora, la diagonale AC misura la radice quadrata della somma dei
quadrati dei due lati.
Rombi
Un rombo è un parallelogramma con tutti i lati della stessa lunghezza (congruenti); esso è il duale
del rettangolo (in matematica, il principio di dualità afferma che un enunciato relativo a due enti
matematici è trasformabile in un altro altrettanto valido scambiando un ente con l’altro e adattando
opportunamente l’enunciato stesso).

Infatti, nel rettangolo tutti gli angoli sono congruenti (retti), nel rombo lo sono i lati (nell’immagine
di lunghezza a). Nel rettangolo i lati opposti sono congruenti (con la stessa misura); nel rombo lo
sono gli angoli opposti. Nel rettangolo il centro è equidistante dai vertici, mentre nel rombo il centro
è equidistante dai lati.
Il rombo ha due diagonali perpendicolari che si intersecano nel loro punto medio. Ciascuna
diagonale divide il rombo in due triangoli isosceli, che sono congruenti. Le diagonali sono anche le
bisettrici degli angoli.
Gli angoli opposti sono congruenti, vale a dire hanno uguale ampiezza.
Due angoli adiacenti a ciascun lato sono supplementari, con somma quindi pari a 180°.
L’area del rombo può trovarsi in vari modi, per esempio considerando i vari triangoli che lo
compongono. Il modo più semplice è di moltiplicare la lunghezza del lato per quella dell’altezza h
oppure di considerare le due diagonali. Come per ogni parallelogramma, l’area è uguale al
semiprodotto delle diagonali.
Quadrati
Il quadrato può essere considerato un particolare tipo di rettangolo o di rombo; è un
parallelogramma che ha 4 angoli retti e tutti i lati di uguale lunghezza.
Il perimetro del quadrato è uguale a 4l, se l è la lunghezza del lato; mentre l’area è uguale al
quadrato della misura del lato. Importante notare che la misura della diagonale del quadrato è
uguale alla misura del lato moltiplicata per la radice quadrata di 2:

Circonferenza e cerchio
La circonferenza è il luogo geometrico dei punti del piano equidistanti da un punto fisso detto
centro (genericamente indicato con O); il cerchio è la parte finita di piano delimitata da una
circonferenza. Il raggio è il segmento che congiunge il centro con un punto della circonferenza;
usualmente viene indicato con r. Il diametro è il segmento che congiunge due punti della
circonferenza opposti rispetto al centro; usualmente viene indicato con d e vale la relazione d=2r.
Si definisce corda il segmento che unisce due punti della circonferenza (quindi il diametro è una
corda che passa per il centro). Ognuna delle due parti della circonferenza divisa da un diametro è
detta semicirconferenza (e il cerchio è diviso da un diametro in due semicerchi). Arco è la parte di
circonferenza compresa fra due punti.
OP è un raggio, CD un diametro, AB è una corda.
Un settore circolare è l’area compresa fra due raggi (per esempio, OC e OP) e la relativa porzione
di circonferenza (l’arco che ha come estremi C e P).
Un’importante prima conseguenza della definizione di circonferenza è che:
dati tre punti non allineati, per essi passa una e una sola circonferenza.
Un’altra importante proprietà, non del tutto immediata è che
l’angolo al centro è il doppio dell’angolo alla circonferenza che insiste sullo stesso arco.
Nella figura l’angolo CÔP è il doppio dell’angolo CÂP. In particolare:
tutti gli angoli alla circonferenza che insistono sullo stesso arco sono congruenti, cioè hanno la
stessa misura.
Una retta può avere tre posizioni rispetto alla circonferenza: essere esterna (non avere nessun punto
in comune, la distanza della retta dal centro è superiore al raggio), essere secante (avere in comune
una corda, la distanza della retta dal centro è inferiore al raggio), essere tangente (avere un solo
punto in comune, la distanza della retta dal centro è uguale al raggio).
Una curiosità è data dal teorema di Dante (così chiamato perché nel paradiso dantesco vi si fa
riferimento):
ogni triangolo inscritto in una semicirconferenza è rettangolo.
Infatti l’angolo alla circonferenza è la metà dell’angolo giro corrispondente alla semicirconferenza.

Circonferenza circoscritta
La circonferenza circoscritta è la circonferenza passante per tutti i vertici di un poligono (viene
detto ciclico). Il suo centro si chiama circocentro. Dato che per tre punti non allineati passa una e
una sola circonferenza, ogni triangolo ha una sua propria circonferenza circoscritta e in ogni
poligono tale circonferenza, se esistente, è sempre unica.
Tutti i triangoli, i rettangoli e i poligoni regolari semplici (ovvero i cui lati non si intersecano) sono
ciclici; inoltre, per questi ultimi, il circocentro è il loro centro di simmetria rotazionale.
Circonferenza inscritta
La circonferenza inscritta è la circonferenza tangente a tutti i lati di un poligono, se ciclico. Il suo
centro si chiama incentro.
Dato che per tre punti non allineati passa una e una sola circonferenza, ogni triangolo ha una sua
propria circonferenza inscritta; per un poligono non è detto che esista la circonferenza inscritta, ma
se esiste, è unica.
Un poligono si può circoscrivere a una circonferenza se le bisettrici dei suoi angoli si incontrano in
un unico punto, l’incentro.

Ciclometria
La ciclometria è la parte della geometria che studia i problemi relativi alla misura del cerchio con
particolare riferimento alla rettificazione della circonferenza e alla quadratura del cerchio, uno
dei tre grandi problemi dell’antichità.
Partendo da due concetti facilmente intuibili:
1. considerando un poligono regolare inscritto in una circonferenza, all’aumentare del numero
dei lati la misura del perimetro aumenta, avvicinandosi alla misura della lunghezza della
circonferenza;
2. considerando un poligono regolare circoscritto in una circonferenza, all’aumentare del
numero dei lati la misura del perimetro diminuisce, avvicinandosi alla misura della
lunghezza della circonferenza;
è possibile trovare che la misura della circonferenza vale 2πr, dove r è la misura del raggio.
Il numero π (pi greco) è un numero reale, non razionale, cioè è irrazionale; è conosciuto anche
come costante di Archimede e costante di Ludolph; è un numero trascendente, cioè non ci sono
polinomi con coefficienti razionali di cui π è radice, quindi è impossibile esprimere π usando un
numero finito di interi, di frazioni e di loro radici. Di fatto, ciò vuol dire che la quadratura del
cerchio è impossibile, cioè è impossibile la costruzione con riga e compasso di un quadrato della
stessa area di un dato cerchio.
Del pi greco di solito si considerano le prime due cifre decimali, indicandolo come 3,14…
Un’indicazione più precisa può considerare le prime cinque cifre decimali: 3,14159…
Esso è curiosamente associato a molte formule matematiche; per esempio, la formula di Leibniz
(in realtà fu scoperta qualche anno prima dal matematico scozzese Gregory) afferma che la somma
infinita a segni alterni di tutti i reciproci dei numeri naturali dispari, partendo da +1, è uguale a un
quarto di pi greco:
1/1-1/3+1/5-1/7+1/9-…= π/4.
Grazie al pi greco possiamo calcolare agevolmente anche l’area del cerchio:

A= πr2.
Se si conosce l’angolo α sotteso da un arco, la misura dell’arco si otterrà semplicemente
considerando che l’intera circonferenza (corrispondente all’angolo giro, 360°, cioè a 2π in radianti)
è pari a 2πr. Quindi la lunghezza a dell’arco sarà:

Geometria dello spazio


La geometria dello spazio introduce una terza dimensione; diventa importante il concetto di piano,
esistendo nello spazio infiniti piani, oltre che infiniti punti e infinite rette. Tutti i piani dello spazio
sono congruenti (ovvero, intuitivamente “uguali”).
Se è facilmente intuibile che per un punto o per una retta passano infiniti piani, è importante notare
che
per tre punti non allineati passa uno e un solo piano.
Nello spazio è necessario introdurre altre definizioni che legano, per esempio, la retta a un piano.
Due rette si dicono complanari se giacciono nello stesso piano e sghembe se giacciono in piani
diversi. Una retta è poi secante a un piano se ha con esso un punto in comune, parallela se non ne ha
alcuno e giacente su di esso se tutti i suoi punti appartengono al piano.
Analogamente, due piani sono paralleli se non hanno nessun punto in comune (e quindi nessuna
retta), secanti se si intersecano. Non è difficile immaginare il seguente teorema (quindi dimostrabile
a partire dai postulati della geometria dello spazio): se due piani hanno in comune un punto, hanno
in comune un’intera retta.

Proprietà delle rette


Anche le condizioni di perpendicolarità e parallelismo delle rette nello spazio sono facilmente
intuibili; ecco alcuni semplici risultati:
Nello spazio due rette perpendicolari giacciono nello stesso piano (complanari) e incontrandosi
formano quattro angoli uguali.
Una retta è perpendicolare a un piano se è perpendicolare a tutte le rette del piano passanti per il
loro punto di incontro.
Grazie a questa definizione si può definire la perpendicolarità fra piani. Due piani nello spazio si
dicono perpendicolari se esiste una retta in uno dei due piani perpendicolare all’altro piano.
Anche nello spazio due rette si dicono parallele se giacciono sullo stesso piano e non hanno punti in
comune.
Una retta non giacente sul piano è parallela al piano se è parallela a una retta del piano.
Proiezione di una retta su un piano
Dato un piano e una retta r non giacente su di essa, consideriamo il punto P in cui tale retta interseca
il piano. Proiettare un punto A della retta r sul piano significa tracciare la perpendicolare dal punto
al piano; la proiezione di tutti i punti sulla retta sarà una retta s che è la proiezione di r sul piano.

Possiamo poi definire l’angolo fra la retta e il piano come l’angolo fra la retta e la sua proiezione sul
piano.

L'angolo diedro
L’angolo diedro è un’estensione del concetto di angolo nello spazio tridimensionale. Esso è la
porzione di spazio compresa tra due semipiani (facce) aventi per origine la stessa retta, che viene
detta spigolo.
Se consideriamo un poligono e un punto esterno al piano su cui giace il poligono, lo spazio
delimitato da tutte le semirette uscenti dal punto dato e passanti per i punti del perimetro del
poligono viene detto angoloide.
Particolare importanza hanno i triedri che sono angoloidi in cui il poligono è un triangolo.
Anche per i triedri si possono trovare interessanti teoremi, proprio come per i triangoli. Per
esempio:
• in un triedro ogni faccia è minore della somma delle altre due;
• in un triedro ogni faccia è maggiore della differenza delle altre due.

I poliedri
Un poliedro è un solido delimitato da un numero finito di facce piane poligonali. Le facce possono
essere tutte congruenti (cubo) oppure avere sempre lo stesso numero di lati senza però essere
congruenti (un generico parallelepipedo) oppure, per esempio, avere un numero di lati variabile
come in un prisma o una piramide.
Gli spigoli sono i lati delle facce e ogni spigolo può essere associato a una lunghezza. Un poliedro
può possedere spigoli di lunghezza costante (cubo) o variabile.
Le estremità degli spigoli sono i vertici del poliedro. Ogni vertice appartiene almeno a 3 facce
distinte. Il numero n di facce cui appartiene è detto valenza del vertice ed è anche uguale al numero
di spigoli che tocca.
La cuspide di un vertice è la struttura locale del poliedro intorno a questo.
Un poliedro convesso è una zona limitata dello spazio ottenuta come intersezione di un numero
finito di semispazi. Intuitivamente, come per le figure piane in due dimensioni, per ogni coppia di
punti del solido, il segmento che li unisce è contenuto interamente nel solido.
Un poliedro è regolare se ha tutte le facce formate da poligoni regolari congruenti.
In particolare, erano noti anche agli antichi greci cinque poliedri regolari (detti anche corpi
platonici): tetraedro, esaedro (cubo), ottaedro, dodecaedro, icosaedro, corrispondenti a 4, 6, 8, 12, e
20 facce.

In chimica e biologia esistono molte strutture che hanno una forma poliedrica (molecole, protozoi,
virus), in mineralogia molti cristalli presentano forme poliedriche anche macroscopicamente.

La formula di Eulero
Un poliedro semplice è intuitivamente un poliedro se è “fatto di un pezzo solo e non ha buchi”. I
poliedri convessi, e la maggior parte dei poliedri studiati, sono semplici.
La formula di Eulero per i poliedri relaziona i numeri F, S e V, rispettivamente di facce, spigoli e
vertici di un poliedro semplice. Essa afferma che
F+V=S+2.
Dal prisma al cubo
Un prisma è un poliedro le cui basi sono due poligoni congruenti di n lati (basi) posti su piani
paralleli e connessi da un ciclo di parallelogrammi (le facce laterali).
Il prisma può essere retto od obliquo. La distanza fra le due basi è l’altezza del prisma.

Un prisma che ha tutte (quindi non solo le superficie laterali) le facce a forma di parallelogramma è
un parallelepipedo. Un parallelepipedo è quindi un poliedro le cui facce sono 6 parallelogrammi.
L’ampiezza degli angoli formati dalle sue facce può variare; quando gli angoli sono retti (formando
un rettangolo per ogni faccia) si parla di parallelepipedo rettangolo.
Un parallelepipedo rettangolo è quindi un parallelepipedo che ha come facce sei rettangoli.
Il cubo è un parallelepipedo rettangolo regolare: ogni faccia è un quadrato di lato l; ha 6 facce
quadrate, 8 vertici e 12 spigoli. Ogni cubo è caratterizzato dalla lunghezza l dei suoi spigoli. Tutti i
cubi con gli spigoli della stessa lunghezza sono congruenti.

Superfici e volumi
Per i poliedri, particolare importanza pratica ha il calcolo della superficie e del volume, inteso
quest’ultimo come lo spazio racchiuso dal poliedro.
In genere si usano semplici formule, soprattutto per i poliedri più semplici. Il calcolo delle superfici
totali è piuttosto semplice perché si tratta di sommare i contributi delle superfici delle varie facce.
Per esempio, l’area della superficie laterale del prisma retto è uguale a perimetro di base×altezza; la
superficie totale si ottiene aggiungendo alla superficie laterale quella delle basi; se il prisma è
rettangolo (si pensi, per esempio, a una classica scatola di cartone) la superficie totale S, data
l’altezza h, la profondità p e la larghezza l, è data da:
S=2(l·p+l·h+h·p).
Come caso particolare, dove le 3 dimensioni sono uguali (l), l’area della superficie totale del cubo è
data da S=6l2.
Leggermente meno intuitivo il calcolo del volume. Si può dimostrare che:
il volume del parallelepipedo rettangolo si calcola con il prodotto delle sue tre dimensioni:
V =a·b·h

Come caso particolare avremo che il volume del cubo è V=l3.


Se abbiamo un semplice prisma, il volume è uguale alla superficie di base moltiplicata per l’altezza
del prisma.
Le piramidi
Una piramide è un poliedro caratterizzato da una faccia (base) poligonale e da un vertice (apice)
non giacente sul piano della base. Gli spigoli sono i lati del poligono di base e i segmenti delimitati
dall’apice e da ciascuno dei vertici della base. Le facce della piramide sono la base e le facce
triangolari (facce laterali) che hanno come vertice il suo apice.
Una piramide n-gonale ha come base un poligono di n lati (ha n+1 facce, 2n spigoli e n+1 vertici).
L’altezza di una piramide è il segmento che cade ortogonalmente dall’apice sul piano contenente la
base.
Le piramidi si dicono rette se nella base può essere inscritto un cerchio e il piede dell’altezza
risiede nel centro di quel cerchio. Una piramide la cui altezza cade al di fuori del poligono di base è
detta obliqua.
In una piramide retta, l’apotema è ogni segmento che congiunge perpendicolarmente il suo apice
con un suo lato di base. L’apotema di base è il raggio del cerchio inscritto nel poligono di base.
Una piramide è convessa se e solo se il poligono di base è convesso.
Le piramidi più studiate sono quelle che hanno per base un poligono regolare e la cui altezza cade
nel centro di tale poligono. Sono le piramidi regolari o simmetriche. La più comune è quella a
base quadrata; essa viene facilmente definita solo con lato l della base e altezza h, con l’apotema
che si calcola come ipotenusa del triangolo rettangolo che ha come cateti l’altezza e metà del lato l.

Le uniche piramidi che sono anche poliedri regolari sono i tetraedri che hanno base e facce laterali
triangolari e tutte uguali.

Area e volume della piramide


L’area laterale per le piramidi rette è
A=(p·a)/2
dove p è il perimetro della base e a l’apotema.
L’area totale è la somma dell’area di base e dell’area laterale.
Il volume di una piramide generica è uguale a un terzo del prodotto dell’area della base (B) per la
misura dell’altezza (h):

Il volume della piramide è cioè un terzo di quello di un prisma con altezza e base uguali.

Tronco di piramide
Secando una piramide con un piano parallelo alla base, e conservando la parte compresa tra il piano
della base e quello della sezione, si ha un tronco di piramide.

Le facce laterali della piramide tronca sono trapezi. Per il tronco di piramide retto e per quello
regolare, l’apotema è l’altezza dei trapezi che costituiscono la faccia laterale.
L’area delle superfici laterali si calcola come l’usuale area dei trapezi costituenti il tronco. La
formula per il volume è più complessa e l’unica che è utile ricordare a memoria.

I solidi di rotazione
Un solido di rotazione è la figura che si ottiene ruotando attorno a un asse n una regione piana P,
sul cui piano giace l’asse stesso.
Per esempio, il toro è ottenuto dalla rotazione di un cerchio attorno a un asse esterno al cerchio
medesimo.
I solidi di rotazione più studiati sono il cilindro, il cono e la sfera.

Il cilindro
Se consideriamo un rettangolo e lo facciamo ruotare lungo un suo lato otteniamo un cilindro.
Il lato lungo cui ruota il rettangolo risulterà l’altezza del cilindro, mentre l’altro risulterà il raggio
del cerchio che costituisce la base del cilindro.
L’area laterale del cilindro si calcola molto semplicemente considerando che il suo sviluppo non è
che un rettangolo con un lato pari alla circonferenza della base e con l’altro pari all’altezza, quindi:
A=2πr·h.
Ovviamente l’area della superficie totale S si otterrà sommando le aree delle basi a quella laterale,
quindi S=2πr·h+2πr2=2πr·(h+r).
Il volume è uguale all’area di base per l’altezza, quindi

V=πr2·h.

Il cono
Analogamente al cilindro, se consideriamo un triangolo rettangolo e lo facciamo ruotare attorno a
un suo cateto otteniamo un cono. L’altezza h del cono è data dalla lunghezza del cateto attorno a
cui ruota il triangolo.
In questo caso l’ipotenusa rappresenta (analogamente a quanto accadeva per la piramide) l’apotema
del cono.
Detto a l’apotema, l’area della superficie laterale vale
A=πr·a,
mentre quella della superficie totale si ottiene sommando l’area della base, quindi
S=πr·a+πr2=πr·(a+r).
Il volume del cono è uguale a

cioè è un terzo di quello del cilindro che ha stessa base e stessa altezza.

Tronco di cono
Se la rotazione è quella di un trapezio rettangolo attorno al lato adiacente agli angoli retti
otteniamo un tronco di cono.
Come per il cono si ottengono facilmente le aree della superficie laterale e di quella totale:
A=πa·(R+r)

S= π[R2+a·(R+r)+r2]
dove a è l’apotema, R il raggio della base maggiore e r quello della base minore.
Il volume ha una formula più complessa:

Sostanzialmente la formula è uguale a quella del tronco di piramide.


La sfera
La sfera può essere definita come la rotazione di un semicerchio attorno a un suo diametro. Più
usualmente, viene definita come lo spazio racchiuso da una superficie sferica, dove per superficie
sferica s’intende il luogo geometrico dei punti dello spazio equidistanti da un punto fisso detto
centro. Analogamente al cerchio, nella sfera possiamo definire il raggio come il segmento che
unisce un punto della superficie sferica al centro, il diametro come il segmento passante per il
centro che unisce due punti della superficie sferica e la corda come un segmento che unisce due
punti generici della superficie sferica.
Il fuso sferico è la parte di superficie sferica compresa fra due semicerchi aventi lo stesso diametro.
Lo spicchio sferico è la parte di sfera compresa fra due semicerchi aventi lo stesso diametro.
La calotta sferica è ognuna delle due parti in cui una superficie sferica viene divisa da un piano
secante. Se il piano secante passa per un diametro della sfera le due parti si dicono emisferi. Il
volume compreso tra la calotta e il piano secante è detto segmento sferico. La base della calotta è il
cerchio delimitato dalla sfera e dal piano secante. Il raggio passante per il centro della base è un
asse di simmetria per la calotta e incontra la calotta stessa nel vertice; la parte di raggio compresa
tra la base e il vertice è l’altezza della calotta.

Aree e volumi della sfera


L’area della superficie sferica è data da:

A= 4πr2.
Il volume della sfera è invece dato da:
Per quanto riguarda l’area del fuso sferico, basta considerare l’angolo α che ci dà l’ampiezza in
gradi del fuso sferico (angolo diedro formato dai due semicerchi generatori); l’area del fuso è
uguale a quella della superficie sferica moltiplicata per α/360. Analogamente per il volume del fuso
sferico.
Se h è l’altezza della calotta e r il raggio della sfera, l’area della calotta vale A=2πr·h, mentre il
volume è meno intuitivo, ma si può dimostrare che vale:

Curioso il fatto che nella formula non intervenga il raggio della base della calotta.

Geometria analitica
La geometria analitica (cartesiana) è lo studio delle figure geometriche attraverso un opportuno
sistema di coordinate dette cartesiane, in onore di Cartesio. La geometria analitica è il legame fra
geometria descrittiva (basata sul concetto di punto) e algebra (basata sul concetto di numero).
Ogni punto del piano cartesiano è individuato dalle sue coordinate su due assi: ascisse (x) e
ordinate (y); nello spazio le coordinate diventano tre (x,y,z). Gli enti geometrici come rette, curve,
poligoni sono definiti con equazioni, disequazioni o sistemi di equazioni e/o disequazioni.
Le proprietà di questi oggetti (per esempio, il parallelismo o la perpendicolarità), sono anch’esse
tradotte in equazioni e poi studiate con gli strumenti dell’algebra e dell’analisi matematica.

La retta dei reali


L’asse delle x non è che una retta i cui punti sono in corrispondenza biunivoca con i numeri reali.
Lo zero corrisponde al punto d’origine, i numeri negativi sono a sinistra e quelli positivi a destra.
Analogamente l’asse y è una retta perpendicolare all’asse x e passante per l’origine. I punti sopra
l’origine sono associati ai numeri reali positivi mentre quelli sotto ai numeri reali negativi.
Il piano viene perciò diviso in quattro quadranti, definiti primo, secondo ecc. in senso antiorario
con primo quadrante quello che comprende punti con ascissa e ordinata positive.
Un punto A sul piano cartesiano sarà contraddistinto pertanto da due valori (a e b; se i valori non
sono noti si preferisce indicarli con lettere finali dell’alfabeto, per esempio: x e y); nello spazio i
valori saranno tre.
Due punti sulla retta saranno separati da una certa distanza, sempre positiva, che si indica come il
modulo delle differenti coordinate. Per esempio, la distanza fra A (10, 0) e B (12,0) è

cioè 2 (il segmento AB è indicato sopralineandone gli estremi).


La distanza fra due punti generici A(x1, y1) e B(x2, y2) si trova facilmente con il teorema di
Pitagora:

La retta generica
Una qualunque retta che passi per l’origine ha come equazione
y=mx
cioè l’ordinata di un punto che le appartiene che ha ascissa x la si ottiene moltiplicando
l’ascissa per un determinato numero m.
Che significato ha m (coefficiente angolare)? Indica la pendenza della retta. Se, per esempio,
poniamo m=1, avremo la retta i cui punti hanno uguali ascissa e ordinata, cioè quella retta che passa
per l’origine e taglia esattamente in due il primo e il terzo quadrante (bisettrice dell’angolo retto,
quindi un’inclinazione di 45°). Se m=-1, avremo sempre una retta che taglia a metà il secondo e il
quarto quadrante.
Se conosciamo due punti sulla retta si può trovare facilmente m come
m=(y2-y1)/(x2-x1).

Per trovare l’equazione di una retta generica sarà sufficiente prendere l’equazione della retta
passante per l’origine y=mx e spostarla verso l’alto di una quantità q:
y=mx+q;
q è l’ordinata del punto che ha ascissa zero (nell’immagine sottostante tale ordinata ha valore 2,4).
L’espressione y=mx+q è l’equazione della retta; viene detta esplicita perché è la funzione y=f(x)
esplicitata nei confronti di y. Una forma implicita, meno immediata potrebbe essere, per esempio,
az+by+c=0.
Usando queste definizioni è possibile, per esempio, indicare tutte le rette che passano per un punto
(x1, y1). Dalla definizione di m, indicando il secondo punto come incognito (x,y), saranno quelle
con equazione: y-y1=m(x-x1).

Proprietà delle rette


Due rette sono perpendicolari se i loro coefficienti angolari sono opposti e inversi.
L’equazione di una retta perpendicolare a una retta data (y=mx+q) e passante per un punto
assegnato (a,b) è:

La distanza di un punto (a,b) da una retta y=mx+q è data da:


Poiché la distanza è positiva, il segno del denominatore deve essere accordato per ottenere un
numero positivo.

Le coniche
Supponiamo di considerare un cono (che potremmo pensare generato da tutte le rette che
congiungono i punti di una circonferenza con un punto non giacente nel piano della
circonferenza stessa, detto vertice; l’asse del cono è la perpendicolare del vertice sulla
circonferenza; le rette sono dette generatrici) e di tagliarlo con una lama piana. A seconda
dell’angolo di incidenza della lama otterremo diverse figure geometriche.
Una conica è una curva algebrica che si ottiene intersecando la superficie di un cono retto indefinito
con un piano non passante per il vertice; a seconda dell’angolo formato dal piano con l’asse del
cono si hanno l’ellisse, la circonferenza, la parabola e l’iperbole.
• Ellisse: si ottiene intersecando il cono con un piano che con il suo asse forma angoli
compresi fra 0 e 90°; ciascuna di tali intersezioni appartiene a una sola delle due falde del
cono ed è una curva chiusa.
• Circonferenza: caso particolare di ellisse ottenuta dall’intersezione del cono con un piano
perpendicolare al suo asse, è anch’essa curva chiusa.
• Parabola: si ottiene per intersezione del cono con un piano parallelo a una delle sue rette
generatrici (l’angolo formato con l’asse della conica è nullo); ogni parabola appartiene a una
sola delle falde del cono e non è una curva chiusa.
• Iperbole: si ottiene per intersezione del cono con un piano che formi con il suo asse un
angolo inferiore a zero; anche l’iperbole è una curva aperta e, siccome il piano interseca
entrambe le falde del cono, essa si bipartisce in due sottoinsiemi connessi detti rami della
conica.

L’equazione generica di una conica è un’equazione di secondo grado ax2+bxy+cy2+dx+ey+f=0.

L’espressione Δ=b2-4ac consente di capire che tipo di curva è rappresentata dall’equazione.


• se Δ>0 è un’iperbole
• se Δ<0 è un’ellisse (caso particolare la circonferenza)
• se Δ=0 è una parabola.

La circonferenza
Si definisce circonferenza l’insieme dei punti del piano che hanno la stessa distanza da un
punto fisso detto centro.
Se C(x0,y0) è il centro e r è il raggio, l’equazione sarà:

(x-x0) 2+(y-y0)2=r2.

Generalizzando, l’equazione generale di una circonferenza è:

x2+y2+ax+by+c=0.
Confrontandola con quella generale di una conica, si può dire che una conica è una circonferenza
se:

• i termini di secondo grado x2 e y2 hanno lo stesso coefficiente;


• il termine rettangolare (bxy) non c’è;
• il raggio deve essere un numero reale.
Data l’equazione generale, si può dedurre che il centro è nel punto C(a/2, b/2) mentre il raggio si
può calcolare come:

Se, per esempio, si vuole calcolare il punto d’intersezione di una retta con una circonferenza, basta
risolvere il sistema costituito dalle equazioni delle due curve. Per esempio:

Risolvendo il sistema si ottiene che i due punti di intersezione hanno coordinate


approssimativamente (3,64, -4,14) e (0,86, -1,36).
La geometria analitica permette di esprimere domande specifiche in forma di equazioni e/o sistemi.
Per esempio, se voglio sapere se un punto appartiene a una circonferenza mi basta sostituire le
coordinate del punto nell’equazione della circonferenza e verificare che sia soddisfatta.
Analogamente, se voglio trovare i punti di intersezione di due circonferenze, mi basta risolvere il
sistema costituito dalle due equazioni delle circonferenze.

L'ellisse
Definita l’ellisse come sezione conica, si può dimostrare che essa è
il luogo geometrico dei punti del piano per cui è costante la somma delle distanze da due punti fissi
detti fuochi.
Nella figura seguente per tutti i punti A della figura vale:
Per calcolare la somma basta spostare il punto X sull’asse orizzontale, notando che la somma è
uguale alla distanza fra i due punti dell’ellisse che tagliano l’asse delle x (asse orizzontale). Detta 2a
questa distanza, avremo per tutte le ellissi:

con a semiasse orizzontale.


L’equazione generale di un’ellissi con i fuochi in F1(c,0) e F2 (-c,0), cioè centrata attorno all’origine
e asse orizzontale uguale ad a è:

x2/a2+y2/b2=1, dove b2=a2-c2.


Il rapporto c/a è detto eccentricità dell’ellisse e fornisce lo schiacciamento dell’ellisse; nella
circonferenza l’eccentricità vale zero perché i due fuochi coincidono con il centro della
circonferenza.

L'iperbole
Analogamente all’ellisse, l’iperbole è definita come
il luogo geometrico dei punti del piano per cui è costante la differenza delle distanze da due punti
fissi detti fuochi.
L’equazione canonica (regolare) dell’iperbole è analoga a quella dell’ellisse solo che invece del
segno + ha il segno – (anche b è definito in modo opposto all’ellisse):

x2/a2-y2/b2=1, dove b2=c2-a2.


Un’interessante proprietà dell’iperbole è che nella forma canonica è una curva simmetrica rispetto
all’origine, tutta compresa fra gli asintoti y=bx/a e y=-bx/a.
Anche per l’iperbole viene definita l’eccentricità e=c/a ed essa indica il ventaglio, l’apertura dei
rami dell’iperbole.

La parabola
La parabola è il luogo geometrico dei punti del piano per cui è uguale la distanza da un punto
fisso F (fuoco) e da una retta fissa (direttrice).
L’equazione della parabola con asse verticale e vertice nell’origine è:

y=ax2
dove le coordinate del fuoco sono (0, 1/4a).
Se a è maggiore di zero la parabola ha concavità rivolta verso l’alto, altrimenti verso il basso.
Più in generale una parabola con asse verticale avrà equazione

y=ax2+bx+c.

Goniometria e trigonometria
La goniometria è la scienza della misura degli angoli.
Supponiamo di avere una circonferenza e di voler esprimere la posizione di un suo punto
utilizzando un solo parametro. Se la circonferenza ha il centro nell’origine di un piano di assi
cartesiani, per definire la posizione di P si può semplicemente considerare l’angolo compreso fra il
raggio che raggiunge P e l’asse delle x.
Gli angoli sulla circonferenza si possono misurare in gradi (e un’intera circonferenza nel
sistema sessagesimale corrisponde a 360°) oppure in radianti. Il radiante è l’unità di misura
dell’ampiezza degli angoli del Sistema Internazionale di unità di misura. La misura
rappresenta il rapporto tra la lunghezza dell’arco di circonferenza tracciato dall’angolo e la
lunghezza del raggio di tale circonferenza; quindi, la misura è un numero puro. La misura
dell’intera circonferenza in radianti sarà 2π, poiché dalla geometria si sa che se il raggio è r, la
circonferenza misura 2πr (π=3,14…, cioè la circonferenza misura circa 6,28 volte il raggio).
Se la circonferenza corrisponde a 360°, la posizione di un punto P corrisponderà, per esempio,
all’angolo di 50°; analogamente si può misurare un arco sulla circonferenza, per esempio quello fra
P e Q, tenendo conto che l’intera circonferenza dalla geometria si sa misurare 2πr dove r è il raggio
del cerchio.
Per semplicità si può assumere r=1 (circonferenza trigonometrica). Così nella circonferenza
trigonometrica l’angolo di 90° (angolo retto) corrisponderà a un quarto di arco, cioè a 2π/4=π/2.
Ovviamente il punto P si può anche descrivere con le sue coordinate cartesiane x e y.
Che relazioni esistono fra x, y e l’angolo α che individua P nella circonferenza trigonometrica?

Le principali funzioni trigonometriche


Il seno di α (sinα) è la coordinata y. Cioè sinα=PH.
Il coseno di α (cosα) è la coordinata x. Cioè cosα=OH.
Pertanto il seno di 90° è 1, mentre il coseno è 0; analogamente il seno di 0° è 0 mentre il coseno è 1.
I valori di seno e coseno possono anche essere negativi; muovendosi in senso antiorario sulla
circonferenza trigonometrica si vede che sin(270°) è -1 e il cos(180°) è -1. Quindi i valori di seno e
coseno variano fra -1 e 1.
La funzione y=sinx può ripetersi oltre 2π nel caso in cui sulla circonferenza si compiano più giri;
per esempio, un angolo di 450° significa un giro (360°)+90°; quindi sin(450°)=sin(90°), la funzione
ha periodo 2π, cioè 360°: i valori del seno per angoli che differiscono di 360° sono uguali.
La funzione y=sinx ha pertanto il seguente andamento:
La funzione y=cosx (anch’essa con periodo 2π) ha il seguente andamento:

La tangente di α (tanα) viene definita come rapporto del segmento di tangente PA alla
circonferenza intercettato dal prolungamento del raggio OP e dall’asse delle ascisse.
Si noti che in un piano cartesiano il coefficiente angolare m di una retta y=mx+q è tale che
m=tan(α).
Si possono definire anche gli inversi delle funzioni appena definite: la secante è l’inverso del
coseno, la cosecante è l’inverso del seno e la cotangente è l’inverso della tangente.
secα=1/cosα; cscα=1/senα; cotα=1/tanα.
Si definiscono equazioni trigonometriche quelle equazioni in cui l’incognita è l’angolo.  Per
esempio:
sinx=2.
La loro soluzione passa attraverso metodi propri della goniometria che si avvalgono di procedimenti
basati sulle proprietà delle funzioni trigonometriche.

Relazioni fra funzioni trigonometriche -


Albanesi.it
Si possono dimostrare le relazioni fondamentali:
• tanα=sinα/cosα
• sin2α+cos2α=1
• sin(90°-α)=cosα
• cos(90°-α)=sinα
• tan(90°-α)=cotα
• cot(90°-α)=tanα.
Alcuni angoli hanno valori particolari che è facile memorizzare; per esempio:
Valgono le seguenti relazioni:
• cos(α+β)=cosα·cos-sinαsinβ
• cos(α-β )=cosα·cosβ+sinαsinβ
• sin(α+β)=sinα·cosβ+cosαsinβ
• sin(α-β)=sinα·cosβ-cosαsinβ
Come caso particolare si può facilmente calcolare il seno o il coseno di un angolo doppio di quello
dato (in questo caso β=α); analogamente, usando le formule sopraesposte si può trovare la tan(α+β).

La trigonometria
La trigonometria studia i triangoli a partire dai loro angoli.
Suo compito è il calcolo delle misure di alcuni elementi del triangolo conoscendo misure di altri
elementi. Questo compito è detto risoluzione del triangolo.
L’importanza della materia deriva dal fatto che le funzioni trigonometriche trovano poi
applicazione in altri campi della matematica.

Il triangolo rettangolo
Dalla geometria si sa che nel triangolo rettangolo l’angolo formato da due lati, detti cateti,
è retto, ovvero di 90° (o π/2 radianti). Il lato opposto all’angolo retto si chiama ipotenusa. Per
il teorema di Pitagora l’ipotenusa è uguale alla radice quadrata della somma dei quadrati dei
cateti.
Per collegarsi alla goniometria è possibile rappresentare un triangolo rettangolo come inscritto in
una semicirconferenza (tale triangolo è sempre rettangolo). Detti:
a, b e c le lunghezze dei lati (c è l’ipotenusa)
• α, β, γ i lati opposti a tali lati (α è il lato opposto al lato di lunghezza a)
• A, B, C i tre vertici relativi ai tre angoli (A è il vertice corrispondente ad α)
dalla definizione delle funzioni trigonometriche (facendo riferimento alla circonferenza
trigonometrica, PH=OP·sinα), sappiamo che:
• a=csinα; cioè un cateto è uguale al prodotto dell’ipotenusa per il seno dell’angolo opposto al
cateto considerato;
• a=ccosβ; cioè un cateto è uguale al prodotto dell’ipotenusa per il coseno dell’angolo
adiacente al cateto considerato;
• b=atanβ; cioè un cateto è uguale al prodotto dell’altro cateto per la tangente dell’angolo
opposto al cateto considerato.
Teoremi validi per un triangolo qualunque
Per risolvere un triangolo qualunque vengono in aiuto alcuni teoremi fondamentali.
Il teorema dei seni (noto anche come teorema di Eulero) esprime una relazione di proporzionalità
diretta fra le lunghezze dei lati di un triangolo e i seni dei rispettivi angoli opposti:
a/sinα=b/sinβ=c/sinγ=(a·b·c)/2S=2r
dove S è l’area del triangolo (che si può calcolare con la formula di Erone a partire dalle lunghezze
dei lati) e r è il raggio del cerchio circoscritto.
Il teorema delle proiezioni afferma che in ogni triangolo un lato è uguale alla somma dei prodotti
degli altri due lati per il coseno degli angoli compresi fra quei lati e il lato cercato. Per esempio,
a=b·cosγ+c·cosβ.
Infine, il teorema di Carnot afferma che in ogni triangolo il quadrato di un lato è uguale alla
somma dei quadrati degli altri due lati meno il doppio prodotto degli stessi lati per il coseno
dell’angolo fra essi compreso. Per esempio: a2=b2+c2-2b·c·cosα.
La trigonometria ha molte applicazioni pratiche. Per esempio è possibile calcolare la distanza fra la
Terra e una stella (si veda Le stelle).

Analisi
L’analisi matematica è un ramo della matematica, sviluppato sulla base dei concetti del calcolo
infinitesimale, che consente di studiare le proprietà che emergono dalla scomposizione infinita di un
oggetto denso.

Intervallo e intorno
Un intervallo è un sottoinsieme dei numeri reali formato da tutti i punti della retta reale che
sono compresi tra due estremi a e b. Gli estremi possono (ma non necessariamente)
appartenere all’intervallo; in questo caso l’intervallo si dice chiuso (I[a,b]), altrimenti si dice
aperto ((I]a,b[). Nella scrittura che indica l’intervallo si noti il diverso posto delle parentesi,
mischiando le quali si può avere un intervallo chiuso a destra (e aperto a sinistra) o un
intervallo chiuso a sinistra (e aperto a destra).
Un intervallo è un intorno chiuso di tutti i punti contenuti al suo interno. Si considerino, per
esempio, i punti 1, 3, 5 sulla retta reale. L’intervallo [1,5] è un intorno del punto 3, è un intervallo
destro di 1 e sinistro di 5.
Un concetto molto importante in analisi è quello di punto d’accumulazione: un punto
d’accumulazione di un insieme di punti contiene sempre in un qualunque suo intorno almeno
un punto dell’insieme diverso da esso.
Il concetto di punto d’accumulazione diventa chiaro se si considera, per esempio, una successione
del tipo 1, 1/2, 1/4 ecc. dove ogni elemento si ottiene dividendo per 2 il precedente. Se si procede
verso lo zero, per come è stata costruita la successione, attorno allo zero ci saranno infiniti punti per
quanto si prenda piccolo l’intervallo intorno allo zero. Gli elementi della successione “si
accumulano” attorno allo zero.

Le funzioni
La funzione è un legame fra due variabili x e y tali che a un valore della variabile x
corrisponda un solo valore della y. Esistono funzioni empiriche, per esempio giorno del mese e
temperatura massima, e funzioni matematiche, che cioè usano operazioni matematiche per
passare dal valore della x a quello della y; a seconda del tipo di operazioni utilizzate possono
essere funzioni algebriche (sono quelle che usano le operazioni algebriche) oppure
trascendenti (sono quelle logaritmiche, esponenziali, trigonometriche).
Una funzione matematica si indica con un’espressione del tipo y=f(x). Per esempio, y=log(x+1) è
una funzione trascendente.
Il campo di esistenza di una funzione è l’insieme dei valori che può assumere la variabile
indipendente x. Per tutte le funzioni, tranne quelle fratte, quelle logaritmiche e quelle irrazionali, il
campo di esistenza è tutto l’asse x.
Per le funzioni fratte non sono ammessi i valori della variabile x che portano a una divisione per
zero nel calcolo della variabile y.
Per le funzioni irrazionali (quelle in cui la x compare sotto il segno di radice), poiché la radice è
definita solo per valori non negativi del radicando, il campo di esistenza esclude appunto quei valori
che rendono il radicando negativo.
Analogamente, per le funzioni logaritmiche il campo di esistenza è definito da quei valori che
rendono positivo l’argomento.
Per esempio, per la funzione y=log(x+7) il campo di esistenza è costituito da tutti i reali della retta
con x>-7.

Il limite
Il limite di una funzione in un punto di accumulazione x0 per il suo dominio esprime la
quantità a cui tende il valore assunto dalla funzione all’avvicinarsi del suo argomento a x0.
Indicando con f(x) la funzione, il limite viene indicato con la notazione:

In altri termini, dire che il limite è l significa che quando il valore di x si avvicina a x0 (la notazione
è x→x0), il valore assunto dalla funzione si avvicina a l. Da notare che l può essere finito, infinito o
non esistere.
Tutto ciò sembra molto astratto, ma è necessario per descrivere casi particolari. Per esempio, per
una banale funzione del tipo y=x+5, è intuitivo capire che, se x si avvicina a 3, y si avvicinerà a 8.
La definizione classica di limite esprime proprio questo concetto di avvicinamento.
Si dice che la funzione y=f(x) ammette limite finito l per x tendente a x0, se per ogni numero
positivo ε piccolo a piacere esiste un numero δε tale che da

|f(x)-l|<ε segua |x-x0 |<δε.

Limite di una successione


Il limite di una successione è il valore a cui tendono i termini di una successione.
Formalmente, un numero reale l è il limite di una successione di numeri reali a1, a2, …, an se
la distanza fra i numeri an-l, data dal valore assoluto |an-l|, è arbitrariamente piccola quando
n è sufficientemente grande, cioè
limn→∞an=1

e si dice che la successione converge a l; la successione è detta convergente se il limite è finito,


altrimenti è detta divergente.
Se l=0, la successione è detta infinitesima.
Anche per le successioni valgono i teoremi già visti per i limiti (unicità e permanenza del segno).

Il concetto di limite e il concetto di infinito


Nello studio delle funzioni possiamo trovare il concetto di infinito in varie circostanze. Per
comprenderle è opportuno riferirsi al piano cartesiano.
1. Può esserci una curva che per un certo valore della x nel piano cartesiano tende all’infinito.
2. Può esserci una curva che tende a un limite finito l per x che tende all’infinito (cioè
spostandosi sempre più a destra sulle ascisse)
3. Infine può esserci una curva che tende all’infinito per x che tende all’infinito.
In questa immagine

siamo nel primo caso, la curva tende all’infinito per x=-0,4.


In quest’altra immagine siamo nel secondo caso
la curva tende a 0 per x→∞.

Teoremi e operazioni sui limiti


Si possono dimostrare importanti teoremi sui limiti. Fra questi:
• teorema dell’unicità del limite – Se esiste, il limite di una funzione in un punto è unico.
• Teorema della permanenza del segno – Se una funzione ha limite non nullo, esiste tutto un
intervallo dove la funzione ha lo stesso segno del suo limite.

Operazioni sui limiti


In modo molto semplice si scopre che per somma, differenza, prodotto e quoziente, il limite
dell’operazione è uguale all’operazione sui limiti, cioè, per esempio, il limite di un prodotto di
funzioni è uguale al prodotto dei limiti (per il quoziente il limite della funzione al
denominatore non deve essere nullo).

Limiti particolari
Esistono funzioni molto particolari. Per esempio, il
limn→∞ sinx/x=1

cioè, il limite è il numero di Nepero.

Le funzioni continue
Intuitivamente, una funzione è continua in un punto quando in quel punto coincide con il suo
limite.
Il termine “continua” vuole proprio esprimere il fatto che il grafico della funzione non si spezza nel
punto considerato. Ovviamente la funzione non è continua se tale grafico si spezza.
Per esempio, una funzione che in un punto tende all’infinito non è continua. Nell’immagine
sottostante un esempio di funzioni non continue (si noti che un caso concreto è praticamente
quello già accennato dei valori che tendono all’infinito; nell’immagine la funzione a destra, la
verticale passante per il punto di ascissa 8, è un asintoto cioè una retta che si avvicina alla
funzione senza mai toccarla, l’asintoto è la tangente all’infinito della funzione):

La derivata
Il concetto di limite ci permette di capire cosa capita alla funzione in un punto. Per riferirci a
un caso concreto, fissiamo le idee su un grafico che tutti conoscono, per esempio il valore di un
indice di borsa, il valore di un’azione. Anche chi non è particolarmente ferrato in matematica
ormai sa che se il grafico sale, l’azione sta guadagnando, se scende, l’azione sta perdendo.
Se però si conosce solo il valore in un punto (per esempio, l’azione vale 1,20 euro), cosa si può dire
sulla decisione di aver acquistato o no quell’azione? Nulla. Sarebbe interessante capire anche se
l’azione è salita nell’ultimo periodo. Il caso migliore sarebbe addirittura se fosse possibile prevedere
l’andamento futuro del grafico.
L’esempio mostra che non è particolarmente interessante conoscere il valore in un punto, ma che
sarebbe interessante conoscere l’andamento della funzione in quel punto. Ci viene in aiuto il
concetto di derivata.
Per capire cosa sia una derivata, consideriamo la rappresentazione grafica di una funzione, per
esempio l’incremento dei valori della nostra azione nel tempo. Il grafico sarà una curva che va su
(l’azione vale di più, l’investitore ci guadagna) e giù (l’azione vale di meno, l’investitore ci perde).
Possiamo dire, per esempio, che in un anno l’azione ha perso il 20% del suo valore; all’inizio del
periodo considerato valeva 1 euro, alla fine vale 0,80 euro.
Più riduciamo il periodo considerato, più tendiamo a chiederci quale sia l’andamento dell’azione nel
breve, brevissimo periodo. L’azione tende a salire o a scendere? Se il periodo tende a zero, avremo
un’indicazione “istantanea” di cosa sta facendo l’azione.
La derivata è appunto il limite del rapporto (detto incrementale) fra la differenza dei valori assunti
dall’azione in un intervallo di tempo quando questo intervallo tende a zero.
La derivata sarà positiva se l’azione sale, negativa se l’azione scende. In un certo punto, quindi, la
“pendenza” della curva dà il segno della derivata. Se la curva sale, la derivata è positiva, se scende,
è negativa.
Formalmente, definiamo rapporto incrementale di una funzione f(x) nel punto x0 il rapporto

Si definisce derivata di una funzione in un punto x0 il limite (se esiste ed è finito) del rapporto
incrementale al tendere a zero dell’incremento h.
La derivata di una funzione in genere si indica con un apostrofo diritto: f'(x) è la derivata di f(x); y’
è la derivata della funzione y=f(x) ecc.

Significati pratici della derivata


La derivata in un punto indica la pendenza che la funzione ha in quel punto. In particolare,
data una curva, se noi tracciamo la retta tangente a essa in un punto, la derivata della curva
nel punto considerato è uguale al coefficiente angolare della retta tangente alla funzione in
quel punto.
Se, invece del valore di un’azione nel tempo, consideriamo lo spazio percorso da un’automobile, il
nostro grafico sarà una funzione crescente nel tempo (il tempo è indicato sull’asse delle ascisse e lo
spazio percorso su quello delle ordinate). La derivata di questa curva (cioè dello spazio rispetto al
tempo) non è che la velocità istantanea dell’automobile, cioè lo spazio percorso nell’intervallo di
tempo quando questo intervallo tende a zero.
Analogamente, la derivata della velocità rispetto al tempo è l’accelerazione: più la velocità
aumenta nell’intervallo infinitesimo di tempo, più significa che l’accelerazione della macchina è
aumentata.
Nell’immagine soprastante l’automobile ha una velocità molto bassa fra a e b, mentre la sua
velocità aumenta fra b e c.

Le operazioni sulle derivate


Le operazioni sulle derivate si possono implementare a partire dalla definizione (calcolando
cioè il limite del rapporto incrementale), ma è molto più facile partire dalla conoscenza di
derivate di funzioni molto comuni e poi applicare alcune regole riguardanti le operazioni
fondamentali come somma, prodotto ecc. Se, per esempio, devo calcolare la derivata della
funzione y=x2·sinx, mi basta conoscere la derivata di x2, quella di sinx e la regola della
derivata del prodotto di due funzioni.
Ecco alcune derivate molto comuni:
y=costante y’=0
• y=x y’=1
• y=xn y’=nxn-1
• y=sinx y’=cosx
• y=cosx y’=-sinx
• y=tanx y’=1/cos2x o y’=1+tan2x
• y=ex y’=ex
• y=ax y’=axloga
• y=logx y’=1/x.
La derivata di una somma (o differenza) di funzioni è la somma (differenza) delle derivate delle
singole funzioni.
Prodotto – Se y=f(x)·g(x) allora y’=f'(x)·g(x)+f(x)·g'(x).
Quoziente – Se y=f(x)/g(x) allora
Funzione di funzione – Se y=f(g(x)) allora y’=f'(g(x))·g'(x).

Per calcolare quindi la derivata di y=x2·sinx, usando la formula che dà la derivata del prodotto,
avremo y’=2xsinx+x2cosx.

Le derivate successive
Abbiamo visto che la velocità è la derivata dello spazio rispetto al tempo e che l’accelerazione
è la derivata della velocità rispetto al tempo. In altri termini, se s=f(t) è la rappresentazione
dello spazio, la derivata s’ rappresenterà la velocità rispetto al tempo; se derivo ulteriormente
tale curva ottengo il grafico dell’accelerazione. Possiamo dire che l’accelerazione è la derivata
seconda dello spazio rispetto al tempo (abbiamo derivato due volte).

La derivata seconda si può indicare con due apici. Per esempio, qual è la derivata seconda di y=4x3?

Da quanto conosciamo sulle derivate comuni, la derivata prima è y’=12x2, derivando ancora, trovo
y”=24x.

Le derivate parziali
Se ho una funzione di due variabili, z=f(x,y), posso considerane una costante e fare la derivata
sull’altra. Tale procedimento è molto utile in fisica quando si considera costante una variabile
di un fenomeno che dipende da due variabili.

La derivata parziale si indica con il simbolo ∂: per esempio, se z=2x2+4y, la derivata parziale
rispetto a x è:
∂z/∂x=4x+y.
Si noti che il simbolo della derivata parziale è la lettera d minuscola cirillica in corsivo.

Lo studio della funzione


Grazie ai concetti di limiti e di derivata possiamo conoscere una funzione in un punto e
nell’intorno di esso; estendendo la ricerca vediamo di scoprire altre informazioni sulla
funzione.
Sappiamo già che, se in un intervallo la derivata è positiva (negativa), allora nell’intervallo la
funzione sarà crescente (decrescente).
Se facciamo sempre mente locale al grafico della funzione, essa avrà un massimo quando,
dopo essere salita, comincerà a discendere; in altri termini, cambierà quindi la sua pendenza
quando la derivata passerà da positiva a negativa, passando per un valore nullo.
Formalmente, se la funzione è continua e derivabile in un intorno completo di x0 allora la tangente
in x0 sarà orizzontale, la derivata avrà valore nullo.

Stessa cosa succederà in un punto di minimo, anche in questo caso la derivata avrà valore nullo.
Esiste un terzo caso in cui la derivata vale zero, cioè nei punti di flesso, dove la curva cambia
concavità e la tangente attraversa la curva.

Per sapere se in un punto dove la


derivata prima è nulla devo studiare il segno della derivata nell’intorno del punto. Se, per esempio,
la derivata è nulla per x=5 e per x>5 la derivata è positiva cioè la funzione cresce, mentre è negativa
per x<5, vorrà dire che 5 è un punto di minimo. Analogamente per i punti di massimo.
Nei punti di flesso troverò che la derivata è positiva sia prima sia dopo il punto 5, per esempio
perché la derivata è rappresentata da un quadrato che è sempre positivo (y’=4x2).
Un altro metodo per studiare massimi, minimi e flessi è di analizzare le derivate successive. Nei
punti in cui la derivata prima è nulla, se la prima derivata diversa da zero è di ordine pari ed è
positiva, avremo un minimo, se è negativa, avremo un massimo; se la prima derivata diversa da
zero è di ordine dispari ed è positiva, avremo un flesso ascendente, se è negativa, avremo un flesso
discendente.

L'integrale
Il concetto di integrale è fondamentale per risolvere il calcolo delle aree. Si supponga di dover
determinare l’area sottesa da una certa curva, per esempio l’area della parabola per valori
positivi delle y, cioè l’area contenuta nel primo quadrante.
L’area si potrebbe calcolare sommando tutti i rettangoli elementari che si costruiscono
all’interno della parabola. Più la base dei rettangoli diventa piccola e più il calcolo dell’area
della parabola diventa preciso.
Si definisce l’integrale come il limite della sommatoria dell’area dei rettangoli interni quando si
suddivide il segmento di base in infiniti intervalli. Formalmente:

L’integrale si indica con:

dx rappresenta l’infinitesima base del rettangolo.


Un importantissimo teorema afferma che
la derivata della funzione integrale è uguale alla funzione di partenza.
Cioè, l’integrale è l’operazione inversa della derivata. In tal senso si parla di integrale indefinito,
cioè a prescindere dall’intervallo in cui si calcola, ma semplicemente come operazione su una
funzione.
Nell’analogia fisica, se si considera il grafico della velocità rispetto al tempo, l’integrale della curva
rappresenterà lo spazio percorso dal mobile. Se la velocità è costante (cioè il grafico è una parallela
all’asse delle ascisse), l’area del rettangolo sarà proprio s=v·t, dove t rappresenta il tempo in cui
calcoliamo lo spazio percorso e v è l’ordinata del nostro grafico.
Quindi, se derivo lo spazio rispetto al tempo ottengo la velocità e se integro la velocità rispetto al
tempo ottengo lo spazio percorso.
Tenendo conto dell’inversione dell’operazione otteniamo subito gli integrali più comuni. Per
esempio:

Si noti che si aggiunge una costante c perché, se si derivano entrambi i membri, la costante
scompare (la derivata di una costante è zero). Quindi l’integrale indefinito è specificato a meno di
una costante. Per esempio, rovesciando quanto abbiamo indicato per le derivate più comuni
troviamo:

Le equazioni differenziali
Si definisce equazione differenziale ordinaria di ordine n un’equazione che abbia come
incognita una funzione y(x) e che leghi fra loro la variabile x, la funzione y(x) e le prime n
derivate della funzione y:

F(x, y(x), y'(x), y”(x), ….., yn(x))=0.


L’ordine è dato dall’ordine più alto delle derivate che sono coinvolte.

Teoria degli insiemi e algebra astratta


Un insieme è una collezione di oggetti nella quale esiste un criterio oggettivo che consente di
decidere univocamente se un qualunque oggetto fa parte o no della collezione.
Gli oggetti che compongono l’insieme sono detti elementi dell’insieme; se a è un elemento
dell’insieme A, si dice che a appartiene ad A e si scrive a∈A.
Un insieme può essere definito per elencazione, indicando tutti gli elementi racchiusi da parentesi
graffe, per esempio: A={cane, gatto, cavallo}; eventualmente, se gli elementi dell’insieme sono
infiniti e sia evidente il criterio di appartenenza all’insieme, si possono elencare solo i primi e poi
usare i puntini di sospensione; per esempio, per indicare l’insieme dei quadrati si scriverà A={1, 4,
9, 16, …}.
Un insieme si può definire anche per proprietà caratteristica, cioè come gli insiemi degli oggetti
che godono di una certa proprietà; per esempio, A={x|x è una specie animale} indica l’insieme delle
specie animali.
Il numero degli elementi di un insieme è detto cardinalità; un insieme può essere finito o infinito a
seconda che il numero dei suoi elementi sia finito o no.
Due insiemi A e B si dicono coincidenti se e solo se hanno gli stessi elementi (sono lo stesso
insieme); si dicono disgiunti, se non hanno nessun elemento in comune.
Un insieme B è sottoinsieme di un altro insieme A quando tutti gli elementi di B appartengono
anche ad A.
B⊆A; B è sottoinsieme di A;
B⊂A; B è sottoinsieme di A, ma non coincide con a (sottoinsieme proprio).
L’insieme vuoto è l’insieme che non contiene nessun elemento. Si indica con il simbolo ∅ o con due
parentesi graffe che non contengono nulla:{}.
L’insieme vuoto è sottoinsieme di qualsiasi altro insieme (incluso sé stesso).
L’insieme universo è l’insieme che contiene tutti gli elementi e tutti gli insiemi esistenti, compreso
quindi anche sé stesso e anche l’insieme vuoto.

Le operazioni sugli insiemi


Vediamo le principali operazioni tra insiemi.
L’unione di due insiemi A e B (A∪B) è l’insieme formato da tutti gli elementi di A e da tutti quelli
di B, presi una sola volta.
L’intersezione di due insiemi A e B (A∩B) è l’insieme formato da tutti gli elementi che
appartengono sia all’insieme A che all’insieme B contemporaneamente.
La differenza tra A e B è (A\B) è l’insieme degli elementi del primo insieme che non appartengono
al secondo insieme. In particolare, se B è sottoinsieme di A, la differenza è detta il complementare
di B rispetto ad A e si indica con AC. Tale complemento è relativo; si può definire anche il
complemento assoluto, come il complemento relativo rispetto all’insieme universo.
La differenza simmetrica tra due insiemi A e B è l’insieme degli elementi che appartengono ad A e
non a B oppure che appartengono a B e non ad A. Si indica con AΔB.
Il prodotto cartesiano di due insiemi A e B (AxB) è l’insieme di tutte le possibili coppie ordinate
(a,b) con a∈A e b∈B.
Sia, per esempio, A={1, 2, 7, 9, 15} e B={1, 2, 14, 23}:
• l’unione sarà l’insieme U={1, 2, 7, 9, 14, 15, 23}
• l’intersezione sarà l’insieme I={1, 2}
• la differenza sarà l’insieme D={7, 9, 15}
• la differenza simmetrica sarà l’insieme S={7 , 9, 14 ,15, 23}.
Si noti che U=D∪I.

Le relazioni
Definiamo relazione R fra due insiemi A e B un qualunque sottoinsieme del prodotto
cartesiano AxB; in genere la relazione R è associata a una proprietà che associa a qualche
elemento di A qualche elemento di B. Ovviamente A e B possono coincidere.
La relazione R su AxA è riflessiva se per ogni elemento a∈A vale aRa. Per esempio, se A è
l’insieme degli iscritti a matematica e la relazione è “faccio la stessa facoltà”, poiché ogni iscritto a
matematica fa la stessa facoltà di sé stesso, la relazione è riflessiva.
La relazione R su AxA è simmetrica se ogni volta che si ha aRb si ha anche bRa. Per esempio, se
Carlo fa la stessa facoltà di Luigi anche Luigi fa la stessa facoltà di Carlo.
La relazione R su AxA è transitiva se ogni volta che si ha aRb e bRc allora segue che aRc. Per
esempio, se Carlo fa la stessa facoltà di Luigi e Luigi fa la stessa facoltà di Roberto allora Carlo fa
la stessa facoltà di Roberto.
La relazione R su AxA è di equivalenza se è contemporaneamente riflessiva, simmetrica e
transitiva.
Le funzioni
Una funzione (applicazione univoca; nella teoria degli insiemi le funzioni vengono spesso dette
applicazioni) è una relazione tra due insiemi, chiamati dominio e codominio della funzione,
che associa a ogni elemento del dominio uno e un solo elemento del codominio.
Se f è l’applicazione da X a Y (X e Y sono dominio e codominio), si scrive f:X→Y.
Il concetto di codominio non è sempre descritto come insieme d’arrivo della funzione; alcuni
preferiscono definirlo solo come i valori che la funzione assume nell’insieme d’arrivo, non essendo
detto che l’applicazione da X a Y esaurisca tutti gli elementi di Y.
In realtà, l’insieme di arrivo della funzione è definito più correttamente come immagine della
funzione.
Si possono definire interessanti funzioni.
Funzione iniettiva (iniezione) – È una funzione che associa elementi distinti del codominio a
elementi distinti del dominio. Un esempio di funzione iniettiva è quella che associa i naturali ai
propri quadrati. Ovviamente se la cardinalità del dominio è superiore a quella del codominio (in
parole semplici, i suoi elementi sono più numerosi di quelli del codominio), la funzione non può
essere iniettiva.
Funzione suriettiva (suriezione) – È tale quando ogni elemento del codominio è immagine di
almeno un elemento del dominio. In tal caso si ha che l’immagine coincide con il codominio. Per
esempio, la funzione f:R→R definita come f(x)=2x è suriettiva perché per ogni numero reale y si ha
f(x)=y dove x=vale y/2.
Corrispondenza biunivoca (funzione biiettiva o biiezione) – Si ha una corrispondenza biunivoca
quando la funzione è contemporaneamente iniettiva e suriettiva. Quindi, a ogni elemento di X
corrisponde uno e un solo elemento di Y e, viceversa, a ogni elemento di Y corrisponde uno e un
solo elemento di X.
Un esempio pratico di corrispondenza biunivoca si ha fra l’insieme dei nomi dei giocatori in campo
di una squadra di calcio e l’insieme dei numeri delle loro maglie (in campo non possono esserci
giocatori con lo stesso numero e ogni giocatore deve avere un numero).
Funzione composta – Se f è una funzione da X a Y e se g lo è da Y a Z, allora, se si considera la
funzione da X a Z che fa corrispondere all’elemento di X l’elemento di Z ottenuto applicando prima
x (per passare da X a Y) e poi g (per passare da Y a Z), si ottiene la funzione composta f(g(x).
Funzione inversa – Considerata la funzione f da X a Y, si definisce inversa di f la funzione g da Y a
X tale che g(f(x))=x per ogni valore di x e f(g(y))=y per ogni valore di y. Affinché g esista, cioè f sia
invertibile, è necessario che f sia biunivoca.
Le strutture algebriche
Una struttura algebrica è un insieme S (insieme sostegno della struttura), munito di una o più
operazioni (nullarie, unarie o binarie) caratterizzate dal poter avere proprietà quali
commutatività, associatività e distributività.
Dato un insieme di enti A, diremo che un’operazione è di composizione interna se, presi
comunque due elementi di A, a e b, esiste l’elemento c appartenente ad A tale che vale
a⋇b=c.
Si può passare quindi a definire l’elemento neutro e l’elemento simmetrico.
n appartenente ad A è l’elemento neutro rispetto all’operazione ⋇ se per qualunque elemento a di A
vale a⋇n=n⋇a=a.
a’ appartenente ad A è l’elemento simmetrico rispetto all’elemento a di A se vale a⋇a’=a’⋇a=n.
Considerato l’insieme dei numeri razionali e l’operazione di prodotto, 1 è l’elemento neutro e il
reciproco di un numero è il suo simmetrico.

I semigruppi
Un semigruppo è un insieme S su cui sia definita un’operazione interna associativa tale che
per ogni elemento a, b, c di S vale (a⋇b)⋇c=a*(b*c).
Se l’operazione è anche commutativa (a*b=b*a per ogni coppia a e b) il semigruppo si dice
commutativo o abeliano; se è dotato di elemento neutro si chiama monoide.
Esempio: l’insieme dei numeri interi positivi munito dell’addizione.

I gruppi
Un gruppo è un insieme G munito di una operazione binaria * che a ogni coppia di elementi a e b
di G associa un elemento appartenente a G tale che valgano:
• proprietà associativa: dati a, b, c appartenenti a G vale (a*b)*c=a*(b*c);
• esistenza dell’elemento neutro: esiste in G un elemento neutro n rispetto all’operazione *,
cioè tale che a*n=n*a=a per ogni a appartenente a G;
• esistenza dell’inverso: a ogni elemento a di G è associato un elemento a’, detto inverso di a,
tale che a*a’=a’*a=n.
In sostanza, un gruppo è un monoide (semigruppo con elemento neutro) nei quali esiste anche
l’inverso.
Un gruppo si chiama commutativo (o abeliano) se vale anche a*b=b*a per ogni coppia a e b di
elementi di G.
Esempio: l’insieme dei numeri interi munito dell’addizione è un gruppo abeliano. Si noti che è
importante considerare anche i numeri negativi perché altrimenti non esisterebbe l’inverso
(l’inverso di 4 è -4; la somma dei due numeri dà l’elemento neutro, lo zero).

Gli anelli
Un anello è una struttura algebrica composta da un insieme A su cui sono definite due operazioni
binarie, chiamate somma e prodotto tali che:
• A è un gruppo abeliano rispetto alla somma (elemento neutro 0).
• A è un semigruppo rispetto al prodotto.
• La moltiplicazione è distributiva rispetto alla somma:
a·(b+c)=(a·b)+( a·c)
(a+b)·c=(a·c)+(b·c)
Esempio: l’insieme dei numeri interi, dotato delle usuali operazioni di somma e prodotto.

I corpi
Un corpo è una struttura algebrica composta da un insieme K su cui sono definite due operazioni
binarie, chiamate somma e prodotto tali che:
• K è un gruppo abeliano rispetto alla somma (elemento neutro 0).
• K è un gruppo rispetto al prodotto (elemento neutro 1).
• La moltiplicazione è distributiva rispetto alla somma:
a·(b+c)=(a·b)+( a·c)
(a+b)·c=(a·c)+(b·c).
La differenza con l’anello è che K non è semplicemente un semigruppo rispetto al prodotto, ma è un
gruppo.

I campi
Un campo è un corpo che è un gruppo abeliano anche rispetto al prodotto.
Esempio: l’insieme dei numeri razionali con le usuali operazioni di somma e prodotto.
A titolo di curiosità, citiamo il fatto che l’insieme dei quaternioni (un’estensione del concetto di
numero complesso) è un corpo, ma non è un campo.
Questa e le precedenti dimostrazioni sembrano molto astratte, ma vengono usate in molti campi
della matematica; per esempio, nella definizione assiomatica della probabilità dove si prende in
considerazione il campo degli eventi.

Logica
Logica deriva dal greco logos, parola, e può essere definita genericamente come studio del
pensiero, del linguaggio. Inizialmente rientrava nel campo d’azione della filosofia, ma
successivamente è stata oggetto di studio anche da parte della matematica e dell’informatica.
La storia della logica scorre parallelamente alla sua diversificazione in varie branche, le più
importanti delle quali sono:
• logica classica; studia il pensare a prescindere dai contenuti delle singole proposizioni
(come estensione, nelle logiche polivalenti sono presenti più valori di verità rispetto ai
tradizionali vero/falso);
• logica dialettica; studia il pensare in relazione ai contenuti;
• logica matematica (formale); è la logica applicata alla matematica.
Per la logica classica è, per esempio, del tutto corretto dedurre dalle prime due proposizioni la terza:
1. Tutti i cavalli sono uccelli.
2. Fulmine è un cavallo.
3. Quindi Fulmine è un uccello.
La logica classica studia cioè i nessi inferenziali, i collegamenti fra i vari oggetti del pensiero.
Da un punto di vista culturale, la logica quotidiana è più vicina alla logica dialettica che a quella
classica o a quella matematica per il semplice fatto che al comune mortale non interessa prescindere
dai contenuti.

La logica matematica
Verificata la profonda differenza fra una logica pratica e una logica del tutto formale, è comunque
utile conoscere le basi della logica matematica perché sono comunque comuni al linguaggio
quotidiano.
La logica matematica inizia il suo cammino studiando le proposizioni, cioè affermazioni a cui è
possibile associare un valore di verità o di falsità.
Convenzionalmente, possiamo indicare le proposizioni con lettere minuscole e i valori di verità
rispettivamente con v e f.
Da un punto di vista pratico, le opinioni che esprimiamo quotidianamente non sono proposizioni,
anche se spesso si ha l’arroganza di volerle “dimostrare” oppure ritenerle a priori “vere” o false”.
Secondo la logica classica, anche un’affermazione del tipo “Firenze è lontana da Roma” non è una
proposizione perché a essa non è assegnabile un valore di verità (che si intende per lontana?)
Una proposizione è, per esempio, “Maria ha due occhi” (vera); oppure “Carlo ha tre gambe” (falsa).
Una proposizione si dirà complessa se può essere scissa in proposizioni semplici; per esempio,
“Mario andrà in ferie e farà il giro del mondo” è composta dalle due proposizioni semplici ognuna
delle quali può essere vera o falsa.
La logica parte da tre principi:
1. Principio di identità – Indica l’eguaglianza di un oggetto rispetto a sé stesso.
2. Principio di non contraddizione – Afferma che la stessa proposizione non può essere
contemporaneamente vera e falsa.
3. Principio del terzo escluso – Afferma che a ogni proposizione si può associare solamente il
valore vero oppure falso e non esiste una terza possibilità (tertium non datur).

Le tavole di verità
Se abbiamo n proposizioni, a seconda che possano essere vere o false, avremo n2 possibilità; per
esempio, per n=3 avremo v, v, v oppure v, f, f ecc.
Particolarmente interessante la tavola di verità con due proposizioni; avremo 4 possibilità:

Negazione - NOT
Negare una proposizione significa di fatto invertirne la verità/falsità. La negazione di una
proposizione si indica premettendo il simbolo ¬; per cui ¬ p indica la negazione della proposizione
p.
La tavola di verità sarà:

Congiunzione - AND
La congiunzione logica (informaticamente AND) è un’applicazione su due proposizioni (binaria),
definita secondo la seguente tabella di verità.
L’operazione si indica con il simbolo ˄ (et).

p q p˄q
v v v
v f f
f v f
f f f
La tavola di verità si esprime dicendo che la congiunzione logica è vera se e solo se p e q sono vere
(la congiunzione e indica la relazione logica). Le verità di p e di q sono condizioni necessarie
affinché la congiunzione sia vera; singolarmente, ognuna di esse non è però sufficiente.

Disgiunzione inclusiva - OR -
La disgiunzione inclusiva (informaticamente OR) è un’applicazione su due proposizioni, definita
secondo la seguente tabella di verità. L’operazione si indica con il simbolo ˅ (vel).

p q p˅q
v v v
v f v
f v v
f f f
La tavola di verità si esprime dicendo che la disgiunzione inclusiva è vera se almeno una delle due
proposizioni è vera (p o q, la congiunzione o indica la relazione logica). p e q sono condizioni
sufficienti affinché la congiunzione sia vera; non è necessario che siano entrambe vere.

Disgiunzione esclusiva - XOR -


La disgiunzione esclusiva (informaticamente XOR) è un’applicazione su due proposizioni, definita
secondo la seguente tabella di verità. L’operazione si indica con il simbolo (aut).

p q pautq
v v f
v f v
f v v
f f f
La tavola di verità si esprime dicendo che la disgiunzione esclusiva è vera solo se solo una delle due
proposizioni è vera. Indica il caso in cui si indicano due possibilità e ci si aspetta che solo una delle
due possa essere soddisfatta. Per esempio: “vado a scuola oppure me ne sto a casa”. Se sono vere
entrambe, la proposizione risultante è manifestamente falsa, vista l’impossibilità di essere
contemporaneamente in due posti diversi.

Implicazione materiale
L‘implicazione materiale si indica con il simbolo p→q che si legge p implica q oppure se p allora
q. L’implicazione materiale di due proposizioni p e q è una proposizione che è falsa se p è vera e q è
falsa, ed è vera in tutti gli altri casi. La tavola di verità è la seguente:

p q p→q
v v v
v f f
f v v
f f v
Si deve notare che non c’è nessun rapporto di causa-effetto fra p e q, ma l’implicazione materiale
indica solo un collegamento fra le due proposizioni dato dalle tavole di verità. In questo la logica
matematica differisce dal linguaggio quotidiano.

Deduzione logica
Per riavvicinarsi al quotidiano, introduce il concetto deduzione logica che viene indicato con p⇒q. 
Qui non c’è nessuna tavola di verità, ma solo un rapporto di causa-effetto, tipico, per esempio, della
dimostrazione dei teoremi. Se p⇒q, diremo che dall’essere vera p segue che è vera anche q.
p è l’antecedente e q è il conseguente. Per esempio:
p= Mario è un medico;
q= Mario è laureato;
se p⇒q si scrive (Mario è un medico)⇒(Mario è laureato).
Come si vede, la deduzione logica esprime quella che nel linguaggio naturale è una condizione
sufficiente.

Coimplicazione logica
Anche la coimplicazione è una relazione puramente formale. Essa si indica con il simbolo p↔q che
si legge p coimplica q. La coimplicazione logica di due proposizioni p e q è una proposizione che è
falsa se una delle due proposizioni è vera e l’altra è falsa, ed è vera in tutti gli altri casi. La tavola di
verità è la seguente:

p q p↔q
v v v
v f f
f v f
f f v
Anche in questo caso si deve notare che non c’è nessun rapporto di causa-effetto fra p e q, ma la
coimplicazione logica indica solo un collegamento fra le due proposizioni dato dalle tavole di
verità.

Doppia deduzione logica


Per stabilire un nesso di causa-effetto più forte di quello stabilito dalla deduzione logica si usa la
doppia deduzione logica, indicata con p⇔q. Se p⇔q, diremo che se e solo se p è vera allora q è
vera. Sostanzialmente p⇔q è l’unione di due condizioni p⇒q e q⇒p.
In matematica, quando si dimostrano teoremi, p è spesso l’ipotesi e q la tesi. Una doppia deduzione
logica può essere per esempio:
p=i numeri naturali pari (divisibili per 2) terminano per 0, 2, 4, 6, 8;
q= i numeri naturali che terminano per 0, 2, 4, 6, 8 sono pari.
Nel linguaggio comune la doppia deduzione logica esprime una condizione necessaria e
sufficiente. Nell’esempio, condizione necessaria e sufficiente per cui un numero naturale sia pari è
che termini per 0, 2, 4, 6 oppure 8.

Tautologie e contraddizioni
Date due proposizioni semplici p e q avremo una tautologia quando la proposizione composta è
sempre vera, mentre avremo una contraddizione quando è sempre falsa.
Una tautologia si esprime facilmente da due proposizioni semplici che completano una situazione,
per esempio, “tutte le persone di questa stanza sono maschi oppure c’è almeno una persona che non
lo è”. La proposizione risultante è sempre vera, qualunque sia la composizione dei presenti nella
stanza.
Per esprimere una contraddizione basta unire due proposizioni semplici mutuamente esclusive con
una “e”; per esempio: “Mario è un bipede e un quadrupede”.

Le regole di inferenza
Le regole di inferenza (deduzione) permettono, partendo da certe ipotesi p, q ecc. di arrivare a una
determinata tesi t. La regola è corretta se da premesse vere segue che è vera anche la tesi.
Modus ponens – Se p⇒q è una proposizione vera, e anche la premessa p è vera, allora la
conseguenza q è vera o, in notazione con operatori logici,
[(p⇒q)˅p]⇒q.
Per esempio: p(se nevica allora fa freddo), q(fa freddo). Se sta nevicando posso dedurre che fa
freddo.
Modus tollens – Se p⇒q è una proposizione vera e q è falsa, allora ne segue che p è falsa, o in
notazione con operatori logici,
[(p⇒q)˅¬q]⇒¬p.
Per esempio: p(se nevica allora fa freddo), q(fa freddo). Se non fa freddo posso dedurre che non sta
nevicando.
Sillogismo ipotetico – Una regola di inferenza ancora più complessa.
Se “p implica q” è vera e anche “q implica r” è vera, allora consegue che anche “p implica r” è vera.
In sostanza, è una transitività da p a r. Formalmente:
[(p⇒q)˄(q⇒r)]⇒(p⇒r).
Per esempio: p(se nevica allora fa freddo), q(fa freddo), r(se fa freddo allora Mario non va in
spiaggia). Se sta nevicando posso dedurre che Mario non va in spiaggia.
Sillogismo disgiuntivo – Una forma complessa che esprime che se (p o q) è vera e se anche la
negazione di q è vera, allora p è vera. Formalmente:
[(p˅q)˄¬q]⇒p.
Per esempio: p(se siamo in Italia) o q(all’estero), posso dedurre che, se non sono all’estero
(negazione di q), allora sono in Italia.

I quantificatori
La logica matematica continua il suo cammino spiegandoci l’uso dei quantificatori. Anche nel
linguaggio comune siamo soliti usarli, ma in modo nettamente meno complesso di quanto può fare
un logico.
Un quantificatore è una locuzione che definisce un insieme di oggetti che hanno una determinata
proprietà. Alcuni esempi:
Esiste almeno un x tale che
• Esistono esattamente 20 x tali che
• Per ogni x tale che.
I quantificatori vengono espressi in logica con simboli che ripetono il linguaggio naturale. Per
esempio, per il quantificatore esistenziale:
• Esiste almeno uno … ∃
• Esistono almeno n individui … ∃n
• Esiste al massimo uno … ∃!
• Esistono al massimo n individui … ∃n!
• Esiste esattamente uno … ∃!!
• Esistono esattamente n individui … ∃n!!
Per quello universale:
• ∀=per ogni.
Usando i quantificatori applicati alle variabili, la logica esprime proposizioni. Per esempio, ciò che
nel linguaggio comune è “qualcuno corre” diventa ∃xP(x) se P(x) indica la proprietà di correre.
Come si vede, incomincia a essere piuttosto complesso esprimere un concetto che persino un
bambino di pochi anni comprende benissimo.
Per esempio, una proposizione universale affermativa (Tutti i cani sono mammiferi) diventerebbe
∀x[A(x)→B(x)].
Cioè preso un x qualsiasi (per ogni x), se x è un cane (proprietà A), allora X è un mammifero
(proprietà B).
Invece una proposizione particolare affermativa (Qualche cane è mordace) diventerebbe ∃x[A(x)
∧B(x)].
Esiste cioè almeno un x tale che x è un cane (proprietà A) e x è mordace (proprietà B). Si noti come
la proposizione particolare affermativa si esprima tramite l’AND delle due proprietà.
Infine una proposizione universale negativa (Nessun cane è un uccello) diventerebbe ¬∃x[A(x)
∧B(x)].
Non esiste cioè un x tale che se x è un cane sia contemporaneamente un uccello.

I sillogismi
I quantificatori servono, per esempio, per esprimere il sillogismo.
Il sillogismo (termine derivato dal greco con il significato di ragionamento concatenato) è un tipo
di ragionamento dimostrativo teorizzato per la prima volta da Aristotele; premesso che in una
proposizione il predicato è l’elemento che insieme al soggetto permette di costruire una frase
completa, egli partiva da 3 tipi di termine:
• maggiore (che funge da predicato nella premessa maggiore e nella conclusione);
• medio (che compare nella premessa maggiore e nella premessa minore);
• minore (che compare nella premessa minore e nella conclusione funge da soggetto).
Essi sono classificati mediante il rapporto contenente-contenuto. Il sillogismo giunge a una
conclusione collegando i suddetti termini con brevi enunciati (premesse).
Nell’immagine sottostante, una rappresentazione di un sillogismo mediante la teoria degli insiemi.

Il giallo sono i Mammiferi, l’arancio


sono i cani, il nero sono gli alani. Ecco premesse e conclusione:
• Tutti i cani sono Mammiferi.
• L’alano è un cane.
• Allora l’alano è un Mammifero.
I tre tipi di termini sono “x è un Mammifero”; “x è un cane”, “x è un alano”.
Nell’esempio precedente abbiamo usato il quantificatore “tutti”. Si possono avere altre forme di
sillogismo, variando i quantificatori. Per esempio:
• Tutte le balene vivono nell’acqua.
• Qualche Mammifero vive nell’acqua.
• Qualche Mammifero è una balena.
• Qualche Mammifero è un alano.
• Qualche Mammifero è un cane.
• Qualche cane è un alano.
• Alcuni Mammiferi sono carnivori.
• Qualche carnivoro vive nella foresta.
• Qualcuno che vive nella foresta è un Mammifero.

Il linguaggio comune
Purtroppo la logica matematica non è in grado di arrivare alla verità. Per esempio, il sillogismo
Tutte le albicocche sono arancioni; io sono arancione, io sono un’albicocca dimostra che il
sillogismo è uno strumento necessario, ma non sufficiente.
In particolare la logica matematica si scontra con paradossi logici che ne evidenziano il limite.
Per esempio, si sono spesi fiumi di inchiostro per discutere su paradossi come quello del mentitore
o su antinomie come quella di Russell (i termini paradosso e antinomia vengono usati spesso
impropriamente; in linea di principio, il paradosso è una conclusione logica non contraddittoria che
si oppone al senso comune, l’antinomia è una contraddizione).
Paradosso 1 (paradosso del mentitore) – Questo enunciato è falso. Se l’enunciato fosse vero
allora sarebbe falso e se fosse falso sarebbe vero!
Paradosso 2 (paradosso degli insiemi o antinomia di Russell) – Esistono insiemi (cataloghi delle
sezioni di una biblioteca, in una versione più concreta del paradosso) che contengono sé stessi (R) e
insiemi (cataloghi) che non contengono sé stessi (NR). Consideriamo l’insieme di tutti gli insiemi
NR (catalogo di tutti i cataloghi NR): sia M. Se M è un insieme NR, esso appartiene a M per la
stessa definizione di M e allora è un insieme R per la definizione di insieme R. Se viceversa M è un
insieme R allora, per la definizione di M, esso non appartiene a M, ossia non appartiene a sé stesso,
ossia è un insieme NR. In entrambi i casi si cade in contraddizione.
Da un punto di vista pratico, i due paradossi si basano su proposizioni “non esprimibili”, cioè del
tutto inutili a priori perché di fatto non hanno un significato, ma sono solo il trionfo della parte
grammaticale sulla dimensione semantica.

Proposizioni nel linguaggio naturale


I linguaggi naturali hanno una complessità tale che nessun linguaggio simbolico e la logica a esso
correlata sono riusciti finora a descrivere. Certo è che anche nel linguaggio naturale è possibile
definire concetti che appartengono alla logica classica.
Per esempio, usualmente definiremo “proposizione” ogni complesso linguistico meritevole di
indagine (non aristotelicamente meritevole di indagine di verità/falsità).
Una proposizione ha due dimensioni, una semantica (semantica come disciplina che studia il
significato delle frasi e dei testi) e una grammaticale (grammatica come insieme di regole
fonetiche, ortografiche, morfologiche, lessicali e sintattiche della lingua).
Per esempio, la proposizione:
l’anatra petrolifera dipingerà bontà dorate
non ha nessun senso comune, ma grammaticalmente, in italiano, è corretta. Viceversa:
a me mi piacere le mele
è grammaticalmente orribile in italiano, ma è compresa da tutti.
Nella vita di tutti i giorni
una proposizione deve essere esprimibile, deve cioè possedere una chiara dimensione semantica.

Condizioni necessarie e sufficienti


Anche se nel linguaggio comune non vengono usati simbolismi che richiederebbero una traduzione
mentale non sempre immediata, si è comunque soliti usare locuzioni del tipo se… allora; se e solo
se ecc.
Prendiamo due eventi, A e B. A prescindere dalla loro natura, che relazione può esistere fra A e B?
Nel mondo reale, partendo dal caso A, si possono verificare questi e solo questi casi (e le loro
negazioni, ovviamente):
A è condizione necessaria di B; cioè se A è falso, B non può essere vero.
1. A è condizione sufficiente di B; cioè se A è vero, B è vero.
2. A è condizione facilitante (penalizzante) di B; se A è vero, B ha più (meno) probabilità di
esserlo che se A fosse falso.
3. A non ha nessuna relazione con B; la conoscenza della verità o della falsità di A non
permette di dedurre nulla su B.
Se poi A è condizione necessaria e sufficiente di B (cioè sono vere contemporaneamente la 1 e la 2),
A e B rappresentano un’equivalenza logica.
Se si chiede a un logico matematico di esprimere formalmente le prime due condizioni, il
formalismo è complesso. Addirittura la condizione 3 non appartiene alla logica matematica.
Nel linguaggio comune la condizione sufficiente si esprime con se… allora, quella necessaria con
solo se… allora, quella necessaria e sufficiente con se e solo se… allora.

Condizione facilitante
Gran parte delle condizioni della realtà non sono né necessarie né sufficienti, ma sono facilitanti o
penalizzanti (un concetto introdotto da Albanesi nel 2011, collegando nella raziologia la logica alla
statistica). Per esempio, “essere allenati al meglio” non è condizione né necessaria né sufficiente per
correre la maratona in 3 ore (è condizione necessaria per ottenere la propria miglior prestazione):
l’atleta dotato che ha, per esempio, un record di 2h30’, anche se non è ben allenato, riesce
nell’impresa di scendere sotto le 3 ore, mentre l’atleta scarsamente dotato, anche se si allena al
meglio, potrebbe non farcela mai.
Noi però intuiamo che “essere allenati al meglio” è molto importante per tutti quegli atleti che in
precedenti occasioni sono andati vicini all’obiettivo; intuiamo che, se ci alleniamo al meglio,
aumentano le probabilità di farcela: essere allenati al meglio è quindi una condizione facilitante.
Un esempio classico di condizione facilitante è la ricchezza. Se viene chiesto a un campione di
persone che relazione esiste fra la ricchezza e la felicità dichiarata (“sono una persona molto
felice”) probabilmente avremo le cinque risposte sottoelencate (ovviamente si potrebbe anche
pensare che la ricchezza sia una condizione penalizzante per la felicità, ma questa posizione è
sostenuta da pochi!).
La ricchezza è condizione necessaria per la felicità – Chi contesta questa affermazione citerà i
numerosi esempi di tutti coloro che non sono ricchi e si dichiarano comunque felici.
La ricchezza è condizione sufficiente per la felicità – Chi contesta questa affermazione citerà i
numerosi esempi dei ricchi con una vita talmente infelice da condurli al suicidio.
La ricchezza è condizione necessaria e sufficiente per la felicità – Peggio ancora, perché gli esempi
citati nei primi due casi sono entrambi validi.
La ricchezza non sta in nessuna relazione con la felicità – Questa affermazione potrebbe essere
facilmente smentita da una ricerca che dimostrasse come nei Paesi più poveri la percentuale della
popolazione che si dichiara felice è molto bassa.
La ricchezza è una condizione facilitante per la felicità – La stessa ricerca potrebbe dirci che la
probabilità di essere felice di chi ha un reddito superiore a X (ricco) è superiore a quella di chi l’ha
inferiore a Y (povero).
L’ultima affermazione è quella più ragionevole e che meglio descrive ciò che accade nella realtà.

Alcuni esempi
Si considerino le seguenti coppie di proposizioni:
1. p=“x è numero pari”; q=“x è divisibile per 2”
2. p=“la batteria del portatile non è scarica”; q=“il portatile funziona”
3. p=“Piero è padre”; q=“Piero è un maschio”
4. p=“Piero è laureato”; q=“Piero è colto”.
In che relazione stanno p e q? In 1, p è condizione necessaria e sufficiente di q; in 2 è condizione
necessaria; in 3 è condizione sufficiente, in 4 è condizione facilitante.

Calcolo combinatorio
Il calcolo combinatorio è la branca della matematica che studia i modi per raggruppare e/o
ordinare secondo date regole gli elementi di un insieme finito di oggetti. Il calcolo combinatorio si
interessa soprattutto di contare tali modi (le configurazioni). Quando si analizzano i
raggruppamenti è importante definire se l’ordinamento è importante, ovvero se due configurazioni
sono le stesse a meno di un riordinamento ({x,y,z} è uguale a {z,x,y}?) e se si possono avere più
ripetizioni di uno stesso oggetto, cioè se uno stesso oggetto dell’insieme può essere o no riusato più
volte all’interno di una stessa configurazione.

Le moltiplicazioni combinatorie
Per esempio, se ho 3 insiemi che contengono x, y e z elementi, quante sigle posso formare
associando a un elemento del primo insieme uno del secondo e uno del terzo?
La regola della moltiplicazione combinatoria è:
N=x*y*z.
Con le 26 lettere dell’alfabeto (i tre insiemi qui coincidono) posso quindi comporre 17.576 sigle
(26*26*26).
Ovviamente il tutto può essere generalizzato a n insiemi.

Le disposizioni
Consideriamo ora un solo insieme. Si parla di disposizione di classe k quando, dato un insieme I di
n elementi, si considerano i raggruppamenti di k elementi scelti fra gli n elementi di I, tali che i
raggruppamenti differiscano per la natura degli elementi o per il loro ordine.
Infatti le disposizioni di n oggetti a k a k sono:

(Dn, k)=nk.

Quanti raggruppamenti di 3 lettere si riescono a comporre con le 5 vocali? Dalla formula trovo che
sono 125.

Le permutazioni
Le permutazioni di n elementi presi k alla volta sono rappresentate dai gruppi di k elementi che si
possono formare con gli n elementi e che differiscono o per almeno un elemento o per l’ordine degli
elementi.
Torniamo al nostro esempio delle vocali e comprendiamo la differenza fra disposizione e
permutazione. Le permutazioni possibili delle 5 vocali prese due alla volta sono:
AE AI AO AU EA EI EO EU IA IE IO IU OA OE OI OU UA UE UI UO
Sono 20. Come si nota, la differenza con le disposizioni sono l’assenza delle sigle AA, EE, II, OO e
UU perché le permutazioni sono una scelta nell’insieme: una volta che ho scelto la lettera A non
posso più sceglierla come seconda opzione. Quindi:
• la disposizione è un modo di ordinare in successione n oggetti;
• una permutazione è un modo di ordinare in successione n oggetti distinti.
Il numero di permutazioni che si possono avere di n elementi presi k a k è indicato con P (n,k):
P(n,k)=n!/(n-k)!.
Un caso particolare si ha quando si vogliono conoscere le permutazioni di n oggetti presi n a n.
poiché 0!=1, tale numero di permutazioni è n!

Le combinazioni
Infine, se l’ordine degli oggetti non è considerato come fattore diversificante, si parla di
combinazioni. Il numero di combinazioni si indica con C(n,k) e si trova:
C(n,k)=P(n,k)/k!=n!/((n-k)!*k!).
Praticamente, le permutazioni vanno divise per il numero di ripetizioni che è dato da k!.
Quante sono le combinazioni di 6 numeri su 90 (problema del Superenalotto)? Con la formula delle
combinazioni otteniamo 622614630. Se puntiamo su 1 2 3 4 5 6 oppure sui numeri 54 83 12 67 15
81, abbiamo sempre la stessa probabilità di fare 6: circa una su 622 milioni.

Teoria della probabilità


Come dice la locuzione, la teoria della probabilità è lo studio matematico della probabilità. Essa
tende a sovrapporsi alla statistica, una disciplina molto professionale, per cui è importante capire le
differenze.
La teoria della probabilità si occupa di fornire modelli teorici probabilistici, cioè distribuzioni di
probabilità adattabili ai vari fenomeni aleatori reali; la statistica parte da un campione aleatorio per
descriverne le proprietà statistiche, eventualmente risalendo al modello teorico che consente di
stimarne i parametri significativi come la media o la deviazione standard.

La probabilità
Il termine probabilità è sicuramente noto a tutti, ma pochi sanno darne una definizione chiara e
immediata. Un primo motivo di questa difficoltà risiede nel fatto che ci sono diversi modi di
intendere la probabilità.
Un modo sicuramente discutibile è quello che identifica la probabilità con il grado di credenza di
un singolo evento. Frasi come “c’è il 30% di probabilità che la squadra X batta la squadra Y”
esprimono una credenza basata non tanto su dati statistici quanto sull’esperienza di chi la esprime.
Questa interpretazione soggettivistica ha alcuni problemi.
Il primo, non grave e teoricamente superabile, è il rispetto delle leggi del calcolo delle probabilità,
per esempio che la somma delle probabilità di un insieme di alternative esaustivo ed esclusivo
debba essere uguale a 1. In realtà, quando le alternative sono molte, le probabilità per credenza sono
date a caso. Se nel caso della squadra si comprende che se il 30% è la probabilità di X di vincere, la
somma delle probabilità del pareggio e della sconfitta deve essere il 70%, quando si considera, per
esempio, la probabilità di non retrocedere delle ultime 5 squadre in base ai risultati delle ultime 4
partite di campionato di cui si vanno a “stimare” le probabilità dei risultati, si scopre molto spesso
che alla fine la somma delle probabilità di salvezza delle squadre coinvolte non è conforme alle
leggi generali del calcolo delle probabilità (soprattutto se, per esempio, si salvano due squadre): un
utile esercizio che si può fare leggendo un qualunque giornale sportivo alla fine del campionato di
calcio.
Il secondo problema è più grave; che la probabilità sia del 30% o del 20% o del 40% è tutto da
dimostrare.
Il terzo problema è quello che definitivamente condanna la definizione soggettivistica: partendo dal
secondo punto, non è possibile trattare l’argomento (probabilità di vittoria della squadra X
nell’incontro con Y) con tecniche statistiche perché si tratta di un evento singolo, che non ha
caratteristiche di regolarità e ripetibilità. Certo, possiamo dire statisticamente che negli ultimi 20
campionati X ha battuto Y solo nel 30% dei casi, ma tutti capiscono che da questo dato non si può
desumere nulla sul prossimo incontro poiché le condizioni (per esempio, le formazioni delle
squadre) sono cambiate.
Se la definizione soggettivistica di probabilità è troppo ampia, quella basata sulla propensità è
troppo ristretta. Le propensità sono proprietà degli oggetti studiati, per esempio la simmetria cubica
di un dado. La struttura di riferimento dà la probabilità di un evento, per cui, per esempio, diciamo
che c’è 1/6 di probabilità che esca il 3.
Purtroppo le propensità non sono poi così comuni ed è necessario essere un po’ più elastici e
riferirsi ai fenomeni cercando di individuare comunque caratteristiche di prevedibilità interagendo
con essi, cioè facendo esperimenti. Ecco allora che la probabilità si identifica con le frequenze di
un grande numero di osservazioni.

Definizioni matematiche di probabilità


Vediamo le principali definizioni di probabilità che sono note dalla matematica. La prima, quella
classica, risale a Laplace e definisce la probabilità di un evento come
il rapporto tra il numero dei casi favorevoli all’evento e il numero dei casi possibili, purché questi
ultimi siano tutti equiprobabili.
La seconda, quella frequentista, risale a von Mises e definisce la probabilità di un evento come
il limite cui tende la frequenza relativa dell’evento al crescere del numero degli esperimenti.
Nota infine è poi la definizione assiomatica di Kolmogorov che, peraltro, non consente di calcolare
la probabilità.
Tutte le definizioni hanno problemi. La definizione di von Mises è sostanzialmente equivalente a
quella che definiamo “empirica” (cioè collegata con la realtà e quindi al di fuori di ogni discorso
teorico); quella di Kolmogorov è piuttosto astratta. Per chi volesse trovare un fondamento logico
(non empirico) al concetto di probabilità non resta che quella classica di Laplace, ma è evidente la
circolarità della definizione: che senso ha definire la probabilità parlando di eventi equiprobabili?
Inoltre un’altra difficoltà sorge quando il numero dei casi possibili è infinito.

La probabilità classica
Utilizzando la definizione classica è immediato risolvere molti problemi comuni. Per esempio, qual
è la probabilità che con il lancio di due dati esca un 11?

Dal calcolo combinatorio sappiamo che i casi possibili sono 36 (62); otteniamo un 11 solo con le
due combinazioni 5 e 6 e 6 e 5, Quindi abbiamo 2 casi favorevoli su 36, la probabilità è 1/18.

Probabilità contraria
La probabilità contraria è definita come la probabilità che l’evento non accada. Poiché un evento
accade o non accade, la somma della sua probabilità e della probabilità contraria deve dare l’unità:
p+q=1.
Probabilità totale
Se due eventi si escludono a vicenda (per esempio, l’uscita del 2 e quella del 6 nel lancio di un
dado), si dice che i due eventi sono mutuamente esclusivi.
In un mazzo di carte sono mutuamente esclusivi l’uscita di una picche e di una fiori, mentre non lo
sono l’uscita di una figura e di una cuori.
Principio della probabilità totale – Se A e B sono mutuamente esclusivi, la probabilità di ottenere
A o B è uguale alla somma della probabilità di A più la probabilità di B.
P(AoB)=P(A)+P(B).
Cosa accade se gli eventi non sono mutuamente esclusivi? La formula della probabilità totale
diventa:
P(AoB)=P(A)+P(B)-P(AeB)
dove P(AeB) indica la probabilità che si verifichino contemporaneamente i due eventi. Nel caso
dell’estrazione di una figura e di una cuori, avremo P(A)=12/52, P(B)=13/52, mentre P(AeB) sarà
3/52, cioè le 3 figure di cuori (che non devono essere contate due volte!). Quindi P(uscita di una
figura o di un cuori)=22/52.

Probabilità composta
La probabilità composta è la probabilità che due eventi A e B accadano uno dopo l’altro.
L’evento A è indipendente dall’evento B se il fatto che si verifichi B non altera le probabilità
dell’evento A:
P(A)=P(A|B)
dove l’espressione P(A|B) indica la probabilità condizionata dell’evento A, posto che B si sia
verificato.
Se l’evento B è indipendente dall’evento A (nel senso che l’esito dell’esperimento che ha originato
B è indipendente dall’esito dell’esperimento che ha originato A), la probabilità composta è data da:
P(AeB)=P(A)*P(B)
cioè dal prodotto delle due probabilità.
Importante notare che i lanci di una moneta sono indipendenti; all’i-esimo lancio la probabilità di
uscita di croce resta 1/2, indipendentemente da ciò che è avvenuto nei lanci precedenti. Quindi, la
probabilità che in 3 lanci successivi si ottengano 3 testa sarà 1/8 (1/2*1/2*1/2).
Più complesso il caso di due eventi dipendenti. Si supponga di studiare la probabilità di estrarre due
numeri che finiscono per 8 dalla tombola in due estrazioni consecutive (senza ovviamente
reimmettere il primo numero estratto). La probabilità di estrarre un numero finale 8 al primo colpo è
di 9/90, ovvio. Al secondo colpo, se al primo abbiamo estratto un finale 8, avremo 8/89 probabilità
di estrarre un altro finale 8. Quindi, la probabilità composta di avere un finale 8 alla prima
estrazione e un finale 8 alla seconda è data dal prodotto della probabilità del primo evento per la
probabilità del secondo, posto che il primo si sia verificato:
P(AeB)=P(A)*P(B|A).
L’espressione P(B|A) è la probabilità condizionata dell’evento B, posto che A si sia verificato (nel
nostro caso 8/89). Quindi, la probabilità di estrarre due finali 8 consecutivi è 9/90*8/89.

La probabilità frequentista
È importante notare la differenza fra frequenza e probabilità: la probabilità viene calcolata a
priori, prima che l’evento accada, mentre la frequenza viene calcolata a posteriori, dopo un numero
opportuno di prove, dopo che gli eventi sono accaduti.
Fondamentale per l’approccio frequentista ai fenomeni è la legge dei grandi numeri:
all’aumentare del numero delle prove fatte il valore della frequenza tende al valore teorico della
probabilità.
Poiché ovviamente è impossibile fare un numero infinito di prove, si può definire la probabilità
statistica di un evento casuale (aleatorio) come il numero che esprime la frequenza relativa
dell’evento in un gran numero di prove precedenti tutte fatte nelle stesse condizioni.

La probabilità assiomatica
Sia dato un insieme S di eventi elementari e la famiglia E di sottoinsiemi di S tale che valgano le
proprietà:
S è un elemento dell’insieme E;
se A e B sono sottoinsiemi di S e sono elementi di E allora lo sono anche i loro complementari, la
loro unione (pensata come somma) e la loro intersezione (pensata come prodotto).
E è il campo di eventi.
Sono definibili gli assiomi:
Con S finito, a ogni evento A è associato un numero P(A) se valgono i seguenti assiomi:
• P(A)≥0
• P(S)=1
• Se A e B sono eventi incompatibili (cioè A∩B=Ø) allora P(A∪B)=P(A)+P(B).
Il numero reale P(A) è detto probabilità dell’evento A.

Proprietà e teoremi
Cominciamo con alcuni enunciati molto intuitivi.
• La probabilità dell’evento impossibile è nulla; P∅)=0.
• La probabilità di un evento è uguale a 1 meno quella dell’evento contrario, Formalmente,
dato un qualunque insieme A appartenente ad S, 1=P(S)=P(A∪AC)=P(A)+P(AC); da questa
si ricava appunto P(A)=1-P(AC).
• La probabilità di un evento è sempre compresa fra 0 e 1.
• Se A è contenuto in B, allora la probabilità dell’evento A è minore della probabilità
dell’evento B.
Additività – La probabilità che si verifichi l’evento A oppure l’evento B è data dalla somma delle
probabilità dei singoli eventi meno la probabilità del loro verificarsi in contemporanea (nel caso in
cui gli eventi siano incompatibili, cioè o si verifica l’uno o si verifica l’altro, tale probabilità è
nulla):
P(A∪B)=P(A)+P(B)-P(A∩B).
Proprietà condizionata – Si definisce probabilità condizionata dell’evento B rispetto all’evento A
la probabilità che si verifichi l’evento B dopo che si è verificato l’evento A; si indica con P(B|A). Si
può dimostrare che
P(B|A)= P(A∩B)/P(A).
Formula analoga vale per P(A|B).
Proprietà moltiplicativa – La probabilità del prodotto di due eventi à uguale al prodotto fra la
probabilità del primo e la probabilità del secondo condizionata al fatto che il primo evento sia
accaduto:
P(A∩B)=P(A)·P(B|A)=P(B)·P(A|B).
Si supponga di calcolare la probabilità che da un mazzo di 52 carte si estraggano di seguito due assi.
P(A) varrà 4/52 mentre P(B|A) varrà 3/51, quindi 12/(52·51) cioè il 4,52% circa.
Teorema della probabilità totale – Se gli eventi A e B sono tra loro mutualmente incompatibili ed
E è un evento che può accadere solamente associato a uno dei due precedenti, allora vale il teorema
della probabilità totale:
P(E )=P(A)·P(E|A)+P(B)·P(E|B).
Il teorema può essere generalizzato con n eventi. Per esempio, se si lancia un dado, e si indicano
con A1…A6 gli eventi “esce 1”, …, “esce 6”, gli eventi sono a due a due incompatibili e hanno
ciascuno probabilità pari a 1/6. La probabilità dell’evento “ottengo un numero maggiore di 4” è
P(A5∪A6)=1/6+1/6=1/3.

Teorema di Bayes
Visto che la trattazione della probabilità assiomatica può sembrare molto astratta, applichiamola a
un caso concreto: studio della convenienza dello screening mammografico a donne di età compresa
fra i 40 e i 50 anni.
Statisticamente si sa che:
• la probabilità che una donna abbia il cancro al seno è dello 0,8%;
• se una donna ha il cancro al seno, la probabilità di mammogramma positivo è del 90%;
• se non ha il cancro, la probabilità che il suo mammogramma risulti comunque positivo è del
7%.
Ci chiediamo: dato un mammogramma positivo, che probabilità c’è che la donna abbia
effettivamente il cancro?
Conoscendo il teorema di Bayes, con una semplice calcolatrice, si trova subito la risposta.
Teorema di Bayes – Considerando un insieme di alternative A1, A2, … An, la probabilità
condizionata si trova mediante la seguente espressione:

Nel nostro caso E


esprime la probabilità che il mammogramma sia positivo, A1 indica che la donna ha il cancro e A2
che non ce l’ha.
Applicando il teorema di Bayes si ottiene:

Cioè, la probabilità (che una donna abbia realmente il cancro dato un mammogramma positivo) è
uguale a 0,90*0,008/(0,90*0,008+0,07*0,992). Svolgendo i calcoli si trova P=0,0939, cioè il 9,4%,
una percentuale sorprendentemente bassa che rivela come la mammografia dia un numero
elevatissimo di falsi positivi se eseguita su donne relativamente giovani.

La teoria dei giochi


Nella teoria dei giochi sono pochi e semplici i concetti che riguardano la cultura matematica.
Il primo è il valore atteso (o speranza matematica) che altro non è che il prodotto fra la somma da
vincere e la probabilità di vincerla. Per indicarlo useremo il prodotto Sp, dove S è la somma da
vincere e p la probabilità di vincerla.
Nel gioco del lotto l’ambo paga 250 volte, ma qual è la probabilità di fare ambo con una giocata
secca di 2 numeri su una ruota?
In una ruota sono estratti 5 numeri; i casi favorevoli sono quelli in cui ho i due numeri giocati fissi e
gli altri 3 numeri variabili, cioè tutte le terne che posso formare con gli 88 numeri restanti (le
combinazioni degli 88 numeri presi a tre a tre). I casi possibili sono tutte le cinquine che posso
formare con i 90 numeri.
Svolgendo i calcoli si trova con ottima approssimazione una probabilità su 400 (0,0025).
La speranza di vincita puntando un euro è quindi 250·0,0025=0,625. Il giocatore ci perde e il gioco
non è equo. Lo Stato mediamente incassa 0,375 euro per euro giocato.
Il gioco è cioè equo se il valore atteso è uguale a quello puntato.
Si potrebbe pensare che in un gioco equo non si vinca né si perda. In realtà, il teorema della rovina
del giocatore ci dice che
in un gioco equo contro un banco illimitato ogni giocatore è destinato alla rovina.
Consideriamo, per esempio, il lancio di una moneta (o il gioco al rosso e al nero alla roulette, che
non è comunque un gioco equo perché c’è lo zero che fa vincere il banco). All’aumentare del
numero dei lanci (giocate) la frequenza si avvicina al valore della probabilità; però lo scarto tra le
uscite di testa e di croce aumenta. Per fissare le idee, dopo un milione di lanci avremo, per esempio,
499500 testa e 500500 croce. La frequenza dell’evento testa è stata di 0,4995 quindi molto, molto
prossima allo 0,5 teorico, ma se il giocatore ha puntato ogni volta 1 euro è già sotto di ben 1000
euro. Se la sua disponibilità è inferiore a 1.000 euro è rovinato.

Le variabili casuali
Una variabile casuale è una variabile che può assumere valori diversi in corrispondenza di
altrettanti eventi che costituiscono una partizione dello spazio delle probabilità.
Dopo aver raccolto dati su un fenomeno caratterizzato da una certa variabile, è opportuno
sintetizzarli con valori caratteristici (indici di posizione), una specie di riassunto che consente di
avere un immediato colpo d’occhio.

Media aritmetica
Si supponga di studiare una variabile, per esempio i voti degli studenti in un esame. Con il simbolo
Xi indichiamo l’i-esimo valore osservato, cioè il voto dello studente I.

La media aritmetica è definita come segue:


μ=(X1+X2+ … +XN)/N=∑Xi/N.

La media è un concetto molto noto anche nel linguaggio comune, tanto che è celeberrima la poesia
di Trilussa (La statistica) sui buffi effetti di un suo pedissequo utilizzo:
Me spiego: da li conti che se fanno
secondo le statistiche d’adesso
risurta che te tocca un pollo all’anno:
e, se nun entra ne le spese tue,
t’entra ne la statistica lo stesso
perché c’è un antro che ne magna due.
In effetti, la media non funziona molto bene per descrivere fenomeni dove le variabili non sono
distribuite con continuità nell’intervallo dei valori.
Due proprietà della media:
1. La somma algebrica delle differenze fra un insieme di numeri e la loro media aritmetica è
zero.
2. La somma dei quadrati delle differenze fra un insieme di numeri e un numero x è minima
solo se x è la media aritmetica dei numeri dell’insieme.

Media mobile
La media mobile è un concetto molto usato in economia. Se le osservazioni di un fenomeno sono
Xi, X2, …, XN, la media mobile di ordine K sarà la sequenza:

• (X1+X2+…+Xk)/K
• (X2+X3+…+ XK+1)K
• …
• (XN-K+1+XN-K+2+XN)/K.

Si supponga che l’inflazione dei 6 anni di un certo periodo sia stata: 6; 4; 3; 2; 1,5; 4. La media
mobile di ordine 3 è rappresentata dai valori 4,33; 3; 2,16; 2,5. Come si può notare la nuova serie
temporale è più smorzata rispetto ai valori iniziali, è stata purificata dalle irregolarità:
• (6+4+3)/3=4,33
• (4+3+2)/3=3
• (3+2+1,5)/3=2,16
• (2+1,5+4)/3=2,5.

Media ponderata
La media ponderata (pesata) è definita come:
μp=ΣwiXi/Σwi

dove wi sono i pesi che vengono attribuiti ai singoli valori Xi.

Si supponga, per esempio, che due aspiranti a un posto ottengano i seguenti punteggi in 4 prove, tre
preliminari e una finale.
A – 10, 7, 8, 6.
B – 9, 6, 8, 8.
Il selettore ritiene che l’importanza (il peso) degli esami preliminari sia 2 e quella di quello finale 3.
Chi sceglierà, A o B?
Media ponderata di A: ((2*10)+(2*7)+(2×8)+(3*6))/(2+2+2+3).
Media ponderata di B: ((2*9)+(2*6)+(2*8)+(3*8))/(2+2+2+3).
La media ponderata di A è 7,55, quella di B è 7,77. Verrà scelto B perché il suo miglior voto
nell’esame finale “pesa” di più.

Mediana
La mediana (μe) è il valore centrale dell’insieme ordinato dei valori dell’insieme X.

Si consideri, per esempio, l’altezza di una classe di liceali; se fra essi c’è un giovane giocatore di
basket alto 2,02 m, la media sarebbe poco significativa. Considerando la mediana, di fatto si esclude
dalla descrizione del fenomeno il dato anomalo.
Se i dati sono in numero dispari è immediato trovare il valore centrale; se sono pari, di valori
centrali ce ne sono due. In questo caso si può considerare la media dei valori o, se tale media non
può essere un valore assunto dal fenomeno, si considera come mediana uno dei due valori centrali.

Moda
Se il fenomeno è qualitativo non abbiamo numeri a disposizione per trovare indici di posizione. Si
supponga, per esempio, di descrivere sinteticamente l’osservazione del colore delle auto di una
certa marca.
La moda (o norma, μo) è la modalità del fenomeno più frequentemente osservata.

Un fenomeno può non avere moda, averne una o più d’una. Se fra le clienti del giorno X di un
parrucchiere per signora 3 sono castane, 3 bionde, 2 nere, 1 rossa, avremo due mode, “castana” e
“bionda”.

Indici di variabilità
Un fenomeno non viene solo sintetizzato dai suoi indici di posizione, ma anche dagli indici di
variabilità.
Se abbiamo due soggetti, uno che mangia due polli e uno che non ne mangia, è vero che la media è
di un pollo a testa, ma è anche vero che la deviazione standard dei nostri dati è 1, indicando che la
maggioranza dei casi rilevati ha mangiato un pollo in più o uno in meno rispetto alla media.
Diventa perciò importante capire come i valori osservati si disperdano attorno al valore medio.
Il più semplice indice di dispersione è il campo di variazione dei valori, cioè la differenza fra il
maggiore e il minore. Il semplice buon senso ci fa capire che quanto più ampio è il campo di
variazione, tanto meno significativa può essere la media aritmetica nella descrizione del fenomeno;
si pensi al caso di un insieme di persone fra le quali ce n’è una ricchissima e le altre con reddito
normale: il campo di variazione è molto grande e la media è fuorviante perché tiene “troppo conto”
del peso dell’unico nababbo.
Deviazione standard e varianza
L’indice di variabilità più importante è sicuramente la deviazione standard della variabile X (σx),
espressa nell’unità di misura originale e definita come:

dove μ è la media dei valori. Si parla di varianza quando ci si riferisce al quadrato della deviazione
standard.
Se la deviazione standard è piccola (rispetto al valore medio dei campioni), allora i valori sono
concentrati attorno alla media, altrimenti sono molto dispersi attorno a essa. Questo concetto è la
traduzione qualitativa del teorema di Chebyshev che dice che “per qualsiasi costante k>1, la
percentuale dei dati che giace nell’intervallo di k deviazioni standard a destra e a sinistra della loro
media è almeno 1-1/k2”.

Per k=2, il valore 1-1/k2 è uguale a 3/4 cioè al 75%: il 75% dei valori giace in un intervallo di due
deviazioni standard a destra e a sinistra della media.
Come vedremo, la deviazione standard è un indice importantissimo nella trattazione della
distribuzione normale.

Variabili continue
Finora si sono sempre considerate variabili discrete; se le variabili sono continue le cose si
complicano leggermente.
Se X è una variabile casuale continua che assume tutti i valori reali compresi nell’intervallo [a,b],
possiamo definire una funzione F(x) (funzione di ripartizione) definita come la probabilità che la
variabile casuale assuma valori inferiori o uguali a x:
F(x)=P(X≤x).
1-F(x) sarà la probabilità contraria, cioè la probabilità che la variabile casuale X assuma un valore
maggiore di x.
Con la differenza F(x2)-F(x1) indichiamo la probabilità che la variabile casuale assuma un valore
compreso tra x1 e x2 con x1 escluso, cioè x1<x≤ x2.

La densità media di probabilità è il rapporto fra F(x2)-F(x1) e x2-x1, cioè la variazione della F(x)
rispetto alla variazione della x.
La densità indica come la probabilità si distribuisce nell’intervallo considerato nell’ipotesi che la
distribuzione avvenga in modo uniforme. Affinché sia un’indicazione significativa, dovremo
considerare un intervallo abbastanza piccolo [x,x+Δx] in tal modo da ottenere la velocità di
variazione della F(x) al variare della x.
Se passiamo al limite con l’intervallo che tende a zero avremo la derivata della funzione F(X); tale
derivata si chiama densità di probabilità o semplicemente funzione di densità.
Graficamente, la seguente funzione di ripartizione delle probabilità si riferisce a una variabile che
può assumere i valori da -3 a 3.

La derivata di F(x) è la densità di probabilità e, come derivata, è in relazione con il coefficiente


angolare della tangente a F(x) nel punto x considerato. Relativamente alla curva precedentemente
esposta avremo che nei punti -3 e 3 la derivata sarà nulla mentre avremo un massimo attorno alla
zero dove è massimo il coefficiente angolare della tangente. Ciò vuol dire che, nel caso in oggetto,
attorno allo zero avremo la massima densità di probabilità, ovvero i valori attorno allo zero hanno
valori di probabilità maggiori. Come vedremo, la derivata di una curva di ripartizione come quella
appena vista è una gaussiana-like.
Il valore medio si otterrà non più come sommatoria, ma come integrale. Più formalmente, se
variabile casuale continua X assume tutti i valori nell’intervallo [a,b] e f(x) è la sua funzione densità
e F(x) la sua funzione di ripartizione, X assume (a meno di infinitesimi) il valore x nell’intervallo
[a;b] con probabilità dF(x)=f(x)dx.
Il valore medio m(X) sarà dato dall’integrale sull’intervallo [a,b] del prodotto dei valori x della
variabile aleatoria per la rispettiva probabilità dF(x)=f(x)dx:

Analogamente per la varianza:

La deviazione standard si calcolerà usualmente come radice quadrata della varianza.

Le distribuzioni di probabilità
Una variabile statistica (per esempio il valore del lancio di un dado) assume modalità diverse,
ognuna con una determinata probabilità di manifestarsi. Se costruiamo il grafico di queste
probabilità otteniamo la distribuzione di probabilità associata alla variabile.
Una distribuzione può essere discreta o continua a seconda che le modalità osservate siano discrete
o continue.
Vediamo per esempio la distribuzione di modalità associata al lancio di due dadi. Abbiamo 36
possibili configurazioni (moltiplicazione delle configurazioni possibili di un dado per quella
dell’altro). Come utile esercizio proviamo a descriverle in modo naturale con carta e penna.
11 21 31 41 51 61
12 22 32 42 52 62
13 23 33 43 53 63
14 24 34 44 54 64
15 25 35 45 55 65
16 26 36 46 56 66
Il punteggio 2 è dato solo dalla configurazione (1 e 1) che si presenta solo una volta su 36. Il
punteggio 3 è dato dalle configurazioni (1 e 2) e (2 e 1), 2 volte su 36; il punteggio 4 è dato dalle
configurazioni (1 e 3), (2 e 2) e (3 e 1) e così via. Si noti che le configurazioni corrispondenti a un
punteggio stanno tutte su una diagonale della nostra matrice. La distribuzione di probabilità sarà la
seguente (dobbiamo dividere il numero di configurazioni corrispondenti a un punteggio per 36, i
casi possibili):

Il
punteggio più probabile è il 7 con circa il 16,67% di probabilità.
Al variare del fenomeno studiato può variare la sua distribuzione. La buona notizia è che molti
fenomeni statistici hanno la stessa distribuzione e quindi il nostro compito di descriverli è facilitato.
Infatti, nel calcolo della probabilità si studiano diverse distribuzioni che poi trovano molti riscontri
nella vita quotidiana. Descriveremo le due più importanti.

La distribuzione di Bernoulli (binominiale)


La distribuzione di Bernoulli è una distribuzione discreta che viene impiegata per calcolare la
probabilità di avere k successi (per esempio testa) in N prove in un determinato esperimento (lancio
di una moneta) quando siano soddisfatte le seguenti condizioni:
1. Ci sono solo due esiti possibili con probabilità p e q=1-p.
2. Le N prove sono indipendenti.
3. La probabilità di successo resta costante in tutte le prove.
Se p è la probabilità di successo, la probabilità che l’evento p si manifesti esattamente k volte su N
prove è:

Il lancio di una moneta rispetta le tre condizioni sopraelencate, per cui, se vogliamo conoscere la
probabilità di avere 3 testa su 5 lanci, applicando la formula otteniamo: 5!*0,53*0,52/3!*2!=0,3125,
cioè il 31,25%.

La distribuzione di Gauss (normale)


Se analizziamo la distribuzione di un campione di persone che seguono un certo programma
televisivo per decadi di età, magari otteniamo un grafico di questo tipo:

L
e cose si complicano quando si hanno molti valori possibili, addirittura infiniti.
Supponiamo, per esempio, di effettuare tante misurazioni di una stessa grandezza con uno
strumento; avremo risultati differenti dovuti all’inevitabile imprecisione del nostro strumento e del
nostro operato, i cosiddetti errori accidentali. Se rappresentiamo le misure ottenute su un grafico, se
il numero di misurazioni è molto grande, al limite infinito, la curva che otterremo è proprio la curva
di Gauss.

Si tratta di una curva dalla classica forma a campana che ha un massimo attorno alla media dei
valori misurati e può essere più o meno stretta a seconda della dispersione dei valori attorno alla
media; la dispersione si misura con la deviazione standard. Anche nel caso della curva di Gauss,
l’area sottesa dalla curva vale 1 perché la somma delle probabilità di tutti i valori dà 1, cioè la
certezza. Nell’immagine, la densità di probabilità indica la probabilità con cui si presenta il singolo
valore in ascissa: più la curva è stretta e maggiore sarà il valore di picco della campana; la curva
sovrapposta alla gaussiana misura l’area sottesa, cioè la probabilità che la variabile abbia un valore
inferiore all’ascissa considerata; come si vede, la probabilità cumulativa tende a 1 per valori
crescenti di x.
La distribuzione di Gauss è spesso detta normale. L’aggettivo è significativo perché indica che
moltissimi fenomeni possono essere descritti da una curva gaussiana o Gauss-like (cioè simile).
Infatti, descrive molto bene i fenomeni in cui le modalità prossime alla media hanno frequenza
elevata, frequenza che diminuisce allontanandosi dalla media.
L’equazione della distribuzione normale è:

dove μ è la media, σ la deviazione standard, π (pi greco) vale 3,14159 ed e è la base dei logaritmi
naturali e vale 2,71828.
Un esempio
Supponiamo di considerare l’altezza degli italiani maschi. Analizziamo un campione di 1000
soggetti. Probabilmente otterremmo una curva a campana, centrata attorno a una media, del tipo
174 cm di media con una “deviazione standard” di circa 20 cm, cioè il 95% dei soggetti analizzati
sarebbe compreso fra 154 cm e 194 cm.
Comprendere il semplicissimo esempio che abbiamo appena descritto consente di migliorare nella
comprensione di fenomeni che la maggioranza della popolazione non sa interpretare.
Consideriamo, per esempio, una persona che ritira le sue analisi del sangue. Se nota un parametro
leggermente fuori intervallo può pensare di essere gravemente ammalata. In questa valutazione due
sono gli errori commessi:
• credere che l’intervallo di normalità sia assoluto: al di fuori di esso c’è patologia;
• non conoscere la distribuzione del parametro.
Il primo punto è quello che genera maggiori preoccupazioni; in realtà, i parametri clinici si
distribuiscono secondo curve a campana centrate attorno a una media; gli intervalli di riferimento
cercano di indicare con buona probabilità se si è di fronte a un individuo normalmente sano. Un po’
come dire che gli italiani maschi sono alti da 165 a 185 cm: un soggetto alto 163 cm è comunque
normale, mentre un soggetto adulto alto 140 cm è sicuramente affetto da nanismo.
Per capire fino in fondo l’esame occorrerebbe quindi avere non solo il range di riferimento, ma
anche la distribuzione completa dei valori nella popolazione, cioè capire la “gaussiana” dei valori e
conoscere la sua deviazione standard.
Per esempio, per la glicemia la deviazione standard potrebbe essere 10 mg/dl con una media di 95
mg/dl, per cui, nonostante i valori “consigliati” da un laboratorio siano 80-110, anche un valore di
75 o 115 potrebbe essere attribuito a un soggetto sano. Consideriamo poi che ci sarebbe sempre e
comunque un 5% di soggetti sani con valori al di fuori del range 75-115.
Per altri parametri la deviazione standard potrebbe essere ancora maggiore. Quindi non è tanto
importante capire se un parametro è vicino alla media della popolazione, bensì se siamo talmente
lontani da avere pochissime probabilità di essere sani!