Sei sulla pagina 1di 242

MONICA BIANCHI ANNA TORRIERO

ELEMENTI
DI PROGRAMMAZIONE MATEMATICA

Milano 2001

2001 I.S.U. Universit Cattolica Largo Gemelli, 1 Milano
http://editoriale.cjb.net
ISBN 88-8311-106-0
3
INDICE
CAPITOLO 1
ELEMENTI DI ALGEBRA LINEARE ............................................... 5
1.1 Richiami sulla struttura algebrica e topologica dello
spazio vettoriale R
n
................................................................... 5
1.2 Autovalori e diagonalizzazione .............................................. 16
1.2.1 Autovalori e autovettori ................................................ 16
1.2.2 Diagonalizzazione di una matrice quadrata. ................. 25
1.3 Forme quadratiche libere e vincolate...................................... 36
1.3.1 Forme quadratiche libere............................................... 36
1.3.2 Forme quadratiche vincolate ......................................... 44
CAPITOLO 2
FUNZIONI DI PI VARIABILI........................................................ 49
2.1 Calcolo differenziale per le funzioni reali di n
variabili reali........................................................................... 49
2.2 Punti estremi per le funzioni di pi variabili .......................... 59
2.3 Funzioni concave e convesse.................................................. 61
2.4 Insiemi di livello e funzioni implicite..................................... 69
CAPITOLO 3
MASSIMI E MINIMI IN INSIEMI APERTI..................................... 77
3.1 Condizioni necessarie per la determinazione dei punti
estremi .................................................................................... 77
3.2 Condizioni sufficienti per la determinazione dei punti
estremi .................................................................................... 82
3.3 Alcune precisazioni sulle condizioni sufficienti: il
caso delle funzioni concave e convesse.................................. 88
4
CAPITOLO 4
MASSIMI E MINIMI IN INSIEMI CHIUSI. VINCOLI DI
UGUAGLIANZA............................................................................... 93
4.1 Concetti introduttivi................................................................ 93
4.2 Condizioni necessarie per la determinazione dei punti
estremi .................................................................................... 98
4.3 Condizioni sufficienti per la determinazione dei punti
estremi .................................................................................. 105
4.4 Interpretazione economica dei moltiplicatori di
Lagrange ............................................................................... 113
CAPITOLO 5
MASSIMI E MINIMI IN INSIEMI CHIUSI. VINCOLI DI
DISUGUAGLIANZA........................................................................ 117
5.1 Concetti introduttivi.............................................................. 117
5.2 Condizioni necessarie per la determinazione dei punti
estremi .................................................................................. 124
5.3 Condizioni sufficienti per la determinazione dei punti
estremi .................................................................................. 139
CAPITOLO 6
PROGRAMMAZIONE LINEARE.................................................. 145
6.1 Formalizzazione di un problema di programmazione
lineare ................................................................................... 145
6.2 Insiemi convessi in R
n
e programmazione lineare................. 147
6.3 Linterpretazione geometrica................................................ 153
6.4 La soluzione algebrica .......................................................... 158
6.5 Analisi di sensitivit ............................................................. 166
6.6 Il metodo del simplesso ........................................................ 170
6.7 Teoria della dualit ............................................................... 175
Referenze bibliografiche................................................................... 185
APPENDICE
ESERCIZI SVOLTI.......................................................................... 187
Autovalori, autovettori e forme quadratiche............................... 189
Ottimizzazione statica.................................................................. 207
5
CAPITOLO 1

ELEMENTI DI ALGEBRA LINEARE
1.1 Richiami sulla struttura algebrica e topologica dello spazio
vettoriale R
n

In questo paragrafo richiameremo brevemente i pi importanti
concetti riguardanti lo spazio vettoriale R
n
. Ricordiamo che si indica
con R
n
linsieme delle n-ple ordinate di numeri reali

x =
(
(
(
(

n
2
1
x
x
x
M
, x
i
R, i = 1, 2, ..., n. (1.1)

Tra gli elementi di R
n
si introducono le seguenti operazioni:

Moltiplicazione per scalare. Sia un numero reale, detto anche
scalare, ed x un elemento di R
n
. Si definisce x lelemento di R
n

assegnato da:

x =
(
(
(
(

n
2
1
x
x
x
M
. (1.2)

6
Addizione. Siano x ed y elementi di R
n
. Si definisce x + y
lelemento di R
n
assegnato da:

x + y =
(
(
(
(

+
+
+
n n
2 2
1 1
y x
y x
y x
M
. (1.3)

Si pu facilmente dimostrare che linsieme R
n
, in relazione alle
operazioni (1.2) e (1.3), costituisce uno spazio vettoriale o spazio
lineare sul campo dei numeri reali
1
.
Nel seguito ci si riferir quindi ad ogni elemento x R
n
come ad
un vettore colonna ed inoltre il numero reale x
i
, verr detto coordinata
o componente i-esima di x.
In modo del tutto equivalente, si possono considerare le n-ple
ordinate di numeri reali del tipo

x
T
= [x
1
, x
2
, ..., x
n
],

detti vettori riga, per le quali si possono introdurre analoghe
operazioni di addizione e di moltiplicazione per uno scalare. Il vettore
x
T
viene anche detto vettore trasposto di x
2
.

1
Linsieme R
n
uno spazio vettoriale sul campo dei numeri reali in quanto:
i) R
n
un gruppo commutativo rispetto alloperazione di addizione
ii) Valgono, comunque si scelgano, , R ed x, y R
n
le seguenti relazioni:

(x + y) = (x + y) = x + y
( + ) x = x ( + ) = x + y
() x = x () = (x)
1 x = x 1 = x
2
La denominazione di vettori colonna e vettori riga legata alla equivalenza tra
questi vettori ed una matrice rispettivamente di tipo (n, l) ed (1, n).
7
Casi particolari di vettori appartenenti ad R
n
sono il vettore nullo 0,
caratterizzato da componenti tutte nulle, ed i vettori fondamentali
e
j
, j = 1, ..., n definiti come

e
j
=
(
(
(
(
(
(

n
j
1
j
j
j
M
M
, con

=
=
j i se 0
j i se 1
i
j


Assegnati k vettori x
1
, x
2
, ... x
k
R
n
e k scalari
1
,
2
, ...
k
definiamo combinazione lineare il vettore

x=
1
x
1
+
2
x
2
+... +
k
x
k


Gli scalari
1
,
2
, ...
k
vengono detti pesi o coefficienti della
combinazione lineare. In particolare la combinazione lineare viene
detta convessa quando tali pesi soddisfano le condizioni

1 , k ,..... 1 i , 0
k
1 i
i i
= =

=
.

Linsieme di tutte le combinazioni lineari di k vettori x
1
, x
2
, ... x
k

viene indicato con il simbolo span(x
1
, x
2
, ... x
k
). Linsieme di tutte le
combinazioni lineari convesse di k vettori x
1
, x
2
, ... x
k
viene indicato
con il simbolo co(x
1
, x
2
, ... x
k
).

Utilizzando le combinazioni lineari possiamo ora introdurre il
concetto di dipendenza lineare.
Diciamo che k vettori x
1
, x
2
, ... x
k
R
n
sono linearmente dipendenti
se il vettore nullo pu essere espresso come una loro combinazione
8
lineare a pesi non tutti nulli
3
. In caso contrario i k vettori verranno
detti linearmente indipendenti.
Definizione 1.1
Un sottoinsieme non vuoto S dello spazio vettoriale R
n
viene detto
sottospazio vettoriale se per ogni coppia s
1
, s
2
S e per ogni R
risulta:

s
1
+ s
2
S ed s
1
S, (1.4)

od equivalentemente se per ogni coppia s
1
, s
2
S e per ogni , R
si ottiene

s
1
+ s
2
S. (1.4)

Si pu facilmente verificare che un sottospazio lineare S di R
n

risulta esso stesso uno spazio vettoriale rispetto alle operazioni (1.2) e
(1.3).

Si dice che i vettori s
1
, s
2
, ... s
k
sono un insieme di generatori per un
sottospazio vettoriale S se S = span (s
1
, s
2
, ... s
k
). Se in particolare i
vettori s
1
, s
2
, ... s
k
sono anche linearmente indipendenti, essi vengono
detti base del sottospazio vettoriale S. Un sottospazio vettoriale pu
ammettere basi distinte, ma il numero di elementi che costituisce ogni
base invariante rispetto al sottospazio vettoriale. Tale numero viene
detto dimensione del sottospazio vettoriale. Per come stata definita,
facile convincersi che la dimensione di un sottospazio vettoriale S il
massimo numero di vettori linearmente indipendenti contenuti in S.


3
Se i k vettori x
1
, x
2
, ... x
k
R
n
sono linearmente dipendenti esiste almeno un
vettore x
i
che pu essere espresso come combinazione lineare dei rimanenti.
9
Ad esempio ogni vettore x R
n
pu essere espresso come
combinazione lineare dei vettori fondamentali e
j
, j = 1, ..., n, ponendo

x =

=
n
1 j
j
j
e x . (1.5)

Si ottiene quindi R
n
= span (e
1
, e
2
, ... e
n
) ed i vettori e
j
, j = 1, ..., n,
costituiscono un insieme di generatori per lo spazio vettoriale R
n
.
Risultando inoltre tra loro linearmente indipendenti, essi costituiscono
una base per R
n
detta base canonica. R
n
quindi un esempio di spazio
vettoriale di dimensione finita pari ad n.

Se S un sottospazio vettoriale di dimensione k, 0 k n
considerati k vettori linearmente indipendenti s
l
, s
2
, ... s
k
contenenuti
in S, ogni s S pu essere espresso come loro combinazione lineare,
ossia

S = span (s
1
, s
2
, ... s
k
) = {s R
n
/ s =

k
1 i
i
i
s ,
i
R}. (1.6)

In particolare per k = 1 otteniamo linsieme

L = span (s
1
) = {s R
n
/ s = s
1
, R}

che viene detto retta orientata passante per lorigine con direzione e
verso fissati dal vettore s
1
.
Linsieme

L (x) = span (s
1
) + x
0
= {x R
n
: x = x+ s
1
, R}, (1.7)

10
viene denominato retta orientata passante per x con direzione e
verso fissati dal vettore s
1
. Si noti che L (x) non costituisce un
sottospazio vettoriale. Dalla (1.7) si deduce facilmente che linsieme
dei vettori x R
n
tali che:

x = x + ( x
)
x) = x
)
+ (1 )x, R (1.8)

costituisce la retta orientata passante per x
)
ed x con direzione e
verso fissati dal vettore ( x
)
x).
Se in particolare si sceglie 0 1 la (1.8) risulta una
combinazione lineare convessa di x
)
ed x ed esprime tutti e soli i
punti del segmento congiungente x
)
con x.
Definizione 1.2
Un insieme S R
n
viene detto convesso quando per ogni coppia di
vettori x, x
)
S e per ogni numero reale con 0 1 si ottiene:

x + (1 ) x
)
S, (1.9)

ossia appartengono ad S tutti i punti che giacciono sul segmento
congiungente x ed x
)
.

Si osservi che se S e T sono insiemi convessi, anche S T un
insieme convesso. Per convenzione si suppongono inoltre convessi
anche gli insiemi costituiti da un solo vettore e linsieme vuoto. Si noti
che ogni sottospazio vettoriale risulta in particolare un insieme
convesso.
Introduciamo ora una nuova operazione tra i vettori che ci
consentir di arricchire la struttura dello spazio vettoriale R
n
.
11
Definizione 1.3
Siano x ed y R
n
. Si definisce prodotto scalare o prodotto interno
di x ed y, e si indica con <x, y> il numero reale

<x, y> = x
T
y =

=
n
1 i
i i
y x (1.10)
In base alla (1.10), comunque si scelgano x, y, z R
n
, sono di
immediata verifica le seguenti propriet:
<x, x> 0 e <x, x> = 0 se e solo se x = 0;
<x, y> = <y, x>;
<x, y + z> = <x, y> + <x, z> e <x + y, z>= <x, z> + <y, z>;
<x, y> = <x, y> e <x, y> = <x, y>, ,R.
Utilizzando la definizione di prodotto scalare, possiamo ora
introdurre la seguente
Definizione 1.4
Assegnati due vettori x ed y R
n
,viene detta distanza euclidea di x
da y il numero reale:

d (x, y) = < x y, x y>
2
1
=
2
1
n
1 i
2
i i
) y x (
(

=
. (1.11)

La (1.11) gode delle seguenti propriet:

d (x, y) 0 e d (x, y) = 0 se e solo se x = y;
d (x, y) = d (y, x);
d (x, y) d (x, z) + d (z, y) (disuguaglianza triangolare)

12
In particolare la distanza (euclidea) del generico vettore x R
n
dal
vettore nullo 0 viene detto norma di x e risulta assegnata da:

x = d (x, 0) = <x, x>
2
1
=
2
1
n
1 i
2
i
x
(

=
. (1.12)

La (1.12) soddisfa le seguenti propriet:
x 0 e x =0 se e solo se x=0
x ==(( x per ogni scalare
y x + x + y (disuguaglianza triangolare)
Un vettore di norma unitaria viene detto versore. possibile
trasformare un generico vettore x non nullo di R
n
in un versore
operando una normalizzazione. Il vettore normalizzato (di norma
unitaria) definito come

x
x
x
*
= .

Siano x, yR
n
. Valendo la disuguaglianza fondamentale
(disuguaglianza di Cauchy-Schwartz)

<x, y> x y ,

se i vettori x ed y non sono nulli, si ottiene

1
y
y
,
x
x
1 .
13
Lo scalare 0 soluzione dellequazione cos () =
y
y
,
x
x
,
viene detto angolo tra i due vettori x ed y. Qualora =/2 i vettori
vengono detti ortogonali. Pertanto due vettori x ed y sono ortogonali
se <x, y> = 0. Ad esempio i vettori fondamentali e
j
, j=1, ... n, sono a
due a due ortogonali.
Assegnato un sottospazio vettoriale S si indica con S

il suo
complemento ortogonale, ossia linsieme

S

={wR
n
: <w, s>=0 per ogni s S}.

In particolare il complemento ortogonale di una retta passante per
lorigine L=span (u) cos definito

L

={wR
n
: <w, u>=0}

e viene detto iperpiano. Si pu facilmente dimostrare che un iperpiano
risulta un sottospazio vettoriale di dimensione (n 1)
4
.

Lo spazio vettoriale R
n
, qualora si introduca la nozione di distanza
euclidea (1.11), risulta uno spazio metrico. Inoltre i vettori x R
n

vengono anche chiamati punti dello spazio metrico R
n
. Si noti che
grazie alla (1.12) si pu porre d(x, y) = y x
La nozione di distanza permette di introdurre la seguente
fondamentale

4
La nozione di iperpiano verr ripresa nel corso del sesto capitolo.
14
Definizione 1.5
Assegnato un vettore x
0
R
n
ed un numero reale > 0, viene detto
intorno circolare aperto di x
0
di raggio linsieme I (x
0
, ) cos
definito:

I (x
0
, )= { x R
n
:
0
x x < }. (1.13)

Possiamo ora richiamare alcune definizioni topologiche che
verranno ampiamente utilizzate nel seguito. Si consideri un
sottoinsieme S R
n
ed un vettore x R
n
.

Un vettore x un punto di accumulazione per S se per ogni
numero reale > 0 lintorno I (x, ) contiene almeno un vettore
appartenente ad S (distinto da x se in particolare x S)
5
.
Linsieme dei punti di accumulazione di S, detto insieme derivato
di S, verr nel seguito indicato con S.

Un vettore x S un punto isolato per S se esiste un numero
reale
)
> 0 opportuno per cui I(x,
)
) S = {x}
6


Un vettore x un punto di frontiera per S se per ogni numero reale
> 0 lintorno I(x, ) contiene vettori appartenenti ad S e vettori non
appartenenti ad S.

5
Una definizione alternativa di punto ai accumulazione la seguente: x R
n

un punto di accumulazione di S se e solo se esiste una successione di vettori ((x
n
))
appartenente ad S, con x
n
x, convergente ad x, cio tale che =

x
n
x Lim
n
. La
successione di vettori ((x
n
)) pu essere ad esempio costruita ponendo x
n
I(x,
1 / n) S, x
n
I(x,
1
1
+ n
) S, n = 1, 2, ...
6
{x} indica linsieme costituito dal solo elemento x.
15
Un punto di frontiera pu dunque essere isolato o di
accumulazione. Linsieme dei punti di frontiera di S verr indicato con
S.

Un vettore x S si dice che un punto interno ad S se esiste un
numero reale
)
> 0 tale che I(x,
)
) S.
Linsieme dei punti interni ad S verr indicato con int (S).

Un insieme S R
n
viene detto aperto se ogni vettore x S risulta
un punto interno ad S, ossia se S int(S).
Un insieme S R
n
viene detto chiuso se contiene tutti i suoi punti
di frontiera, ossia se SS.

Si pu dimostrare che un insieme S R
n
risulta chiuso se e solo se
il suo complementare R
n
\S risulta un insieme aperto.
La chiusura Sdi un insieme S R
n
linsieme chiuso ottenuto
unendo ad S i suoi punti di frontiera.
Si dimostra che S = S S

= S S =S S.

Un insieme S R
n
viene detto limitato se esiste una costante reale
M > 0 per cui x < M, per ogni x S, ossia se esiste un opportuno
intorno dellorigine che lo contiene.

Un insieme S R
n
chiuso e limitato viene detto compatto.
16
1.2 Autovalori e diagonalizzazione
1.2.1 Autovalori e autovettori
Premettiamo allo studio delle forme quadratiche libere e vincolate,
alcuni indispensabili cenni sugli autovalori e autovettori di una
matrice quadrata.
Sia A una matrice quadrata, reale, di ordine n; si presenta spesso il
problema di ricercare i vettori x, non nulli, che soddisfano la
relazione:

Ax = x (1.14)
Definizione 1.6
Un numero complesso e un vettore non nullo x C
n
che
soddisfano la (1.14) sono detti rispettivamente autovalore e
autovettore, associato a , della matrice A.

chiaro che gli autovettori sono determinati a meno di uno scalare
non nullo; vale a dire se (, x) una coppia autovalore-autovettore, lo
stesso vero per ogni coppia (, tx) con t 0. Infatti:
A (tx) = t (Ax) = (tx).
Abbastanza evidente il significato geometrico di autovettore.
Infatti la relazione definitoria individua gli autovettori come quei
vettori che premoltiplicati per A non cambiano in direzione ma solo in
norma ed, eventualmente, in verso se < 0; vale a dire che il
trasformato di x mediante la trasformazione lineare f individuata dalla
matrice A, appartiene alla retta per lorigine individuata da x stesso.
Dal punto di vista geometrico si cercano cio le rette invarianti
rispetto alla trasformazione f.
17
Per determinare gli autovalori e gli autovettori, riprendiamo
lequazione Ax = x che si pu porre nella forma:

(A I) x = 0. (1.15)

Si tratta di un sistema lineare omogeneo di n equazioni in n
incognite del quale interessano le soluzioni non nulle.
Dalla teoria dei sistemi lineari omogenei noto che condizione
necessaria e sufficiente per lesistenza di vettori x0 soddisfacenti la
(1.15) che sia:

f () = det (A I) =

nn 2 n 1 n
n 2 22 21
n 1 12 11
a ... a a
...
a ... a a
a ... a a
= 0. (1.16)

Si dimostra facilmente che f () un polinomio esattamente di
grado n in che apparir pertanto come

f () = det (A I) = a
0

n
+ a
1

n1
+ ... + a
n
,

che chiamato polinomio caratteristico di A mentre lequazione
f () = 0 detta equazione caratteristica di A.
Per il teorema fondamentale dellAlgebra, ogni polinomio di grado
n ammette esattamente n radici nel campo complesso C, ciascuna
contata secondo il proprio ordine di molteplicit. Da ci si deduce,
quindi, che lequazione (1.16) ammette n radici appartenenti a C,
siano esse distinte o meno. Linsieme degli autovalori viene detto
spettro di A e il valore del modulo dellautovalore di massimo
modulo, vale a dire (A) =
i
max|
i
|, detto raggio spettrale di A.
18
Definizione 1.7
Si definisce molteplicit algebrica dellautovalore

i
(i = 1, ..., k n) e si indica con
A
i
m , il suo ordine di molteplicit
come radice dellequazione caratteristica; vale a dire il numero di
volte che
i
compare come radice della (1.16).

Siano
1,

2
, ...,
k
(k n) gli autovalori distinti di A, dal teorema
fondamentale dellAlgebra vale evidentemente:


A
1
m +
A
2
m +...+
A
k
m = n (1.17)

Ci interessa segnalare che se
1
,

2
, ...,
n
sono gli autovalori di A,
allora:

1
+
2
+...+
n
= a
11
+ a
22
+... + a
nn
= tr A

1
,...
n
= det A.

Dopo avere determinato gli autovalori
1
,
2
, ...,
n
di A,
eventualmente non tutti distinti, gli autovettori ad essi associati si
ottengono immediatamente come soluzioni del sistema lineare
omogeneo (1.15).
Evidentemente, se
i
un autovalore di A esiste almeno un
autovettore ad esso associato. Infatti det (A I) = 0 ed esiste almeno
un vettore non nullo tale che (A I)x = 0.
Inoltre, si pu facilmente dimostrare che:
TEOREMA 1.1
Linsieme di tutti gli autovettori associati ad un dato autovalore
(con laggiunta del vettore nullo) costituisce un sottospazio vettoriale
detto autospazio.
19
Definizione 1.8
Si definisce molteplicit geometrica dellautovalore
i
, che si indica
con
G
i
m , la dimensione del sottospazio vettoriale X R
n
costituito
dalle soluzioni del sistema omogeneo (A
i
I) x = 0, vale a dire il
massimo numero di autovettori linearmente indipendenti associati a
i
.

La molteplicit geometrica di un dato autovalore coincide perci
con la dimensione del nucleo del sistema omogeneo ad esso associato
e, dalla teoria dei sistemi lineari omogenei risulta


G
i
m = n rango (A
i
I) (1.18)

Si pu inoltre dimostrare che la molteplicit geometrica di ogni
autovalore non supera la rispettiva molteplicit algebrica. In simboli:


G
i
m
A
i
m i. (1.19)

Dalle (1.17) e (1.19) si deduce la relazione seguente:

k
G
1
m +... +
G
k
m
A
1
m +... +
A
k
m = n (1.20)

dove k indica il numero di autovalori distinti di A (k n).

Se
G
i
m =
A
i
m allora lautovalore
i
viene detto regolare.
TEOREMA 1.2
Autovettori associati ad autovalori distinti sono linearmente
indipendenti.
20
DIMOSTRAZIONE
La dimostrazione per induzione sul numero degli autovalori e per
assurdo.
Per n = 2 il teorema vero. Infatti supponiamo che x
1
e x
2
siano
due autovettori linearmente dipendenti associati a
1
e
2
(
1

2
).
Allora esisterebbe ad esempio
1
0 tale che:


1
x
1
+
2
x
2
= 0. (1.21)

Essendo
1

2
, si suppone, senza perdita di generalit,
2
0.
Moltiplicando ambo i membri della (1.21) una volta per A e una volta
per
2
si ottiene:

A
1
x
1
+ A
2
x
2
= 0

2

1
x
1
+
2

2
x
2
= 0
da cui:

1

1
x
1
+
2

2
x
2
= 0

1

2
x
1
+
2

2
x
2
= 0

e sottraendo membro a membro:


1
(
1

2
) x
1
= 0.

Ma, essendo
1

2
e
1
0, questa relazione implicherebbe x
1
= 0
il che assurdo. Perci x
1
e x
2
sono linearmente indipendenti.
Sia ora il teorema vero per k vettori x
1
, x
2
, ..., x
k
e dimostriamolo
vero per k + 1.
Per assurdo siano x
1
, x
2
, ..., x
k
, x
k+1
linearmente dipendenti. Allora:


1
x
1
+
2
x
2
+... +
k
x
k
+
k+1
x
k+1
= 0 (1.22)

con
1
,
2
, ...,
k
,
k+1
non tutti nulli.
21
Pi precisamente si pu osservare che, essendo x
1
, x
2
, ..., x
k
, x
k+1

vettori non nulli, sar senzaltro non nullo almeno un coefficiente

i
, i = 1, ..., k.
Senza perdita di generalit, sia
k+1
0.
Moltiplicando la (1.22) prima per A, poi per
k+1
e sottraendo
membro a membro si ottiene:


1
(
k+1

1
) x
1
+
2


(
k+1

2
) x
2
+... +
k
(
k+1

k
) x
k
= 0.

Essendo per ipotesi x
1
, x
2
, ..., x
k
vettori linearmente indipendenti,
almeno un
i
non nullo e gli autovalori tutti distinti, questa
uguaglianza non pu sussistere. Si conclude pertanto che i vettori
x
1
, x
2
, ..., x
k
, x
k+1
sono linearmente indipendenti.

Questo teorema fornisce una condizione solo sufficiente per
lindipendenza lineare degli autovettori come dimostra il seguente
semplice esempio.
Sia A =
1 0
0 1

(
. Come si verifica facilmente, tale matrice ammette
lautovalore =1 con molteplicit algebrica e geometrica entrambe
uguali a 2. Infatti, risolvendo il sistema lineare omogeneo A 1x = 0,
si ottiene x = h e
1
+ k e
2
, dove e
1
e e
2
sono i vettori fondamentali di
R
2
e costituiscono una base per lautospazio associato allautovalore 1.

Enunciamo e dimostriamo infine alcune interessanti propriet degli
autovalori:
Teorema 1.3
Sia A una matrice quadrata di ordine n. Allora:
a) = 0 un autovalore di A se e solo se A singolare;
b) gli autovalori di una matrice diagonale o triangolare (inferiore o
superiore) sono uguali agli elementi diagonali della matrice stessa;
22
c) se autovalore di A, non singolare, allora 1/ autovalore di A
1
;
d) A e A
T
hanno gli stessi autovalori;
e) se autovalore di A, allora
p
autovalore di A
p
con p intero
positivo.
DIMOSTRAZIONE
a) Se = 0 un autovalore di A, lequazione caratteristica
det (A I) = 0 in corrispondenza di tale autovalore, diviene
det (A 0I) = det A = 0. Viceversa, se detA = 0 si pu scrivere:

det A = det(A 0I) = 0 e pertanto 0 un autovalore di A.

b) Si lascia al lettore lovvia dimostrazione.
c) Sia autovalore di A, da Ax = x, moltiplicandone ambo i membri
a sinistra per A
1
, si ottiene A
1
Ax = A
1
x da cui, notando che
senzaltro non nullo per la a), risulta (1/) x =
= A
1
x. Pertanto 1/ autovalore di A
-1
.
d) A e A
T
hanno gli stessi autovalori perch, per le propriet dei
determinanti, risulta

det (A I) = det (A I)
T
= det (A
T
I).

e) Per induzione su p: per p = 2 il teorema vero. Infatti da Ax = x
segue AAx = Ax cio A
2
x =
2
x. Sia ora vero per k e
dimostriamolo vero per k + 1. Da A
k
x =
k
x segue AA
k
x =
k
Ax,
che implica A
k+1
x =
k+1
x.
ESEMPIO 1.1
Determinare gli autovalori e gli autovettori di

A =
4 5
2 3

(

23
SOLUZIONE
Formiamo lequazione caratteristica det (A I) = 0;

det
4 5
2 3

=
2
2 = ( + 1) ( 2) = 0

Le radici di tale equazione, che forniscono gli autovalori di A, sono

1
= 1 e
2
= 2. Ad ogni autovalore corrisponde un sottospazio
vettoriale di autovettori che soddisfano lequazione omogenea
(A I) x = 0:


1
= 1: (A
1
I) x =
(

=
(

0
0
x
x
2 - 2
5 - 5
2
1
,
da cui:
x
1
= h
1
1

(
, h R

2
= 2: (A
2
I) x =
(

2
1
x
x
5 2
5 2
= 0

che ammette come soluzione:

x
2
= k
5
2

(
, k R.
ESEMPIO 1.2
Determinare gli autovalori e gli autovettori di

A =
3 1
1 1

(

24
SOLUZIONE
Si ha:

det (A I) = det
( )
( )
3 1
1 1

= ( 2)
2
= 0

Gli autovalori sono
1
=
2
= 2.
Pertanto
1
= 2 un autovalore doppio (
A
1
m = 2).
Gli autovettori associati a
1
sono le soluzioni non nulle del sistema
omogeneo (A
1
I) x = 0:

(A
1
I) x =
1 1
1 1

(
x = 0

da cui x = a
1
1

(
, a R.
Si osservi che linsieme degli autovettori associati a
1
= 2
determina un sottospazio vettoriale di dimensione uguale a 1; si
deduce quindi che
G
1
m = 1.
ESEMPIO 1.3
Determinare gli autovalori e gli autovettori di:

A =
(

2 0
1 k
, k R
SOLUZIONE
Poich A una matrice triangolare, gli autovalori di A sono uguali
agli elementi sulla diagonale principale della matrice stessa.
Pertanto:

1
= k,
2
= 2. Se k = 2 allora
1
=
2
= 2 un autovalore doppio
(
A
1
m = 2).
25
In questo caso, per avere gli autovettori relativi a = 2 si risolve il
sistema:
(A 2I) x =
0 1
0 0

(
x = 0

da cui x = h
1
0

(
, h , e
G
1
m = 1
Se k 2:

1
= k :
(

k 2 0
1 0
x = 0 da cui x = p
1
0

(
, p R.

2
= 2 :
(


0 0
1 2 k
x = 0 da cui x = m
(

k 2
1
, m R.

Pertanto
G
1
m = 1 e
G
2
m = 1.
1.2.2 Diagonalizzazione di una matrice quadrata.
Il problema della diagonalizzazione di una matrice quadrata che qui
presenteremo, nasce dallesigenza di determinare gli autovalori della
matrice stessa. Infatti bisogna osservare che, calcolando gli autovalori
di una matrice di ordine n attraverso la sua equazione caratteristica,
non appena n > 4, non esiste una formula esatta che determini le radici
di una generica equazione algebrica di grado superiore al quarto.
Inoltre, lutilizzo di metodi numerici di tipo iterativo, vale a dire che
non richiedono un numero finito di operazioni, per la soluzione di
equazioni algebriche (metodo delle corde, delle secanti, delle
tangenti...) altamente influenzato dalla precisione con cui sono
calcolati i coefficienti della equazione caratteristica ed fortemente
sconsigliato qualora non si conoscano con precisione tali coefficienti
in quanto anche minime variazioni nei coefficienti dellequazione
caratteristica, dovute ad esempio ad errori di arrotondamento, possono
26
comportare grandi variazioni nelle radici dellequazione stessa. In tal
caso si suol dire che il problema mal condizionato.
Un celebre esempio costituito dal polinomio di Wilkinson:

P () = ( 1) ( 2) ... ( 20)

le cui radici sono 1, 2, ..., 20. Se si pone P() =
20
+
1

19
+... +
20
,
si trova in particolare
1
= 210. Se invece, a causa di errori di
arrotondamento,
1
diventa 210 2
23
, le radici del polinomio sono:
1, 2, ..., 7, 8.007, 8.917, 10.095 + 664i, 11.794 + 1.652i,
13.992 + 2.519i, ..., 16.731 + 2.813i, ..., 19.502 + 1.940i, 20.847.
Per ovviare a questo problema, si ricorre ad algoritmi risolutivi che
consistono nel sottoporre la matrice A ad una trasformazione che lasci
invariato lo spettro ma che riduca A ad una forma pi semplice
(diagonale o triangolare) per la quale sia immediata la determinazione
dei rispettivi autovalori.
Non possiamo entrare nel dettaglio di tali metodi numerici. Vale
tuttavia la pena di illustrare, anche per la sua rilevanza teorica, lidea
di base che quella delle trasformazioni per similarit il cui utilizzo
motivato dal fatto che tali trasformazioni sono ben condizionate.
Definizione 1.9
Siano A e B matrici quadrate di ordine n. Si dice che A simile a
B se esiste una matrice S, non singolare, di ordine n, tale che:

A = SBS
1
. (1.23)

Loperazione che trasforma B in A si dice trasformazione di
similarit.
Tali trasformazioni godono di alcune importanti propriet.
27
TEOREMA 1.4
La relazione di similarit una relazione di equivalenza, vale A
dire che gode delle propriet:
(i) riflessiva
(ii) simmetrica
(iii) transitiva.
DIMOSTRAZIONE
(i) Essendo I = I
1
, si pu scrivere A = IAI
1
, pertanto A simile a
s stessa.
(iii) Se A = SBS
1
allora B = S
1
AS = QAQ
1
, dove Q = S
1
e perci
B simile ad A.
(iii) Se A = SBS
1
e B = QCQ
1
, allora A = (SQ)C(SQ)
1
. Perci A
simile a C.
TEOREMA 1.5
Matrici simili hanno gli stessi autovalori e se A = SBS
1
e x un
autovettore di A associato a un dato autovalore , allora S
1
x un
autovettore di B associato allo stesso autovalore .
DIMOSTRAZIONE
Se A simile a B, vale a dire A = SBS
1
, allora si ottiene:

det (A I) = det (SBS
1
I) = det(SBS
1
SIS
1
) =
det [S

(B I)S
1
] = det(S)det(B I)det(S
1
) = det (B I).

Pertanto A e B avendo la stessa equazione caratteristica hanno gli
stessi autovalori.
Se Ax=x, allora SBS
1
x = x. Moltiplicando ambo i membri di
tale relazione a sinistra per S
1
si ottiene B(S
1
x) = (S
1
x) che prova
che S
1
x un autovettore di B associato allautovalore .

28
Si osservi che la condizione espressa da tale teorema non
sufficiente, vale a dire che matrici con gli stessi autovalori non sono
in generale simili, come mostra il seguente esempio:
ESEMPIO 1.4
Siano A =
1 0
0 1

(
e B =
1 0
1 1

(
. A e B ammettono entrambe
autovalori
1
=
2
=1 ma, come si pu facilmente verificare, A non
simile a B. Infatti se A fosse simile a B esisterebbe una matrice S, non
singolare, tale che S
1
AS = B, vale a dire AS = SB. Sia ora S=
(

d c
b a
,
da AS = SB si ottiene:


(

d c
b a
=
(

+
+
d d c
b b a


che equivale al seguente sistema:

+ =
+ =
d c c
b a a


le cui soluzioni sono a = a, b = 0, c = c, d = 0.
Pertanto si trova:
S=
(

0 c
0 a
.

Ma, osservando che det S = 0, si conclude che non sussiste la
relazione di similarit S
1
AS = B.
Evidentemente le matrici pi semplici in cui trasformare, mediante
una similarit, una matrice A sono quelle diagonali; in tal caso gli
autovalori di A non sono altro che gli elementi diagonali della matrice
29
D. Ci si pu chiedere allora se esiste una matrice diagonale D simile
ad A, cio tale che A = SDS
1
.
Definizione 1.10
Una matrice A, quadrata di ordine n, detta diagonalizzabile se
esiste una matrice diagonale D simile ad essa, cio tale che
A = SDS
1
.
Non sempre possibile, come vedremo pi avanti, ricondurre una
generica matrice alla forma diagonale mediante una trasformazione di
similarit. Presentiamo ora alcuni teoremi che forniscono criteri per
decidere se una generica matrice quadrata sia, o meno,
diagonalizzabile.
Sussiste il seguente teorema:
TEOREMA 1.6
Sia A una matrice quadrata di ordine n. Condizione necessaria e
sufficiente affinch A sia diagonalizzabile, vale a dire A = SDS
1
,
che A possieda n autovettori linearmente indipendenti. In tal caso S
la matrice le cui colonne sono costituite dagli n autovettori
linearmente indipendenti di A e gli elementi sulla diagonale di D sono
gli autovalori relativi. S detta matrice polare o modale di A.
DIMOSTRAZIONE
Se A ha n autovettori linearmente indipendenti x
1
, x
2
,..., x
n

associati rispettivamente agli autovalori
1
,
2
, ...,
n
, allora la matrice
S = [x
1
| x
2
| ... | x
n
] non singolare.
Dalle equazioni Ax
i
=
i
x
i
, i = 1, ..., n, si ottiene:

AS = [Ax
1
| Ax
2
|... |Ax
n
] = [
1
x
1
|
2
x
2
|... |
n
x
n
] = SD

dove D = diag (
i
), i = 1, ..., n.
30
Poich S non singolare da AS= SD, moltiplicandone a destra
ambo i membri per S
1
si ottiene A = SDS
1
.
Viceversa da A=SDS
1
segue

AS= SD (1.24)

dove S = [x
1
| x
2
| ... |x
n
] e D = diag (
i
), i = 1, ..., n, ossia le n relazioni
Ax
i
=
i
x
i
, i = 1, ..., n. Le colonne della matrice S, sono dunque gli
autovettori di A, linearmente indipendenti perch S non singolare.

La condizione espressa da questo teorema equivale ad affermare
che, ogni autovalore regolare, ossia:

i
G
i
m =
A
i
m .
ESEMPIO 1.5
Sia A =
(
(
(

1 0 0
0 1 0
4 2 k
, k R
a) Determinare tutti gli autovalori di A e gli autovettori associati.
b) Discutere, in relazione al parametro reale k, la diagonalizzazione
della matrice A indicando, se possibile, la matrice che realizza tale
diagonalizzazione.
SOLUZIONE
Formiamo lequazione caratteristica, det (A I) = 0, di A:

det
(
(
(

) (1 0 0
0 ) (1 0
4 2 ) (k

= (k ) (1 )
2
= 0

31
Le radici di tale equazione forniscono gli autovalori di A che sono
quindi
1
= k e
2
= 1. Si osservi che
A
1
m = 1 e
A
2
m = 2 se k 1,
mentre, nel caso k = 1, lunico autovalore
1
= 1 ha molteplicit
algebrica
A
1
m = 3. Determiniamo ora gli autovalori associati e
1
= k
risolvendo il sistema omogeneo (A kI) x = 0.
Si ha:

1
= k:
(
(
(

k) (1 0 0
0 k) (1 0
4 2 0
x = 0

Se k = 1:

x = p
1
0
0

(
(
+ m
0
2
1

(
(


e, poich
G
1
m = 2, si pu concludere, osservando inoltre che
G
1
m
A
1
m = 3, che, per k = 1 la matrice A non diagonalizzabile.

Se k 1:


1
= k : x = h
1
0
0

(
(



1
= 1 : (A
2
I) x =
(
(
(


0 0 0
0 0 0
4 2 ) 1 k (
x = 0

da cui segue:
(k 1) x
1
+ 2x
2
+ 4x
3
= 0
32

Ponendo allora x
2
= a e x
3
= b si ottiene:

x = a
(
(
(


0
1
) 1 k /( 2
+ b
(
(
(


1
0
) 1 k /( 4


Si osservi che, in questo caso, la molteplicit algebrica e la
molteplicit geometrica dellautovalore
2
= 1 coincidono, infatti
A
2
m =
G
2
m = 2 e si pu pertanto concludere che, per k 1, la matrice
A risulta diagonalizzabile.
La matrice che realizza tale diagonalizzazione la seguente:

S =
(
(
(


1 0 0
0 1 0
1) 4/(k 1) 2/(k 1

che si ottiene accostando gli autovettori linearmente indipendenti
determinati in precedenza.
Si pu facilmente verificare, inoltre, che:

S
1
AS =
(
(
(

1 0 0
0 1 0
0 0 k
.

Casi speciali notevoli si hanno quando la matrice A, di cui si studia
leventuale diagonalizzabilit, soddisfa a certe condizioni particolari.
Esiste, infatti, una classe di matrici, sempre diagonalizzabili, i cui
autovalori ed autovettori godono di particolari propriet, che
enunciamo senza dimostrazione. Tali propriet permettono di trovare
in modo rapido la matrice S che realizza la relazione di similarit con
33
una matrice diagonale. La classe a cui ci riferiamo quella delle
matrici simmetriche.
TEOREMA 1.7
Gli autovalori di una matrice simmetrica sono tutti reali.
Gli autovettori associati ad autovalori distinti di una matrice
simmetrica sono ortogonali.
Una matrice simmetrica ammette sempre n autovettori linearmente
indipendenti.

La trasformazione di similarit che realizza la diagonalizzazione
pu, in particolare, essere realizzata mediante matrici ortogonali
(ovvero matrici che godono della propriet: P
T
P = PP
T
= I). In tal caso
si dice che A diagonalizzabile mediante una relazione di similarit
ortogonale. Infatti sussiste il seguente:
TEOREMA 1.8
Se A una matrice simmetrica, esiste sempre una matrice
ortogonale P tale che P
T
A

P sia diagonale. Le colonne di P sono
costituite dagli autovettori ortogonali normalizzati di A e gli
autovalori corrispondenti costituiscono gli elementi diagonali di
D = P
T
A

P.
DIMOSTRAZIONE
Siano
1
,
2
, ...,
n
gli autovalori, non necessariamente distinti, di A
e a
1
, a
2
, ..., a
n
i corrispondenti autovettori linearmente indipendenti. Il
teorema 1.8 assicura che gli autovettori associati ad autovalori distinti
sono ortogonali. Lo stesso vale per gli autovettori associati ad
autovalori coincidenti; infatti sempre possibile costruire, da una base
di un autospazio, una base ortogonale dello stesso autospazio. Infine,
dividendo ogni vettore per la sua norma, otteniamo un insieme di
vettori ortonormali che indichiamo con p
1
, p
2
, ..., p
n
. evidente allora
34
che la matrice P = [p
1
| p
2
| ... | p
n
] una matrice ortogonale che
diagonalizza A, vale a dire P
T
AP = D.

In virt di tale teorema, possibile pertanto diagonalizzare le
matrici simmetriche mediante una similarit ortogonale individuata
dalla matrice P di cui sopra. Tale metodo, come vedremo pi avanti,
pu essere vantaggiosamente usato per diagonalizzare una forma
quadratica reale, rappresentata da una matrice simmetrica, mediante
un cambiamento ortogonale di coordinate.
ESEMPIO 1.6
Sia
A =
2 1 1
1 2 1
1 1 2

(
(


si determini una matrice P ortogonale tale che P
T
AP sia diagonale.
SOLUZIONE
det
(
(
(

) (2 1 1
1 ) (2 1
1 1 ) (2
= (1 )
2
( 4) = 0

Gli autovalori sono
1
=
2
= 1 e
3
= 4.
Per avere gli autovettori relativi a
1, 2
si risolve il sistema:

(A I) x =
1 1 1
1 1 1
1 1 1

(
(
x = 0

da cui, ponendo x
2
= h e x
3
= k, si ottiene:

35
x = h

(
(
1
1
0
+ k

(
(
1
0
1
, con h, k R.

Determiniamo ora, per tale sottospazio, una base costituita da
vettori ortogonali x
1
e x
2
. Tale base si pu costruire col seguente
procedimento. Fissiamo per comodit il primo vettore della base come

x
1
=

(
(
1
1
0


e individuiamo tra i generici vettori del sottospazio, che hanno la
forma [( h k) h k]
T
, quello ortogonale a x
1
, imponendo che sia:

[ 1 1 0]
(
(
(


k
h
k h
= 2h + k = 0 ;

da cui k = 2h. Allora se poniamo ad esempio h = 1 si ha k = 2 da
cui x
2
= [1 1 2]
T
.
Perci una base ortogonale costituita da x
1
=

(
(
1
1
0
e x
2
=
1
1
2

(
(
, e
v
1
= x
1
/ ||x
1
|| = [ 1 1 0]
T
/ 2 = [ 1 / 2 1 / 2 0]
T
,
v
2
= x
2
/ ||x
2
||= [1 1 2]
T
/ 6 = [1 / 6 1 / 6 2 / 6]
T
la
corrispondente base ortonormale.
Determiniamo ora gli autovettori associati allautovalore
2
= 4. Si
ottiene:
(A 4I) x =

(
(
2 1 1
1 2 1
1 1 2
x = 0
da cui:
36

x = p
1
1
1

(
(
, p R,
che, normalizzato d luogo a:

v
3
= x / ||x|| = [1 1 1]
T
/ 3 = [1 / 3 1 / 3 1 / 3]
T


Costruiamo infine la matrice P = [v
1
v
2
v
3
] richiesta:

P =

(
(
1 2 1 6 1 3
1 2 1 6 1 3
0 2 6 1 3
/ / /
/ / /
/ /
.

Si verifica facilmente che:

P
T
AP =
1 0 0
0 1 0
0 0 4

(
(

1.3 Forme quadratiche libere e vincolate
1.3.1 Forme quadratiche libere
Definizione 1.11
Si definisce forma quadratica una funzione Q:R
n
R cos definita:

Q (x) =

= =
n
1 i
n
1 j
j i ij
x x a

37
che, in forma compatta, pu essere anche scritta:

Q (x) =x
T
Ax

dove x un vettore di R
n
e A = [a
ij
] una matrice quadrata di ordine
n.
Si pu notare che la matrice A non univocamente determinata,
come mostra il seguente esempio:
ESEMPIO 1.7
Sia Q(x) =
2
2 2 1
2
1
3x x 6x x + + . Allora, come si pu facilmente
verificare, sia la matrice A
1
=
1 2
4 3

(
che la matrice A
2
=
1 3
3 3

(
si
possono associare alla forma quadratica Q(x). Lo stesso vale per tutte
le infinite matrici A =
(

3 a
a 1
21
12
con a
12
+ a
21
= 6.

Tuttavia, sempre possibile determinare una ed una sola matrice A
che sia simmetrica. Infatti se A non lo fosse, da:

Q (x) = x
T
Ax =
2
x A x Ax x
T T T
+

ponendo:
B =
2
A A
T
+

si ottiene Q (x) =x
T
Bx e B , come si verifica facilmente, una matrice
simmetrica.
Osserviamo ora che alcune forme quadratiche godono della
propriet che x
T
Ax > 0, oppure x
T
Ax < 0, per ogni x 0 come accade
ad esempio se consideriamo rispettivamente

38
Q (x)=
2
3
2
2
2
1
2x 5x x 3 + + e Q (x)=
2
3
2
2
2
1
3x 6x x .

Altre forme quadratiche verificano invece la propriet che x
T
Ax 0
per ogni x, oppure x
T
Ax 0. Si osservi che in questi casi non
necessariamente vero che x
T
Ax = 0 solo per x = 0, come mostra il
seguente esempio:
Q (x) = (x
1
2x
2
)
2
+ 5
2
3
x

che sempre non negativa e assume in particolare valore nullo in
corrispondenza di tutti e soli i vettori del tipo:

x
T
= [2 1 0 ], R.

Di rilevante importanza sono alcuni casi in cui la forma quadratica
assume valori dello stesso segno. Pi precisamente si introducono le
seguenti definizioni:
Definizione 1.12
La forma quadratica Q (x) = x
T
Ax, con x R
n
e A matrice
simmetrica, si dice:
definita positiva: se per ogni x0 risulta Q (x) > 0.
definita negativa: se per ogni x0 risulta Q (x) < 0.
semidefinita positiva: se per ogni x risulta Q (x) 0.
semidefinita negativa: se per ogni x risulta Q (x) 0.
indefinita: se assume valori positivi per alcuni x e negativi per altri.

Per la matrice simmetrica A associata a Q (x) valgono le stesse
qualificazioni.
Secondo tali definizioni, le matrici definite positive sono anche
semidefinite positive ma, qualora sia necessario evidenziare che
39
Q (x) 0 ed esiste un vettore x, non nullo, tale che Q (x) = 0, diremo
che A semidefinita positiva e singolare.
ESEMPIO 1.8
Dalla definizione 1.12 si pu dedurre facilmente il carattere delle
seguenti forme quadratiche:
a) Q
1
(x) =
2
3
2
2
2
1
x 3x x + + definita positiva: infatti x 0 risulta
Q (x) > 0.
b) Q
2
(x) =
2
1
2
2
2
1
7x 5 3x definita negativa: infatti x 0 risulta
Q (x) < 0.
c) Q
3
(x) =
2
1
x 9 6x
1
x
2
+
2
2
x semidefinita positiva: infatti
Q
3
(x) = (3x
1
x
2
)
2
, x, non negativa.
d) Q
4
(x) =
2
1
x 2x
1
x
2

2
2
x 4
2
3
x semidefinita negativa: infatti si
pu scrivere Q
4
(x) = (x
1
x
2
)
2
4x
3
e risulta, evidentemente,
Q
4
(x) 0 x.
e) Q
5
(x) =
2
1
x +
2
2
x
2
3
x indefinita: infatti essa assume sia valori
positivi, ad esempio per x = [2 2 1]
T
, che valori negativi, ad
esempio per x = [1 1 2]
T
.
Definizione 1.13
Si definisce forma quadratica diagonale una forma quadratica cui
associata una matrice diagonale.
TEOREMA 1.9
Data una forma quadratica Q (x) = x
T
Ax, esiste sempre una
trasformazione ortogonale di coordinate che trasformi Q (x) nella
seguente forma diagonale:

Q (y) =

=
n
1 i
2
i i
y = y
T
Dy

40
dove
i
(i = 1, ..., n) sono gli autovalori di A e D la matrice che
presenta sulla diagonale principale gli autovalori di A. Tale
trasformazione detta diagonalizzazione della forma quadratica.
DIMOSTRAZIONE
Poich la matrice A simmetrica, in virt del teorema 1.8, esiste
una matrice ortogonale P tale che risulti:

D = P
T
AP
da cui:
A = PDP
T
.

Pertanto si pu scrivere:

x
T
Ax = x
T
PDP
T
x

e, ponendo S=P
T
e y=Sx = P
T
x, si ha infine:

x
T
Ax = (Sx)
T
D(Sx) = y
T
Dy.

La diagonalizzazione della forma quadratica Q (x) viene pertanto
realizzata mediante un cambiamento ortogonale di coordinate
rappresentato da:
x = Py.

Esistono vari criteri che permettono di stabilire il carattere di una
forma quadratica. Tra essi, ricordiamo i seguenti teoremi:
TEOREMA 1.10
Condizione necessaria e sufficiente affinch la forma quadratica
Q(x) = x
T
Ax sia:
definita positiva che tutti gli autovalori di A siano positivi;.
41
definita negativa: che tutti gli autovalori di A siano negativi;
semidefinita positiva: che tutti gli autovalori di A siano non
negativi;
semidefinita negativa: che tutti gli autovalori di A siano non
positivi;
indefinita: che alcuni autovalori di A sono positivi ed altri
negativi.
DIMOSTRAZIONE
Dal teorema 1.9 segue che, operando un cambiamento ortogonale di
coordinate rappresentato da x = Py, si pu scrivere:

Q (x) =
2
n
2
2 2
2
1 1
y ... y y
n
+ + + .

evidente allora che, se ogni autovalore
i
positivo, allora Q(x)
definita positiva. Analoghe considerazioni si applicano negli altri
4 casi.

Tale criterio implica che si conoscano gli autovalori di A o, quanto
meno, il loro segno e, pertanto, in pratica, non molto conveniente.
Enunciamo quindi, senza dimostrazione, un criterio alternativo che
permette di caratterizzare le forme quadratiche, premettendo alcune
semplici condizioni necessarie per le forme quadratiche definite
positive. Un analogo teorema si pu evidentemente formulare per le
forme quadratiche definite negative.
TEOREMA 1.11
Condizione necessaria affinch la forma quadratica Q (x) = x
T
Ax
sia definita positiva che:
Gli elementi diagonali di A siano tutti positivi;
a
ii
a
jj
> |a
ij
|
2
(ij );
42
lelemento di A, pi grande in valore assoluto, deve trovarsi sulla
diagonale principale;
det A > 0.
TEOREMA 1.12
Condizione necessaria e sufficiente affinch la forma quadratica
Q (x) = x
T
Ax sia:
definita positiva che tutti i minori principali di N W di A siano
positivi,
definita negativa: che i minori principali di N W di A di ordine
dispari siano negativo mentre quelli di ordine pari siano positivi;
semidefinita positiva: che tutti i minori principali di A siano non
negativi;
semidefinita negativa: che i minori principali di A di ordine
dispari siano non positivi mentre quelli di ordine pari siano non
negativi.
ESEMPIO 1.9
1) Determinare il carattere della seguente forma quadratica:

Q (x) =
2
1
x + 4
2
2
x 4x
1
x
2
+ 5
2
3
x
SOLUZIONE
Posso scrivere:
Q (x) = (x
1
2x
2
)
2
+ 5
2
3
x

Allora, applicando la definizione 1.11, Q (x) risulta, in modo
evidente, semidefinita positiva. Infatti x R
3
risulta Q (x) 0.
Alla stessa conclusione si perviene calcolando gli autovalori della
matrice A associata a Q (x) e applicando poi il teorema 1.10.
Si ha pertanto:

43
A =
1 2 0
2 4 0
0 0 5

(
(
e A I =
( )
( )
( )
1 2 0
2 4 0
0 0 5

=
= (5 )
2
= 0, da cui
1
= 0 e
2
=
3
= 5. Pertanto Q (x) risulta
semidefinita positiva.
Applicando invece il teorema 1.12, bisogna controllare il segno dei
3 minori principali di ordine 1: 1, 4, 5, dei tre minori principali
di ordine 2:
1 2
2 4

= 0,
1 0
0 5
= 5,
4 0
0 5
= 2 e di det A = 0. Si
conclude che Q (x) semidefinita positiva.
ESEMPIO 1.10
Determinare lintervallo dei valori di Q per i quali risulta definita
positiva la forma quadratica seguente:

Q (x) =
2
1
x + 9
2
2
x + 6ax
1
x
2
, a R.
SOLUZIONE
La matrice simmetrica A = [a
ij
] che rappresenta Q (x) ha lelemento
diagonale a
ij
uguale al coefficiente di
2
i
x ed ha gli elementi a
ij
e a
ji

uguali ciascuno alla met del coefficiente di x
i
x
j
. Pertanto:

A =
(

9 a 3
a 3 1


Calcoliamo ora gli autovalori di A:

det (A I) = det
(



) 9 ( a 3
a 3 ) 1 (
=
2
10 + 9 (1 a
2
) = 0

da cui si ottiene
1
= 5
2
a 9 16 + e
2
= 5 +
2
a 9 16 + .
44
Per il teorema 1.10 si deduce che, affinch Q (x) sia definita
positiva,
1
e
2
devono essere entrambi positivi.
Perci:

> + +
> +
0 a 9 16 5
0 a 9 16 5
2
2
da cui 1 < a < 1 .

Si perviene alla stessa conclusione applicando il teorema 1.12.
Infatti, indicando con A
i
il minore principale di N W di ordine i si
ottiene:

A
1
= 1 > 0 A
2
= 9 9a
2
> 0 se 1 < a < 1.
1.3.2 Forme quadratiche vincolate
Nel paragrafo precedente abbiamo studiato il segno di una forma
quadratica in R
n
. Vogliamo ora limitare lo studio del segno di una
forma quadratica ad un sottospazio vettoriale di R
n
. Parliamo in questo
caso di forme quadratiche vincolate.
Si consideri allora una forma quadratica Q (x) = x
T
Ax e il
sottospazio lineare S R
n
dimensione (n m) dato da

S = {x R
n
: Bx = 0} (1.25)

con B matrice di tipo (m, n) e r(B) = m < n.
In base alla teoria generale dei sistemi lineari, risolvendo il sistema
lineare Bx=0, i vettori dellinsieme S risultano combinazioni lineari di
(n m) vettori di R
n
linearmente indipendenti. Quindi

S = {x R
n
: x = C, R
n
} (1.26)

con C matrice di tipo (n, n m), r(C) = n m.
45
Definizione 1.14
La forma quadratica Q (x) = x
T
Ax viene detta:
definita positiva (negativa) in S se per ogni x S \ {0} si ha
Q (x) > 0 (< 0);
semidefinita positiva (negativa) in S

se per ogni x S si ha
Q (x) 0 ( 0);
indefinita in S se Q assume in S valori positivi e negativi.

Risulta evidente che se la forma quadratica Q (x) = x
T
Ax definita
positiva (negativa) o semidefinita positiva (negativa) in R
n
a maggior
ragione lo sar in un sottospazio lineare S R
n
. Una forma quadratica
che risulta invece indefinita in R
n
pu risultare definita o semidefinita
in un sottospazio S R
n
.
ESEMPIO 1.11
Si consideri la forma quadratica

Q (x) =
2
1
x + 4
2
2
x 4x
1
x
2
5
2
3
x = (x
1
2x
2
)
2
5
2
3
x .

Applicando la Definizione 1.12, Q (x) risulta, in modo evidente,
indefinita. Se invece consideriamo il segno di Q(x) nel sottospazio
S={xR
3
: x
3
=0} immediato verificare che Q(x) risulta semidefinita
positiva.

Lo studio del segno di una forma quadratica vincolata pu essere
sempre ricondotto allo studio di una forma quadratica libera. Infatti si
osservi che, in base alla (1.26) ed alla Definizione 1.14, determinare il
segno della forma quadratica Q in S equivale a determinare il segno
della forma quadratica Q*() =
T
(C
T
AC) in R
n m
.
ESEMPIO 1.12
Consideriamo ancora la forma quadratica dellesempio precedente
46

Q (x) =
2
1
x + 4
2
2
x 4x
1
x
2
5
2
3
x = (x
1
2x
2
)
2
5
2
3
x

ed il sottospazio vettoriale S = {xR
3
: x
1
x
3
=0, 2x
1
+x
2
=0}.
Dal momento che i vettori xS sono del tipo x=[, 2, ]
T
si
ottiene Q*()=
2
+4( 2)
2
4( 2) 5
2
= 20
2
che risulta
definita positiva in R
3 2
=R.

Analogamente a quanto visto per le forma quadratiche libere,
vogliamo ora introdurre delle condizioni necessarie e sufficienti per
determinare direttamente il segno di una forma quadratica in un
sottospazio lineare. Un primo criterio si basa sullo studio del segno
delle soluzioni di una equazione algebrica di grado (n m). Tale
criterio estende quello presentato nel Teorema 1.10.
Consideriamo lequazione algebrica

det
(
(
(
(
(


n , m
T
n
0 B
B I A
= 0. (1.27)

Si dimostra il seguente
TEOREMA 1.13
Condizione necessaria e sufficiente affinch una forma quadratica
Q (x) = x
T
Ax sia

definita positiva in S che tutte le radici dellequazione algebrica
(1.27) siano positive.
definita negativa in S che tutte le radici dellequazione algebrica
(1.27) siano negative.
47
demidefinita positiva in S che tutte le radici dellequazione
algebrica (1.27) siano non negative.
semidefinita negativa in S che tutte le radici dellequazione
algebrica (1.27) siano non positive.
indefinita in S che almeno due radici dellequazione algebrica
(1.27) siano di segno opposto.

Enunciamo, per concludere, un criterio alternativo che ci consente
di determinare il segno di una forma quadratica vincolata definita. Si
consideri a questo proposito la matrice orlata di dimensione (n+m)
data da

(

=
A B
B 0
A
T
m
(1.28)
TEOREMA 1.14
Condizione necessaria e sufficiente affinch la forma quadratica
Q(x) = x
T
Ax sia
definita positiva in S che gli ultimi (n m) minori principali di
N W della matrice (1.28) abbiano segno costante dato da ( 1)
m
.
definita negativa in S che gli ultimi (n m) minori principali di
N W della matrice (1.28) abbiano segno alterno a partire da
( 1)
m + 1
.
49
CAPITOLO 2

FUNZIONI DI PI VARIABILI
2.1 Calcolo differenziale per le funzioni reali di n variabili reali
Assegnato un sottoinsieme A R
n
, viene detta funzione reale di n
variabili reali, una relazione F che ad ogni elemento x A fa
corrispondere uno ed un solo numero reale F (x).

Linsieme A viene detto campo di esistenza o dominio di F e
linsieme F (A) definito da

F (A) = {y R: y = F (x), x A} (2.1)

viene detto codominio o immagine di F.
Definizione 2.1
I sottoinsiemi L(F, d) di R
n
costituiti dai vettori x A per cui
F (x) = d, con d F (A), vengono chiamati linee o curve di livello
1
di
F. In simboli:

L(F, d) = {x A: F (x) = d, d F (A) }. (2.2)


1
In economia le curve di livello di una funzione vengono chiamate, a seconda
del contesto, isoquanti, isocosti, curve di indifferenza.
50
I sottoinsiemi S(F, d) [I(F, d)] di R
n
costituiti dai vettori x A per
cui F (x) d [ d], con d F (A), vengono chiamati sezioni o insiemi
di livello superiori [inferiori] di F. In simboli:

S(F, d) = {x A: F (x) d, d F (A) }. (2.3)

I (F, d) = {x A / F (x) d, d F (A) }. (2.4)

Si osservi che L(F, d) = S(F, d) I(F, d).
Utilizzando la nozione di intorno circolare richiamata nel
precedente paragrafo, possibile estendere alle funzioni di pi
variabili il concetto di limite e di continuit.
Definizione 2.2
Una funzione F definita in A R
n
viene detta continua in
x A A se


x x
lim F (x) = F (x), (2.5)

ossia se per ogni numero reale > 0 esiste un aumero reale > 0 tale
che se x I(x, ) A allora | F (x) F (x) | < .

Se in modo particolare linsieme A aperto, in base alla
definizione precedente si puo controllare la continuit di F per ogni
x A. Nel seguito C
0
(A) indicher la classe delle funzioni continue in
A.
Illustrare i procedimenti utilizzati per verificare la continuit di una
funzione F in pi variabili esula dagli scopi di questo lavoro. Per il
seguito si ricordi che risultano sicuramente continue le funzioni che
appartengono a ciascuna delle seguenti classi:

51
le funzioni lineari affini: F (x) = <a, x>+ b;
le funzioni quadratiche: F (x) = x
T
Ax +<a, x>+ b con A matrice
simmetrica di ordine n;
le funzioni elementari (esponenziali, logaritmiche, potenza,
trigonometriche) nel loro campo di esistenza;
le funzioni ottenute dalle funzioni elementari con le usuali
operazioni algebriche;
le funzioni composte con funzioni continue.

Si consideri ora una funzione reale F definita in un aperto A R
n
,
un vettore x A e la retta orientata passante per x con direzione e
verso fissati dal versore v.
Essendo A un insieme aperto, per ogni t reale appartenente ad un
opportuno intorno dellorigine I(0) linsieme

I
v
(x
0
) = {xR
n
: x = x
0
+tv, tI(0)}

risulta contenuto in A.
La funzione reale di variabile reale (t) = F (x
0
+ tv) risulta definita
nellintervallo aperto I(0) e viene detta restrizione della funzione F
alla porzione di retta I
v
(x
0
).
Per tale funzione si pu calcolare il limite del rapporto
incrementale in ogni punto t I (0).
Si arriva pertanto alla seguente
Definizione 2.3
Se la funzione reale di variabile reale (t) ammette derivata prima
in t = 0, ossia se esiste finito il limite del suo rapporto incrementale in
t = 0, si dice che F ammette in x
0
derivata nella direzione v. Si pone
poi
52

t
) x ( F ) v t x ( F
t
) 0 ( ) t (
) 0 ( '
0 0
0 t 0 t
+
=

=

lim lim = D
v
F (x
0
).

Scegliendo come versori i vettori fondamentali e
1
, e
2
, ..., e
n
, dalla
definizione precedente si ottengono le derivate parziali (prime) che
vengono indicate con uno dei seguenti simboli equivalenti

D
j
F (x
0
), ) x (
x
F
0
j

, ) x ( F
0
x
j
, j=1, ... n.

In questo caso particolare, fissato il vettore fondamentale e
j
, lunica
variabile incrementata risulta la j-esima e quindi la derivata parziale
prima D
j
F (x) si calcola considerando tutte le variabili x
i
, i = 1, ..., n,
i j, come delle costanti.
Il vettore che ha come componenti le n derivate parziali prime di F
in x viene detto gradiente di F in x ed indicato con il simbolo:

F (x) =
( )
( )(
(
(

x F D
x F D
n
1
M (2.6)
ESEMPIO 2.1
Si considerino la funzione lineare F (x) = <a, x> e la funzione
polinomiale omogenea di secondo grado, o forma quadratica,
Q (x) = x
T
Ax, con A matrice quadrata simmetrica. Semplici passaggi
algebrici permettono di verificare che

<a, x>= a (2.7)

x
T
Ax = 2Ax. (2.8)
53
ESEMPIO 2.2
Si consideri la funzione

F (x
1
,x
2
) =

0 x se 0
0 x se
x
x
2
2
2
1
ed il punto x
0
=(1,0).

facile verificare che D
1
F (x
0
)=0, mentre tutte le altre derivate
direzionali non esistono. Quindi lesistenza della derivata di F lungo
una direzione non ci d informazioni circa lesistenza delle derivate di
F lungo altre direzioni.

Se esiste D
v
F (x
0
), la restrizione (t) = F (x
0
+tv) della funzione F,
risulta derivabile in t=0 e quindi continua in t=0. La funzione F risulta
pertanto continua in x
0
lungo la direzione v. Lesistenza delle derivate
direzionali di F in x
0
lungo ogni direzione, non implica comunque la
continuit globale di F in x
0
come mostra il seguente esempio.
ESEMPIO 2.3
Si consideri la funzione

F (x
1
,x
2
) =

0 x se 0
0 x se
x
x
2
2
2
1
2
ed il punto x
0
=(0,0).

facile verificare che la funzione F ammette in x
0
=0 tutte le
derivate direzionali, ma non risulta continua in x
0
, poich F (x
1
,0) = 0
mentre F (x
1
, x
1
2
) = 1.

Per ottenere una sufficiente regolarit della funzione F in un intorno
del punto x
0
dobbiamo introdurre il concetto di differenziabilit.
54
Definizione 2.4
Una funzione F: AR
n
R, A aperto, viene detta differenziabile in
x
0
A se esiste un vettore aR
n
tale che

F (x
0
+h) = F (x
0
) + <a, h> + o( h ),

per ogni hR
n
tale che x
0
+hA. Una funzione differenziabile in A
se differenziabile in ogni punto di A.
Per le funzioni differenziabili si dimostra il seguente
TEOREMA 2.1
Sia F: A R
n
R, A aperto. Se F differenziabile in x
0
A,
allora valgono le seguenti implicazioni:
1. F risulta continua in x
0
.
2. Il vettore a risulta univocamente determinato e coincide con
F (x
0
).
3. F ammette in x
0
derivata lungo qualunque direzione v ed inoltre
D
v
F (x
0
) = <F (x
0
), v>.
Definizione 2.5
Se F differenziabile in x
0
, liperpiano passante per (x
0
, F (x
0
))
assegnato dai vettori

{(x, y)R
n+1
: y= F (x
0
) + <F (x
0
),xx
0
>}

viene detto iperpiano tangente al grafico di F in (x
0
, F (x
0
)).
OSSERVAZIONE
Sia F differenziabile in x
0
con F (x
0
) 0. Per un generico versore
v R
n
, dalla uguaglianza D
v
F (x
0
) = <F (x
0
), v> otteniamo
55

D
v
F (x
0
)= cos ) x ( F
0


dove langolo formato dai vettori F (x
0
) e v (cfr. capitolo 1, 1).
D
v
F (x
0
) risulta pertanto massima per cos()=1, cio per


) x ( F
) x ( F
v
0
0

=

mentre risulta minima per cos()= 1 cio per


) x ( F
) x ( F
v
0
0

= .
Dato che la derivata direzionale misura lincremento della funzione
nella direzione corrispondente, possiamo concludere che la funzione
presenta incremento massimo quando
) x ( F
) x ( F
v
0
0

= (direzione di
massima crescita), mentre presenta incremento minimo quando
) x ( F
) x ( F
v
0
0

= (direzione di minima crescita).



Il seguente teorema fornisce una condizione sufficiente di
differenziabilit.
TEOREMA 2.2
Sia F: A R
n
R, A aperto. Se F ammette derivate parziali prime
continue in x
0
, allora F risulta differenziabile in x
0
.

56
Sottolineamo ancora una volta che la sola esistenza delle derivate
parziali prime in x
0
non implica la differenziabilit di F in x
0
. Basta
infatti osservare come lesistenza delle derivate parziali prime in x
0

non implichi nemmeno la continuit di F in tale punto. Si veda al
proposito lEsempio 2.3.
Nel seguito con C
l
(A) si indicher la classe delle funzioni continue,
con derivate parziali prime continue nellaperto A.

Sia F: A
n
, A aperto con F C
1
(A). Essendo in queste
ipotesi F differenziabile in A, esistono per ogni v
n
e per ogni xA,
le derivate direzionali D
v
(F (x)) che a loro volta risultano funzioni
reali definite in A.
Definizione 2.6
Siano v e w versori di R
n
. Si consideri la funzione reale D
v
(F):
AR
n
R, A aperto ed un punto x
0
A. Se esiste la derivata
direzionale D
w
(D
v
F)(x
0
) diciamo che F ammette in x
0
derivata
seconda nelle direzioni v e w e poniamo D
w
(D
v
F)(x
0
)= D
2
wv
F (x
0
).
Scegliendo come versori i vettori fondamentali e
j
ed e
i
, si ottengono
le derivate parziali seconde che vengono indicate con uno dei seguenti
simboli equivalenti

D
2
i,j
F (x
0
), ) x (
x x
F 0
j i
2

, ) x ( F
0
x x
'
j i
, i,j=1,... n.

In particolare per i=j si adottano le seguenti notazioni:

D
2
i
F (x
0
), ) x (
x
F 0
i
2
2

, ) x ( F
0
x x
i i
, i=1,... n.

57
Per i = j le derivate parziali seconde si dicono pure. Per ij le
derivate parziali seconde si dicono miste.
Si noti che in generale D
2
wv
F (x
0
) D
2
vw
F (x
0
). Si consideri al
proposito la funzione

F (x
1
,x
2
) =

+
0 ) x , x ( se 0
0 ) x , x ( se
x x
x x
2 1
2 1 2
2
2
1
3
2 1
.

Svolgendo i conti si ottiene:

D
1
F (x
1
,x
2
) =

0 ) x , x ( se 0
0 ) x , x ( se
) x x (
x x x
2 1
2 1
2 2
2
2
1
3
2
2
1
5
2
;
D
2
F (x
1
,x
2
) =

+
+
0 ) x , x ( se 0
0 ) x , x ( se
) x x (
x x 3 x x
2 1
2 1
2 2
2
2
1
2
2
2
1
4
2 1
.

Si pu ora verificare che D
12
F (0,0) = 0, mentre D
21
F (0,0)=1.

Per evitare gli inconvenienti illustrati nel precedente esempio nel
seguito con C
2
(A) si indicher la classe delle funzioni continue, con
derivate parziali prime e seconde continue nellaperto A. In queste
ipotesi si pu infatti dimostrare linvertibilit dellordine di
derivazione (teorema di Schwartz). Possiamo ora introdurre la
seguente
Definizione 2.7
Sia F: AR
n
R, A aperto con F C
2
(A). La matrice simmetrica
delle derivate parziali seconde di F in x
0

58

H
F
(x
0
) =
(
(
(
(
(

) x ( F D .... ) x ( F D ) x ( F D
.... .... .... ....
) x ( F D .... ) x ( F D ) x ( F D
) x ( F D .... ) x ( F D ) x ( F D
0
2
n
0
2
2 n
0
2
1 n
0
2
n 2
0
2
2
0
2
21
0
2
n 1
0 2
12
0
2
1


viene detta matrice hessiana di F in x
0
.
La funzione quadratica

Q (h) = h
T
H
F
(x
0
)h =
j i
0
n
1 i
n
1 j
2
ij
h h ) x ( F D

= =

viene detta forma quadratica associata alla matrice hessiana di F
in x
0
o pi brevemente forma quadratica hessiana.
ESEMPIO 2.4
Si consideri la forma quadratica Q(x) = x
T
Ax. In base allEsempio
2.1, ricordando che A una matrice simmetrica, si ottiene:

H
Q
(x) = 2A.

A conclusione del paragrafo si richiama un importante teorema che
ci consente di avere informazioni sul comportamento di una funzione
F in un intorno di un punto x
o
dalla conoscenza delle derivate parziali
prime e seconde della funzione stessa. Utilizzerremo questa
approsimazione nel corso del Capitolo successivo.
TEOREMA 2.3
Sia F: AR
n
R, A aperto, F C
2
(A) ed x
0
A, hR
n
tale che
x
0
+hA. Allora vale la seguente uguaglianza nota come formula di
Taylor con centro in x
0


59
F (x
0
+h) = F (x
0
) + <F (x
0
),h> +
2
1
h
T
H
F (
x
0
)h + o( h
2
)

Se poniamo h=tv con t reale appartenente ad un intorno I(0)
dellorigine e v versore di R
n
, la formula di Taylor precedente pu
essere riscritta come

F (x
0
+tv)= F (x
0
) + t < F (x
0
),v > +
2
t
2
v
T
H
F
(x
0
)v +o(t
2
).
2.2 Punti estremi per le funzioni di pi variabili
Definizione 2.8
Assegnata una funzione reale F definita in A R
n
, un punto xA
viene detto punto di massimo relativo (o locale) per F in A se esiste un
opportuno intorno I (x, ) tale che:

F (x) F (x) per ogni x I(x, ) A. (2.9)

Analogamente un punto xA viene detto punto di minimo relativo
(o locale) per F in A se esiste un opportuno intorno I (x, ) tale che
2
:

F (x) F (x) per ogni x I(x, ) A. (2.10)

Qualora nella (2.9) o nella (2.10) la disuguaglianza sia stretta per
ogni xx
o
, il punto x rispettivamente un punto di massimo relativo
forte o un punto di minimo relativo forte. In caso contrario si parla di
punto di massimo relativo debole o punto di minimo relativo debole.

2
Le relazioni (1) e (2) non escludono la possibilit che il vettore x sia un punto
di frontiera di A, appartenente ad A.
60
I punti di massimo e di minimo relativo di una funzione F in A
verranno anche detti punti estremi (locali) o estremanti (locali) di F in
A.
Definizione 2.9
Assegnata una funzione reale F definita in A R
n
, un punto xA
viene detto punto di massimo assoluto (o globale) di F in A se:

F (x) F (x) per ogni x A. (2.11)

Analogamente un punto xA viene detto punto di minimo
assoluto (o globale) di F in A se:

F (x) F (x) per ogni x A. (2.12)

Dallesame delle relazioni (2.11) e (2.12) risulta evidente come un
punto di massimo o minimo assoluto sia necessariamente un punto di
massimo o minimo relativo, mentre in generale non vale il viceversa
3
.
Una funzione pu dunque ammettere dei punti estremi relativi senza
tuttavia ammettere un punto di massimo ed un punto di minimo
assoluti.
Il seguente teorema, dovuto a Weierstrass, fornisce una condizione
sufficiente per garantire lesistenza di punti di massimo e di minimo
assoluti.

3
Esiste unimportante classe di funzioni, dette funzioni concave (convesse) per
cui i punti di massimo (minimo) relativo si identificano con i punti di massimo
(minimo) assoluti.
61
TEOREMA 2.4
Una funzione reale F definita in un insieme chiuso e limitato
(compatto) K R
n
ed ivi continua, ammette in K almeno un punto di
massimo ed un punto di minimo assoluti.

Si noti che se la funzione F ammette in xA un punto di minimo
relativo o assoluto, la funzione G(x) = F (x), ammette in x un punto
di massimo relativo o assoluto. Quindi nel seguito, senza perdita di
generalit, potremo limitarci allo studio dei punti di massimo locale o
assoluto.
2.3 Funzioni concave e convesse
Si consideri, per tutto il paragrafo, una funzione reale F definita in
un insieme convesso A R
n
.
Definizione 2.10
La funzione F viene detta concava in A se per ogni coppia x
l
,
x
2
A e per ogni scalare con 0 1, vale la disuguaglianza:

F (x
1
+ (1 )x
2
) F (x
1
) + (1 )F (x
2
) (2.13)

In particolare F viene detta strettamente concava in A se per ogni
coppia x
l
, x
2
A, x
l
x
2
, e per ogni scalare con 0 < < 1 vale la
disuguaglianza:

F (x
1
+ (1 )x
2
) > F (x
1
) + (1 )F (x
2
) (2.14)

Analogamente la funzione F viene detta convessa in A se la
funzione F concava in A. La funzione F risulta pertanto convessa
62
in A per ogni coppia x
l
, x
2
A e per ogni scalare con 0 1 vale
la disuguaglianza:

F (x
1
+ (1 )x
2
) F (x
1
) + (1 )F (x
2
) (2.15)

In particolare F viene detta strettamente convessa in A se per ogni
coppia x
l
, x
2
A, x
l
x
2
, e per ogni scalare con 0 < < 1 vale la
disuguaglianza:

F (x
1
+ (1 )x
2
) < F (x
1
) + (1 )F (x
2
) (2.16)
ESEMPI
1 Una funzione F costante, cio tale che per ogni x R
n
,
F (x) = k per un opportuno k R, sia concava che convessa ma mai
strettamente concava o strettamente convessa.

2 Una funzione reale lineare in R
n
, F (x) = a
T
x con a R
n
, sia
concava che convessa. Si ha infatti:

a
T
(x
1
+ (1 )x
2
) = a
T
x
1
+ (1 ) a
T
x
2
(2.17)

per ogni x
l
, x
2
R
n
e per ogni scalare con 0 1. La funzione
lineare non mai n strettamente concava n strettamente convessa.

3 La forma quadratica Q (x) = x
T
Ax risulta una funzione concava
se semidefinita negativa, convessa se semidefinita positiva. Infatti
supponendo Q semidefinita negativa e osservando che
2
si
constata facilmente che:

Q (x
1
+ (1 )x
2
) = Q (x
2
+ (x
1
x
2
)) =

[x
2
+ (x
1
x
2
)]
T
A [x
2
+ (x
1
x
2
)] = (x
2
)
T
A(x
2
) +
63

+
2
(x
1
x
2
)
T
A (x
1
x
2
) + 2(x
2
)
T
A (x
1
x
2
)

(x
2
)
T
A(x
2
) + (x
1
x
2
)
T
A (x
1
x
2
) + 2(x
2
)
T
A (x
1
x
2
) =

= (x
1
)
T
A(x
1
) + (1 )(x
2
)
T
A (x
2
) =

= Q (x
1
) + (1 ) Q (x
2
).

La verifica per il caso in cui Q risulta semidefinita positiva pu
essere condotta in modo del tutto analogo. In particolare Q risulta
strettamente concava (convessa) se definita negativa (positiva).

4 La somma di funzioni concave (convesse) ancora una
funzione concava (convessa). Perci una funzione affine risulta
concava e convessa in R
n
, mentre la funzione reale

F (x) = x
T
Ax + a
T
x + (2.18)

risulta concava (convessa) quando Q(x) = x
T
Ax semidefinita
negativa (positiva).

OSSERVAZIONE
Da un punto di vista geometrico, una funzione F risulta concava
(convessa) in A quando, fissati comunque due vettori x
l
, x
2
A, i
vettori di R
n + 1
, appartenenti al segmento di estremi
(

) x ( F
x
1
1
ed
(

) x ( F
x
2
2
ossia i vettori del tipo
(

+
+
) x ( F ) 1 ( ) x ( F
x ) 1 ( x
2 1
2 1
per 0 < < 1,
64
giacciono tutti al di sotto (sopra) dei vettori
(

+
+
) x ) 1 ( x ( F
x ) 1 ( x
2 1
2 1
per
0 < < 1, che appartengono al grafico di F.
I seguenti grafici esemplificano quanto si detto per il caso di una
funzione concava reale di variabile reale:


FIGURA 2.1

Le propriet valide per le funzioni concave si possono facilmente
adattare a rispettive propriet per le funzioni convesse. Perci, senza
perdita di generalit, parleremo nel seguito solo di funzioni concave
lasciando al lettore il compito di riscrivere i risultati ottenuti per le
funzioni convesse.
TEOREMA 2.5
Se la funzione F concava in A, le sezioni superiori di F

S(F, d) = {x A / F (x) d, d F (A)} (2.19)
65

sono insiemi convessi.

Dimostrazione. Linsieme (2.18) risulta sicuramente convesso se
costituito da un unico vettore. In caso contrario scelti comunque due
vettori x
1
, x
2
S(F, d) per la (2.13) si ottiene:

F (x
1
+ (1 )x
2
) F (x
1
) + (1 )F (x
2
) d

e perci x
1
+ (1 )x
2
S(F, d).

Limportanza delle funzioni concave nei problemi di
ottimizzazione e dovuta al fatto che, per le funzioni concave, i punti di
massimo relativo si identificano con i punti di massimo assoluto.
Sussiste infatti il seguente
TEOREMA 2.6
Ogni punto di massimo relativo per una funzione F concava in A
un punto di massimo assoluto per F in A.

Dimostrazione. Sia x un punto di massimo relativo per F in A.
Allora esiste un opportuno intorno I(x, ) per cui:

F (x) F (x) per ogni x I(x, ) A. (2.20)

Si supponga per assurdo che x non sia un punto di massimo
assoluto per F in A. Questo significa che esiste almeno un vettore
x* A con x x* per cui:

F (x) > F (x*). (2.21)

66
Dalla definizione di funzione concava si ottiene perci per ogni
0 1:

F (x + (1 )x
*
) F (x) + (1 )F (x
*
) >
F (x) + (1 ) F (x) = F (x). (2.22)

Poich i vettori del tipo x() = x + (1 )x* appartengono per
ogni 0 1 al segmento congiungente x con x*, sempre possibile
scegliere un numero reale opportuno, con 0 < < 1, in modo che i
vettori x() appartengano allintorno I(x, ). In questo caso la (2.22)
assicura:

F (x()) > F (x) per < < 1

che risulta in contraddizione con lipotesi (2.20).

Si pu inoltre dimostrare facilmente che linsieme dei punti di
massimo di una funzione concava costituiscono un insieme convesso e
che una funzione strettamente concava ammette al pi un solo punto
di massimo assoluto.

I seguenti teoremi caratterizzano le funzioni F concave
differenziabili.
TEOREMA 2.7
Una funzione F C
l
(A), con A insieme aperto e convesso di R
n
,
concava in A se e solo se per ogni coppia di vettori x
l
, x
2
A vale la
disuguaglianza:

F (x
2
) F (x
1
) [grad F (x
l
)]
T
(x
2
x
1
). (2.23)

67
Inoltre nella (2.23) vale la disuguaglianza stretta per ogni coppia x
l
,
x
2
A, x
l
x
2
se e solo se la funzione F strettamente concava in A.

Il teorema enunciato ha unimmediata interpretazione geometrica.
Ricordando che la funzione y(x) = F (x
1
) + [grad F (x
1
)] (x x
1
) ha
come grafico liperpiano tangente al grafico di F in x
1
, dalla (2.23) si
deduce che:

F (x
2
) y(x
2
) per ogni x
2
A (2.24)

I valori di una funzione F concava sono per la (2.24) sovrastimati
dai valori di y, ovvero il grafico di F sempre al di sotto
delliperpiano tangente ad F in x
l
per ogni x
1
A.
Il seguente grafico esemplifica quanto si detto nel caso di una
funzione reale di variabile reale concava


FIGURA 2.2
68

Per le funzioni dotate di derivate parziali seconde continue in A,
sussiste il seguente teorema che risulta il criterio pi usato per stabilire
la concavit di una funzione.
TEOREMA 2.8
Una funzione F C
2
(A), con A insieme aperto e convesso di R
n
,
concava in A se e solo se la forma quadratica hessiana:

Q (h) = h
T
H
F
(x) h (2.25)

semidefinita negativa in R
n
per ogni x A.
Inoltre se la forma quadratica hessiana (2.25) definita negativa per
ogni x A, la funzione F strettamente concava in A.

Il seguente esempio ci mostra come una funzione strettamente
concava non ammetta necessariamente una forma quadratica hessiana
definite negativa.
ESEMPIO 2.5
Si consideri la funzione F (x, y) = x
4
y
4
. La matrice hessiana di F
:

H
F
(x, y) =
(

2
2
y 12 0
0 x 12


ed semidefinita negativa in R
2
. Infatti essa assume valori negativi per
ogni (x, y)R
2
, (x, y) (0, 0), tranne che in corrispondenza dei punti
appartenenti agli assi coordinati, ove si annulla.
La funzione F (x, y) = x
4
y
4
comunque strettamente concava in R
2
.

69
Terminiamo con un risultato riguardante la minimizzazione di una
funzione concava.
TEOREMA 2.9
Sia F una funzione concava non costante in A con A insieme
convesso di R
n
. Se x
*
un punto di minimo per F in A, allora x
*
A.

Dimostrazione. Supponiamo per assurdo che il punto di minimo x
*

sia un punto interno di A. Dato che per le ipotesi F non risulta costante
in A, esister un punto yA tale che F (y) > F (x
*
); inoltre
F (x) F (x
*
) per ogni xA.
Essendo x
*
un punto interno di A, possiamo sempre determinare un
vettore zA tale che x
*
= y + (1 )z. Quindi F (x
*
) = F (y +
(1 ) z) F (y) + (1 ) F (z) > F (x
*
) che assurdo.

2.4 Insiemi di livello e funzioni implicite
Una funzione reale di variabile reale, oltre che nella forma esplicita
y = f (x) o x = g (y), pu essere definita implicitamente da
unequazione del tipo F (x, y) = 0. Lo stesso vale per le funzioni reali
di n variabili. Sar allora interessante sapere quali condizioni sulla
funzione F garantiscono la possibilit di rendere esplicita una variabile
in funzione delle rimanenti. Come vedremo questo problema non
ammette necessariamente una soluzione ed inoltre, se la soluzione
esiste non necessariamente unica.
Inizieremo la trattazione nel caso pi semplice di funzioni reali F di
due variabili reali, in quanto saremo aiutati da interpretazioni
geometriche dei risultati ottenuti, per presentare poi il caso pi
generale di funzioni di n variabili reali, n>2.
Consideriamo allora una funzione reale F: A R
2
R di classe
C
1
(A), con A insieme aperto e linsieme di livello
70

L
0
=L(F,0)={(x, y)A: F (x, y)= 0}.

Gli esempi seguenti mostrano che linsieme L
0
pu coincidere o
interamente o parzialmente con il grafico di una funzione reale di
variabile reale y = h (x) o x = k (y).
ESEMPI
1) Sia F (x, y) = y 2x
2
+ 3x 4.
In questo caso linsieme di livello L
0
= {(x, y): y 2x
2
+ 3x
4 = 0} coincide con il grafico della funzione y = 2x
2
3x + 4.
2) Sia F (x, y) = x
2
+ y
2
1.
Linsieme di livello L
0
= {(x, y): x
2
+ y
2
1 = 0} rappresenta la
circonferenza di equazione x
2
+ y
2
=1.
In questo caso, L
0
non rappresenta il grafico di una funzione ma si
pu considerare come lunione dei grafici delle due funzioni
continue seguenti:


1
(x) =
2
1 x e
2
(x) =
2
1 x .

Si noti che entrambe le suddette funzioni soddisfano identicamente
lequazione

x
2
+
i
2
(x) 1 = 0 (i = 1,2).

La prima funzione univocamente determinata dalla condizione
(0)=1, mentre la seconda funzione dalla condizione (0) = 1.
Pi in generale ogni funzione del tipo (x) = (x)
2
x 1 , dove
assume nellintervallo [ 1,1] i valori 1 ed 1, soddisfa identicamente
lequazione x
2
+
2
(x) 1 = 0. Nessuna di queste funzioni risulta per
continua in [ 1,1].
71
3) Sia F (x, y) = x
2
+ 2y
2
+ 3 = 0.
immediato vedere che in questo caso linsieme di livello L
0

vuoto.

Indicando, come di consueto, con x la variabile indipendente e con
y la variabile dipendente, si pone allora il problema di ricavare
dallequazione F (x, y) = 0, una funzione y = (x) che, per opportuni
valori di x, soddisfi lequazione F (x, (x))=0. Si introduce a questo
proposito la seguente
Definizione 2.11
Una funzione y = (x) definita nellinsieme D R, tale che per
ogni x D si abbia (x, (x)) A si dice una funzione implicita
definita da F (x, y) = 0, se

F (x, (x)) = 0, xD.

Vogliamo ora esaminare sotto quali condizioni garantita
lesistenza e lunicit di una funzione implicita definita dallequazione
F (x, y) = 0. Inoltre vogliamo studiare la differenziabilit della
funzione implicita a partire da informazioni sulla differenziabilit
della funzione F. I risultati che presenteremo hanno, come vedremo,
carattere locale.
TEOREMA 2.10 (Teorema di Dini)
Sia F: A R
2
R, A insieme aperto, F C
1
(A) ed (x
o
, y
o
) A
tale che F (x
o
, y
o
) = 0; se D
y
F (x
o
, y
o
) 0 allora esiste un intorno I di x
o

e un intorno J di y
o
, con I J A e una sola funzione : I J tale
che:

72
y
0
= (x
0
);
F [x, (x)] = 0, x I;
C
1
(I) ed inoltre (x) =
[ ]
[ ] ) x ( , x F D
) x ( , x F D
y
x

per ogni xI.



Dimostrazione. Sia F (x
o,
y
o
) = 0 e, senza perdita di generalit,
supponiamo D
y
F

(x
o,
y
o
) > 0. Per ipotesi D
y
F una funzione continua,
pertanto per il teorema della permanenza del segno esiste un intervallo
chiuso e limitato [x
o
h, x
o
+ h] [y
o
k, y
o
+ k], con h > 0, k > 0,
contenuto in A, in ciascun punto del quale D
y
F

>0.
La funzione F (x
0
, y) strettamente crescente nellintervallo
[y
o
k, y
o
+ k] e si annulla in y
o
. Pertanto si ha

F (x
0
, y) < 0 per y
o
k < y < y
o
,
F (x
0
, y) > 0 per y
o
< y < y
o
+ k.

In particolare si avr

F (x
o
, y
o
k) < 0 < Fx
0
, y
o
+ k)

La funzione F continua e, per il teorema della permanenza del
segno, risulta positiva in un opportuno intorno di (x
o
, y
o
+ k) e
negativa in un opportuno intorno di (x
o
, y
o
k). Pertanto esiste un
numero reale positivo a tale che:

F (x, y
o
k) < 0 < F (x, y
o
+ k) per x
o
a < x < x
o
+ a.

73

FIGURA 2.3

Si fissi x* [x
o
a, x
o
+ a].
Inoltre, poich F (x*, y) continua e strettamente crescente in
[y
o
k, y
o
+ k], essendo

F (x*, y
o
k) < 0, F (x*, y
o
+ k) > 0,

F (x*, y) si annuller in corrispondenza ad un unico punto
y*[y
o
k, y
o
+ k].
Tuttavia affermare che per ciascun x I = [x
o
a, x
o
+ a] esiste uno
ed un solo y J = [y
o
k, y
o
+ k] che verifica F (x, y) = 0, equivale ad
affermare che esiste una ed una sola applicazione : I J, tale che

F [x, (x)] = 0

per ogni x I.

Alla stessa conclusione si perviene se si suppone la derivata
parziale D
y
F negativa.

Se nellenunciato del Teorema di Dini, la funzione F C
2
(A),
anche la funzione C
2
(I) ed inoltre
74

(x) =
3
y
2
x yy y x xy
2
y xx
F
) F ( F F F F 2 ) F ( F +
,
dove tutte le derivate si intendono calcolate in (x, (x)).
Pi in generale se la funzione F C
n
(A), anche la funzione C
n
(I)
e le derivate successive di possono essere calcolate utilizzando le
derivate parziali di F. Questo ci consente di conoscere della funzione
lo sviluppo di Taylor con centro in x
0
fino ad un ordine opportuno.
Anche se lespressione analitica della funzione non nota, si
conosce per una sua buona approssimazione polinomiale.
OSSERVAZIONI

1) Il Teorema di Dini rappresenta una condizione sufficiente per
lesistenza di una funzione implicita. Al proposito basta considerare la
funzione F (x, y)= x
3
y
3
ed il punto (x
0
, y
0
)=(0,0). immediato
verificare che F (0,0)=0 ed inoltre in un intorno dellorigine x
3
y
3
=0
y=x. Esiste quindi ununica funzione continua definita
implicitamente dallequazione F (x, y)=0, anche se F (0,0)=0.

2) Quando F (x
0
, y
0
) = 0 nulla si pu dire circa lesistenza e
lunicit della funzione definita implicitamente dallequazione
F (x, y) = 0. Al proposito si considerino i seguenti esempi:

F (x, y)= x
3
y
3
, (x
0
, y
0
)=(0,0).
F (x, y)= y
4
x
4
, (x
0
, y
0
)=(0,0).
F (x, y)= y
4
+x
2
, (x
0
, y
0
)=(0,0).

Abbiamo in ogni caso F (0, 0) = 0. Nel primo esempio la funzione
implicita esiste ed unica, nel secondo esempio esistono due funzioni
implicite mentre nel terzo caso non esistono funzioni implicite.
75

Il teorema 2.10 pu essere esteso al caso di funzioni di n variabili,
n > 2, come segue.
TEOREMA 2.11
Sia F: A R
n+1
R, A insieme aperto, F C
1
(A) ed (x
o
, y
o
) A
tale che F (x
o
, y
o
) = 0; se D
y
F (x
o
, y
o
) 0 allora esiste un intorno
completo I di x
o
e un intorno completo J di y
o
, con I J A e una sola
funzione : I J tale che:
y
0
= (x
0
);
F [x, (x)] = 0, x I;
C
1
(I) ed inoltre
i
(x) =
[ ]
[ ] ) x ( , x F
) x ( , x F
y
x
i

per ogni xI.


Definizione 2.12
Sia F: A R
n+1
R, A insieme aperto, F C
1
(A). Un punto
(x
o
, y
o
) A viene detto punto regolare se F (x
o
, y
o
) 0.

Il Teorema di Dini ci consente di studiare in un intorno di un punto
regolare gli insiemi di livello di una funzione F. Per semplicit ci
riferiamo ancora al caso bidimensionale, anche se i risultati ottenuti
possono essere estesi al caso pi generale.
Assegnata allora F: A R
2
R, A insieme aperto, F C
1
(A),
consideriamo linsieme di livello L

={(x, y)R
2
: F (x, y)= } che
supponiamo non vuoto. Sia (x
0
, y
0
) L

. Se in (x
0
, y
0
) sono soddisfatte
le ipotesi del Teorema di Dini, esiste in un intorno I del punto x
0
una
funzione definita implicitamente dallequazione F (x, y) = e
possiamo quindi concludere che, in un intorno di (x
0
, y
0
), linsieme di
livello L

coincide con il grafico della funzione y=(x).


Possiamo inoltre osservare che la retta di equazione
76

y = y
0
+ (x
0
)(x x
0
) (2.26)

risulta tangente al grafico di in (x
0
, y
0
) e quindi tangente nello stesso
punto alla curva di livello L

. Essendo, per il teorema di Dini,


(x
0
) =
[ ]
[ ] ) ,
,
0 0
0 0
y x F
y x F
y
x
dalla (2.25) si deduce

(y y
0
) F
y
(x
0
, y
0
) + F
x
(x
0
, y
0
) (x x
0
)=0. (2.27)

Lultima uguaglianza ci segnala che il vettore F (x
0
, y
0
) risulta
ortogonale alla linea di livello L

.


FIGURA 2.4
77
CAPITOLO 3

MASSIMI E MINIMI
IN INSIEMI APERTI
3.1 Condizioni necessarie per la determinazione dei punti
estremi
In questo paragrafo ci si occuper della ricerca di condizioni
necessarie per lesistenza di punti di massimo e di minimo locali di
una assegnata funzione reale di pi variabili reali, in un insieme A
aperto contenuto nel dominio della funzione stessa.
Ricordiamo che i punti di A sono, per la definizione stessa di
insieme aperto, tutti punti interni ad A. Questo comporta che se x
0
A
anche x
0
+tuA per ogni versore uR
n
e per ogni scalare t in un
opportuno intorno dellorigine.

Il seguente teorema assegna una condizione necessaria, perch un
punto assegnato risulti di massimo o minimo locale. Tale condizione
detta del primo ordine poich coinvolge solo le derivate parziali
prime.
TEOREMA 3.1 (Condizione del primo ordine)
Sia x un punto di massimo (minimo) relativo per F in A. Se
F C
1
(A)
1
allora


1
Questa ipotesi pu essere indebolita, richiedendo in x
0
,lesistenza delle solo
derivate parziali prime.
78
F (x) = 0 (3.1)

Dimostrazione. Senza perdita di generalit dimostriamo lenunciato
nel caso x sia un punto di massimo relativo. Se F ammette in x un
punto di massimo relativo, essendo x un punto interno ad A, esiste un
opportuno intorno I(x, ) in cui

F (x) F (x), per ogni x I(x, ). (3.2)

Osservando che i vettori x I(x, ) sono esprimibili nella forma
x = x + t u con u R
n
, ||u|| = 1, e t (, ) opportuni, la (3.2) si
formula equivalentemente come:

F (x) F (x + t u) (3.3)

per ogni t (, ) e per ogni u R
n
, con ||u|| = 1.

Per t (0, ) si ha quindi
t
) x ( F ) u t x ( F
0 0
0 t
+
+

lim 0, mentre per


t ( ,0) si ottiene
t
) x ( F ) u t x ( F
0 0
0 t
+

lim 0. Essendo per ipotesi la
funzione F differenziabile in x
0
, sappiamo che


t
) x ( F ) u t x ( F
0 0
0 t
+

lim = D
u
F (x
0
) = <F (x
0
),u>.

Dalle precedenti disuguaglianze otteniamo pertanto <F (x
0
),u>=0
e la tesi discende dallarbitrariet di u.

Nelle ipotesi del teorema dimostrato, gli eventuali punti di estremo
di F in A vanno ricercati tra i punti che annullano tutte le derivate
parziali prime di F. Introduciamo pertanto la seguente
79
Definizione 3.1
I vettori x A in cui F (x) = 0 vengono chiamati punti stazionari
di F in A.

Il seguente esempio mostra che possono esistere punti stazionari di
F in A che non sono punti estremi.

ESEMPIO
Si consideri la funzione di due variabili:

F (x) = F (x
l
, x
2
) =
4
1
x
2
2
x

ed il vettore x =
(

0
0
.
Essendo F (0, 0) = 0, F (0, x
2
) =
2
2
x < 0 per x
2
0, F (x
1
,
0) =
4
1
x > 0, per x
1
0, il punto x non risulta un punto estremo per F.
Eppure essendo:

F (x) =
(

2
3
1
x 2
x 4


il vettore x un punto stazionario.

Lesempio precedente ci suggerisce la seguente
80
Definizione 3.2
Un punto stazionario x
0
che non sia n punto di massimo n punto
di minimo locale detto punto di sella (o colle)
2
.

Dalla definizione 3.2 deriva che se x
0
un punto di sella, allora in un
opportuno intorno di x
0
di raggio > 0 esistono x ed x tali che

F (x) < F (x
0
) <F (x).

Una condizione del secondo ordine, anchessa necessaria, data
dal seguente
TEOREMA 3.2 (Condizione del secondo ordine)
Sia x un punto di massimo (minimo) relativo per F in A. Se
F C
2
(A) allora la forma quadratica hessiana Q (h) = h H
F (
x) h
semidefinita negativa (positiva) in R
n
.

Dimostrazione. Senza perdita di generalit dimostriamo anche in
questo caso lenunciato per x punto di massimo relativo. Per le
ipotesi assunte, se x + t u A, u R
n
, ||u|| = 1, possiamo scrivere per
F la seguente formula di Taylor con centro in x
0
:

F (x + t u) = F (x) + < F (x), t u >+ (3.5)

+ (1/2) (t u)
T
H
F (
x) (t u) + (t) ||tu||
2
=

= F (x) + t < F (x), u >+ (1/2) t
2
(u)
T
H
F (
x) (u) + t
2
(t)


2
Si noti che in alcuni testi di programmazione matematica, si classificano come
punti di sella i punti stazionari che risultano punti di minimo lungo determinate
direzioni e punti di massimo lungo altre.
81
con (t) infinitesimo per t 0. Portando al primo membro F (x) e
tenendo presente la (3.1) e la (3.3), dalla (3.5) discende

(1/2) t
2
(u)
T
H
F (
x) (u) + t
2
(t) 0. (3.6)

Dividendo per t
2
si ha

(u)
T
H
F (
x) (u) + (t) 0 (3.7)

e per t 0

(u)
T
H
F (
x) (u) 0, per ogni u R
n
con ||u|| = 1. (3.8)

Poich per ogni vettore non nullo h R
n
, il vettore u = h / ||h||
risulta di norma euclidea unitaria, dalla (3.8) si deduce che:

(u)
T
H
F (
x) (u) = (1/ ||h||
2
) (h
T
H
F (
x) h) 0,

da cui la tesi.

Se x
0
un punto di massimo (minimo) locale forte non detto che
la forma quadratica Hessiana risulti definita negativa (positiva) in x
0
,
come mostra il seguente esempio.
ESEMPIO
Sia F (x) = x
1
2

|

\
|
12
1
x
2
4
. F (x) = [ 2 x
1
2
,
3
1
x
2
3
]
T
si annulla
in corrispondenza del punto x
0
=(0,0)
T
.
Inoltre H
F
(0,0) =
(

0 0
0 2
cosicch la forma quadratica hessiana
Q(h)=h
T
H
F
(0,0)h semidefinita negativa. Poich F (x) < 0 = F (0, 0)
82
per ogni xR
2
, x0, x
0
=(0,0)
T
comunque un punto di massimo
assoluto forte.

Concludiamo con un esempio che ci mostra come le condizioni
espresse nel teorema 1.2 non sono sufficienti a caratterizzare i punti di
estremo.
ESEMPIO
Sia F (x) = x
1
2
+ x
2
4
. F (x) = [2x
1
, 4x
2
3
]
T
si annulla in
corrispondenza del punto x
0
=(0,0). Inoltre

H
F
(0,0) =
(

0 0
0 2


cosicch la forma quadratica Q(h) = h
T
H
F
(0,0) h semidefinita
negativa. Poich F (x) = x
1
2
+ x
2
4
assume valori positivi lungo la
retta di equazione x
1
= 0 e valori negativi lungo la retta di equazione
x
2
= 0, si conclude che x
0
=(0,0) non un punto di estremo ma un
punto di sella.
3.2 Condizioni sufficienti per la determinazione dei punti
estremi
Si consideri una funzione reale F ed un suo punto stazionario x.
Essendo x interno ad A, per ogni h R
n
\ {0}, i vettori del tipo
x = x + t h appartengono, per | t | <
h

, allintorno I(x, ).
Per decidere la natura del punto stazionario x si ricorre alla
formula di Taylor, relativa al punto x ed allincremento t h:

F (x) = F (x + th) F (x) = (1/2) t
2
h
T
H(x) h +

83
+ t
2
||h||
2
(t),

con (t) infinitesimo per t 0. Risulta quindi evidente che il segno
della differenza F (x), per t 0, coincide con il segno, in R
n
, della
forma quadratica Q (h) = h
T
H
F (
x).

In base alla definizione di punti di massimo (minimo) relativo,
dalle precedenti considerazioni discende immediatamente il seguente
teorema.
TEOREMA 3.3 (Condizione sufficiente del secondo ordine)
Sia x A un punto stazionario per F. Allora
Q(h) = h
T
H
F
(x
0
)h definita negativa x
0
punto di massimo locale
(forte).
Q(h) = h
T
H
F
(x
0
)h definita positiva x
0
punto di minimo locale
(forte).
Q(h) = h
T
H
F
(x
0
)h indefinita x
0
punto di sella.

Il Teorema 3.3 non caratterizza completamente la natura di ogni
punto stazionario x.

Posto Q (h) = h H
F (
x) h, non sono infatti stati esaminati i seguenti
casi, detti casi dubbi:

a) Q (h) 0 per ogni h R
n
, Q (h) 0;
b) Q (h) 0 per ogni h R
n
, Q (h) 0;
c) Q (h) = 0 per ogni h E
n
.

In questi non ci si pu pronunciare in modo definitivo a proposito
della natura del punto stazionario x.
84
Sarebbe necessario allo scopo procedere allesame dei differenziali
di ordine k > 2
3
, sempre che ci sia possibile. In alternativa si pu
cercare di esaminare direttamente il segno della differenza

F (x) = F (x + th) F (x)

per | t | < / ||h||, h R
n
\{0}

Concludiamo con alcuni esempi che illustrano la metodologia
introdotta.
ESEMPI
1. Si consideri la funzione reale

F (x) = F (x
1
, x
2
) =
2
1
x +
2
2
x con (, ) (0, 0),

e si discuta la natura del punto x =
(

0
0
al variare dei parametri reali
e .
Essendo:

grad F (x) =
(

2
1
x 2
x 2


il vettore x risulta un punto stazionario per F in R
2
per ogni
(, ) (0, 0). La matrice hessiana assegnata da:

3
Se la funzione F del tipo F (x) = x Ax + a x + con A matrice quadratica
simmetrica la condizione Q (h) 0 ( 0) sufficiente per garantire che x sia un
punto di massimo (minimo) relativo debole in quanto le derivate parziali di ordine
k > 2 risultano per la funzione F in esame identicamente nulle e quindi sono nulli
anche i differenziali di ordine k > 2.
85

H
F
(x) =
(

2 0
0 2


ed il segno della forma quadratica Q (h) = h H
F (
x) h in R
2
dipende
chiaramente dal segno dei parametri e .

Si distinguono i seguenti casi
> 0, > 0. La forma quadratica q (h) risulta definita positiva e
perci la funzione F presenta in x un punto di minimo relativo
forte. Essendo inoltre F (x) = 0 e F (x) > 0 per ogni x R
2
, x x,
la funzione F presenta in x un punto di minimo assoluto.
< 0, < 0. La forma quadratica q (h) risulta definita negativa e
perci la funzione F presenta in x un punto di massimo relativo
forte. Essendo inoltre F (x) = 0 e F (x) < 0 per ogni x R
2
, x x,
la funzione F presenta in x un punto di massimo assoluto.
> 0, < 0 oppure < 0, > 0. La forma quadratica q (h) risulta
indefinita perci la funzione F presenta in x un punto di sella non
degenere.
> 0, = 0. La forma quadratica q (h) risulta semidefinita positiva.
Osservando che F (x) = F (x + th) F (x) = t
2

2
1
h 0 per ogni
t R, h R
2
si pu concludere che la funzione F presenta in x un
punto di minimo assoluto.
< 0, = 0. La forma quadratica q (h) risulta semidefinita
negativa. Osservando che F (x) = F (x+ th) F (x) = t
2

2
1
h 0
per ogni t R, h R
2
, si pu concludere che la funzione F presenta
in x un punto di massimo assoluto.
= 0, > 0. Analogo al caso = 0, > 0
= 0, < 0. Analogo al caso = 0, < 0.

86
2. Sia F (x, y) = x
2
(y
2
x).
Per individuare gli eventuali punti stazionari si consideri il seguente
sistema lineare:

=
=
0 y x 2
0 x 3 xy 2
2
2 2


Tutti i punti del tipo (0, ) sono stazionari.
Inoltre H
F
(x, y) =
(


2
2
x 2 xy 4
xy 4 x 6 y 2
e H
F
(0,) =
(


0 0
0 2
2

semidefinita positiva.
Studiamo direttamente il segno di F = F (x, y) F (0, ) = x
2
(y
2
x).
Si noti che il segno di F coincide in questo caso con il segno di F.
facile osservare che la funzione F di segno positivo per i punti che
appartengono alla regione di piano esterna alla parabola di equazione
y
2
x = 0; inoltre la funzione F si annulla nei punti dellasse y e nei
punti della parabola di equazione y
2
x = 0. Pertanto per i punti di
coordinate (0, ) 0 esiste sempre un intorno di raggio opportuno nel
quale F > 0; tali punti sono pertanto di minimo relativo.
Rimane da analizzare lorigine. Poich non possibile individuare
un intorno dellorigine nel quale F ha segno costante, si conclude che
lorigine un punto di sella.

3. Determinare i punti stazionari della funzione
F (x) = F (x
1
, x
2
) =
2
1
x
4
1
x
4
2
x e discuterne la natura.
Essendo:

grad F (x) =
(
(

3
2
3
1 1
x 4
x 4 x 2


i punti stazionari della funzione F risultano le soluzioni del sistema:
87

=
=
0 x
0 ) x 2 1 ( x
3
2
2
1 1
,

ossia x
1
=
(

0
0
, x
2
=
(

0
) 2 / 1 (
, x
3
=
(

0
) 2 / 1 (
.

La matrice hessiana della funzione F assegnata da

H
F
(x) =
(

2
2
2
1
x 12 0
0 x 12 2
.

In corrispondenza al punto stazionario x
l
si ottiene

H
F
(x
1
) =
(

0 0
0 2


e la forma quadratica Q (h) = h H
F (
x
1
) h risulta semidefinita positiva.
Il segno di F (x
1
) non per costante in un intorno di x
l
essendo:

F (x
l
) = F (0, 0) = 0;

F (x
l
+ th) = F (0, t) = t
4
0 per h =
(

0
0
;

F (x
l
+ th) = F (t, 0) = t
2
(1 t
2
) > 0 per h =
(

0
1
, t (1, 1).

e perci la funzione F presenta in x
l
un punto di sella.
In corrispondenza al punto stazionario x
2
si ottiene:
88

H
F
(x
2
) =
(

0 0
0 4


e la forma quadratica Q (h) = h H
F (
x
2
) h risulta semidefinita
negativa.
Il segno di F (x
2
) per costante in un intorno di x
2
essendo:

F (x
2
) = F ((1/ 2 ), 0) = 1/4;

F (x
2
+ th) = F ((1/ 2 ) + th
1
, th
2
) =
= 1/4 (t
2 2
1
h + 2 th
1
)
2
t
4 4
2
h ;

F (x
2
) = F (x
2
+ th) F (x
2
) =
= (t
2 2
1
h + 2 th
1
)
2
t
4 4
2
h 0.

La funzione F presenta quindi in x
2
un punto di massimo relativo.
In modo del tutto equivalente si pu concludere che la funzione F
presenta in x
3
un punto di massimo relativo.
3.3 Alcune precisazioni sulle condizioni sufficienti: il caso delle
funzioni concave e convesse
Si consideri, in questo il paragrafo, una funzione reale F definita in
un sottoinsieme aperto e convesso A R
n
.
TEOREMA 3.4
Sia F una funzione concava in A con F C
1
(A). Un vettore x A
un punto di massimo assoluto per F in A se e solo se F (x) = 0.

89
Dimostrazione. Se x un punto di massimo assoluto per F in A,
risulta in particolare un punto di massimo relativo e la tesi segue dal
Teorema 3.1.
Daltro canto se F (x) = 0 dal Teorema 2.11 segue che

F (x) F (x) per ogni x A

ossia x un punto di massimo assoluto per F in A.

Analogamente si pu dimostrare il seguente teorema riguardante le
funzioni convesse.
TEOREMA 3.5
Sia F una funzione convessa in A con F C
1
(A). Un vettore
x A un punto di minimo assoluto per F in A se e solo se
F (x) = 0.

Nel caso particolare in cui la funzione F risulti strettamente
concava (convessa) in base ai precedenti teoremi si pu concludere
che F ammette al pi un unico punto stazionario in A.
ESEMPIO
Discutere la natura dei punti stazionari della funzione
F (x) = x
T
Ax + 2a
T
x + con A matrice simmetrica di ordine n.
I punti stazionari della funzione F sono le (eventuali) soluzioni del
sistema lineare:

F (x) = 2Ax + 2a = 0. (3.9)

Se la matrice A non singolare esiste un unico punto stazionario
assegnato da:

90
x = A
1
a. (3.10)

Essendo inoltre H
F
(x) = 2A, risulta Q (h) = 2h
T
Ah. Si pu allora
concludere che:

se Q (h) definita positiva il punto stazionario x un punto di
minimo assoluto forte per F in R
n
;
se Q (h) definita negativa il punto stazionario x un punto di
massimo assoluto forte per F in R
n
;
se Q (h) indefinita il punto stazionario x un punto di sella non
degenere per F in R
n
.

Se invece la matrice A risulta singolare, esistono punti stazionari
per F in R
n
se e solo se il sistema (3.9) risulta consistente, ossia se e
solo se r(A) = r(A|a)
4
.
Posto che la condizione di consistenza risulti soddisfatta, linsieme
dei punti stazionari di F costituisce un sottospazio lineare di
dimensione (n r(A)). La natura di tutti questi punti stazionari
univocamente determinata osservando che H
F
(x) = 2A per ogni
x R
n
. Posto ancora Q (h) = 2h
T
Ah, si pu allora concludere che:

se Q (h) indefinita i punti stazionari sono tutti dei punti di sella.
se Q (h) semidefinita positiva i punti stazionari sono tutti dei
punti di minimo assoluto;
se Q (h) semidefinita negativa i punti stazionari sono tutti dei
punti di massimo assoluto.
ESEMPIO
Si consideri il sistema lineare:


4
Si indica con r(A) il rango della matrice A.
91
Ax = b (3.11)

con x R
n
, b R
m
ed A matrice di tipo (m, n) e si definisca la
funzione:

F (x) = (1/2) (Ax b)
T
(Ax b) = (3.12)

= (1/2) x
T
A
T
Ax b
T
Ax + (1/2) b
T
b.

Ovviamente risulta F (x) 0 per ogni x R
n
ed in particolare per
ogni soluzione x del sistema (3.11) si ha F ( x ) = 0. La funzione F
ammette quindi un punto di minimo assoluto in corrispondenza ad
ogni soluzione x del sistema (3.11).
Si vogliono ora determinare, qualora il sistema (3.11) non risulti
consistente, i vettori di R
n
in cui la funzione F ammette dei punti di
minimo assoluto.
Dalla (3.12) segue che i punti stazionari di F in R
n
sono le soluzioni
del sistema lineare
5
:

F (x) = (A
T
A)x A
T
b = 0. (3.13)

Poich inoltre F una funzione convessa
6
il Teorema 1 bis assicura
che le soluzioni del sistema costituiscono tutti punti di minimo
assoluto per F in R
n
. Se in particolare r(A) = n, n m, lunica
soluzione del sistema (3.13), essendo in questo caso det(A
T
A) 0,
diviene:

x = (A
T
A)
1
(A
T
b). (3.14)

5
Il sistema ammette sempre soluzione essendo r(A
T
) = r(A
T
A) = r(A
T
A | A
T
b).
6
La funzione F risulta convessa in R
n
in quanto la forma quadratica hessiana
q (h) = h
T
H
F
(x)h = h
T
(A
T
A)h = (Ah)
T
(Ah) semidefinita positiva in R
n
.
92

La (3.14) viene denominata soluzione dei minimi quadrati del
sistema (3.11).
93
CAPITOLO 4

MASSIMI E MINIMI IN INSIEMI
CHIUSI. VINCOLI DI UGUAGLIANZA
4.1 Concetti introduttivi
Nel paragrafo precedente ci siamo occupati del problema della
ricerca degli estremi liberi di una funzione reale di pi variabili reali
nel caso in cui la funzione sia definita in un insieme aperto A. Tuttavia
in molte applicazioni, le variabili in gioco devono soddisfare
condizioni aggiuntive (vincoli) rappresentate in molti casi concreti da
sistemi di uguaglianze e/o disuguaglianze. Inoltre si interessati alla
ricerca degli estremi assoluti piuttosto che a quelli locali.
Si pone quindi il problema di determinare gli estremi globali di una
restrizione della funzione data ed in questo caso si parla di estremi
vincolati.
evidente, come mostrato in figura, che, in generale gli estremi di
un problema di ottimizzazione vincolata non coincidono con quelli di
un problema di ottimizzazione libera.

94

FIGURA 4.1

Assegnato un insieme aperto A R
n
, si considerino una funzione
reale F e q (<n) funzioni reali g
k
,k = 1, 2, ..., q, definite in A.
Sia inoltre

S {xA: g
k
(x) = 0, k = 1,..., q}.

Un problema di ottimizzazione vincolata, con vincoli di
uguaglianza, consiste nella ricerca degli estremi globali della funzione
F in S.

La funzione F viene detta funzione obiettivo, S viene detta regione
ammissibile e le funzioni g
k
sono chiamate vincoli.
ESEMPIO 4.1
Sia F (x, y) = x
2
+ y
2
+ xy ed S {(x, y)R
2
: x y 1 = 0}. Poich,
per (x, y) S si ha y = x 1, la restrizione di F ad S funzione della
sola variabile x e risulta:

95
F (x, x 1) = f (x) = 3x
2
3x + 1.
Ora si possono ricercare gli estremanti liberi di F, in quanto del
vincolo gi si tenuto conto. Poich f(x) = 6x 3, si riconosce
facilmente che f ammette un punto di minimo globale nel punto x=1/2
e quindi si conclude che il punto (1/2,1/2) un punto di minimo
globale per F in S.

Il metodo di sostituzione illustrato nel precedente esempio non
sempre possibile, in quanto non detto che il vincolo sia direttamente
esprimibile nella forma esplicita y = (x) o x = (x).
Osserviamo inoltre, che, applicando il metodo di sostituzione,
bisogna porre particolare attenzione al dominio della restrizione di F
ad S, come evidenziato nel seguente esempio.
ESEMPIO 4.2
Determinare gli eventuali estremanti della funzione:

F (x, y, z) = x + x
2
+ y
2
+ y (z + x 1)

soggetta ai vincoli:
x
2
+ y
2
= 1
x + y + z = 1

Dal secondo vincolo otteniamo z=1 x y, mentre dal primo si
ricavano le limitazioni 0x1, 0y1. La restrizione della funzione F
alla regione ammissibile S risulta f (x) = x
2
x. Si devono pertanto
ricercare gli estremanti di f nellinsieme chiuso e limitato 0x1. Si
verifica facilmente che x=0 ed x=1 sono punti di massimo assoluto,
mentre x=1/2 un punto di minimo assoluto.
Di conseguenza i punti (0,1,0) e (0, 1,2) sono punti di massimo
assoluto per F in S, mentre (1/2, 3/2, 1/2 3/2) un punto di
minimo assoluto per F in S.
96

Se la natura del problema lo consente, possibile risolvere un
problema di ottimizzazione con vincoli di uguaglianza ricorrendo al
metodo delle curve di livello che si basa sullindividuazione dei punti
di una funzione F mediante lo studio delle curve di livello della
funzione obiettivo in rapporto ai vincoli.
ESEMPIO 4.3
Determinare gli eventuali estremanti di

F (x, y) = (x 3)
2
+ (y 3)
2
1,

soggetta al vincolo
x
2
+ y
2
= 32.

Essendo la regione ammissibile S un insieme chiuso e limitato e la
funzione obiettivo continua, per il teorema di Weierstrass, la funzione
F ammette massimo e minimo assoluti in S. Le curve di livello della
funzione F (x, y) sono circonferenze di centro C = (3, 3) e raggio
r = 1 k + con k 1. Infatti:

F (x, y) = k (x 3)
2
+ (y 3)
2
= k + 1.

Lequazione del vincolo la circonferenza di centro (0, 0) e raggio
4 2 .
97

FIGURA 4.2

Il punto A della figura appartiene alla curva di livello della
funzione F corrispondente a k = 1, il punto B alla curva di livello con
k = 97.
evidente da considerazioni geometriche che per determinare A e
B sufficiente intersecare il vincolo con la retta OA di equazione
y = x:

=
= +
x y
32 y x
2 2


Risolvendo il precedente sistema si ottiene A=(4, 4), B=(4, 4).
Quindi, essendo F ( 4, 4) = 97 > 1 = F (4, 4), possiamo
concludere che il punto A=(4, 4) un punto di minimo assoluto,
mentre B=(4, 4) un punto di massimo assoluto.
98
4.2 Condizioni necessarie per la determinazione dei punti
estremi
Nei casi in cui non si possa applicare n il metodo di sostituzione
n quello delle curve di livello, si ricorre ad un metodo pi generale, il
metodo dei moltiplicatori di Lagrange. In perfetta analogia con quanto
gi visto nel caso della ricerca degli estremanti liberi, determiniamo
dapprima una condizione necessaria o del primo ordine. Tale
condizione risulter necessaria per un punto di estremo locale e quindi
a maggior ragione per un punto di estremo gobale. Per individuare i
punti di estremo globale si dovr poi ricorrere ad ulteriori propriet
della regione ammissibile e/o della funzione obiettivo.
Per poter usufruire di una utile interpretazione geometrica,
trattiamo prima il caso di una funzione obiettivo di due variabili reali
soggetta ad un solo vincolo.
Siano allora F: A R
2
R, g: A R
2
R, con A insieme aperto,
funzioni differenziabili con continuit in A. Si dimostra il seguente
risultato
TEOREMA 4.1 (Lagrange)
Sia S = {(x, y) A: g(x, y) = }. Se (x
o
, y
o
) un punto di estremo
locale per F in S allora i vettori F (x
o
, y
o
) e g(x
o
, y
o
) sono
linerarmente dipendenti, ossia

det
(

) ,y x ( g ) ,y x ( g
) ,y x ( F ) ,y x ( F
o o y o o x
o o y o o x
= 0.

Dimostrazione. Se g(x
o
, y
o
) = 0 allora la tesi banalmente
verificata.
Se g(x
o
, y
o
) 0 allora (x
o
, y
o
) un punto regolare per linsieme S e,
senza perdita di generalit, si pu supporre g
y
(x
o
, y
o
) 0.
99
Per il teorema di Dini in un opportuno intorno I del punto x
0

definita una funzione di classe C
1
(I) tale che:

g[x, (x)] = per ogni xI,
(x
o
) = y
o
,
(x
0
) = g
x
(x
o
, y
o
) / g
y
(x
o
, y
o
) .

Ma, per ipotesi, la funzione G: I R assegnata da
G (x) = F [x, (x)] ammette in x
0
un punto di estremo locale, e,
poich x
0
un punto interno allintervallo I, si ha G(x
0
)= 0.
Essendo G(x)= F
x
(x, (x)) + F
y
(x, (x)) (x) si ha:

G (x
0
) = F
x
(x
o
, y
o
) + F
y
(x
o
, y
o
) (x
0
) = 0.

Sostituendo in questa uguaglianza (x
0
) = g
x
(x
o
, y
o
) / g
y
(x
o
, y
o
) si
ottiene

F
x
(x
o
, y
o
) g
y
(x
o
, y
o
) F
y
(x
o
, y
o
) g
x
(x
o
, y
o
) =0

da cui la tesi.

Se il punto (x
o
, y
o
) regolare, la tesi del Teorema di Lagrange
garantisce lesistenza di uno scalare
0
tale che

F (x
o
, y
o
) =
0
g(x
o
, y
o
) (4.1)

Se
0
0, i due vettori F (x
o
, y
o
) e g(x
o
, y
o
) risultano pertanto
paralleli. Poich g(x
o
, y
o
) risulta ortogonale ad S

nel punto (x
o
, y
o
)
anche F (x
o
, y
o
) risulta ortogonale allinsieme di livello S

nel punto
(x
o
, y
o
). Inoltre entrambi i gradienti sono ortogonali alla curva di
livello di F passante per (x
o
, y
o
).
100
Il numero
0
viene detto moltiplicatore di Lagrange.


FIGURA 4.3

La condizione (4.1) pu essere considerata come la condizione di
annullamento delle derivate parziali prime, rispetto a x e a y, della
funzione

L(x, y,) = F (x, y) g(x, y)

detta funzione Lagrangiana. La condizione di annullamento della
derivata parziale di L rispetto a esprime invece la condizione di
appartenenza del punto (x
o
, y
o
) alla regione ammissibile S.
Pertanto il teorema di Lagrange afferma che, se il punto (x
o
, y
o
)
regolare e di estremo locale per F in S esiste uno scalare
0
tale che
101
(x
o
, y
o
,
0
) un punto stazionario della funzione Lagrangiana
L(x, y,).
ESEMPIO 4.4
Determinare i punti di estremo locale della funzione:

F (x, y) = xy
soggetta al vincolo

g (x, y) = (x 2)
2
+ y
2
4 = 0.

Come si pu facilmente verificare, i punti appartenenti allinsieme
S={(x, y)
2
:(x 2)
2
+ y
2
4 = 0} sono tutti regolari.
I punti stazionari di:

L (x, y,) = xy ((x 2)
2
+ y
2
4)

sono le soluzioni del seguente sistema:

= +
=
=
4 y ) 2 x (
0 y 2 x
0 ) 2 x ( 2 y
2 2

Dalla seconda equazione si ottiene x = 2y e pertanto dalla prima
y (1 4
2
) = 4.
Se = 1/2 il sistema contraddittorio, pertanto y = 4/(4
2
1)
e quindi
x = 8
2
/(4
2
1).

Se si sostituiscono tali valori nella terza equazione del sistema si
ottiene 4
2
(4
2
3) = 0, che assegna per i seguenti valori = 3/2,
= 3/2, = 0, in corrispondenza dei quali si ottengono i punti
102
(3, 3), (3, 3), (0, 0), tra i quali vanno ricercati gli eventuali
estremanti di F in S.

Il successivo esempio mostra come sia importante non dimenticare
di analizzare i punti non regolari.
ESEMPIO 4.5
Si consideri la funzione:
F (x, y) = x
e linsieme ammissibile

S= {(x, y) R
2
: y
2
x
3
=0}.

La funzione Lagrangiana risulta L(x, y,)= x (y
2
x
3
).
immediato verificare che le condizioni del primo ordine non
conducono ad alcuna soluzione. La funzione F ammette comunque un
punto di minimo assoluto in S in corrispondenza a (0,0), punto non
regolare.

Passiamo ora ad analizzare il caso generale considerando linsieme

S ={x A: g
k
(x) = 0, k = 1, 2, ..., q}.

La seguente definizione generalizza la nozione di punto regolare
introdotta nel capitolo 2. Sia x
0
S e

J(x
0
) =
(
(
(
(
(

) x ( g
......
) x ( g
) x ( g
0
T
q
0
T
2
0
T
1
.

103
la matrice jacobiana dei vincoli, in x
0
.
Definizione 4.1
Si dice che il punto x
0
S regolare per linsieme S, se i vettori
g
1
(x
0
), g
2
(x
0
), ..., g
q
(x
0
) sono linearmente indipendenti, ossia se
r(J(x
0
))=q.

Si definisca la funzione Lagrangiana,

L (x, ) = F (x)
q
1 k=

k
g
k
(x)

con = [
1
,
2
, ...,
q
]
T
. In analogia con il caso di funzioni di due
variabili, gli eventuali estremi locali di F in S sono da ricercarsi tra i
punti non regolari di S e tra i punti regolari di S che annullano le
derivate parziali prime della funzione Lagrangiana, ossia tra le
soluzioni del seguente sistema:

= =

= =

q ..., , 2 , 1 k 0 ) , x (
L
n ..., , 2 , 1 i 0 ) , x (
x
L
k
i


Se il punto x
0
regolare per linsieme S e se x
0
un punto di
estremo locale per la funzione F in S allora devono esistere q
coefficienti reali
1
,
2
, ...,
q
tali che:

F (x
0
) =
q
1 k=

k
g
k
(x
0
).

104
Tali coefficienti, univocamente determinati
1
, si chiamano
moltiplicatori di Lagrange.
ESEMPIO 4.6
Determinare i punti di estremo locale della funzione:

F (x, y,z) = x
2
+ y
2
+ z
2

soggetta ai vincoli

g
1
(x, y,z) = x + y 1 = 0,
g
2
(x, y,z) = x y = 0.

Come si pu facilmente verificare, la regione ammissibile
costituita da punti regolari. La funzione Lagrangiana :

L(x, y, z,
1,

2
) = x
2
+ y
2
+ z
2

1
(x + y 1)
2
(x y),

e gli eventuali estremanti vanno ricercati tra le soluzioni del seguente
sistema:

=
=
=
=
=

=
= +
=
= +
=
0
1
0 z
2 / 1 y
2 / 1 x
0 y x
0 1 y x
0 z
0 y 2
0 x 2
2
1
2 1
2 1
.

Si ottiene quindi lunica soluzione (1/2, 1/2, 0).

1
I moltiplicatori di Lagrange sono univocamente determinati per lunicit della
rappresentazione del vettore F (x
0
) come combinazione lineare di vettori
linearmente indipendenti.
105
4.3 Condizioni sufficienti per la determinazione dei punti
estremi
Il teorema di Lagrange fornisce solo una condizione necessaria per i
punti di estremo locale. In analogia con il caso libero, possiamo ora
introdurre delle condizioni sufficienti del secondo ordine per la
determinazione degli estremanti locali.
Consideriamo quindi una funzione obiettivo F: A R
n
, R, con
A aperto e q (q<n) vincoli g
k
: A R, k = 1, 2, ..., q che definiscono
la regione ammissibile

S = {x A: g
k
(x) = 0, k = 1, 2, ..., q}.

Sia inoltre H
L
(x, ) la matrice Hessiana di ordine n delle derivate
parziali seconde della funzione Lagrangiana

L(x, ) = F (x)
q
1 k=

k
g
k
(x)
rispetto ad x:
H
L
(x, ) = H
F
(x)
q
1 k=

k
) x ( H
k
g
.
Se x un punto regolare di S, sia

T (x) ={hR
n
: J(x
0
)h = 0 }
il sottospazio vettoriale di dimensione (n q) delle direzioni
tangenziali ai vincoli
2
.
Assegnato un punto stazionario della Lagrangiana (x
0
,
0
), sia
infine Q (h) = h
T
H
L
(x
0
,
0
) h la forma quadratica associata alla
matrice Hessiana H
L
.

2
Linsieme T costituito dai vettori di R
n
soluzioni di un sistema lineare
omogeneo avente come matrice dei coefficienti la matrice jacobiana che per le
ipotesi assunte ha rango q.
106

Si dimostra il seguente teorema
TEOREMA 4.2
Se (x
0
,
0
) un punto stazionario della Lagrangiana ed x
0
un punto
regolare di S allora:

Q(h) < 0 per ogni hT(x
0
) x
0
punto di massimo locale (forte)
per F in S.
Q(h) > 0 per ogni hT(x
0
) x
0
punto di minimo locale (forte) per
F in S.
Q(h) indefinita in T(x
0
) x
0
punto di sella per F in S.

Le condizioni sufficienti del secondo ordine richiedono lo studio
del segno di una forma quadratica in un sottospazio vettoriale di R
n
di
dimensione (n q). A questo proposito, come illustrato nel paragrafo
1.3.2, si pu procedere direttamente studiando in R
n q
il segno di una
forma quadratica libera.
ESEMPIO 4.7
Determinare i punti di estremo locale della funzione:

F (x, y,z) = x
2
+ y
2
+ z
2

soggetta ai vincoli
g
1
(x, y,z) x + y 1=0,
g
2
(x, y,z) x y = 0.

Per quanto visto nellEsempio 4.6, sappiamo che (1/2, 1/2, 0)
rappresenta lunico possibile estremante per F in S.
Si verifica facilmente che

T = {h
3
: h = [0,0,1]
T
, R }.
107

Essendo H
L
(x
0
,
0
)= H
F
(x
0
) la restrizione della forma quadratica
Q(h) allinsieme T

Q*() = 2
2
>0

e quindi il punto (1/2, 1/2, 0) risulta di minimo locale per F in S.

Lo studio del segno della forma quadratica associata alla matrice
Hessiana H
L
(x
0
,
0
)pu essere effettuato direttamente ricorrendo ad
uno dei due criteri illustrati nei Teoremi 1.4 e 1.5 del Capitolo 1. Per
applicare, ad esempio, il teorema 1.5 si deve considerare la matrice
quadrata di ordine n+q


(

=
+ +
) , x ( H ) x ( J
) x J( 0
) , x ( H
0 0
L
0
T
0
q q,n n

ottenuta orlando la matrice Hessiana H
L
(x
0
,
0
)con la matrice
jacobiana dei vincoli J (x
0
).
ESEMPIO 4.8
Determinare i punti di estremo locale della funzione:

F (x, y,z) = x
2
+ y
2
+ z
2

soggetta ai vincoli
g
1
(x, y,z) x + y 1=0,
g
2
(x, y,z) x y = 0.

Per quanto visto nellesempio 4.6 il punto (1/2, 1/2, 0) rappresenta
lunico possibile estremante di F in S.
Costruiamo la matrice orlata

108

(
(
(
(
(
(

=
2 0 0 0 0
0 2 0 1 1
0 0 2 1 1
0 1 1 0 0
0 1 1 0 0
) , x ( H
0 0


Poich in questo caso n = 3, q = 2 si dovr esaminare il minore
principale di Nord-Ovest di ordine 5, ossia il determinante della
matrice H .
Essendo Det ( H ) = 8, possiamo concludere che il punto in esame
di minimo locale per F in S.
ESEMPIO 4.9
Determinare i punti di estremo locale della funzione

F (x, y,z) = x
2
y
2
z
2
+ 4x 4

soggetta al vincolo
g (x, y,z) = x + y 6=0.

Linsieme ammissibile costituito da punti regolari, pertanto gli
eventuali estremanti vanno ricercati tra i punti stazionari della
Lagrangiana:

L(x, y,z, ) = x
2
y
2
z
2
+ 4x 4 (x + y 6),

ossia tra le soluzioni del seguente sistema:


+ =
=
=
+ =


=
=
=
=

2 4 0
2 0
2 0
6 0
4
2
0
4
x
y
z
x y
x
y
z


109

Si ottiene lunica soluzione (4, 2, 0).
Costruiamo la matrice orlata


(
(
(
(

=
2 0 0 0
0 2 0 1
0 0 2 1
0 1 1 0
) , x ( H
0 0


Poich in questo caso n = 3, q = 1 si dovranno esaminare, per la
condizione del secondo ordine, gli ultimi due minori principali di
Nord-Ovest di ordine 3 e 4. Si ha pertanto

4
2 0 1
0 2 1
1 1 0
det =
(
(
(

,
det ( H ) = 8.

Poich gli ultimi due minori principali di Nord-Ovest si alternano
di segno a partire da quello di (1)
q+1
il punto in esame di massimo
locale.
Se, in alternativa, vogliamo applicare il criterio illustrato nel
Teorema 1.4, dobbiamo calcolare le radici dellequazione:

0
0 0 1 1
0 2 0 0
1 0 2 0
1 0 0 2
det =
(
(
(
(

.

110
Essendo tali radici tutte pari a 2 si conclude che il punto in esame
risulta di massimo locale.
ESEMPIO 4.10
Determinare i punti di estremo locale della funzione

F (x, y) = xy
soggetta al vincolo
g (x, y) (x 2)
2
+ y
2
4 = 0.

Per quanto visto nellesempio 4 sappiamo che i punti (3, 3),
(3, 3), (0, 0) sono gli eventuali estremanti di F in S.
La matrice orlata risulta


(
(
(

=
2 1 y 2
1 2 ) 2 (x 2
y 2 ) 2 (x 2 0
) , (x,y H

Poich in questo caso n = 2, q = 1, si dovr esaminare lultimo
minore principale di Nord-Ovest di ordine 3, ossia il determinante
della matrice H . Essendo
det ( H ) = 24 3 in corrispondenza di (3, 3, 3/2),
det ( H ) = 24 3 in corrispondenza di (3, 3, 3/2),
det ( H ) = 0 in corrispondenza di (0,0,0),
possiamo concludere che (3, 3) risulta un punto di massimo locale,
(3, 3) un punto di minimo locale, mentre in corrispondenza della
terza soluzione nulla si pu dire, mediante lutilizzo del criterio.

Vediamo come risolvere questo caso dubbio studiando direttamente
il segno dellincremento F (x, y) F (0,0).
111
Il vincolo rappresenta la circonferenza di centro C = (2, 0) e raggio
2, pertanto un insieme chiuso e limitato


FIGURA 4.4

Si pu osservare facilmente che (0,0) non un estremante poich
F (0,0) = 0 e la funzione F assume valori positivi nel primo quadrante,
e negativi nel quarto.
Infine notiamo che essendo linsieme ammissibile chiuso e limitato,
il Teorema di Weierstrass assicura che gli estremanti locali trovati
sono anche assoluti.

Lutilizzo delle condizioni del secondo ordine pu in alcuni casi
essere evitato ricorrendo al Teorema di Weiestrass, come vediamo nel
seguente esempio.
ESEMPIO 4.11
Determinare i punti di estremo locale della funzione

F (x, y) = 2x +3y

soggetta al vincolo

g (x, y) (x 2)
2
+ y
2
4 = 0.

112
Ricorrendo alle condizioni del primo ordine si verifica facilmente
che i punti x
1
= (
5
4
2 ,
5
6
) ed x
2
= (
5
4
2 + ,
5
6
) sono
gli eventuali estremanti di F in S.
Essendo linsieme ammissibile chiuso e limitato, il Teorema di
Weierstrass assicura che lesistenza di un punto di massimo e di un
punto di minimo assoluto. Poich F (x
1
) < F (x
2
) il punto x
1
risulta un
punto di minimo assoluto ed il punto x
2
di massimo assoluto.
ESEMPIO 4.12
Si consideri una matrice simmetrica A di ordine n e sia Q(x)=x
T
Ax
la forma quadratica ad essa associata. Sia inoltre

S = {xR
n
: x
2
=1}={xR
n
: x
T
x=1}.

Dal momento che linsieme S risulta compatto, la funzione Q
ammette in S un punto di massimo e un punto di minimo assoluto.
Essendo inoltre S costituito da punti regolari, possiamo calcolare i
punti estremi utilizzando il metodo dei moltiplicatori di Lagrange.
Sia L(x,)= x
T
Ax (x
T
x 1). Dalle condizioni del primo ordine
otteniamo

x
L(x,) = 2Ax 2x = 0 (4.2)

L(x,) = 1 x
T
x = 0. (4.3)

I punti stazionari della funzione Lagrangiana soddisfano le
condizioni:
Ax = x,
x
T
x = 1

e risultano pertanto le coppie (x, ) con autovalore di A ed x
autovettore normalizzato ad esso associato.
113
Premoltiplicando la (4.2) per un vettore x
T
che soddisfa la (4.3) si
ottiene Q(x) = . Quindi il massimo (minimo) assoluto della funzione
Q in S viene assunto in corrispondenza allautovettore associato
allautovalore massimo (minimo).
In S vale quindi la seguente disuguaglianza:


min
Q(x)
max
. (4.4)

Per un generico vettore non nullo xR
n
si ha Q(x)=
|
|

\
|
x
x
Q x
2
,
dove il vettore normalizzato
|
|

\
|
x
x
appartiene ad S.Quindi dalla (4.4)
discende


min

2
x Q(x)
max
2
x (4.5)

per ogni xR
n
. La (4.5) fornisce di nuovo una prova della condizione
sufficiente del Teorema 1.2.
4.4 Interpretazione economica dei moltiplicatori di Lagrange
I moltiplicatori di Lagrange non risultano soltanto dei catalizzatori
che ci permettono di risolvere un problema di ottimo vincolato, ma
hanno una interessante interpretazione. Per semplicit espositiva
limiteremo la nostra analisi al caso di un solo vincolo e di due variabili
decisionali.
Consideriamo il problema di determinare gli estremi locali di

F (x, y)= x
2
+2y
2

nellinsieme
114
S={(x, y)R
2
: x y = 2}.

Linsieme S costituito da punti regolari, pertanto gli eventuali
estremi di F in S vanno ricercati tra i punti stazionari della funzione
lagrangiana L(x, y,) = x
2
+2y
2
(x y 2) ossia tra le soluzioni del
sistema

=
= +
=
0 2 y x
0 y 4
0 x 2
da cui

=
=
=
3 / 8
3 / 2 y
3 / 4 x
.

Poich in questo caso n = 2, q = 1 per decidere la natura del punto
(4/3, 2/3) si dovr esaminare il minore principale di Nord-Ovest di
ordine 3, ossia il determinante della matrice

H (4/3, 2/3, 8/3)
(
(
(

=
4 0 1
0 2 1
1 1 0
.

Essendo det ( H ) = 6, il punto (4/3, 2/3) di minimo locale per
F in S.
Sia ora S
b
={(x, y)R
2
: x y = b}, con b parametro reale.
Calcolando nuovamente gli estremi locali di F in S
b
, si ottiene

x = 2b/3, y = b/3, = 4b/3

H (2b/3, b/3, 4b/3)
(
(
(

=
4 0 1
0 2 1
1 1 0
.

115
Quindi il punto (2b/3, b/3) di minimo locale per F in S
b
.
Il valore assunto dalla funzione F nel punto di minimo, che
indicheremo con F (b), chiaramente funzione del parametro b

F (b) = f (2b/3, b/3) = 2b
2
/3.

Derivando F (b) rispetto alla variabile b risulta F(b) = 4b/3 = (b),
ovvero la derivata della funzione F (b) proprio uguale al
moltiplicatore di Lagrange.

Questo risultato vale pi in generale e si deduce quindi che il
moltiplicatore di Lagrange fornisce una misura della sensibilit del
valore ottimale di F rispetto a variazioni di b. Se ad esempio il
moltiplicatore in corrispondenza ad un punto di ottimo risulta
negativo, un aumento del parametro b diminuir il valore della
funzione obiettivo.

Queste osservazioni hanno numerose applicazioni in campo
economico. Ad esempio se la funzione F una funzione costo da
minimizzare, ed il vincolo rappresenta linsieme dei fattori che
consentono la produzione di una certa quantit di output, il
moltiplicatore di Lagrange misura la sensibilit del valore ottimale a
variazioni delle quantit prodotta, ossia ci dice come varia il costo
minimo quando la quantit prodotta varia. Pertanto il moltiplicatore di
Lagrange rappresenta un prezzo, detto prezzo ombra della quantit
prodotta.
117
CAPITOLO 5

MASSIMI E MINIMI IN INSIEMI
CHIUSI. VINCOLI DI DISUGUAGLIANZA
5.1 Concetti introduttivi
Nellanalisi economica si incontrano frequentemente problemi di
ottimizzazione vincolata nei quali le variabili indipendenti sono
soggette ad uno o pi vincoli di disuguaglianza oltre che alle
condizioni di non negativit. Basti pensare ad esempio alla
massimizzazione dellutilit di un consumatore, dato il vincolo di
bilancio, o la minimizzazione del costo di produzione, dato il vincolo
della capacit produttiva.
Sono questi tipici esempi di problemi di ottimizzazione vincolata
con vincoli di disuguaglianza.

Assegnato un insieme aperto A R
n
, si considerino una funzione
reale F e m funzioni reali g
k
,k = 1, 2, ...,m, definite in A.
Sia inoltre
S {xA: g
k
(x)0, k = 1,..., m}
1
.

Un problema di ottimizzazione vincolata, con vincoli di
disuguaglianza, consiste nella ricerca degli estremi globali della

1
Conveniamo di scrivere i vincoli nella forma g
j
(x) 0 anzich g
j
(x) 0.
evidente che ogni vincolo pu sempre essere espresso nella forma g
j
(x) 0, ad
esempio le due scritture x y 0 e y x 0 sono equivalenti.
118
funzione F in S. Tale problema viene comunemente indicato con il
termine problema di programmazione non lineare.

La funzione F viene detta funzione obiettivo, S viene detta regione
ammissibile, le funzioni g
k
sono chiamate vincoli e linsieme
I = {1, 2, ..., m} insieme degli indici.

Per indicare un problema di ottimizzazione vincolata con vincoli di
disuguaglianza si scriver:

) x ( F max
S x

) x ( F min
S x


a seconda che si tratti di un problema di massimizzazione o
minimizzazione o equivalentemente come

max F (x) (min F (x))
soggetta ai vincoli
g
j
(x) 0, j=1,...m

Nel seguito ci interesseremo esclusivamente delle ricerca dei punti
di massimo globali in quanto la ricerca dei punti di minimo di una
funzione obiettivo F pu essere sempre ricondotta alla ricerca dei
punti di massimo della funzione F ricordando che min F = max(F),
Definizione 5.1
Un problema di massimizzazione vincolata con vincoli di
disuguaglianza in cui linsieme di definizione A risulta convesso, la
funzione obiettivo concava in A e le funzioni vincolo convesse in A,
viene detto problema di programmazione concava.
119
OSSERVAZIONI
Se le funzioni vincolo sono convesse, linsieme ammissibile risulta
convesso. Infatti linsieme ammissibile S risulta lintersezione degli
insiemi di livello inferiore L(g
j
, 0) = {xA: g
j
(x) 0}, j = 1, ... m,
che risultano convessi (teorema 2.5).
Se le funzioni vincolo sono continue, la regione ammissibile risulta
un insieme chiuso. Non comunque detto che la regione
ammissibile sia limitata.
In un problema di ottimizzazione vincolata con vincoli di
disuguaglianza, il numero dei vincoli pu essere maggiore, minore
od uguale al numero n delle variabili. Molto spesso il numero di
vincoli risulta maggiore del numero delle variabili, basti pensare ad
esempio come in molte applicazioni di carattere economico siano
presenti vincoli di non negativit delle variabili del tipo x 0.
Definizione 5.2
Un vincolo g
j
viene detto attivo in x
0
se g
j
(x
0
) = 0, inattivo se
g
j
(x
0
) < 0.
Linsieme degli indici i I corrispondenti ai vincoli attivi in x
0
S
viene indicato con il simbolo I (x
0
) = {j I : g
j
(x
0
) = 0}.
ESEMPIO 5.1
Si consideri linsieme S = {xR
2
: x
1
0, x
2
0, x
2
(1x
1
)
3
0}
ed il punto x
0
=(1,0).

120

FIGURA 5.1

Le funzioni vincolo sono g
1
(x) = x
1,
g
2
(x) = x
2,

g
3
(x) = x
2
(1x
1
)
3
. Si verifica facilmente che I(x
0
) = {2,3}.

Sia g
j
(x
0
)=0 e g
j
(x
0
) 0. Per un noto risultato
2
, in queste ipotesi, il
vettore g
j
(x
0
) risulta ortogonale in x
0
alla curva di livello {xA:
g
j
(x)= 0}. Inoltre g
j
(x
0
) rappresenta la direzione di massima
crescita
3
. Possiamo pertanto garantire che g
j
(x
0
) risulta diretto verso
lesterno della regione A
j
= {xA: g
j
(x)0 }, essendo in tale regione
g
j
(x)>0.

Un problema di massimizzazione vincolata con vincoli di
disuguaglianza pu essere risolto con le tecniche gi introdotte nei
precedenti capitoli. Considerando per semplicit il caso di funzioni di
classe C
1
(A), si pu infatti procedere seguendo i seguenti passi:

2
Vedi paragrafo 4, capitolo 2.
3
Vedi paragrafo1, capitolo 2.
121
ricercare i punti di massimo F nei punti interni allinsieme
ammissibile S (problema di ottimizzazione libera);
ricercare i punti di massimo di F sulla frontiera dellinsieme
ammissibile S (Problema di otttimizzazione vincolata con vincoli
di uguaglianza).
ESEMPIO 5.2
Determinare il massimo della funzione

F (x, y) = x
2
+ y

soggetta ai vincoli
x 0
y 0
x + y 1 0.

x
y
O
S
A
B

FIGURA 5.2

122
Applicando le condizioni del primo ordine, si determinano gli
eventuali punti stazionari della funzione F interni allinsieme
ammissibile S. Si ha:

= =

0 1
y
F
0 x 2
x
F


Il sistema non ammette soluzioni, pertanto non vi sono punti
stazionari interni ad S.
Consideriamo ora i punti di frontiera di S.
Sul lato OA abbiamo y = 0, e la restrizione della funzione F risulta

F (x, 0) = x
2
, con 0 x 1.

Tale restrizione decrescente ed inoltre F (0, 0) = 0, F (1, 0) = 1.
Sul lato OB abbiamo x = 0, e la restrizione della funzione F risulta

F (0, y) = y, con 0 y 1.

Tale restrizione crescente ed inoltre F (0, 0) = 0, F (0, 1) = 1.
Infine sul lato AB abbiamo x + y 1 = 0, e la restrizione della
funzione F risulta
F (x, x + 1) = x
2
x + 1, con 0 < x <1.

Tale restrizione decrescente essendo F ((x, x + 1) = 2x 1 < 0
con 0 < x < 1.
Poich S un insieme chiuso e limitato e la funzione obiettivo
continua, si pu concludere, in base al Teorema di Weierstrass, che il
punto (0, 1) punto di massimo assoluto.

123
Analogamente a quanto visto nel caso dei vincoli di uguaglianza,
anche il metodo delle curve di livello pu aiutarci a risolvere problemi
di massimizzazione vincolata con vincoli di disuguaglianza.
ESEMPIO 5.3
Determinare il massimo della funzione

F (x, y) = x
2
+ y
soggetta ai vincoli
x 0
y 0
x + y 1 0.

Utilizzando il metodo delle curve di livello si pu subito osservare
che il massimo assunto in (0, 1).

x
y
O
k = 1
k = 0
k = 1
S

FIGURA 5.3
124
5.2 Condizioni necessarie per la determinazione dei punti
estremi
Introduciamo ora un metodo di carattere generale, detto metodo dei
moltiplicatori di Karush-Kuhn-Tucker che ci consente di stabilire
delle condizioni necessarie per risolvere un problema di
massimizzazione vincolata in presenza di vincoli di disuguaglianza.
Tale metodo risulta unestensione al caso in esame del metodo dei
moltiplicatori di Lagrange. Verranno quindi introdotte delle condizioni
necessarie per punti di massimo locale, che risulteranno altres
necessarie per i punti di massimo globale. Per individuare i punti di
massimo globale si dovranno poi utilizzare ulteriori propriet della
funzione obiettivo e delle funzioni vincolo.

Premettiamo il seguente teorema dellalternativa che ci limitiamo
ad enunciare:
TEOREMA 5.1 (di Gordan)
Sia M una matrice di tipo (k,n). Si considerino gli insiemi

X = {v R
n
: Mv>0} e

X* = { R
k
: M
T
=0, 0
4
}.

Se X vuoto allora X* non vuoto e viceversa.

Consideriamo allora un problema di massimizzazione vincolata
dove le funzioni F e g
i
, i=1,...m appartengono alla classe C
1
(A).

4
Con la scrittura 0 si intende un vettore non nullo con le componenti non
negative.
125
TEOREMA 5.2 (di Fritz-John)
Se x
0
S un punto di massimo locale per F in S allora esistono
uno scalare
0
e un vettore
0
con
(

0
0
0 tali che


0
F (x
0
)
) I(x i
0
i
0

g
i
(x
0
) = 0. (5.1)

Dimostrazione. Siano F = {vR
n
: <F (x
0
),v> >0}, G
j
= {vR
n
:
<g
j
(x
0
),v> <0}, j=1, ... m,
j
) x ( I j
G G
0

= I .
Se x
0
risulta un punto di massimo locale per F in S, allora F
G = . Infatti se per assurdo esistesse un vettore v F G, anche i
vettori (x
0
+tv) risulterebbero ammissibili per t variabile in un
opportuno introrno destro dellorigine, essendo
per i vincoli inattivi, ossia per jI(x
0
), g
j
(x
0
+tv) <0 per la
condizione g
j
(x
0
)<0 e la continuit del vincolo;
per i vincoli attivi, ossia per jI(x
0
), g
j
(x
0
+tv) = g
j
(x
0
) + t
<g
j
(x
0
),v> + o(t) = t<g
j
(x
0
),v> + o(t) < 0 per lo sviluppo di
Taylor e la condizione v G
j
.
Ma allora, per t variabile in un opportuno intorno destro
dellorigine, si ha

F (x
0
+tv) F (x
0
) = t <F (x
0
),v> + o(t) > 0

per la condizione vF, e questo contraddice lipotesi dellottimalit
locale di x
0
.
Possiamo allora garantire che non esiste nessun vettore vR
n
che
risolve il sistema di disuguaglianze

126

>> <
>> <
>> <
>> <
0 v ), x ( g
....
0 v ), x ( g
0 v ), x ( g
0 v ), x ( F
0
m
0
2
0
1
0
.

La tesi segue allora facilmente dal Teorema dellalternativa di
Gordan ponendo
M =
(
(
(
(
(

) x ( g
...
) x ( g
) x ( F
0
m
T
0
1
T
0 T
.

Lequazione (5.1) equivalente al seguente sistema:

0 ) x (
x
g
) x (
x
F
.
.
.
0 ) x (
x
g
) x (
x
F
0
n
i
) I(x i
0
i
0
n
0
0
1
i
) I(x i
0
i
0
1
0
0
0
,

che coinvolge solo i vincoli attivi, ed parimenti equivalente al
seguente sistema di equazioni e disequazioni che coinvolge tutti i
vincoli:
127

=
= =
= =


=
m ..., 2, 1, j 0 , 0
m ..., 2, 1, j 0 ) x ( g , 0 ) x ( g
n ..., 2, 1, i 0 ) x (
x
g
) x (
x
F
0
j
0
0
j
0
j
0
j
0
i
j
0
j
m
1 j
0
i
0
(5.2)

dove
0
e
0
j
, j=1,...m, non sono tutti contemporaneamente nulli.
Le condizioni 0 ) x ( g
0
i
0
i
= sono note come condizioni di
complementarit. Si noti che in corrispondenza ai vincoli inattivi si ha
0
0
i
= , mentre in corrispondenza ai vincoli attivi si ha solo 0
0
i
.
Inoltre la condizione 0
0
i
> implica che il vincolo i esimo attivo in
x
0
.
In particolare se non esistono vincoli attivi in x
0
, si ha
0
i
=0,
i=1,...m, ed essendo allora necessariamente
0
0, le condizioni (5.2)
ripropongono la condizione necessaria per un punto di massimo locale
libero F (x
0
)=0.

Se si introduce la funzione lagrangiana (completa
5
)

L(x, , ) = F (x) ) x ( g
j j
m
1 j

=

il sistema (5.2) equivale al sistema:


5
Laggettivo completa si riferisce alla presenza del moltiplicatore anche per la
funzione obiettivo.
128

=
= =

= =

m ,..... 1 j , 0 , 0
m ,... 1 j , 0 ) , , x (
L
m ,.... 1 j , 0 ) , , x (
L
n ,...... 1 i , 0 ) , , x (
x
L

0
j
0
0 0 0
j
0
j
0 0 0
j
0 0 0
i
(5.3)
dove
0
e
0
j
, j=1,...m, non sono tutti contemporaneamente nulli.

I punti di massimo locale per F in S devono dunque essere ricercati
tra le soluzioni del sistema (5.3).
ESEMPIO 5.4
Si consideri la massimizzazione della funzione
F (x, y) = (y + x)
soggetta ai vincoli
g
1
(x, y) = x
2
y 0
g
2
(x, y) = x 0

La lagrangiana completa :

L(x, y, ,
1,

2
) = (x + y)
1
(x
2
y) +
2
x.

I punti di massimo locale per F in S sono da ricercarsi tra le
soluzioni del sistema:

129


=
=
= +
= +
0 , 0 , 0
0 x 0 x
0 ) y x ( 0 y x
0
0 x 2
2 1
2
2
1
2
1
2 1


dove ,
1
,
2
non sono contemporaneamente nulli.
Se = 0 allora si ha
1
= 0 =
2
, che contraddice le condizioni introdotte.
Se 0, ponendo = 1 ( si pu scegliere uguale ad uno, poich
la prima equazione del sistema omogenea in e ) si ottiene la
seguente soluzione:

x = 0, y = 0,
1
= 1,
2
= 1.

In corrispondenza a questo punto si ha F (0, 0) = 0. Inoltre per
(x, y) S si ha
F (x, y) = (x + y) 0 = F (0,0).

Pertanto si pu concludere che (0, 0) il punto di massimo assoluto
di F in S. Si ha inoltre

F (0,0) = [ 1, 1]
T
= 1 g
1
(0,0) + 1 g
2
(0,0) = [0, 1]
T
+ [ 1,0]
T
.
ESEMPIO 5.5
Si consideri la massimizzazione della funzione

F (x, y) = x
soggetta ai vincoli
y (1 x)
3
0
-x 0
-y 0
130

Utilizzando il metodo delle curve di livello si pu subito osservare
che il massimo globale assunto in (1, 0) (linsieme ammissibile
disegnato in Figura 1)
La lagrangiana completa :

L(x, y, ,
1,

2
,
3
) = (x)
1
(-x)
2
(-y)
3
(y-(1-x)
3
)

I punti di massimo locale per F in S sono da ricercarsi tra le
soluzioni del sistema:



=
=
=
= +
0 , 0 , 0 , 0
0 y ) x 1 ( 0 y ) x 1 (
0 y 0 y
0 x 0 x
0
0 ) x 1 ( 3
3 2 1
3
3
3
2
1
3 2
2
3 1


dove ,
1
,
2,

3
non sono contemporaneamente nulli.
Se
2
=
3
=0 otteniamo anche =
1
=0 che non pu essere
accettato. Allora necessariamente
2
>0 e
3
> 0. Questo comporta
x=1, y=0, =
1
=0. Le soluzioni del sistema risultano pertanto:

x=1, y=0, = 0,
1
=0,
2
=
3

dove
2
=
3
sono numeri reali positivi arbitari.
Essendo la regione ammissibile chiusa e limitata e la funzione
obiettivo continua, per il Teorema di Weiestrass possiamo concludere
che il punto (1,0) un punto di massimo globale per F in S.

131
Se il Teorema di Fritz John verificato in x
0
con
0
0, i vincoli
si dicono regolari.
In questo caso, senza perdita di generalit, si pu supporre
0
=1.
Esistono diverse condizioni per la regolarit dei vincoli note in
letteratura come condizioni di qualificazione dei vincoli. Ci limitiamo
a ricordarne alcune fondamentali. Sia x
0
S.
I vettori g
i
(x
0
) per i I(x
0
) sono linearmente indipendenti.
Le funzioni vincolo g
j
, j I(x
0
), sono concave.
Le funzioni vincolo g
j
, j I(x
0
), sono convesse ed esiste un vettore
x
*
A tale che g
j
(x
*
)<0, per ogni j I(x
0
) (Condizione di Slater).

j
) x ( I j
G G
0

= I =
) x ( I j
0

I {vR
n
: <g
j
(x
0
),v> <0} (condizione di
Cottle)
OSSERVAZIONE
Poich una funzione lineare risulta sia concava che convessa, se le
funzioni g
j,
j = 1, 2, ..., m sono lineari in x
1
, x
2
, ..., x
n
allora i vincoli
sono regolari. In particolare i vincoli di non negativit delle variabili

g
j
(x) = x
j
0 j = 1, 2, ..., n

sono regolari.

Nel caso di vincoli regolari il teorema di Fritz-John noto come
teorema di Kuhn-Tucker.
TEOREMA 5.3 (di Kuhn-Tucker)
Se x
0
S un punto regolare di S e risulta di massimo locale per F
in S allora esiste un vettore non negativo
0
tale che

F (x
0
) =
0
i
) ( i
0

x I
g
i
(x
0
)

132
ossia, tenendo conto anche dei vincoli non attivi in x
0
:

=
= =
= =

=
, ..., m 2 , 1 j 0
, ..., m 2 , 1 j 0 ) x ( g 0 ) x ( g
, ..., n 2 , 1 i 0 ) x (
x
g
) x (
x
F
0
j
0
j
0
j
0
j
m
1 j
0
i
j 0
j
0
i
. (5.4)

La prima condizione riportata nel sistema (5.4) ci dice che F (x
0
)
appartiene allo spazio vettoriale generato dai gradienti dei vincoli
attivi in x
0
, calcolati in x
0
ed inoltre i coefficienti della combinazione
lineare risultano non negativi.
Per comprendere linterpretazione geometrica della condizione
(5.4) dobbiamo ricordare che il gradiente di una funzione calcolato in
un punto, se diverso dal vettore nullo, risulta ortogonale alla curva di
livello della funzione passante per quel punto ed individua la direzione
di massima crescita.

133
x
1
g
2
g
1
x
2
Curve di livello di F
S
g (x ,
1 1
0
x )
2
0
g (x ,
2 0
1
x )
0
2
F (x ,
0
1
x )
0
2
x
1
0
x
2
0

FIGURA 5.4

La funzione Lagrangiana nel caso di vincoli regolari :

L(x, ) = F (x)

m
1 j
j j
) x ( g

Utilizzando tale funzione, il sistema (5.4) risulta equivalente al
seguente:
134

=
= =

= =

m ,..... 1 j , 0
m ,... 1 j , 0 ) , x (
L
m ,.... 1 j , 0 ) , x (
L
n ,...... 1 i , 0 ) , x (
x
L

0
j
0 0
j
0
j
0 0
j
0 0
i
(5.5)
Le condizioni (5.5) sono note come condizioni di Kuhn Tucker.
ESEMPIO 5.6
Determinare il massimo della funzione

F (x, y) = x
2
+ y
soggetta ai vincoli
x 0
y 0
x + y 1 0.

I vincoli sono regolari in ogni punto essendo lineari. Dopo aver
riscritto i vincoli con il segno di , la Lagrangiana risulta:

L(x, y,
1
,
2
,
3
) = x
2
+ y
1
( x)
2
( y)
3
(x + y 1),

e le condizioni di Kuhn-Tucker divengono:

135

=
= + +
=
=
= + =

= + =

3 2, 1, i 0
0 ) 1 y x ( 0 1 y x
0 y 0 y
0 x 0 x
0 1
y
L
0 x 2
x
L
i
3
2
1
3 2
3 1
.
Si ha:

1
=
2
= 0
3
= 1 x =
1
2
non accettabile;

1
> 0 x = 0
3
=
1
> 0 y = 1 > 0
2
= 0

3
= 1 =
1
;

2
> 0 y = 0
3
=
2
+ 1 > 0 x = 1 >0
1
= 0

3
= 2 non accettabile.

Lunica soluzione del precedente sistema risulta quindi

x= 0, y=1,
1
=
3
=1,
2
=0.

Pertanto il punto (0,1) una possibile soluzione del problema di
massimizzazione in quanto soddisfa le condizioni necessarie del
teorema di Kuhn-Tucker.
Poich linsieme ammissibile risulta chiuso e limitato, per il
Teorema di Weiestrass possiamo concludere che (0, 1) un punto di
massimo assoluto per F in S, con F (0, 1) = 1.
I vincoli attivi in (0, 1) sono il primo e il terzo. Si ha inoltre

F (0,1) = [0,1]
T
= 1 g
1
(0,1) + 1 g
3
(0,1) = [-1,0]
T
+ [1,1]
T
.
ESEMPIO 5.7
Determinare il massimo della funzione:
136

F (x, y) = 5x + 2y 3xy

soggetta ai vincoli:
x + y 4
x 0
y 0.

I vincoli sono regolari in ogni punto essendo lineari. Dopo aver
riscritto i vincoli con il segno di , costruiamo la funzione
Lagrangiana:
L(x, y,
1
,
2
,
3
) = 5x + 2y 3xy
1
(x + y 4) +
2
x +
3
y,

e consideriamo le condizioni di Kuhn Tucker:

=
=
=
= + +
= +
= +
3 2, 1, i 0
0 y 0 y
0 x 0 x
0 ) 4 y x ( 0 4 y x
0 x 3 2
0 y 3 5
i
3
2
1
3 1
2 1
.

Si hanno i seguenti casi:

1
= 0,
2
= 0,
3
= 0 x =
2
3
, y =
5
3
;

1
= 0,
2
= 0,
3
> 0 y = 0 5 = 0 impossibile;

1
= 0,
2
> 0,
3
= 0 x = 0 2 = 0 impossibile;

1
> 0,
2
= 0,
3
= 0
1
= 5 3y = 2 3x x + y 4 = 0
x =
7
3
, y =
5
3
,
1
= 2, non accettabile;

1
= 0,
2
> 0,
3
> 0 x = 0, y = 0

2
= 5,
3
= 2 non accettabile;
137

1
> 0,
2
= 0,
3
> 0 y = 0 x = 4
1
=5,
3
= 15;

1
> 0,
2
> 0,
3
= 0 x = 0 y = 4
1
=2,
2
= 9;

1
> 0,
2
> 0,
3
> 0 x = 0, y = 0
1
=0, non accettabile.

Le soluzioni del precedente sistema sono:
x =
2
3
, y =
5
3
,
1
= 0,
2
= 0,
3
= 0;
x = 4, y = 0,
1
= 5,
2
= 0,
3
= 15;
x = 0, y = 4,
1
= 2,
2
= 9,
3
= 0;

Pertanto i punti (
2
3
,
5
3
), (4,0) e (0,4) sono possibili soluzione del
problema di massimizzazione in quanto soddisfano le condizioni
necessarie del teorema di Kuhn-Tucker.
Poich linsieme ammissibile risulta chiuso e limitato, per il
Teorema di Weiestrass, sappiamo che la funzione F ammette massimo
assoluto in S. Essendo

F (
2
3
,
5
3
) =
10
3
, F (4, 0) = 20, F (0, 4) = 8
possiamo concludere che (4, 0) un punto di massimo assoluto per F
in S.
I vincoli attivi in (4, 0) sono il primo e il terzo. Si ha inoltre

F (4,0) = [5, 10]
T
= 5 g
1
(4,0) + 15 g
3
(4,0) = [5,5]
T
+ [0,
15]
T
.

Gli altri punti trovati possono essere caratterizzati utilizzando
metodi alternativi. Osserviamo ad esempio come il punto (
2
3
,
5
3
)
risulti interno allinsieme ammissibile e sia un punto di sella (libero).

Come si visto, per individuare il punto di massimo assoluto si
utilizzato il Teorema di Weiestrass. Questo tipo di approccio pu
138
chiaramente essere utilizzato solo nel caso in cui la regione sia chiusa
e limitata e ci consente di individuare il punto di massimo assoluto
senza caratterizzare la natura degli altri punti che soddisfano le
condizioni necessarie.

Per concludere, osserviamo che nel caso siano presenti i vincoli di
non negativit delle variabili, le condizioni di Kuhn-Tucker possono
essere riscritte in una forma pi espressiva.
Supponiamo allora che la regione ammissibile sia

S = {xA: x 0, g
j
(x) 0, j=1,...m}.

Considerata la funzione Lagrangiana

L(x, ) = F (x)

m
1 j
j j
) x ( g

che non tiene conto dei vincoli di non negativit delle variabili, si pu
verificare che se x
0
S un punto regolare che risulta di massimo
locale per F in S, allora esiste un vettore 0
0
tale che

= =

m ,.... 1 j , 0 ) , x (
L
, 0 , 0 ) , x (
L
n ,...... 1 i ), , x (
x
L
x , 0 x , 0 ) , x (
x
L
0
0
j
0
j
0
j
0 0
j
0 0
i
0
i
0
i
0 0
i
.
139
5.3 Condizioni sufficienti per la determinazione dei punti
estremi
Le condizioni di Fritz-John o di Kuhn-Tucker sono solo necessarie
affinch x
0
sia soluzione di un problema di ottimizzazione vincolata
con vincoli di disuguaglianza, come evidenziato nel seguente esempio.
ESEMPIO 5.8
Determinare il massimo della funzione

F (x, y) = x
2
+y
2

soggetta ai vincoli
x-y
2
0,
-x-y
2
0.

La regione anmmisibile costituita da punti regolari, essendo le
funzioni vincolo concave. In corrispondenza del punto

x=0, y=0,
1
=
2
>0

immediato verificare che il sistema di Kuhn-Tucker risulta
soddisfatto, anche se il punto (0,0) risulta un punto di minimo assoluto
per F in R
2
e quindi anche in S.

Nel caso della programmazione concava e di vincoli regolari, le
condizioni di Kuhn-Tucker risultano invece sia necessarie che
sufficienti.
Consideriamo allora un problema di programmazione concava dove
le funzioni F e g
i
, i=1,...m appartengono alla classe C
1
(A), con A
insieme convesso, F risulta concava in A e g
j
, j=1,...m, sono convesse
in A.
140
TEOREMA 5.4 (programmazione concava)
Se il vettore (x
0
,
0
) soddisfa il sistema delle condizioni di Kuhn-
Tucker (5.5) allora x
0
un punto di massimo assoluto per F in S.

Dimostrazione. La funzione

z(x) = L(x,
0
) = F (x)

m
1 j
j
0
j
) x ( g

risulta, per ipotesi, concava in S. Quindi per il teorema 3.3 per ogni
xS abbiamo:
z(x) z(x
0
) <z(x
0
), x x
0
> =
= <F (x
0
), x x
0
>

=
= > <
m
1 j
0 0
j
0
j
x x ), x ( g

=
>= <
m
1 j
0 0
j
0
j
0
0 x x ), x ( g ) x ( F
dove lultima uguaglianza sussiste per le condizioni di Kuhn Tucker.
Allora per ogni x S
F (x) F (x)

m
1 j
j
0
j
) x ( g = z(x) z(x
0
) = F (x
0
).
ESEMPIO 5.9
Determinare il massimo della funzione:

F (x, y) = x
1
3
y
3
+ 4y
soggetta ai vincoli
x 0, y 0.

immediato verificare che la funzione obiettivo risulta concava
nella regione ammissibile.
141
Costruita la Lagrangiana:

L(x, y,
1
,
2
) = x
1
3
y
3
+ 4y +
1
x +
2
y,

le condizioni di Kuhn-Tucker divengono:

=
=
=
= + +
= +
. 2 , 1 i 0
0 y 0 y
0 x 0 x
0 4 y
0 1
i
2
1
2
2
1


Quindi:

1
= 1,
2
= 0, x = 0, y = 2,

1
= 1,
2
> 0, x = 0, y = 0
2
= 4 non accettabile.

Lunica soluzione del sistema risulta

x = 0, y = 2,
1
= 1,
2
= 0,
ed il punto (0,2) risulta un punto di massimo assoluto per F in S.

Notiamo che in questo esempio non era applicabile il Teorema di
Weiestrass.

Si segnala, in conclusione, la seguente condizione sufficiente per
funzioni di classe C
2
(A), che individua per solo punti di massimo
locale. Lanalogia con il caso dei vincoli di uguaglianza evidente.
Introduciamo la matrice Hessiana di ordine n delle derivate parziali
seconde della funzione Lagrangiana rispetto ad x

142
H
L
(x, )= H
F
(x)
m
1 k=

k
) x ( H
k
g
,
ed il sottospazio vettoriale

T ={hR
n
: h
T
g
k
(x
0
) = 0, k I(x
0
) }
TEOREMA 5.5 (Condizione sufficiente del secondo ordine)
Sia (x
0
,
0
) un vettore che soddisfa il sistema delle condizioni di
Kuhn-Tucker (5.5) Q(h) = h
T
H
L
(x
0
,
0
)h la forma quadratica associata
alla matrice hessiana H
L
calcolata in corrispondenza a (x
0
,
0
). Allora:

Q(h) < 0 per ogni hT, h0 x
0
punto di massimo locale (forte)
per F in S.
Q(h) > 0 per ogni hT, h0 x
0
punto di minimo locale (forte)
per F in S.
Q(h) indefinita in T x
0
punto di sella per F in S.

Per i criteri operativi che consentono di studiare il segno di una
forma quadratica vincolata, si veda il paragrafo 1.3.2.
importante sottolineare che in questo caso si devono considerare
solo i gradienti dei vincoli attivi nel punto in esame.
ESEMPIO 5.10
Determinare il massimo della funzione:

F (x, y) = x
1
3
y
3
+ 4y
soggetta ai vincoli
x 0, y 0.

Nellesempio 5.9 abbiamo visto che lunico punto che pu risultare
di massimo locale per F in S risulta (0,2).
Applichiamo ora la condizione sufficiente del teorema 5.5.
143
Nel punto (0, 2) attivo solo il primo vincolo, pertanto dobbiamo
studiare il segno della forma quadratica associata alla matrice
H
L
(x, y,) = H
F
(x, y) nel sottospazio vettoriale T = {h R
2
: h
1
=0}.
immediato verificare, ricorrendo ad uno qualunque dei criteri esposti
nel capitolo 1, che la forma quadratica in esame risulta definita
negativa in T e pertanto (0, 2) risulta un punto di massimo locale.
Non possiamo in questo modo garantire che il punto risulta di
massimo globale a meno di non osservare la concavit della funzione
obiettivo in S.
145
CAPITOLO 6

PROGRAMMAZIONE LINEARE
6.1 Formalizzazione di un problema di programmazione lineare
Il problema fondamentale della programmazione lineare (L.P.)
consiste nel determinare un estremo (cio il massimo o il minimo) di
una funzione lineare soggetta a vincoli anchessi lineari.
Tale problema un caso particolare di un problema di
programmazione non lineare e, in quanto tale, valgono tutti i risultati
visti precedentemente. Tuttavia, come esamineremo pi oltre, in vista
delle numerose applicazioni della L.P. a problemi economico-sociali e
finanziari, risulta particolarmente significativo riformulare le
condizioni di Kuhn-Tucker (5.5) utilizzando la forma particolare della
funzione obiettivo e dei vincoli.
Utilizzando la rappresentazione in forma vettoriale, un problema di
L.P. in forma canonica, pu cos formularsi:

=
0 x
b x A
x c
T

: a soggetto
z Max
(6.1)
dove:
z = z (x) R si dice funzione obiettivo
x R
n
si dice vettore delle variabili decisionali
146
b R
m
si dice vettore dei termini noti
c R
n
si dice vettore dei coefficienti della funzione
obiettivo
A matrice di tipo (m, n) si dice matrice dei coefficienti
dei vincoli.
La risoluzione di un problema di L.P. consiste nella ricerca di
almeno una n-upla x
1
, x
2
, ..., x
n
che dia il valore massimo a z tra tutte
le n-uple che soddisfano i vincoli.
In generale, un problema di L.P. potr presentarsi diversamente
dalla forma canonica (6.1), tuttavia sempre possibile ricondursi ad
essa. Infatti la minimizzazione equivale alla massimizzazione valendo
la seguente relazione: min z = Max ( z).
Inoltre, i vincoli del tipo Ax b possono scriversi come Ax b,
mentre i vincoli Ax = b si possono scrivere Ax b, Ax b, da
valere congiuntamente.
Definizione 6.1
Si dice soluzione ammissibile del problema (6.1) un qualsiasi
vettore x R
n
, soddisfacente il sistema degli (m + n) vincoli
Ax b x 0.
Linsieme delle soluzioni ammissibili, che si indicher con S
a
,
quindi linsieme definito da:
S
a
= {x R
n
: x 0 Ax b}.
Definizione 6.2
Dicesi soluzione ottimale del problema (6.1) una soluzione
ammissibile che fa assumere alla funzione obiettivo il massimo valore
finito.

147
Come si vedr pi avanti, se la soluzione ottimale esiste pu non
essere unica, ci sono infatti problemi che ammettono infinite soluzioni
ottimali.
6.2 Insiemi convessi in R
n
e programmazione lineare
Introduciamo ora alcuni insiemi che hanno un ruolo fondamentale
nella programmazione lineare: gli iperpiani e i semispazi. Tali insiemi,
come si pu dimostrare facilmente, sono convessi (cfr. cap.1).
Premettiamo la seguente:
Definizione 6.3
Un insieme Q R
n
viene detto variet lineare se
Q = x
0
+ V, = {x R: x = x
0
+ v, v V} x R
n
e dove V un
sottospazio lineare di R
n
.

La dimensione di una variet lineare Q = x
0
+ V la dimensione
del sottospazio V. Cos ad esempio in R
3
variet lineari non vuote
sono punti, rette, piani e lintero spazio di dimensioni rispettivamente
0, 1, 2 e 3. La retta orientata passante per x
0
con direzione e verso
fissati da un vettore s
1
(rif. (1.7)), un esempio di variet lineare di
dimensione 1.
Si definisce dimensione di un insieme convesso S R
n
la pi
piccola dimensione delle variet lineari contenenti S.
Definizione 6.4
Sia c R
n
non nullo e z R. Si definisce iperpiano linsieme

H={x R
n
: c
T
x = z}.

148
Si osservi che in un problema di L.P. linsieme dei vettori in
corrispondenza dei quali la funzione obiettivo assume un determinato
valore, vale a dire la curva di livello definita da c
T
x = z, costituisce un
iperpiano.
Definizione 6.5
Liperpiano H={x R
n
: c
T
x = z} divide R
n
in 3 sottoinsiemi, pi
precisamente:

X
1
={xR
n
: c
T
x < z}, X
2
= {xR
n
: c
T
x = z}, X
3
={xR
n
: c
T
x > z}

tali che

X
1
X
2
X
3
=R
n
e X
1
X
2
= X
1
X
3
= X
2
X
3
= .

Gli insiemi X
1
e

X
3
si dicono semispazi aperti (in R
2
definiscono 2
semipiani).
Gli insiemi X
4
={xR
n
: c
T
x z}, X
5
={xR
n
: c
T
x z}, si dicono
semispazi chiusi. Liperpiano H detto iperpiano origine. Si noti che:
X
4
X
5
=X
2
.
Definizione 6.6
Sia H = {x R
n
: c
T
x = z} e sia S un insieme convesso di R
n
; se per
ogni x S risulta c
T
x z (oppure c
T
x z), ed esiste almeno un
x S che appartiene alliperpiano H, si dice che H un iperpiano di
supporto di S.
Definizione 6.7
Lintersezione di un numero finito di semispazi chiusi detto
politopo convesso o troncone.
149
Un politopo pu essere vuoto, limitato o illimitato (Fig. 6.1).

FIGURA 6.1
Definizione 6.8
Un politopo convesso non vuoto e limitato detto poliedro convesso.
Si pu dimostrare che un poliedro convesso coincide con linsieme
di tutte le combinazioni lineari convesse
1
di un numero finito di punti,
i punti estremi.
Definizione 6.9
Un punto v S, insieme convesso, detto punto estremo per S se,
non ci sono due punti distinti x e y S, tali che v = x + (1 ) y per
qualche , 0 < < 1.
In altre parole, un punto estremo per S un punto v S che non
appartiene a nessun segmento congiungente due altri punti
dellinsieme stesso.

Vale il seguente teorema:

1
Cfr. cap.1.
150
TEOREMA 6.1
Se S un insieme chiuso, convesso e limitato inferiormente
2
, allora
ogni iperpiano di supporto di S contiene almeno un punto estremo di S.
Definizione 6.10
Si dicono facce di un politopo convesso le intersezioni tra gli
iperpiani di supporto del politopo e il politopo stesso.

Le facce sono anchesse politopi convessi; in particolare, una faccia
di dimensione zero si dice vertice, una faccia di dimensione uno si
dice spigolo.

Ad esempio in R
2
i punti estremi di un rettangolo sono i suoi
vertici, di un cerchio sono i punti sulla circonferenza. I punti estremi
di un politopo convesso sono tutti e soli i suoi vertici.

Un caso particolare di poliedro convesso costituito dal
m-simplesso.
Definizione 6.11
Si dice m-simplesso il poliedro convesso generato da (m+1) punti
in R
n
(m n) che non appartengono alla stessa variet lineare di
dimensione (m 1).

In particolare uno 0-simplesso un punto, un 1-simplesso un
segmento, un 2-simplesso un triangolo e il suo interno, un
3-simplesso un tetraedro e il suo interno.


2
Un insieme S R
n
viene detto limitato inferiormente se esiste un vettore
v
0
R
n
:xv
0
per ogni xS.
151
Il seguente teorema evidenzia unimportante caratteristica
dellinsieme S
a
= {x
n
: x 0 Ax b}.
TEOREMA 6.2
Linsieme S
a
un politopo convesso.
DIMOSTRAZIONE
Linsieme dei vettori che soddisfano una disuguaglianza del tipo
a
T
x b oppure x 0 costituisce un semispazio chiuso. Tale
semispazio ovviamente convesso. Gli (m + n) vincoli che
definiscono S
a
, vale a dire

n
1 j
i j ij
b x a , i = 1, ..., m e x
j
0, j = 1, ..., n
descrivono quindi lintersezione in R
n
di (m + n) semispazi chiusi e
pertanto S
a
un politopo convesso.

Si osservi che gli (m + n) iperpiani H
i
= {xR
n
:
j
a
ij
x
j
= b
i
,
i = 1, ..., m} e H
j
= {xR
n
: x
j
= 0, j = 1, ..., n} sono di supporto per S
a

e pertanto le loro intersezioni con S
a
ne costituiscono le facce. Ne
consegue che su ogni faccia uno o pi vincoli sono soddisfatti come
uguaglianza.
La rilevanza della teoria degli insiemi convessi in programmazione
lineare notevole. Infatti fondamentale il seguente teorema:
TEOREMA 6.3
Sia S
a
non vuoto e limitato. Allora esiste almeno una soluzione
ottimale e questa si trova in un vertice del poliedro S
a
. Se esistono pi
soluzioni ottimali, allora anche ogni loro combinazione lineare
convessa soluzione ottimale.
DIMOSTRAZIONE
Poich il problema di L.P. (6.1) consiste nella massimizzazione di
una funzione continua (z=c
T
x) sullinsieme S
a
chiuso e limitato, il
teorema di Weierstrass assicura che tale massimo esiste. Sia esso x*.
152
Osserviamo che x* non pu essere allinterno di S
a
;
;
infatti se cos
fosse, dovrebbe essere nullo il gradiente di z, che invece risulta
costante ed uguale a c. Si conclude pertanto che x* deve giacere sulla
frontiera di S
a
, vale a dire su una sua faccia.
Poich c
T
x c
T
x* x S
a
, ne consegue che liperpiano
H = {x R
n
: c
T
x = c
T
x*}, che contiene ovviamente x*, di supporto
per S
a
, il quale inoltre, in virt dei vincoli di non negativit,

limitato
inferiormente. Vale allora il teorema 6.1 e ci consente di dire che
almeno un punto estremo di S
a
sar ottimale.
Se vi sono pi punti estremi comuni a S
a
e H, siano essi x
1
, x
2
, ...,
x
k
, allora c
T
x
1
= c
T
x
2
= ... = c
T
x
k
= c
T
x* e si dimostra facilmente che
anche ogni loro combinazione lineare convessa

=
=
k
1 i
i
i
x x
) 1 , 0 (
k
1 i
i i
=
= ottimale.
Infatti c
T
x

= c
T

k
1 i
i
i
x = c
T

k
1 i
i
* x = c
T
x*

k
1 i
i
= c
T
x*. Si pu
pertanto concludere che, se il punto di massimo non unico, sono
punti di massimo due o pi vertici e tutti i punti della faccia di S
a
che
li contiene.

Ci sono infine casi in cui il problema di L.P. non ammette soluzioni
e precisamente:
se i vincoli sono incompatibili cosicch S
a
= : ad esempio
3 x
2
incompatibile con la non negativit di
2
x ed anche
6 x x e 2 x x
2 1 2 1
+ sono incompatibili;
se S
a
e illimitato la funzione obiettivo pu crescere
indefinitamente in S
a
: come si pu facilmente verificare, questo
ad esempio il caso del seguente problema di L.P.:


max , , . x x x x x x
1 2 1 2 1 2
10 0 0 + soggetto a :

153
6.3 Linterpretazione geometrica
Da quanto precedentemente detto, la funzione obiettivo z = c
T
x
rappresenta un iperpiano di R
n
mentre linsieme dei vettori x non
negativi che soddisfano il sistema di disuguaglianze Ax b costituisce
un insieme convesso S
a
R
n
definito dallintersezione di m semispazi
chiusi e dellottante positivo di R
n
.
Il problema della L.P. dunque quello di trovare un punto (o un
insieme di punti) in S
a
che sia contenuto nelliperpiano z = c
T
x
corrispondente al massimo valore di z. Le considerazioni svolte in
precedenza mostrano che, se il massimo di z esiste finito, esso, per il
teorema 6.3, si trova in almeno uno dei vertici di S
a
.
Inoltre, poich la funzione obiettivo lineare e linsieme
ammissibile convesso, un punto di massimo locale risulta essere
anche globale. Ne consegue che se z raggiunge in un vertice un valore
pi elevato di quello assunto in tutti i vertici adiacenti, allora a tale
valore corrisponde la soluzione ottimale.
Prima di introdurre la teoria generale della programmazione lineare,
conveniente mostrare ora con un semplice esempio, utilizzando i
concetti fin qui introdotti, la risoluzione di un problema di
programmazione lineare per via geometrica. Come vedremo, ci
possibile solo in casi del tutto particolari, pi precisamente quando nel
problema di L.P. ci sono solo due variabili decisionali che si possono
perci interpretare come coordinate di un punto x = [x
1
x
2
]
T
in R
2
.

Consideriamo dunque il seguente problema di L.P. che illustra un
esempio di pianificazione della produzione in unindustria
manifatturiera:
Una piccola industria manifatturiera produce due diversi tipi di
merci A e B che richiedono entrambe per la loro produzione, luso di
due macchinari U e V con una capacit lavorativa complessiva
rispettivamente di 15 e 10 ore. Inoltre la produzione unitaria di A
154
richiede 3 ore di lavoro sul macchinario U e 5 ore di lavoro sul
macchinario V, mentre quella di B richiede 5 ore di lavorazione su U e
2 su B. Il profitto dellindustria su ogni unit prodotta e venduta delle
merci A e B, che si suppone costante al variare della produzione,
rispettivamente uguale a $5 per A e $3 per B. Il problema consiste nel
decidere quante unit di ciascuna merce si devono produrre, con
lobiettivo di massimizzare il profitto totale dellindustria in esame.
Indicando rispettivamente con x
1
e x
2
il numero di unit delle merci
A e B e con z il profitto totale che lindustria realizza, il problema di
L.P. pu essere cos formulato:


+
+
+ =
0 x , 0 x
10 x 2 x 5
15 x 5 x 3
: a soggetto
x 3 x 5 z Max
2 1
2 1
2 1
2 1
(6.2)
Come si vede esistono due sole variabili decisionali che si possono
interpretare come coordinate di un punto x = [x
1
x
2
]
T
in
2
. Sullo
stesso piano possibile individuare graficamente la regione delle
soluzioni ammissibili, S
a
.
Consideriamo infatti il primo vincolo:


3x
1
+ 5x
2
15 (6.3)
che, com noto, rappresenta il semipiano chiuso contenente lorigine
e delimitato dalla retta che rappresentata in Figura 6.1 con la lettera
a. Analogamente il secondo vincolo:
5x
1
+ 2x
2
10 (6.4)
155
individua il semipiano chiuso contenente lorigine e delimitato dalla
retta che indicata in figura 1 con la lettera b. Infine i vincoli di non
negativit rappresentano tutti e soli i punti del primo quadrante.
Pertanto linsieme delle soluzioni ammissibili S
a
per il problema
assegnato, individuato dallintersezione dei semipiani trovati:
linsieme S
a
un poliedro convesso (nel caso un quadrilatero) ed
allora il problema ammetter almeno una soluzione ottimale che
corrisponde ad almeno un vertice di S
a
.
Per determinarla necessario considerare la famiglia di rette
parallele, individuate dalla funzione obiettivo, di equazione:
5x
1
+ 3x
2
= k (6.5)
con k parametro variabile. Ad ogni generico punto x = [x
1
x
2
]
T
la
(6.5) fa corrispondere un particolare valore di k, vale a dire di z. In
linea di principio, quindi, ottimizzare la funzione obiettivo proposta,
richiederebbe di valutare il k corrispondente ad ogni punto x S
a
e
quindi sceglierne il valore massimo.

x
1
a
b
x
2
(0, 5)
(0, 3)
(0, 0)
k = 0
S
a
z
(2, 0) (5, 0)
k = 235/19
(
20
19
45
19
)

FIGURA 6.2
156

Il teorema 6.3, precedentemente dimostrato, asserisce per che
sufficiente, per questo esame, prendere in considerazione i vertici di
S
a
, che sono:

[0 0]
T
, [0 3]
T
, [2 0]
T
,
T
19
45
19
20
(

(6.6)

sui quali la funzione obiettivo assume rispettivamente i valori: 0, 9,
10, 235/19. Il massimo della funzione obiettivo pertanto 235/19 ed i
valori delle variabili decisionali corrispondenti sono:
19
20
x
*
1
= ,
19
45
x
*
2
= .

Il procedimento che consente di arrivare a tale soluzione pu essere
visto anche per via grafica nel modo seguente: per k = 0 la retta
definita dalla (6.5) passa evidentemente per lorigine ed ha
coefficiente angolare m = 5/3, costante al variare di k. facile
verificare che le rette parallele cos determinate si allontanano sempre
di pi dallorigine verso il primo quadrante al crescere di k. Il
problema quindi si riconduce a calcolare il massimo k tale che la retta
cos determinata abbia ancora punti in comune con S
a
.
Con questo procedimento si riconosce appunto che il massimo
valore di k assunto sul vertice di S
a
di coordinate (20/19, 45/19).
Se la famiglia di rette che rappresenta la funzione obiettivo fosse
parallela alla retta originante un vincolo, le soluzioni ottimali
potrebbero essere in numero infinito, giacenti tutte sullintersezione di
tale retta con S
a
. Ci non contraddice il teorema (6.3), perch tra tali
punti esiste certamente almeno un vertice di S
a
.
Come si vede, il metodo grafico molto semplice e d interessanti
risultati. Esso pu essere applicato senza problemi quando vi siano
157
due variabili decisionali oppure, pi difficilmente, nello spazio,
quando vi siano tre variabili decisionali. In particolari casi, (ad
esempio quando siano presenti anche vincoli di uguaglianza)
possibile trattare anche problemi di dimensioni maggiori.
Consideriamo ad esempio il problema:


= +
+
+
+ + =
0 x , 0 x , 0 x
0 x x x 2
10 x 2 x 5
15 x 5 x 3
: a soggetto
x x x z Max
3 2 1
3 2 1
2 1
2 1
3 2 1
(6.7)
Il terzo vincolo unuguaglianza, che pu essere risolta fornendo
per x
3
il valore x
3
= 2x
1
+ x
2
da cui la funzione obiettivo, sostituendo,
vale:
z = x
1
+ x
2
+ 2x
3
= 5 x
1
+ 3 x
2
(6.8)
La limitazione x
3
0 automaticamente soddisfatta in quanto deve
valere x
1
0 e x
2
0.
Pertanto il problema (6.7) mediante questo artificio, assume la
stessa struttura del (6.2) e ne possiede le stesse soluzioni. In questo
caso, per, poich x
3
variabile decisionale, anche ad essa occorrer
attribuire il valore ottimale. Pertanto la soluzione ottimale del
problema (6.7) sar:

19
85
x ,
19
45
x ,
19
20
x ,
19
235
z
*
3
*
2
*
1
*
= = = = (6.9)
158
6.4 La soluzione algebrica
Per esaminare il procedimento risolutivo generale dei modelli di
L.P. conveniente esprimerli nella seguente forma normale o
standard:

=
=
0 x
) 0 b ( b x A
: a soggetto
x c z min
T
(6.10)
dove x R
n
, c R
n
, b R
m
, A di tipo (m, n).

La forma normale ottenuta da qualsiasi problema, formulato con
tutti i vincoli, nel modo che ora delineiamo.
Consideriamo il problema:


=
0 x
b x A
b x A
) 0 b , b , b ( b x A
: a soggetto
y c z min
3 3
2 2
3 2 1 1 1
T
0
(6.11)
e definiamo per accostamento i seguenti vettori e matrici:
x =
(
(
(

2
1
s
s
y
, b =
(
(
(

3
2
1
b
b
b
, c =
(
(
(

2
1
0
c
c
c
(6.12)
159

(
(
(

=
0 0 A
I 0 A
0 I A
A
3
2
1
(6.13)
dove c
0
e c
1
sono due vettori a componenti nulle,
s
1
= b
1
A
1
y e s
2
= A
2
y b
2
; le componenti di s
1
e s
2
sono dette
rispettivamente variabili surplus e variabili deficit: in generale esse si
diranno variabili di scarto. Dai vincoli del problema risulta essere
s
1
0, s
2
0.
Con tale notazione il problema (6.11) si identifica con il (6.10).
Infatti il problema (6.11) diviene ora:

=
=
= +
+ + =
0 s , s , y
b y A
b s y A
b s y A
: a soggetto
s c s c y c z min
2 1
3 3
2 2 2
1 1 1
2
T
2 1
T
1
T
0


Si osservi che, senza perdita di generalit, si potr sempre supporre
che m < n e rango (A) = m. A priori questa condizione pu sembrare
restrittiva perch implica che il numero dei vincoli, m, sia inferiore ad
n, numero delle variabili e pertanto esclude il caso m n. Se m = n il
sistema ha o una sola soluzione oppure nessuna soluzione, mentre se
m > n il sistema dei vincoli ammette soluzione se e solo se almeno
(m n) vincoli sono ridondanti, cio sono dipendenti dagli altri.
Allora, eliminando le equazioni ridondanti, il sistema pu essere
ricondotto al caso m < n. Poich rango(A) = m, si pu estrarre da A
una sottomatrice quadrata B, di ordine m, non singolare. Operando
160
eventualmente una permutazione sulle colonne di A e naturalmente
sulle corrispondenti componenti di x possibile scrivere:
A = [B | D] (6.14)
In corrispondenza sia:

(

=
t
y
x (6.15)
dove y R
m
, t R
nm
. Allora Ax = b si pu scrivere come:
By + Dt = b (6.16)
e quindi sfruttando linvertibilit della matrice B:
y = B
1
b B
1
Dt (6.17)
da cui

(

+
(

=

I
D B
0
b B
x
1 1
t (6.18)
Definizione 6.12
Si dice soluzione di base una soluzione particolare x del sistema
Ax = b ottenuta ponendo in (6.18) t = 0, vale a dire:

(

0
b B
x
1
(6.19)
161
Le m variabili che assumono i valori dati da B
1
b sono dette
variabili di base. Se inoltre x 0, tale soluzione verr detta soluzione
di base ammissibile e pertanto apparterr ad S
a
.
Definizione 6.13
Si dice soluzione di base degenere una soluzione di base con pi di
nm componenti nulle. Si dice, inoltre, soluzione di base ammissibile
degenere una soluzione di base ammissibile con pi di (n m)
componenti nulle.

Vale il seguente teorema:
TEOREMA 6.4
Ogni soluzione di base ammissibile x corrisponde ad un vertice di S
a
.

DIMOSTRAZIONE
Sia

m
B
B
R x ,
0
x
x
(

= (6.20)
una soluzione di base ammissibile per il sistema Ax = b, con
x
B
= B
1
b (6.21)
Per dimostrare che x un vertice dobbiamo far vedere che non
esistono due vettori
x
1
, x
2
S
a,
x
1
x
2
, tali che:
x = x
1
+ (1) x
2
, 0 < <1 (6.22)
Per assurdo, esistano due soluzioni ammissibili x
1
e x
2
tali che
valga la (6.22), essendo x
1
e x
2
dati da:
162

(

=
1
1
1
v
u
x ,
(

=
2
2
2
v
u
x (6.23)
con u
1
, u
2
R
m
e v
1
, v
2
R
nm
. Sostituendo nella (6.22) la (6.20) e la
(6.23) ed uguagliando le ultime (nm) componenti si ottiene:
0 = v
1
+ (1)v
2
(6.24)
con > 0, 1 > 0, v
1
0, v
2
0, pertanto la (6.24) vale solo per
v
1
= v
2
= 0.
Si ha quindi per lammissibilit di x
1
, x
2
:
Ax
1
= Bu
1
= b (6.25)
Ax
2
= Bu
2
= b (6.26)
Ricordando che un vettore b si pu esprimere in un unico modo in
funzione della base (i vettori colonna di B), e valendo anche:
Bx
B
= b (6.27)
si ha
x
B
= u
1
= u
2
(6.28)
quindi non esistono soluzioni ammissibili diverse da x , per le quali
valga la (6.22) e perci x un vertice di S
a
.

Dai teoremi 6.3 e 6.4 segue il teorema fondamentale della
Programmazione Lineare:
163
TEOREMA 6.5
Se un problema di L.P. ammette una soluzione ammissibile allora
esiste una soluzione di base ammissibile; se esiste una soluzione
ottimale, allora esiste una soluzione ammissibile di base ottimale.

Si osservi che se un vertice ha k<m componenti positive, ad esso
corrisponde una soluzione di base ammissibile degenere perch
esistono (m k) colonne di A che assieme alle colonne a
j
(j = 1, ..., k)
formano una base per R
m
e danno una matrice non singolare. perci
possibile formare una soluzione di base ammissibile degenere con
(m k) variabili nulle.
In assenza di degenerazione c una corrispondenza biunivoca tra
vertici e soluzioni di base ammissibili. Qualora vi sia degenerazione,
questo non pi vero, perch gli (m k) vettori colonna di A associati
alle variabili di base nulle, possono essere scelti in pi modi; pertanto
ad un vertice di S
a
corrispondono pi soluzioni di base.
Geometricamente, la degenerazione compare quando per un vertice di
S
a
passano pi di n iperpiani di vincolo.
Dato il sistema dei vincoli Ax = b, vi sono chiaramente tante basi
quante sono le possibilit di scomporre la matrice A nella forma (6.14)
con det (B) 0. Si dimostra facilmente che il massimo numero di
soluzioni di base per il sistema in esame
|
|

\
|
m
n
. Poich ogni soluzione
di base corrisponde ad un vertice di S
a,
il teorema 6.3 assicura che, per
trovare la soluzione al problema (6.10), sufficiente individuarne tutte
le basi e, per ognuna di queste, calcolare il valore della funzione
obiettivo, per sceglierne il minimo.
Per ogni base, identificata dalla matrice B non singolare, si verifica
immediatamente che il valore della funzione obiettivo risulta:
z = c
T
B
B
1
b (6.29)
164
dove c
B
dato dalla scomposizione del vettore c in:

(

=
D
B
c
c
c (6.30)
originata dalla stessa permutazione determinata dalla (6.14).
In pratica, nei problemi con un elevato numero di variabili e di
vincoli, risulta poco conveniente individuare tutte le possibili
sottomatrici quadrate a rango massimo contenute in A, e di ognuna
calcolarne linversa, come richiesto dalla formula risolutiva (6.29). Si
preferisce utilizzare metodi iterativi (tra i quali il metodo pi diffuso
quello del simplesso) che, partendo da una situazione iniziale
prefissata, passano in rassegna i vertici di S
a
tentando di migliorare ad
ogni passo il valore della funzione obiettivo. Il metodo tale che in un
numero finito di iterazioni giunge alla soluzione oppure segnala che il
problema ammette soluzione illimitata. In casi particolari (cio con
opportune modifiche) questo metodo anche in grado di segnalare che
il problema originario non risolubile per incompatibilit dei vincoli
(cio S
a
= ). Lalgoritmo risolutivo abbastanza semplice e verr
ricavato da considerazioni algebriche nel prossimo paragrafo.
ESEMPIO 6.1
Consideriamo il problema di L.P. illustrato nel paragrafo 8, che
scritto sotto forma canonica diviene:


+
+
+ =
0 x , 0 x
10 x 2 x 5
15 x 5 x 3
: a soggetto
x 3 x 5 z Max
2 1
2 1
2 1
2 1
(6.31)
da cui, dopo averlo ricondotto alla forma standard:
165
(

=
(

=
(
(
(
(

=
1 0 2 5
0 1 5 3
A ,
10
15
b ,
0
0
3
5
c
le possibili basi sono:
(

=
2 5
5 3
B
1
,
(

=
0 5
1 3
B
2
,
(

=
1 5
0 3
B
3
,
(

=
0 2
1 5
B
4
,
(

=
1 2
0 5
B
5
,
(

=
1 0
0 1
B
6

da cui
(

19 3 19 5
19 5 19 2
B
1
1
,
(

5 3 1
5 1 0
B
1
2
,
(

1 3 5
0 3 1
B
1
3
,
(

2 5 1
2 1 0
B
1
4
,
(

1 5 2
0 5 1
B
1
5
,
(

1 0
0 1
B
1
6
.
Pertanto:
x
1
= [20/19 45/19 0 0]
T
, x
2
= [2 0 9 0]
T
, x
3
= [5 0 0 15]
T
,
x
4
= [0 5 10 0]
T
, x
5
= [0 3 0 4]
T
, x
6
= [0 0 15 10]
T
.
Si nota subito che i vettori x
3
e x
4
non appartengono ad S
a
in
quanto presentano una componente negativa: per i rimanenti si osserva
che, considerando solo le due prime componenti, essi rappresentano
tutti i vertici di S
a
raffigurato in figura 6.2.
Per quanto concerne il valore della funzione obiettivo si ha:
166
z
1
= 235/19, z
2
= 10, z
3
= non definita, z
4
= non definita, z
5
=
9, z
6
= 0.
Il segno () spiegato dal fatto che il minimo della funzione
obiettivo nella forma standard lopposto del massimo della funzione
obiettivo del problema (6.31).
Come si pu osservare dallesame della fig. 6.2 S
a
un insieme
chiuso e limitato. Pertanto, per il teorema 6.3, il nostro problema
ammette soluzione ottimale data da:
z
*
= 235/19, x
*
=[20/19 45/19 0 0]
T
.
6.5 Analisi di sensitivit
Consideriamo il problema:

=
=
0 x
b x A
: a soggetta
x c z min
T

(6.32)
dove x, c R
n
, b R
m
, A una matrice di tipo (m n). In presenza di
una soluzione ottimale calcolata, si vogliono studiare le alterazioni
provocate su di essa per il fatto di imporre che le variabili non di base
x
D
assumano valore positivo. Dalla formula Bx
B
+ Dx
D
= b si trae:
x
B
= B
1
b B
1
Dx
D
=

B
x B
1
Dx
D
(6.33)
La soluzione del problema, modificata da x
D
0, sar pertanto, in
termini di variabili decisionali:
167

(

D
D
1
B
x
x D B x
x
(6.34)
Posto:
G = B
1
D (6.35)

si ottiene dalla (6.33) che la variazione sul valore numerico delle
variabili di base data in questo caso da:
x
B
= Gx
D
(6.36)
Il significato della matrice G il seguente: supponiamo di imporre
il valore 1 alla j-esima componente del vettore x
D;
si verificher allora
che la componente i-esima del vettore x
B
varier della quantit
g
ij
. Gli elementi della matrice G, visto il loro chiaro significato,
vengono anche detti tassi marginali di sostituzione.
La funzione obiettivo, valutata nel punto x
**
vale:
z
**
=
T
B
c (

B
x Gx
D
)+
T
D
c x
D
(6.37)
e poich z
*
=
T
B
c

B
x , si ottiene che la sua variazione sar misurata da
z = z
**
z
*
=

(
T
D
c
T
B
c G) x
D

(6.38)
Posto
h
T
=
T
D
c
T
B
c G (6.39)
il vettore h cos risultante ha il significato che emerge da questa
osservazione: se si impone il valore 1 alla j-esima componente di x
D
, il
valore della funzione obiettivo subisce unalterazione pari a h
j
.
Pertanto le componenti h
j
vengono dette costi marginali o costi ridotti.
168
Le formule (6.36) e (6.38) consentono quindi di calcolare gli effetti
sulla soluzione ottimale dovuti allimposizione di valori positivi x
D
ad
una o pi delle variabili non di base.
ESEMPIO 6.2
Sia dato il seguente problema: determinare il piano di produzione
ottimale (quantit/settimana) di 4 beni, per la cui fabbricazione sono
necessari due macchinari, disponibili rispettivamente per 70 e 50
ore/settimana, sapendo che:

beni A B C D
impiego unitario macch.1(h/pezzo) 4 2 6 9
impiego unitario macch.2(h/pezzo) 3 7 4 4
profitto unitario di produzione ($) 6 8 12 24

Il problema si scrive:

=
+ + +
+ + +
+ + + =
4 , 3 , 2 , 1 i 0 x
50 x 4 x 4 x 7 x 3
70 x 9 x 6 x 2 x 4
: a soggetto
x 24 x 12 x 8 x 6 z Max
i
4 3 2 1
4 3 2 1
4 3 2 1
(6.40)

Introducendo le variabili di scarto, i parametri del problema sono:
c
T
=[6 8 12 24 0 0], b
T
= [70 50],
(

=
1 0 4 4 7 3
0 1 9 6 2 4
A .
Si dimostra che la base

(

=
7 4
2 9
B
,
(

55 9 55 4
55 2 55 7
B
1

169
ottimale e in corrispondenza si ha:
x
B
= B
1
b=
390 55
170 55

(
, z =
B
T
B
x c = [10720/55].
Si ha inoltre

T
B
x = [x
4
x
2
],
T
D
x = [x
1
x
3
s
1
s
2
],

(

= =

55 / 9 55 / 4 55 / 12 55 / 11
55 / 2 55 / 7 55 / 34 55 / 22
D B G
1

e dalla (6.36)
x
4
= 1/55(22x
1
+34x
3
+7s
1
2s
2
), x
2
= 1/55(11x
1
+12x
3
4s
1
+9s
2
).
Ad esempio per produrre una unit di x
1
devo diminuire la
produzione (ottimale) di x
4
di 22/55 e quella di x
2
di 11/55. Infine
dalla (6.38), poich
T
B
c = [24 8],
T
D
c = [6 12 0 0], si ha
z = {[6 12 0 0] [24 8]G} x
D
=
1/55(286x
1
+252x
3
+136s
1
+24s
2
).
Da ci si deduce che:
il profitto (funzione obiettivo) diminuisce di $ 252/55 se si impone
la produzione di 1 unit del bene 3 (in tal caso il valore 252/55
verr detto perdita di opportunit o costo ridotto).
il profitto diminuisce di $ 136/55 se si impone 1 unit di s
1
, cio se
si toglie unora lavorativa alla macchina 1 (tale valore verr detto
valore marginale o prezzo ombra).
170
6.6 Il metodo del simplesso
Dalle considerazioni svolte nel paragrafo precedente possibile
ricavare le regole per il metodo di risoluzione dei problemi di L.P. che
va sotto il nome di Metodo del Simplesso.
Tale metodo un algoritmo iterativo che, in un numero finito di
passi, esamina i vertici dellinsieme S
a
(ossia le soluzioni di base
ammissibili); ad ogni iterazione il metodo stabilisce la eventuale
ottimalit della base precedente; se ci non avviene segnala la
impossibilit di proseguire nellindagine in quanto si in presenza di
una soluzione illimitata, oppure esamina unaltra soluzione di base
ammissibile, contigua alla precedente, e che permetta un
miglioramento della funzione obiettivo.
Vediamo innanzitutto come procede il metodo del simplesso nel
caso di cambiamento di una soluzione di base ammissibile. La base
viene trasformata mediante linserimento in base di una variabile non
di base e la contemporanea esclusione dalla base di unaltra variabile.
Metodologicamente, lalgoritmo si basa sulla (6.33)
x
B
=

B
x Gx
D
(6.41)
dove

B
x la soluzione di base relativa alla base individuata dalla
matrice B.
Per cambiare base (in assenza di degenerazione) sufficiente
azzerare una componente del vettore x
B
, attraverso la modifica di una
sola componente del vettore x
D
.
Pertanto il vettore x
D
pu essere espresso mediante una delle
seguenti alternative, dove e
1
, ..., e
nm
sono valori da determinare
opportunamente in seguito:
171

(
(
(
(
(
(
(
(
(
(
(

=
0
.
.
0
0
.
0
e
x
1
D

(
(
(
(
(
(
(
(
(
(
(

=
0
.
.
0
0
.
e
0
x
2
D

(
(
(
(
(
(
(
(
(
(
(

=
m n
D
e
.
.
0
0
.
0
0
x (6.42)
Sostituendo nella (6.41) e ponendo g
ij
gli elementi della matrice G,
si ha:
(x
B
)
i
= (

B
x )
i
g
ij
e
j
(6.43)
Si tratta ora di trovare per ogni j il valore di e
j
che lascia positive
tutte le componenti di x
B
tranne una che si annulla. Dalla (11.3) si
deduce che:
se, fissato j, g
ij
0 i, allora (

B
x )
i
g
ij
e
j
sempre positivo, visto
che sia e
j
che (

B
x )
i
sono per ipotesi positivi;
se, fissato j, esiste qualche g
ij
> 0, allora (

B
x )
i
g
ij
e
j
0 se
e
j

ij
i B
g
) (x

e pertanto il valore di e
j
che consente di annullare solo
una componente di x
B
:

> =

0 g ,
g
) (x
e
ij
ij
i B
i
j
min (6.44)
Lindice i
0
per cui viene raggiunto il minimo dato dalla (6.44)
segnala la componente del vettore x
B
che viene estratta dalla base. Pu
172
per accadere che il valore minimo di
ij
i B
g
) x (

, in relazione agli elementi
g
ij
> 0, venga raggiunto, oltre che per il valore i
0
dellindice i, anche
per altri valori di i, ad esempio i = l. In tal caso si avr
e
j
=
j i
i B
0
0
g
) x (

=
lj
l B
g
) x (

e pertanto indifferente prendere i
0
oppure l.
Tuttavia si conviene di scegliere lindice corrispondente al minimo
valore.
Fatte salve le considerazioni precedenti, per ogni indice j delle
variabili non in base possibile quindi determinare un indice i
0

corrispondente.
Resta ora da determinare quale delle variabili non in base
immettere nella base; ci si traduce nella determinazione dellindice j
opportuno.
Il criterio di scelta basato sul miglioramento della funzione
obiettivo durante tale passaggio. Con riferimento al problema
dellesempio 6.1, consideriamo allo scopo la (6.38)
z = (
T
D
c
T
B
c G)x
D
(6.45)
che, trattandosi di un problema di minimo, deve risultare il minimo
possibile.
Come gi in precedenza osservato, le componenti del vettore
T
D
c
T
B
c G vengono dette costi ridotti o costi marginali. In
corrispondenza delle formulazioni alternative di x
D
date dalle (11.2)
risulta:

j ij
B i
i j
e ) g c c ( z

= (6.46)
Si verificher ora che:
173
se
ij
B i
i j
g c c

< si ha un decremento effettivo della funzione


obiettivo;
se
ij
B i
i j
g c c

> non conviene inserire nella base la variabile di


indice j, in quanto ci provocherebbe un incremento della funzione
obiettivo.
Pertanto se i costi ridotti sono tutti positivi, vale a dire che per ogni
j si ha
ij
B i
i j
g c c

> , si raggiunta la base ottimale perch non sono pi


consentiti miglioramenti della funzione obiettivo rimanendo
nellinsieme delle soluzioni ammissibili; linserimento di una qualsiasi
variabile fuori base comporterebbe un aumento del valore della
funzione obiettivo. Viceversa in presenza di costi ridotti negativi, il
massimo decremento potenziale della funzione obiettivo si ottiene
inserendo in base la variabile di indice j alla quale corrisponde il costo
ridotto (negativo) minore.
A scopo esplicativo, consideriamo nuovamente lesempio 9.1 e sia
x
*
=[0 0 15 10]
T
una soluzione di base ammissibile. Le variabili x
1
e x
2

sono fuori base, mentre s
1
e s
2
sono in base. In corrispondenza di tale
soluzione, la funzione obiettivo vale z=0. Calcolando i costi ridotti si
ottiene:
T
D
c
T
B
c G = [5 3]. Poich i costi ridotti sono negativi, esiste
una soluzione di base ammissibile migliore; pi precisamente il
decremento maggiore della funzione obiettivo si ottiene mediante
linserimento in base della variabile x
1
.
Per quanto riguarda la variabile da estrarre dalla base, dalla (6.44)
ponendo j = 1 ed essendo
(

=
2 5
5 3
G , si ottiene
e
1
15
3
10
5
2 =


`
)
= min , , pertanto la variabile s
2
uscir dalla base e
tenendo conto della (6.41) si avr:
174


(

=
0
2
x
D
,
(

=
(

=
0
9
0
2
2 5
5 3
10
15
x
B
, perci:
(
(
(
(

=
0
9
0
2
x .

In corrispondenza di tale base la funzione obiettivo vale z = 10.
Calcoliamo ora i costi ridotti per vedere se la base trovata quella
ottimale:
T
D
c
T
B
c G =[ ] [ ] [ ] 1 1
1 2
0 5
5 / 3 1
5 / 1 0
0 5 0 3 =
(

.
Il costo ridotto 1 segnala che possibile ottenere un ulteriore
miglioramento della funzione obiettivo inserendo in base la variabile
x
2
. Poich
(

=
5 / 3 5 / 19
5 / 1 5 / 2
G e j=1, si ottiene
19
45
5 / 19
9
,
5 2
2
min
1
=
)
`

= e ,
pertanto la variabile s
1
uscir dalla base ed entrer x
2
. Avremo quindi:

(

=
0
19 / 45
x
D
,
(

=
(

=
0
19 / 20
0
19 / 45
5 / 3 5 / 19
5 / 1 5 / 2
9
2
x
B
,
perci:
(
(
(
(

=
0
0
19 / 45
19 / 20
x e z=235/19. Calcolando nuovamente i costi
ridotti si ottiene:
175
T
D
c
T
B
c G =[ ] [ ] [ ] 19 / 16 19 / 5
19 / 3 19 / 5
19 / 5 19 / 2
3 5 0 0 =
(


che, essendo un vettore positivo, segnala che la soluzione trovata
quella ottimale.
6.7 Teoria della dualit
Consideriamo un problema di L.P. scritto nella forma canonica

=
0 x
b x A
: a soggetta
x c z Max
T

P)
Si chiama problema duale di P) il seguente problema:

=
0
. c A
a: soggetta
b w min
T
T

(
T
A c
T
) D)
e P) viene detto problema primale.

Le regole per costruire un problema duale dal primale sono le
seguenti:

i coefficienti della funzione obiettivo di D) sono i termini noti dei
vincoli di P);
176
i termini noti dei vincoli di D) sono i coefficienti della funzione
obiettivo di P);
la matrice dei coefficienti dei vincoli di D) la trasposta di quella
relativa a P);
la funzione obiettivo di D) deve essere minimizzata se la funzione
obiettivo di P) deve essere massimizzata;

Si verifica facilmente che, costruendo con queste regole il duale di
D) si ottiene ancora il primale.
La teoria della dualit si propone di studiare le relazioni tra P) e D).
Considerando ad esempio il problema dellesempio (6.2), il duale si
scrive come:


+
+
+
+
+
0 ,
24 4 9
12 4 6
8 7 2
6 3 4
:
50 70 min
2 1
2 1
2 1
2 1
2 1
2 1
a soggetta
(6.47)
Applicando ora ai problemi primale e duale il metodo dei
moltiplicatori di Lagrange, possibile evidenziare lo stretto legame
intercorrente tra i due problemi ed interpretare le variabili duali come i
moltiplicatori di Lagrange del primale. Infatti, come si vedr qui di
seguito, la funzione Lagrangiana e le condizioni di Kuhn-Tucker del
primale e del duale sono uguali.
Siano
177
P)

=
0 x
b x A
x c
T

: a soggetta
z Max
e D)

=
0
. c A
b
T T
T

: a soggetta
w min

rispettivamente il problema primale e duale. In virt del teorema di
Kuhn-Tucker, x* una soluzione ottimale di P) se esiste un vettore *
tale che risulti in (x*, *):
x
L

= c A
T
0,
T
x
L
|

\
|

= (c
T
A) x = 0, x 0,

L
= b Ax 0,
T

L
=
T
(b Ax) = 0, 0
dove L la funzione lagrangiana del primale L(x, ) = c
T
x +
T
(bAx).
Analogamente, * una soluzione ottimale di D), se esiste un
vettore x* tale che risulti in (*, x*):
x
L

= b Ax 0,
T

L
=
T
(b Ax) = 0, 0,
x
L

= c A
T
0,
T
x
L
|

\
|

= (c
T
A) x = 0, x 0,
dove L la funzione lagrangiana del duale
L(, x) =
T
b x
T
(c A
T
).

Pertanto, come abbiamo gi anticipato, le condizioni di Kuhn-
Tucker sono le stesse per entrambi i problemi. Da tale risultato
178
derivano i tre principali teoremi sulla dualit della programmazione
lineare: di esistenza, di dualit e di scarto complementare e alcune
notevoli implicazioni economiche.
TEOREMA DI ESISTENZA
Il primale ed il duale hanno soluzione ottimale se e solo se
entrambi hanno soluzioni ammissibili.
DIMOSTRAZIONE
Siano x
1
e
1
soluzioni ammissibili per P) e D) rispettivamente. Da
Ax b e
T
A c
T
, premoltiplicando per
T
la prima disuguaglianza e
postmoltiplicando per x la seconda, si ottiene:
T
Ax
T
b = w () e

T
Ax c
T
x = z (x), da cui z (x) w ()
Poich
1
una soluzione ammissibile per D) ne consegue che
z (x) w(
1
) per ogni x ammissibile e pertanto, poich z (x) limitata
e linsieme ammissibile non vuoto perch contiene x
1
, ne consegue
che il problema P) ammette soluzione ottimale. In modo analogo si
dimostra che il duale ammette soluzione ottimale.
Si supponga ora che x* sia una soluzione ottimale di P),
ovviamente x* anche soluzione ammissibile. Essendo z(x) funzione
concava e i vincoli funzioni convesse in quanto lineari, in virt del
teorema di Kuhn-Tucker esister un vettore * tale che (*)
T
A c
T
,
* 0 che esprimono il fatto che * soluzione ammissibile per D).

Pertanto lesistenza di una soluzione assicurata se e solo se
entrambi i problemi hanno soluzioni ammissibili.

Si possono allora presentare le seguenti possibilit:
P) e D) hanno entrambi soluzioni ammissibili esiste soluzione
ottimale;
n P) n D) hanno soluzioni ammissibili non esiste soluzione
ottimale.
179
P) non ha soluzioni ammissibili (vale a dire S
a
= ) e D) ha
soluzioni ammissibili D) ha soluzione illimitata;
P) ha soluzioni ammissibili e D) non ha soluzioni ammissibili (vale
a dire S
a
= ) P) ha soluzione illimitata.
TEOREMA DI DUALIT
Un vettore ammissibile x* (*) del primale (del duale) soluzione
ottimale del primale (del duale) se e solo se esiste un vettore
ammissibile * (x*) del duale (del primale) tale che z(x*) = w(*).
DIMOSTRAZIONE
Sia x* una soluzione ottimale per P). Allora, per il teorema di
Kuhn-Tucker, esister un vettore *, soluzione ammissibile per D) tale
che (c
T
(*)
T
A) x*= 0 e (*)
T
(b Ax*) = 0. Ne consegue che
z(x*) = c
T
x* = (*)
T
Ax* = (*)
T
b = w(*). Con procedimento del tutto
analogo si il caso in cui * sia soluzione ottimale per D).
Viceversa, siano x* e * soluzioni ammissibili per P) e D)
rispettivamente e sia inoltre z(x*) = w(*). Poich z(x) w(*) per
ogni soluzione ammissibile x, come provato nel teorema di esistenza,
ne consegue che z(x) z(x*) per ogni x ammissibile e ci dimostra
che x* soluzione ottimale di P). Analogamente si dimostra che
w(*) w() per ogni ammissibile.
TEOREMA DI SCARTO COMPLEMENTARE
x* e * sono rispettivamente soluzioni ottimali del primale e del
duale se e solo se soddisfano le seguenti condizioni dette condizioni
di scarto complementare.
(c
T
(*)
T
A) x*= 0; (*)
T
(b Ax*) = 0.
180
DIMOSTRAZIONE
La condizione necessaria deriva immediatamente dalle condizioni
di Kuhn-Tucker.
Per dimostrare la seconda parte del teorema, siano x* e *
soluzioni ammissibili.
Allora imponendo le condizioni di scarto complementare si ottiene:
z(x*) = c
T
x* = (*)
T
Ax* = (*)
T
b = w (*), e applicando il teorema di
dualit segue immediatamente la tesi.

Il teorema di scarto complementare permette di evidenziare lo
stretto legame intercorrente tra variabili e vincoli dei problemi primale
e duale in corrispondenza della soluzione ottimale. Scriviamo infatti
per esteso le condizioni (c
T
(*)
T
A)x*= 0 e (*)
T
(bAx*)= 0:
(c
j

m
1 i
*
i ij
a )
*
j
x = 0 j = 1,..., n (a)

*
i
(b
i

=
n
1 j
*
j ij
x a ) = 0 i = 1,..., m (b)
Dalle (a) e (b) si ottiene:
x
j
*
> 0

m
1 i
*
i ij
a = c
j
j = 1,..., n (6.48)

m
1 i
*
i ij
a > c
j
x
j
*
= 0 j = 1,..., n (6.49)

=
n
1 j
*
j ij
x a < b
i

j
*
= 0 i = 1, ..., m (6.50)
181

j
*
> 0

n
1 i
*
i ij
a = b
i
i = 1, ..., m (6.51)
Con riferimento ad esempio ad un problema di produzione come
quello dellesempio 6.2, le suddette relazioni di scarto complementare
indicano nellordine che:
se una produzione attivata a livello positivo, il vincolo
corrispondente del duale saturato (6.48);
se ci non accade, la produzione corrispondente non attivata
(6.49);
se una risorsa non completamente utilizzata, la corrispondente
variabile duale nulla (6.50);
se la variabile duale positiva, la corrispondente risorsa
pienamente utilizzata (6.51).

Pertanto, tali considerazioni, unitamente al fatto che le variabili
duali sono proprio i moltiplicatori di Lagrange del primale e che
i
*
b
z

=
*
i
portano a concludere che tali variabili misurano la
sensibilit del valore ottimale della funzione obiettivo rispetto a
piccole variazioni del vettore b. Se il valore ottimo di
*
i
nullo,
piccole variazioni di b
i
non hanno alcun effetto sul valore della
funzione obiettivo perch, in tal caso la risorsa corrispondente non
pienamente utilizzata.
In generale, nei problemi di allocazione, nei quali la funzione
obiettivo rappresenta ad esempio un profitto (ricavo, costo,...) e i
vincoli esprimono una certa quantit di date risorse, le variabili duali
hanno le dimensioni di un valore e perci vengono dette prezzi ombra,
cos chiamati perch non sono prezzi di mercato bens esprimono una
valutazione delle risorse in relazione ad un piano di produzione
ottimale.
182
Pertanto la soluzione del problema del problema duale (6.47)
fornisce una valutazione delle risorse utilizzate dallazienda. Infatti il
valore ottimale delle variabili duali ( 44 . 0 , 47 . 2
2 1
= =

) esprime il
valore marginale delle risorse, vale a dire il prezzo di unora in pi
di capacit delle macchine. Ponendo in (6.40) b
1
= 71 si otter-
rebbe z
*
= 197.37 che corrisponde ad un profitto extra di
$ (197.37 194.9) = $2.47 che esattamente

1
.
Utilizzando i prezzi ombra anche possibile riesaminare il piano di
produzione ottimale dellazienda alla luce dei costi ridotti o perdite
dopportunit gi introdotti nel paragrafo 6.6.
I prodotti A e C non sono inseriti in tale piano perch valutando ad
esempio la produzione di A mediante i prezzi ombra delle risorse
utilizzate, si ottiene:

Produrre ununit di A Ricavi/costi
4h. del macchinario 1 a $2.47/h. $ 9.88
3h. del macchinario 2 a $0.44/h. $ 1.32

Valore marginale totale degli input $ 11.20
Ricavo $ 6.00

Perdita di opportunit netta o costo ridotto $ 5.20

Pertanto $5.2 rappresenta la diminuzione del profitto totale
derivante dalla produzione di una unit di A, vale a dire la perdita di
opportunit dovuta allattivazione di un piano di produzione non
ottimale.
Il significato economico attribuito alle variabili duali, consente
infine di associare al problema duale (6.47) il seguente problema di
L.P.: unaltra azienda vuole detenere il monopolio della produzione
delle merci A, B, C e D. Perci offre alla nostra azienda $
1
per ogni
183
ora di utilizzo del macchinario 1 e $
2
per ogni ora di utilizzo del
macchinario 2. Per rendere questa offerta attraente, essa si dichiara
disposta a pagare importi tali da soddisfare i seguenti vincoli:


+
+
+
+
0 ,
24 4 9
12 4 6
8 7 2
6 3 4
2 1
2 1
2 1
2 1
2 1

Il suo obiettivo evidentemente quello di minimizzare i costi di
utilizzo dei macchinari, vale a dire: min.
2 1
50 70 + .
185
REFERENZE BIBLIOGRAFICHE
ACKOFF R., SASIENI M., La ricerca operativa. Principi e metodi,
ETAS Kompass, Torino, 1972.
BAROZZI G.C., CORRADI C., Corso di matematica per le scienze
economiche, Il Mulino, Bologna, 1988.
BERTOCCHI M., STEFANI S., ZAMBRUNO G., Matematica per
leconomia e la finanza, McGraw-Hill, Milano, 1995.
CASTAGNOLI E., PECCATI L., Matematica per lanalisi economica,
vol. II, ETAS Libri, 1990.
DED E., VARISCO A., Algebra lineare, ed. Citt Studi, 1997.
GUERRAGGIO A., SALSA S., Metodi matematici per leconomia e le
scienze sociali, Giappichelli Editore, Torino, 1997.
HADLEY G., Linear Programming, Addison-Wesley. Pub. Company,
1975.
HOGHES A.J., GRAWING D.E., Linear Programming: an emphasis on
decision making, Addison-Wesley. Pub. Company, 1973.
INTRILLIGATOR M.D., Mathematical optimization and economic
theory, Prentice Hall, New York, 1971.
MANGASARIAN O.L., Nonlinear programming, McGraw-Hill Book
Company, New York, 1969.
MONTRUCCHIO L., Introduzione alla teoria delle scelte (ottimizzazione
statica), Carocci Editore, 1998.
NOBLE B., DANIEL J.W., Applied linear Algebra, Prentice-Hall, 1977.

APPENDICE
ESERCIZI SVOLTI
a cura di ROSANNA GRASSI ANDREA RANCAN
189
AUTOVALORI, AUTOVETTORI
E FORME QUADRATICHE
ESERCIZIO 1
Si consideri la forma quadratica:

( )
2
3
2
2 3 1 2 1
2
1
8 6 x x x x x x x q + + + + = x .

a) Determinare il segno di q (x) in
3
.
b) Determinare il segno di q (x) nel sottospazio
V = {x
3
: < x, c > = 0}, dove c = [ 1, 2, 1]
T
.
c) Determinare gli autovettori destri normalizzati della matrice A
associata alla forma quadratica.
SOLUZIONE
a) La forma quadratica q (x) pu essere riscritta in forma matriciale
come:

q (x) =x
T
Ax

dove
(
(
(

=
1 0 4
0 1 3
4 3 1
A e
(
(
(

=
3
2
1
x
x
x
x . Per determinarne il segno possiamo
ad esempio calcolare gli autovalori associati ad A.
190
A tale scopo considerata la matrice:

(
(
(




=
1 0 4
0 1 3
4 3 1
I A ,

gli autovalori di A si ottengono risolvendo lequazione caratteristica:

Det (A I) = 0 (1 ) (
2
2 24) = 0.

Da tale equazione otteniamo le soluzioni
1
= 1,
2
= 6 e
3
= 4.
Essendo gli autovalori trovati di segno opposto, concludiamo che la
forma quadratica q (x) indefinita
1
.

b) Essendo:

<x, c> = 0 x
1
+ 2x
2
+ x
3
= 0 x
3
= x
1
2x
2
,

si ottiene:
V = {x
3
: x
3
=x
1
2x
2
};

pertanto la forma quadratica q (x) ristretta al sottospazio V diventa:

( ) ( ) ( ) = + + + + =
2
2 1
2
2 2 1 1 2 1
2
1 2 1 2 1
2 2 8 6 2 , , x x x x x x x x x x x x x q
[ ]
(

= + =
2
1
2 1
2
2 2 1
2
1
5 7
7 10
, 5 14 10
x
x
x x x x x x
T
.


1
Per determinare il segno della forma quadratica si poteva in alternativa studiare
il segno dei minori estratti dalla matrice A, in virt di un noto teorema.
191
Calcolando gli autovalori associati alla matrice
(

=
5 7
7 10
B si
ottiene:

( ) 2 , 13 0 1 15
2 1
2
= = = + = I B Det .

Poich gli autovalori trovati sono positivi, la forma quadratica q (x)
definita positiva in V.

c) Gli autovettori destri della matrice A si ottengono risolvendo il
sistema:

Ax = x (A I) x = 0,

dove x lautovettore destro associato allautovalore di A.
Gli autovettori corrispondenti allautovalore
1
= 1 si ottengono
risolvendo il sistema omogeneo:

( )
(
(
(

=
(
(
(

(
(
(

=
0
0
0
0 0 4
0 0 3
4 3 0
0
3
2
1
1
x
x
x
I A x .

La matrice (A
1
I) ha rango 2, quindi il sistema ammette
1

soluzioni; eliminando la terza riga, che dipende linearmente dalle
prime due, il sistema equivalente al seguente:

(

=
(

=
(
(
(

0
4
0 3
3 0
0
0
0 0 3
4 3 0
3
2
1
3
2
1
x
x
x
x
x
x
.

192
Applicando la regola di Cramer otteniamo:

( ) 9 ,
0 3
3 0
=
(

= C Det C ;
( ) 0 0 ,
0 0
3 4
1 1
3
1
= =
(

= x C Det
x
C ;
( )
3
3
2 3 2
3
2
3
4
9
12
12 ,
0 3
4 0
x
x
x x C Det
x
C =

= =
(


= .

Pertanto gli autovettori associati allautovalore
1
= 1 sono:

(
(
(

=
(
(
(

3
4
0
3
2
1
x
x
x
.

Osservando che x = 5
2
, gli autovettori normalizzati sono:

(
(
(

=
5 3
5 4
0
x
x
.

Procedendo in modo analogo si prova che gli autovettori destri
normalizzati associati agli autovalori
2
= 6 e
3
= 4 sono
rispettivamente:


2
Si ricordi che
2
3
2
2
2
1
x x x + + = x .
193
(
(
(

=
50 4
50 3
50 5
x
x
,
(
(
(

=
50 4
50 3
50 5
x
x
.
194
ESERCIZIO 2
Si consideri la matrice:


(
(
(


=
0 2 1 0
2 1 0 0
1 2 0
A

a) Stabilire se A risulta diagonalizzabile. In caso affermativo
determinare le matrici P e D tali che P
1
AP = D.
b) Costruire la forma quadratica q (x) associata alla matrice A + A
T
e
studiarne il segno in
3
.
c) Determinare il segno di q (x) nel sottospazio
V = {x
3
: < x, c > = 0}, dove c = [1, 1, 0]
T
.
SOLUZIONE
a) Condizione necessaria e sufficiente affinch la matrice A di ordine
3 risulti diagonalizzabile che ammetta 3 autovettori linearmente
indipendenti; questultima condizione risulta senzaltro soddisfatta
se gli autovalori di A sono tutti distinti.
Calcolando il determinante della matrice (A I) si ottiene:

( )
2
1
,
2
1
, 0 0 4
3 2 1
3
= = = = + = I A Det

ed essendo gli autovalori trovati tutti distinti, la matrice A
diagonalizzabile e:
195


(
(
(

=
2 1 0 0
0 2 1 0
0 0 0
D .

Gli autovettori associati allautovalore
1
= 0 si ottengono
risolvendo il sistema omogeneo:

( )
(
(
(

=
(
(
(

(
(
(


=
0
0
0
0 2 1 0
2 1 0 0
1 2 0
0
3
2
1
1
x
x
x
I A x .

Tale sistema ammette
1
soluzioni, essendo r (A
1
I) = 2, che si
ottengono procedendo come segue:

(
(
(

=
(
(
(


1
3
2
3
2
1
0 2 1 0
0 1 2
0
0
2 1 0 0
1 2 0
x
x
x
x
x
x
=
(

=
(

0
0
2 1 0
1 2
0
0
3
2
x
x
.

La matrice
(


=
2 1 0
1 2
B non singolare e quindi invertibile,
pertanto il sistema omogeneo:


(

=
(


0
0
2 1 0
1 2
3
2
x
x


ammette lunica soluzione banale. Pertanto la soluzione del sistema
omogeneo (A
1
I) x = 0 :

196

(
(
(

=
(
(
(

0
0
1
3
2
1
x
x
x
.

Gli autovettori associati agli autovalori
2
1
2
= e
2
1
3
= sono
rispettivamente:


(
(
(

=
(
(
(

0
0
1
3
2
1
x
x
x
;


(
(
(

=
(
(
(

1
1
6
3
2
1
x
x
x
,

come si verifica procedendo in modo analogo a quanto fatto nel caso
dellautovalore
1
= 0.
La matrice P pu quindi essere scelta come:


(
(
(

=
1 1 0
1 1 0
6 2 1
P .

b) Essendo:


(
(
(

= +
0 1 1
1 0 2
1 2 0
T
A A ,
197

la forma quadratica ad essa associata :

( ) ( )
3 2 3 1 2 1
2 2 4 x x x x x x A A q
T T
+ = + = x x x .

Dallequazione caratteristica:

( ) 0 4 6 0
3
= + = + I A A Det
T


si ottengono gli autovalori:

3 1 , 3 1 , 2
3 2 1
= + = = .

Essendo tali autovalori di segno discorde, possiamo concludere che
la forma quadratica indefinita.

c) Osserviamo che:


2 1 2 1
0 0 , x x x x = = >= < c x

dunque V = {x
3
: x
1
= x
2
} e la forma quadratica q (x) in V :

( ) ( )
2
1 3 1 1
4 , , x x x x q q = = x .

Poich:
( ) 0 0
1
> x q x ,
( ) 0 0
1
= = x q x

q (x) si annulla non solo in corrispondenza al vettore nullo, ma anche
per tutti i vettori del tipo x = [0, 0, x
3
]
T
, e quindi semidefinita
positiva.
198
ESERCIZIO 3
Si consideri la matrice:


(
(
(

=
2 1
0 1 0
0 0
k
k
k
A

a) Determinare per quali valori di k la matrice A risulta
diagonalizzabile.
b) Per
2
1
= k si scrivano, se possibile, le matrici V e D tali che
V
1
AV = D.
c) Scrivere la forma quadratica associata a B = (A + A
T
) e determinare
se esistono valori di k per i quali la matrice B risulta definita
negativa.
SOLUZIONE
a) Risolvendo
3
lequazione caratteristica:

( ) ( )( )( ) k k k k I A Det = = = = + = 1 , , 2 0 2 1
3 2 1

otteniamo che, per
2
1
, 2 k k e k 1, gli autovalori associati ad A
sono tutti distinti, dunque la matrice diagonalizzabile.

3
Si veda il punto a) dellesercizio 15.
199
Per 2 ,
2
1
= = k k e k = 1 gli autovalori di A non sono tutti distinti,
tuttavia gli autovettori ad essi associati sono linearmente indipendenti
se, per ciascuno degli autovalori trovati, la molteplicit algebrica m
a

coincide con la molteplicit geometrica m
g
.
Per
2
1
= k si hanno gli autovalori
1
= 2 con m
a
= 1, e
2
1
3 2
= =
con m
a
= 2;
ricordando che 0 < m
g
m
a
, per lautovalore
1
, si ottiene
immediatamente che:

m
a
= m
g
= 1.

Per quanto riguarda lautovalore
2
, si osserva che r (A
2
I) = 1,
dunque il sistema omogeneo:

(A
2
I) x = 0,

ammette
2
soluzioni, e quindi m
g
= 2. Concludendo, anche in questo
caso la matrice A diagonalizzabile.
Per k = 2 si hanno gli autovalori
1
=
2
= 2 con m
a
= 2 e
3
= 1
con m
a
= 1; per lautovalore
3
si ha ancora che:

m
a
= m
g
= 1,

mentre per lautovalore
1
si ha che r (A
1
I) = 2. Quindi il sistema
omogeneo:

(A
1
I) x = 0

ammette
1
soluzioni e m
g
= 1, pertanto la matrice A non
diagonalizzabile.
200
Infine per k = 1 si trovano gli autovalori
1
=
3
= 2 con m
a
= 2 e

2
= 1 con m
a
= 1 e in modo analogo al caso precedente si prova che
la matrice A non diagonalizzabile.

b) Per
2
1
= k sappiamo che la matrice risulta diagonalizzabile.
Essendo i suoi autovalori
1
= 2,
2
1
3 2
= = si ha:


(
(
(

=
2 0 0
0 2 1 0
0 0 2 1
D .

Gli autovettori associati agli autovalori
2
1
3 2
= = si ottengono
risolvendo il sistema omogeneo 0 x =
|

\
|
I A
2
1
. Eliminando le prime 2
righe otteniamo:


3 2 1
3
2
1
2
3
2
1
0
0
0
2
3
2
1
1
2
1
x x x
x
x
x
I A =
(
(
(

=
(
(
(

=
|

\
|
0 x

e quindi si ottiene la soluzione:


(
(
(

+
(
(
(

=
(
(
(

2
0
3
0
2
1
3
2
1
x
x
x
,

201
dove gli autovettori [1, 2, 0]
T
e [ 3, 0, 2]
T
sono linearmente
indipendenti.
Gli autovettori associati allautovalore
1
= 2 si determinano
risolvendo il sistema:

( )
(
(
(

=
(
(
(

(
(
(

=
0
0
0
0 2 5 1
0 2 3 0
0 0 2 3
0 2
3
2
1
x
x
x
I A x ;

che equivalente a:


(

=
(

=
(
(
(

0
0
2 3 0
0 2 3
0
0
0 2 3 0
0 0 2 3
2
1
3
2
1
x
x
x
x
x
.

Questultimo sistema ammette come unica soluzione quella banale,
pertanto la soluzione del sistema omogeneo (A 2I) x = 0 :


(
(
(

=
(
(
(

1
0
0
3
2
1
x
x
x
.

Una possibile scelta per la matrice V pertanto la seguente:


(
(
(

=
1 0 2
0 2 0
0 1 3
V .

202
c) Considerata la matrice:


(
(
(

= + =
4 1
2 2 0
1 0 2
k
k k
k
A A B
T
,

la forma quadratica ad essa associata :

( ) ( )
2
3 3 2
2
2 3 1
2
1
4 2 2 2 2 2 x x kx x k x x kx B q
T
+ + + = = x x x .

Tale forma risulta definita negativa se, per 1 h 3, soddisfatta
la condizione:

( 1)
h
Det (B
h
) > 0,

dove B
h
la sottomatrice di nord-ovest di ordine h estratta da B.
Quindi deve essere:

( ) ( ) ( ) 0 2 0 0 1
1 1
1
< < > k B Det B Det ;

( ) ( ) ( ) ( ) 0 2 2 2 0 0 1
2 2
2
> > > k k B Det B Det ;

( ) ( ) ( ) ( ) 0 1 9 8 2 0 0 1
2 3
3 3
3
> + + < > k k k B Det B Det ;

La prima condizione risulta soddisfatta per k < 0, mentre la seconda
per 0 < k < 1, dunque la forma quadratica q (x) non pu essere definita
negativa.
203
ESERCIZIO 4
Si consideri la matrice:


(
(
(

=
h
h
A
2 0
2 0 1
0 1


a) Determinare per quali valori di h la matrice A ammette un
autovalore pari a 5.
b) Per h = 4 calcolare gli autovalori di A e gli autovettori destri
associati.
c) Per h = 4 determinare il segno della forma quadratica associata alla
matrice A nel sottospazio { } 0 :
3 2 1
3
= + + = x x x V x .
SOLUZIONE
a) Affinch la matrice A ammetta un autovalore = 5, deve essere
soddisfatta la condizione:

( ) ( )( ) 0 4 5 5 0 5 = = h h I A Det

da cui otteniamo i valori h = 5 e h = 4.

204
b) Per h = 4 la matrice A diventa:


(
(
(

=
4 2 0
2 0 1
0 1 4
A

e risolvendo lequazione caratteristica otteniamo:

( ) ( )( ) 1 , 5 , 4 0 5 4 4
3 2 1
2
= = = = = I A Det .

Calcoliamo gli autovettori associati allautovalore
1
= 4 risolvendo
il sistema omogeneo:

( )
(
(
(

=
(
(
(

(
(
(

=
0
0
0
0 2 0
2 4 1
0 1 0
4
3
2
1
x
x
x
I A 0 x .

Il sistema ammette
1
soluzioni perch la matrice dei coefficienti
(A 4I) ha rango 2 ed eliminando la terza riga si ottiene il sistema
equivalente:


(

=
(

=
(
(
(

3 2
1
3
2
1
2
0
4 1
1 0
0
0
2 4 1
0 1 0
x x
x
x
x
x
.

Applicando la regola di Cramer si ottiene:

( ) 1 ,
4 1
1 0
=
(

= B Det B ;

205
( )
3
3
1 3 1
3
1
2
1
2
2 ,
4 2
1 0
x
x
x x B Det
x
B =

= =
(


= ;

( ) 0 0 ,
2 1
0 0
2 2
3
2
= =
(

= x B Det
x
B .

Pertanto gli autovettori associati allautovalore
1
= 4 sono:


(
(
(

=
(
(
(

1
0
2
3
2
1
x
x
x


In modo analogo si prova che gli autovettori destri associati agli
autovalori
2
= 5 e
3
= 1 sono rispettivamente:


(
(
(

=
(
(
(

2
1
1
3
2
1
x
x
x
,


(
(
(

=
(
(
(

2
5
1
3
2
1
x
x
x
.

c) La forma quadratica associata alla matrice A :

( )
2
3 3 2 2 1
2
1
4 4 2 4 x x x x x x q + + + = x

e nel sottospazio { } 0 :
3 2 1
3
= + + = x x x V x diventa:

206
( ) ( )
( ) ( )
2 1
2
1
2
2 1 2 1 2 2 1
2
1
2 1 2 1
6 8
4 4 2 4
, ,
x x x
x x x x x x x x
x x x x q q
+ =
= + + + =
= = x
.

La matrice ad essa associata risulta:


(

=
0 3
3 8
C

ed ammettendo autovalori
1
= 1 e
2
= 9 di segno opposto possiamo
concludere che q (x) indefinita.
207
OTTIMIZZAZIONE STATICA
ESERCIZIO 1 (VERSIONE A)
Si consideri la funzione

f (x, y, z) = x
2
+ y
4
+ y
2
+ z
3
2 xz

a) Determinare gli estremi liberi di f (x,y,z).
b) Determinare gli estremi di f (x,y,z) in
{ } S x y z x z = = ( , , ) :
3
4 4 3 .
SOLUZIONE
a) La funzione da ottimizzare definita sullo spazio euclideo a tre
dimensioni ed a valori reali, ovvero
3
: f . inoltre
evidente che si tratta di una funzione differenziabile.

Gli estremi liberi di tale funzione vanno cercati tra i punti che
annullano il gradiente ovvero tra i punti che soddisfano la condizione
seguente:

=
|
\

|
|
=

|
\

|
|
=
|
\

| f x y z
f
f
f
x z
y y
z x
x
y
z
( , , )
'
'
'
2 2
4 2
3 2
0
0
0
3
2
.
208
Da tale sistema si ottengono i punti stazionari A ( , , ) 0 0 0 e
|

\
|

3
2
, 0 ,
3
2
B .
Per determinare la natura dei punti stazionari, si studia il segno
della forma quadratica associata alla matrice Hessiana calcolata in
corrispondenza degli stessi.
La matrice Hessiana associata alla funzione la seguente:

Hf x y z
f f f
f f f
f f f
y
z
xx xy xz
yx yy yz
zx zy zz
( , , )
'' '' ''
'' '' ''
'' '' ''
=
|
\

|
|
|
=

|
\

|
|
2 0 2
0 12 2 0
2 0 6
2
.

In corrispondenza al punto A la forma quadratica associata alla
matrice Hessiana risulta indefinita in quanto, come si pu agevolmente
verificare, la matrice assume due autovalori positivi ed un autovalore
negativo.
Si pu pertanto concludere che il punto A punto di sella.
In corrispondenza al punto
|

\
|

3
2
, 0 ,
3
2
B si ottiene:
Hf
2
3
0
2
3
2 0 2
0 2 0
2 0 4
, ,
|
\

|
=

|
\

|.
I minori principali di Nord-Ovest sono tutti positivi, infatti:


2 2 0
2 0
0 2
4 0
2 0 2
0 2 0
2 0 4
8 0
= >
= >

= >
,
,



209
pertanto la matrice definita positiva e quindi il punto B un punto di
minimo locale.

b) Per lo studio dei punti di stazionariet della funzione vincolati
allinsieme S, si pu ricorrere al metodo dei moltiplicatori di
Lagrange. Tuttavia, data la natura dellinsieme S, si pu anche
procedere esprimendo la variabile x in funzione della variabile z e
sostituendo tale espressione nella funzione f . Il problema di
ottimizzazione vincolata in
3
si riduce cos ad un problema di
ottimizzazione libera nello spazio
2
. Infatti, sostituendo x z = +
3
4

in f (x,y,z) si ottiene:


16
9
)
4
3
( 2 )
4
3
(
) , ( ) , , 4 / 3 (
2 3 2 4 3 2 4 2
+ + + = + + + + +
= = +
z z y y z z z y y z
z y g z y z f
.

Annullando il gradiente di g, dato da

= + g y z y y z z
T
( , ) ( ; ) 4 2 3 2
3 2
,

si trovano i seguenti punti stazionari (0,0) e (0,2/3). La matrice
Hessiana della funzione g data da:

Hg y z
y
z
( , ) =
+

|
\

|
12 2 0
0 6 2
2
,

che risulta evidentemente indefinita nel punto (0,0) e definita positiva
nel punto (0,2/3). Pertanto (0,0) un punto di sella per g in
2
mentre
(0,2/3) un punto di minimo per g in
2
. A tali punti corrispondono i
punti di
3
: C=(3/4,0,0) e D=(17/12,0,2/3), che rispettivamente hanno
la natura di punto di sella ed di punto di minimo per g in
3
.
210

Si risolve il problema usando il metodo di Lagrange.
I punti dellinsieme definito dal vincolo sono tutti regolari, infatti:

=
+

|
\

|
|
\

| g x y z ( , , )
4
0
4
0
0
0
.

La funzione Lagrangiana del problema in questione la seguente:

L x y z x y y z xz x z ( , , , ) ( ) = + + + +
2 4 2 3
2 4 4 3 .

Gli estremi vincolati si ottengono tra le soluzioni del seguente
sistema:










L
x
x z
L
y
y y
L
z
z x
L
x z
= + =
= + =
= =
= =

2 2 4 0
4 2 0
3 2 4 0
4 4 3 0
3
2
;
;
;
;


le cui soluzioni sono date dai punti C=(3/4,0,0) e D=(17/12,0,2/3) a
cui associato il moltiplicatore =-3/8.
Per studiare la natura dei punti trovati bisogna studiare in
corrispondenza agli stessi il segno della forma quadratica associata
alla matrice Hessiana del problema, vincolata allinsieme

{ } V x y z g x y z x y z = = ( , , ) :
3
0 0 0
0 < ( , , ) , ( , , ) >
T T
.

211
Dette H
f
e H
g
rispettivamente le matrici Hessiane della funzione
obiettivo e del vincolo, la matreice Hessiana del problema risulta
essere

H x y H x y H x y
f g
( , ) ( , ) ( , ) = + .

In corrispondenza al punto C=(3/4,0,0) la matrice Hessiana del
problema quindi data da

H( / , , ) 3 4 0 0
2 0 2
0 2 0
2 0 0
3
8
0 0 0
0 0 0
0 0 0
2 0 2
0 2 0
2 0 0
=

|
\

|
|
\

| =

|
\

|,

a cui associata la forma quadratica:
2 4 2
2 2
x xz y +

che, vincolata allinsieme

{ } V x y z x z = = ( , , ) :
3
4 4 0 -
diventa
+ 2 2
2 2
x y ,

che evidentemente indefinita. Il punto C = (3/4,0,0) ha quindi la
natura di punto di sella per f nellinsieme S.

In corrispondenza al punto D = (17/12,0,2/3) la matrice Hessiana
del problema risulta

H( / , , / ) 17 12 0 2 3
2 0 2
0 2 0
2 0 4
3
8
0 0 0
0 0 0
0 0 0
2 0 2
0 2 0
2 0 4
=

|
\

|
|
\

| =

|
\

|,

212
a cui associata la forma quadratica:

2 4 2 4
2 2 2
x xz y z + +

che, vincolata allinsieme

{ } V x y z x z = = ( , , ) :
3
4 4 0 -
diventa
2 2
2 2
x y + ,

che evidentemente definita positiva. Il punto D=(17/12,0,2/3) ha
quindi la natura di punto di minimo per f nellinsieme S.
213
ESERCIZIO 2
Si consideri il problema di massimizzazione vincolata:

max ( , )
( , ) x y S
f x y


dove:

f x y x y x y ( , ) = + 2 2
2 2
, e
{ } S x y x y x y = ( , ) : , ,
2
2 0 1 2 0 1 2 0 .

a) Stabilire se si tratta di un problema di ottimizzazione concava.
b) Risolvere il problema di ottimizzazione.
c) Stabilire se lintroduzione dei vincoli di non negativit delle
variabili, x 0 e y 0, modifica la soluzione trovata.
SOLUZIONE
a) Si tratta di un problema di programmazione concava in quanto sia
la funzione da ottimizzare che le funzioni che definiscono i vincoli
sono funzioni concave, come si pu agevolmente verificare per
esempio studiando il segno della forma quadratica associata alla
matrice Hessiana di dette funzioni, ricordando che i vincoli vanno
tutti considerati nella forma g(x)0.

b) Il problema pu essere risolto sia per via grafica, rappresentando le
curve di livello della funzione da ottimizzare e linsieme S, che per
via analitica, utilizzando il metodo di Kuhn Tucker.
Si inizia illustrando velocemente il metodo grafico.
214
Le curve di livello della funzione obiettivo sono le circonferenze di
equazione:

f x y x y x y k ( , ) = + = 2 2
2 2
,

mentre la regione ammissibile, S, tratteggiata nella figura seguente:


Il problema di ottimizzazione va quindi risolto cercando tra le
curve di livello che intersecano linsieme S quella a cui corrisponde il
pi grande valore di k. Con semplici considerazioni geometriche si
evince che il massimo della funzione f sullinsieme S si ottiene in
corrispondenza del punto (1/2, 1/2) dove la funzione assume il valore f
(1/2,1/2)=3/2.

In alternativa al metodo grafico si pu risolvere il problema di
massimizzazione per via algebrica. Le funzione obiettivo f e le
funzioni g
j
, j=1,2,3, che descrivono i vincoli sono concave, esiste
xR
n
ove g
j
(x)0, j=1,2,3, si pu quindi applicare il teorema di
Kuhn Tucker che, trattandosi di un problema di ottimizzazione
215
concava fornisce condizioni necessarie e sufficienti per lesistenza dei
massimi vincolati.
La funzione lagrangiana del problema di masimizzazione la
seguente:


) 2 1 ( ) 2 1 ( ) 2 ( 2 2
) , , , , (
3 2 1
2 2
3 2 1
y x y x y x y x
y x L
+ + + +
=
,

da cui si ricavano le condizioni di Kuhn Tucker (K-T):






;
;
;


1 2


L
x
x
L
y
y
x y x y
x x
y y
= + =
= =
=
=
=

2 2 2 2 0
2 2 2 0
2 0 2 0
1 2 0 1 2 0
1 2 0 1 2 0
0 0 0
1 3
1
2
3
1 2 3
;
;
( ) ;
( ) ;
( ) ;
; ; ;


Si distinguono i seguenti casi:

1

2

3
(x,y) (
1
,
2
,
3
) f (x,y)
1) 0 0 0 non accettab. = =
2) 0 0 + non accettab. = =
3) 0 + 0 non accettab. = =
4) + 0 0 non accettab. = =
5) + + 0 non accettab. = =
6) + 0 + non accettab = =
7) 0 + + (1/2,1/2) (0,1/2,1/2) 3/2
8) + + + non accettab. = =

216
in corrispondenza dei quali si ottiene:
1) nel caso
1
=
2
=
3
=0: dalle prime due condizioni K-T si ottiene
x = y = 1, tale soluzione non accettabile in quanto viola il secondo
ed il terzo vincolo;
2) nel caso
1
=
2
=0 e
3
>0: dalla prima condizione K-T si ottiene x=
1, che viola il secondo vincolo;
3) nel caso
1
=
3
=0 e
2
>0: dalla seconda condizione K-T si ottiene
y=1, che viola il terzo vincolo;
4) nel caso
2
=
3
=0 e
1
>0: dalla condizione di complementariet
relativa al primo vincolo si ottiene y=2x, che sostituita nelle prime
due equazioni implica y = 6/5 e x= 12/5, che non sono accettabili in
quanto non appartengono allinsieme S;
5) nel caso
3
=0,
1
>0 e
2
>0: per le condizioni di complementariet
deve valere y=2x e x=1/2, che implica y=1, che non accettabile;
6) nel caso
2
=0,
1
>0 e
3
>0: con semplici passaggi algebrici si
ottiene il punto (x,y)=(1/4,1/2) a cui associato il moltiplicatore

1
= 3/4, e pertanto anche questo caso deve essere scartato;
7) nel caso
1
=0,
2
>0 e
3
>0: per le condizioni di complementariet
relative al secondo e terzo vincolo deve valere: 1-2x=0 e 1- 2y =0.
Si ottiene cos il punto (1/2,1/2) a cui sono associati i moltiplicatori
(0,1/2,1/2), ed in corrispondenza del quale la funzione vale f
(1/2,1/2) = 1+1-1/4-1/4=3/2;
8) nel caso
1
>0,
2
>0 e
3
>0: dalle condizioni di complementariet si
ottiene che x=y=1/2 e contemporaneamente deve valere y=2x, che
impossibile, e pertanto anche questo caso deve essere scartato.
Si pu quindi concludere che il punto di massimo per la funzione
nellinsieme S si ha per (x,y)=(1/2,1/2).
Si osserva infine che, trattandosi di un problema di
programmazione concava, sarebbe stato possibile arrestare lanalisi al
settimo caso in quanto per questa classe di problemi garantita
lunicit del punto di massimo.

217
c) Aggiungendo i vincoli di non negativit per le variabili non si
modifica la soluzione trovata in quanto la stessa appartiene al
primo quadrante, insieme definito dalle condizioni di non negativit
delle variabili.
218
ESERCIZIO 3 (VERSIONE B)
Si consideri la funzione

f (x,y) = (y + x
2
6x + 6)(y + 1)
2

a) Determinare i punti stazionari di f (x,y) e discuterne la natura.
b) Determinare i punti stazionari di f (x,y) in
{ } S x y y x = + = ( , ) :
2
3 4 7 0 e discuterne la natura.
c) Stabilire che la funzione f (x,y) non risulta n concava n convessa.
SOLUZIONE
a) La funzione f (x,y) definita sullo spazio euclideo a due
dimensioni, a valori reali e di classe C

. I punti stazionari vanno


quindi cercati tra quelli che ne annullano il gradiente, ovvero tra i
punti che soddisfano la condizione seguente:

= + + + + +
= +

|
|

\
|
=
|
|

\
|
=
0 ) 1 ( 2 ) 6 6 ( ) 1 (
0 ) 1 )( 6 2 (
0
0
) , (
2 2
2
'
'
y x x y y
y x
f
f
y x f
y
x
(1)

Dalla (1) si evince immediatamente che esiste una retta di punti
stazionari definita da (y+1)=0, ovvero sono punti stazionari i punti del
tipo (a,-1), ove a un numero reale. Vanno ora cercate le soluzioni di
(1) tali che (y+1)0, che si ottengono risolvendo il sistema:


( )
( ) ( )
2 6 0
1 2 6 6 0
2
x
y y x x
=
+ + + + =

;
219

Si ottiene cos il punto A=(3, 5/3).

Si inizia studiando la natura del punto A=(3, 5/3). La matrice
Hessiana della funzione f risulta:


|
|

\
|
+ + + + +
+ +
=
|
|

\
|
=
) 6 6 ( 2 ) 1 ( 4 ) 1 )( 6 2 ( 2
) 1 )( 6 2 ( 2 ) 1 ( 2
) , (
2
2
' ' ' '
' ' ' '
x x y y y x
y x y
f f
f f
y x Hf
yy yx
xy xx
,

pertanto nel punto A si ottiene:

Hf ( , / ) 3 5 3
128
9
0
0
4
3
=
|
\

|
|
|
.
allora evidente che il punto A=(0,5/3) un punto di minimo
locale.

Per studiare la natura dei punti stazionari costituiti dalla retta y= -1
si ricorrer ad unanalisi grafica basata sullo studio del segno della
funzione.
Si incomincia con lo studio degli zeri della funzione, ovvero si
cercano quelle coppie di punti (x,y) tali che f (x,y) = (y + x
2

6x + 6)(y + 1)
2
= 0. Si pu quindi dedurre che la funzione si annulla
lungo la retta di equazione (y + 1)=0 e lungo la parabola di equazione
y + x
2
6x + 6 = 0. Essendo (y+1)
2
sempre positivo, il segno della
funzione dipende esclusivamente da quello del polinomio (y + x
2

6x + 6). In particolare f (x,y) > 0 se e solo se y + x
2
6x + 6 > 0.
Graficamente si ha la seguente rappresentazione:
220


Per decidere la natura dei punti stazionari di coordinate (a, 1) si
osservi che f (a, 1) = 0 e che per ogni valore di a < 1 e a > 5, esiste
un intorno del punto (a, 1), U(a, 1), tale che:

f x y f a x y U a ( , ) ( , ) , ( , ) ( , ) = 1 0 1 ,

ovvero i punti (a, 1) con a < 1 e a > 5 sono punti di minimo locale
(debole).
In base ad analoghe considerazioni si deduce che per 1 < a < 5 i
punti del tipo (a, 1) sono punti di massimo locale (debole).

Per i punti B = (1, 1) e C = (5, 1) non esistono degli intorni in
cui la funzione assume un valore positivo o negativo ed essendo nullo
il gradiente in corrispondenza degli stessi si pu affermare che si tratta
di punti di sella. Si osserva infine che si tratta di punti di sella debole
in quanto non possibile individuare due direzioni lungo le quali la
funzione assuma valore massimo e valore minimo in corrispondenza
al punto B o C.

221
b) Per lo studio dei punti di stazionariet della funzione vincolati
allinsieme S si proceder esprimendo la variabile x in funzione
della variabile y. Sostituendo tale espressione nella f, si ridurr
quindi il problema di ottimizzazione vincolata in
2
ad un
ordinario problema di ottimizzazione di una funzione reale di
variabile reale.
Procediamo dunque esprimendo y x =
4
3
7
3
, che, sostituito nella
funzione obiettivo, consente di scrivere:

f x x g x x x x x ( , ) ( )
4
3
7
3
4
3
7
3
6 6
4
3
7
3
1
2
2
= = + +
|
\

| +
|
\

| .

Con semplici passaggi algebrici, la funzione obiettivo diviene:

( ) g x x x x ( ) ( ) = +
16
27
3 14 11 1
2 2
,

la cui derivata prima data da:
( )
[ ] g x x x x x x ' ( ) ( )( ) ( ) = + +
16
27
6 14 1 3 14 11 2 1
2 2
.

I valori di x che annullano la derivata prima sono x = 1 e x = 3.
Dallo studio del segno di g(x) in corrispondenza a tali punti, si
evince che i due punti hanno rispettivamente la natura di flesso e di
minimo locale per g in . Da questo si deduce che i punti D =(1, 1)
ed E = (3,5/3) sono rispettivamente un punto di sella ed un punto di
minimo locale per f sullinsieme S.

c) La funzione f (x,y) non risulta n concava n convessa in quanto nel
suo insieme di definizione ammette punti stazionari che risultano
sia massimi relativi che minimi relativi.
222
ESERCIZIO 4
Si consideri la funzione

f x y x y ( , ) ( ) ( ) = + 2 3 5 2
2 2


a) Determinare gli estremi liberi di f (x,y).
b) Determinare gli estremi assoluti di f (x,y) in
{ } S x y x y y x = + ( , ) : , ,
2
1 2 2 7 0 .
c) Verificare che nel punto di massimo assoluto determinato in b)
sono soddisfatte le condizioni di qualificazione dei vincoli ed
esprimere in tale punto il gradiente di f come combinazione lineare
dei vincoli attivi.
SOLUZIONE
a) Gli estremi liberi della funzione si trovano tra i punti che ne
annullano il gradiente, ovvero tra le soluzioni del sistema:


|
|

\
|
=
|
|

\
|

=
0
0
) 2 ( 10
) 3 ( 4
) , (
y
x
y x f ,

da cui si evince immediatamente che lunico punto di stazionariet
(3,2).
Si verfica agevolmente che la forma quadratica associata alla
matrice Hessiana, Hf (x,y), definita positiva per ogni coppia di (x,y)
e, trattandosi di una funzione convessa, si pu affermare che il punto
di stazionariet trovato un punto minimo assoluto per f in
2
.
223

b) La funzione obiettivo f e le funzioni g
j
, j=1,2,3, che descrivono i
vincoli sono concave ed esiste xR
n
ove g
j
(x)0, j=1,2,3, si pu
quindi applicare il teorema di Kuhn Tucker che, trattandosi di un
problema di ottimizzazione concava fornisce condizioni necessarie
e sufficienti per lesistenza dei massimi vincolati.
La funzione lagrangiana del problema di ottimizzazione la
seguente:

) 2 7 ( ) 2 ( ) 1 ( ) 2 ( 5 ) 3 ( 2
) , , , , (
3 2 1
2 2
3 2 1
y x y x y x
y x L
+ + + +
=


da cui si ricavano le seguenti condizioni di Kuhn Tucker (K-T):





;
;
;

1


L
x
x
L
y
y
x x
y y
x y x y
= + =
= + =
=
=
=

4 3 0
10 2 2 0
1 0 1 0
2 0 2 0
7 2 0 7 2 0
3
2 3
1
2
3
( ) ;
( ) ;
( ) ;
( ) ;
( ) .


224
Si distinguono i seguenti casi:


1

2

3
(x,y) (
1
,
2
,
3
) f (x,y)
1) 0 0 0 (3,2) (0,0,0) 0
2) + 0 0 (1,2) (8,0,0) 8
3) 0 + 0 non acc. =
4) 0 0 + non acc. =
5) + + 0 non acc. =
6) + 0 + (1,3) (13,0,5) 13
7) 0 + + non acc. =
8) + + + non acc. =

Discussione dei risultati:
1) Nel caso in cui
1
=
2
=
3
=0 dalle prime due condizioni K-T si
ottiene x = 3 e y=2 che soluzione accettabile in quanto compresa
nellinsieme definito dai vincoli. in corrispondenza al punto trovato
la funzione assume valore: f (3,2)=0.
2) Nel caso in cui
1
>0 e
2
=
3
=0 dalla prima condizione di
complementariet si evince che x=1, che sostituito nelle altre
condizioni K-T, consente di trovare il punto (1,2) a cui sono
associati i moltiplicatori (8,0,0). In corrispondenza a tale punto si
ha che f (1,2)=8.
3) Nel caso in cui
1
=0,
2
>0 e
3
=0 dalla seconda condizione di
complementariet si ottiene y=2 che sostituito nella seconda
condizione K-T implica
2
=0, che non accettabile.
4) Nel caso in cui
1
=
2
=0 e
3
>0 per la condizione di
complementariet relativa al terzo vincolo deve valere x=7 2y,
che sostituito nelle prime due condizioni K-T, implica:


4 7 2 3 0
10 2 2 0
3
3
( ) ;
( ) ;
=
=

y
y



225
le cui soluzioni sono y=2 e
3
=0, che non sono accettabili in quanto
si ipotizzato
3
>0.
5) Nel caso in cui
1
>0,
2
>0 e
3
=0 dalle condizioni di
complementariet relative al primo ed al secondo vincolo si
ottengono i valori x=1 e y=2 che sostituiti nelle prime due
condizioni di K-T implicano
1
=0,
2
=0, che non sono accettabili
in quanto si ipotizzato che tali moltiplicatori siano strettamente
positivi.
6) Nel caso in cui
1
>0,
2
=0 e
3
>0 dalle condizioni di
complementariet si ottiene: x=1 e y=3 che, sostituiti nelle prime
due condizioni di K-T, comportano
1
=13 e
3
=5. In
corrispondenza del punto trovato si ha f (x,y)=13.
7) Nel caso in cui
1
=0,
2
>0 e
3
>0 dalle condizioni di
complementariet relative al secondo e terzo vincolo si ottiene x=3
e y=2, a cui sono associati i moltiplicatori (0,0,0), contrariamente
allipotesi
2
>0 e
3
>0.
8) Nel caso in cui
1
>0,
2
>0 e
3
>0 si verifica facilmente che non
esiste alcun punto che soddisfa contemporaneamente tutte e tre le
condizioni di complementariet.

Non trattandosi di un problema di programmazione concava, il
punto di massimo della funzione nellinsieme S dato dalla soluzione
accettabile a cui corrisponde il pi grande valore di f (x,y). Si pu
quindi concludere che il punto di massimo assoluto ha per (x,y)=(1,3)
con f (1,3)=13.

c) Come si evince dai risultati ottenuti nel punto b), i vincoli attivi in
corrispondenza al punto di massimo sono il primo ed il terzo.
Indicati con g
1
, g
2
e g
3
i vincoli del problema, i gradienti dei
vincoli attivi sono dati dai vettori:
=
|
\

| g
1
1 3
1
0
( , ) ,
226
=

|
\

| g
2
13
1
2
( , ) .
Essendo tali vettori linearmente indipendenti, sono quindi
soddisfatte le condizioni di qualificazione dei vincoli.
Facendo infine riferimento ai moltiplicatori individuati al punto 6,
il gradiente di f nel punto di massimo pu scriversi come:

|
|

\
|

|
|

\
|
=
|
|

\
|
=
2
1
5
0
1
13
10
8
i.e. ) 3 , 1 ( 5 ) 3 , 1 ( 13 ) 3 , 1 (
3 1
g g f .
227
ESERCIZIO 5
Si consideri la funzione

f (x,y) = (y x)
2
(x
2
+ y
2
2).

a) Dimostrare che la retta y = x costituita da punti stazionari e
studiarne la natura senza ricorrere alle condizioni del secondo
ordine.
b) Determinare gli altri punti stazionari di f (x,y) e stabilirne la natura.
c) Si verifichi che esiste una funzione x = g(y) definita implicitamente
dalla equazione f (x,y)=0 in un intorno di ( , ) 2 0 e si scriva per tale
funzione lo sviluppo di Taylor arrestato ai termini del primo ordine.
SOLUZIONE
a) I punti di stazionariet di una funzione regolare sono quelli che ne
annullano il gradiente. In corrispondenza dei punti della retta y = x
il gradiente di f identicamente nullo, come si pu agevolmente
verificare dallespressione seguente:

=
+ +
+ + +
|
\

| f x y
y x x y x y x
y x x y y y x
( , )
( )( ) ( )
( )( ) ( )
2 2 2
2 2 2
2 2 2
2 2 2
.

Per studiare la natura dei punti stazionari costituiti dalla retta y= x
si ricorrer ad unanalisi grafica basata sullo studio del segno della
funzione.
228
Si incomincia con lo studio degli zeri della funzione, ovvero si cercano
quelle coppie di punti (x,y) tali che f (x,y) = (y x)
2
(x
2
+ y
2
2) = 0. Si pu
quindi dedurre che la funzione si annulla lungo la retta di equazione
(y x) = 0 e lungo la circonferenza di equazione x
2
+ y
2
2 = 0. Il segno
della funzione dipende esclusivamente da quello del polinomio (x
2
+y
2

2). In particolare f (x,y) > 0 se e solo se x
2
+ y
2
2 > 0.
Graficamente si ha la seguente rappresentazione:



I punti di intersezione tra la retta e la circonferenza, indicati con A
e B hanno rispettivamente coordinate: (1, 1) e ( 1, 1).
Per stabilire la natura dei punti stazionari che giacciono sulla
bisettrice del primo e terzo quadrante, che hanno coordinate (a, a), ove
a un numero reale, si osservi che f (a, a) = 0 e che per ogni valore di
a < 1 e a > +1, esiste un intorno del punto (a,a), U(a,a), tale che:

f x y f a a x y U a a ( , ) ( , ) ( , ) ( , ) = 0 ,

ovvero i punti (a, a) con a < 1 e a > +1 sono punti di minimo locale
debole.
229
In base ad analoghe considerazioni si deduce che per 1 < a < +1 i
punti del tipo (a,a) sono punti di massimo locale debole.

Per i punti A = (1,1) e B = ( 1, 1) non esistono degli intorni in
cui la funzione assume un valore positivo o negativo; essendo nullo il
gradiente in corrispondenza degli stessi si pu affermare che si tratta
di punti di sella. Si osserva inoltre che si tratta di punti di sella debole
in quanto non possibile individuare due direzioni lungo le quali la
funzione assuma valore massimo e minimo in corrispondenza al punto
A o B.

b) Gli altri punti stazionari della funzione si trovano annullando il
gradiente della stessa quando x y ovvero quando x y 0. Tali
punti si ottengono quindi risolvendo il sistema:


+ + =
+ + + =

2 2 2 0
2 2 2 0
2 2
2 2
( ) ( ) ;
( ) ( ) .
x y x y x
x y y y x
;

Si ottengono cos i punti A
|
\

|
1
2
1
2
, e B
|
\

|
1
2
1
2
, .

Si inizier studiando la natura del punto A per mezzo dello studio
del segno della forma quadratica associata alla matrice Hessiana della
funzione nel punto. Si ottiene quindi:

Hf x y
x y xy x y xy
x y xy x y xy
( , ) =
+ + +
+ + +
|
\

|
12 4 4 12 6 6 4 8
6 6 4 8 4 12 4 12
2 2 2 2
2 2 2 2
,

che calcolata nel punto A diventa:

230
Hf ( , )
1
2
1
2
10 6
6 10
=

|
\
|

;

Essendo la forma quadratica associata alla matrice Hessiana
definita positiva si pu concludere che il punto A un punto di
minimo locale.
Nel punto B la matrice Hessiana assume gli stessi valori, si pu
pertanto affermare che anche il punto B di minimo locale.

c) Omissis. Si rimanda al capitolo sulle funzioni implicite.
231
ESERCIZIO 6
Si consideri il problema di massimizzazione vincolata:

max ( , )
( , ) x y S
f x y


dove:

f x y y x ( , ) = 2
{ } S x y y x y x y = + + ( , ) : , ,
2 2 2
0 2 1 2 0 4 1

a)Stabilire se si tratta di un problema di ottimizzazione concava.
b) Risolvere il problema.
c) Esprimere nel punto di massimo assoluto determinato in b) il
gradiente di f come combinazione lineare dei gradienti dei vincoli
attivi. Tale rappresentazione unica?
SOLUZIONE
a) Si tratta di un problema di programmazione concava in quanto sia
la funzione da ottimizzare che le funzioni che definiscono i vincoli
sono funzioni concave, come si pu agevolmente verificare, per
esempio studiando il segno della forma quadratica associata alla
matrice Hessiana di dette funzioni, ricordando che i vincoli vanno
tutti considerati nella forma g(x)0.

b) Il problema pu essere risolto sia per via grafica, rappresentando le
curve di livello della funzione da ottimizzare e linsieme S, che per
via analitica utilizzando il metodo di Kuhn Tucker.
232
Si illustra velocemente il metodo grafico: le curve di livello della
funzione obiettivo sono le rette di equazione:

f (x,y) = y 2x = K

mentre la regione ammissibile, S, tratteggiata nella figura seguente:



Il problema di ottimizzazione va quindi risolto cercando tra le
curve di livello che intersecano linsieme S quella a cui corrisponde il
pi grande valore di K. Con semplici considerazioni geometriche, si
evince che il massimo della funzione f sullinsieme S si ottiene in
corrispondenza del punto ( 1/2, 0) dove la funzione assume il valore f
( 1/2,0)=1.

In alternativa al metodo grafico si pu risolvere il problema di
ottimizzazione per via algebrica. Le funzione obiettivo f e le funzioni
g
j
, j=1,2,3, che descrivono i vincoli sono concave, esiste xR
n
ove
g
j
(x)0, j=1,2,3, si pu quindi applicare il teorema di Kuhn Tucker
che, trattandosi di un problema di ottimizzazione concava fornisce
233
condizioni necessarie e sufficienti per lesistenza dei massimi
vincolati.
La funzione lagrangiana del problema di ottimizzazione la
seguente:

L x y y x y x y x y ( , , , , ) ( ) ( )
1 2 3 1 2 3
2 2
2 2 2 1 1 4 = + + + +

da cui si ricavano le seguenti condizioni di Kuhn Tucker (K-T):





;
;
;




L
x
x
L
y
y
y y
x y x y
x y x y
= + =
= + =
=
+ + =
=

2 2 8 0
1 2 2 0
0 0
2 2 1 0 2 2 1 0
1 4 0 1 4 0
2 3
1 2 3
1
2
2 2
3
2 2
;
;
;
( ) ;
( ) ;


Si distinguono i seguenti casi:

1

2

3
(x,y) (
1
,
2
,
3
) f (x,y)
1) 0 0 0 non acc. =
2) 0 0 + non acc. =
3) 0 + 0 non acc. =
4) + 0 0 non acc. =
5) + + 0 (1/2,0) (1,1,0) 1
6) + 0 + non acc. =
7) 0 + + (1/2,0) (0,1/2,1/4) 1
8) + + + (1/2,0) (14
3
, 12
3
,
3
) 1

Discussione dei risultati:
1) nel caso in cui
1
=
2
=
3
=0 dalla prima condizione di K-T si
ottiene 2 = 0 che impossibile;
234
2) nel caso in cui
1
=
2
=0 e
3
>0 dalle prime due equazioni di K-T si
ottiene y= 2x che sostituito nella condizione di complementariet
relativa al terzo vincolo implica 1 = 0;
3) nel caso in cui
1
=
3
=0 e
2
>0 dalla prima condizione si ottiene

2
=1, mentre dalla seconda si ricava
2
=1/2, che contraddittorio;
4) nel caso in cui
2
=
3
=0 e
1
>0 dalla prima condizione K-T si
ottiene lequazione impossibile 2 = 0;
5) nel caso in cui
3
=0,
1
>0 e
2
>0 per le condizioni di
complementariet relative al primo e secondo vincolo deve valere:
y=0 e 2x 2y+1=0, da cui si ottiene il punto ( 1/2,0). Si ricavano
quindi
1
=1,
2
=1 e
3
=0. In corrispondenza a tale punto si ha che f
(x,y)=1;
6) nel caso in cui
2
=0,
1
>0 e
3
>0 si ottiene che
1
= 1 e pertanto
la soluzione non accettabile;
7) nel caso in cui
1
=0,
2
>0 e
3
>0 per le condizioni di
complementariet relative al secondo e terzo vincolo deve valere:
2x 2y+1=0 e 1 4x
2
y
2
=0. Si ottengono cos i due punti
( 1/2,0) e (3/10,4/5), al primo sono associati i moltiplicatori
(0,1/2,1/4) mentre in corrispondenza al secondo si ottiene
3
= 1/4
e pertanto non accettabile;
8) nel caso in cui
1
>0,
2
>0 e
3
>0 dalle condizioni di
complementariet si ottiene il punto ( 1/2, 0) al quale sono
associati i moltiplicatori:

=
=
=
.
; 2 1
; 4 1
3 3
3 2
3 1


Si verifica facilmente che per ogni valore di
3
(0,1/4) tutti i i
moltiplicatori sono positivi e pertanto si ottiene ancora una volta il
punto di massimo ( 1/2,0) in corrispondenza al quale si ha f (x,y)=1.

235
Si pu quindi concludere che il punto di massimo per la funzione
nellinsieme S si ha per (x,y)=( 1/2,0) con f ( 1/2,0)=1.

Si osserva infine che, trattandosi di un problema di
programmazione concava, sarebbe stato possibile arrestare lanalisi al
quinto caso in quanto per questa classe di problemi garantita
lunicit del punto di massimo.

c) Come si evince dai risultati ottenuti nel punto b) tutti i vincoli sono
attivi in corrispondenza al punto di massimo. Indicati con g
1
, g
2
e g
3

i vincoli del problema, facendo riferimento ai moltiplicatori
individuati ai punti 5 e 7, il gradiente di f nel punto di massimo pu
scriversi come:

|
|

\
|

|
|

\
|
=
|
|

\
|
=
2
2
1
0
1
2
i.e. ) 0 ,
2
1
( ) 0 ,
2
1
( ) 0 ,
2
1
(
2 1
g g f ,

oppure

|
|

\
|

|
|

\
|

=
|
|

\
|
=
0
4
4
1
2
2
2
1
1
2
i.e.
) 0 ,
2
1
(
4
1
) 0 ,
2
1
(
2
1
) 0 ,
2
1
(
3 2
g g f
.

Pertanto la rappresentazione non unica.
236
ESERCIZIO 7
Si consideri la funzione

f (x, y, z) = x
2
+ (1/3) y
3
+ (1/2) z
2
xy xz

a) Determinare in quale regione dello spazio la funzione f risulta
strettamente concava e in quale risulta strettamente convessa.
b) Determinare i punti stazionari di f e stabilirne la natura.
c) Determinare gli estremi di f in { } S x y z x y = + = ( , , ) :
3 2
0 .
SOLUZIONE
a) Si ricorda che condizione sufficiente affinch una funzione due
volte differenziabile sia strettamente convessa su di un insieme
convesso che, su detto insieme, sia definita positiva la forma
quadratica associata alla sua matrice Hessiana. Condizione
sufficiente per la stretta concavit avere la forma quadratica
associata alla matrice Hessiana definita negativa.

La matrice Hessiana associata alla funzione la seguente:

Hf x y z y ( , , ) =

|
\

|
|
2 1 1
1 2 0
1 0 1
.
Per lo studio del segno della forma quadratica associata alla matrice
Hessiana si pu usare il metodo dei minori principali di Nord-Ovest.
In particolare la forma quadratica. definita positiva se e solo se tutti i
minori principali di Nord-Ovest sono positivi, ovvero se:
237

2 0
2 1
1 2
0 4 1 0 1 4
2 1 1
1 2 0
1 0 1
0 4 2 1 0 1 2
>

> > >


> > >


;
/ ;
/ .
y
y y
y y y y


La forma quadratica quindi definita positiva se e solo se y>1/2.
Pertanto la funzione strettamente convessa nellinsieme
{ } S x y z y = > ( , , ) : /
3
1 2 .

La forma quadratica associata alla matrice Hessiana non mai
definita negativa in quanto il primo minore principale di Nord Ovest
sempre positivo. Quindi la funzione f non mai strettamente concava.

b) I punti stazionari si ottengono risolvendo il seguente sistema:

=
=
=
=

f x y z
x y z
y x
z x
( , , ) 0
2 0
0
0
2
;
le cui soluzioni sono date dai punti A=(0,0,0) e B=(1,1,1).

Per quanto riguarda la natura dei punti stazionari, si osserva che nel
punto B la funzione strettamente convessa e quindi B un punto di
minimo locale.

La natura del punto A pu essere indagata studiando il segno della
forma quadratica associata alla matrice Hessiana nel punto stesso.
Essendo:
Hf ( , , ) 0 0 0
2 1 1
1 0 0
1 0 1
=

|
\

|;
238

Dallo studio dei minori principali di Nord-Ovest,


2 0
2 1
1 0
1 0
2 1 1
1 0 0
1 0 1
1 0
>

= <

= <
;
;
,


si evince che in A la forma quadratica associata alla matrice Hessiana
indefinita e pertanto il punto A punto di sella per la funzione f.

c) Per lo studio dei punti di stazionariet della funzione vincolati
allinsieme S, si pu ricorrere al metodo dei moltiplicatori di
Lagrange; tuttavia, data la natura dellinsieme S si pu anche
procedere esprimendo la variabile x in funzione della variabile y e
sostituendo tale espressione nella f . Il problema di ottimizzazione
vincolata in
3
si riduce cos ad un problema di ottimizzazione
libera in
2
. Infatti sostituendo x y =
2
in f (x,y,z) si ottiene:


z y z y y
z y y z y y z y g z y y f
2 2 3 4
2 3 2 3 4 2
) 2 / 1 ( ) 3 / 4 (
) 2 / 1 ( ) 3 / 1 ( ) , ( ) , , (
+ + +
= + + + + = =
.

Annullando il gradiente di g(y,z), dato da

= + + + g y z y y yz z y
T
( , ) ( ; ) 4 4 2
3 2 2
,

si trovano i seguenti punti stazionari (0,0) e ( 2, 4). La matrice
Hessiana della funzione g data da:

239
Hg y z
y y z y
y
( , ) =
+ +
|
\

|
12 8 2 2
2 1
2
.

La forma quadratica associata risulta evidentemente definita
positiva nel punto ( 2, 4) e semidefinita positiva nel punto (0,0).
Pertanto ( 2, 4) un punto di minimo per g in
2
mentre non si pu
dire nulla sulla natura del punto (0,0) in quanto la condizione trovata
solo necessaria per lesistenza di un punto di massimo. Per lo studio
della natura del punto (0,0) bisogna quindi ricorrere ad altri metodi.
Ad esempio, studiando il segno delle derivate parziali lungo gli assi
coordinati si evince che il punto (0,0) non pu essere n di massimo,
n di minimo, n di sella forte, poich lungo lasse z la funzione
assume un minimo, mentre lungo lasse y si in presenza di un
flesso
1
. Quindi (0,0) un punto di sella debole.
A tali punti corrispondono i punti di
3
: C=( 4, 2, 4) e
D=(0,0,0), che sono rispettivamente un punto di minimo ed un punto
di sella per g in
3
.

1
Metodo non richiesto, ai fini dellesame bastava segnalare la presenza del caso
dubbio.
240
ESERCIZIO 8
Si consideri la funzione

f x y x y x x ( , ) ( ) = + exp
2 2

a) Determinare i punti stazionari di f e stabilirne la natura.
b) Verificare che la funzione risulta concava in R
2
.
c) Stabilire che i punti (1,0) e ( 1,0) sono rispettivamente un punto di
massimo ed un punto di minimo locale per f in
{ } S x y x y = + = ( , ) : R
2 2 2
1
SOLUZIONE
a) I punti stazionari della funzione f sitrovano annullandone il
gradiente, ovvero tra le soluzioni del sistema:

=
= +
=

; 0 e 2
; 0 1 2 e
0 ) , (
2
2
y
y
xy
x
y x f

da cui si evince immediatamente che lunico punto stazionario (1,0).
Per stabilire la natura del punto di stazionariet si deve studiare il
segno della forma quadratica associata alla matrice Hessiana della
funzione nel punto stesso, che risulta essere:


|
|

\
|
+

=

2 2 2
2
e 4 e 2 e 2
e 2 2
) , (
2 y y y
y
f
x y x y
y
y x H ,
241
e quindi

|
|

\
|

=
2 0
0 2
) 0 , 1 (
f
H

di immediata evidenza che la forma quadratica in esame
definita negativa e pertanto il punto stazionario (1,0) punto di
massimo globale.

b) La funzione non risulta concava in tutto R
2
poich la matrice
Hessiana non semidefinta negativa su tutto R
2
. Ad esempio nel
punto ( 1,0) la matrice Hessiana risulta indefinita, infatti si ha:


|
|

\
|
+

=
4 0
0 2
) 0 , 1 (
f
H .

c) Si visto che il punto (1,0) massimo globale per la funzione e,
appartenendo lo stesso allinsieme S, si pu dire che anche
massimo vincolato.
Per verificare la natura di punto di minimo di ( 1,0) bisogna
vedere se lostesso soddisfa le condizioni di Lagrange per il problema
di ottimizzazione in questione.
Si pone pertanto:

L x y x y x x x y ( , , ) ) ( ) = + + + exp(
2 2 2 2
1 .

Le condizioni necessarie per lesistenza di un minimo vicolato sono
le seguenti:
242

= + =
= + =
= + + =

; 0 1


; 0 2 e 2


; 0 2 1 2 e


2 2
2
2
y x
L
y yx
y
L
x x
x
L
y
y



si verifica facilmente che tali condizioni necessarie sono soddisfatte
nel punto ( 1,0).

Bisogna infine verificare che siano soddisfatte le condizioni
sufficienti, ovvero si deve studiare nel punto ( 1,0) il segno della
forma quadratica associata alla matrice Hessiana del problema
vincolata allinsieme

{ } V x y R x = = ( , ) :
2
2 0 .

Dette H
f
e H
g
rispettivamente le matrici Hessiane della funzione
obiettivo e del vincolo, la matreice Hessiana del problema risulta
essere

H x y H x y H x y
f g
( , ) ( , ) ( , ) = + .

La matrice Hessiana del problema quindi data da

H H H
f g
( , ) ( , ) ( , ) = + =
|
\
|

10 1 0 2 1 0
2 0
0 4

che definita positiva su tutto R
2
e quindi anche in V.

Il punto ( 1,0) pertanto un punto di minimo locale vincolato.

Potrebbero piacerti anche