Sei sulla pagina 1di 44

4 Convessità

M.C. Escher, Convesso e Concavo (1955)

Uno dei grandi spartiacque in matematica è tra ciò che è lineare e ciò che non è
lineare. Per esempio, risolvere un sistema di equazioni lineari è semplice, risolvere
un sistema di equazioni non lineari è difficile; se si vuole studiare una funzione non
lineare si ricorre spesso alla sua “linearizzazione”. In ottimizzazione la situazione
è alquanto differente e la distinzione più importante è tra ciò che è convesso e ciò
che non lo è. Questa distinzione in effetti corrisponde poi, volendo essere molto
riduttivi, alla distinzione tra problemi “facili” e problemi “difficili”. Ovviamente
anche in ottimizzazione la linearià ha un ruolo importante e semplifica molti
problemi, ma a livello concettuale e per molti risultati pratici, ciò che fa vera-
mente la differenza è la convessità. Notiamo fin d’ora che una funzione lineare è
anche una funzione convessa e quindi in qualche misura la convessità permette
di ampliare la gamma di problemi “facili”.
Convessità 1

In questo capitolo introduciamo le definizioni di base relative alla convessità


e alcuni risultati connessi. Nel resto del corso avremo poi modo di verificare il
ruolo e l’importanza della convessità in ottimizzazione.

4.1 Definizioni di base

Iniziamo introducendo le due definizioni più importanti nell’ambito della con-


vessità: quelle di insieme convesso e di funzione convessa. Nei paragrafi seguenti
approfondiremo poi le conseguenze e le proprietà degli insiemi e delle funzioni
convesse

Insiemi convessi
Per dare la definizione di insieme convesso è comodo utilizzare il concetto di
segmento.

Definizione 4.1. Siano x e y due punti in IRn . L’insieme dei punti di IRn
ottenuti come
z = (1 − β)x + βy,
al variare di β nell’intervallo [0, 1] viene definito come segmento (chiuso) di
estremi x e y e viene sinteticamente indicato con [x, y].

Example 4.1: Nella Figura 4.1 è rappresentato il segmento in IR2 avente per
estremi i punti x = (1, 1) T e y = (8, 5) T . Per β = 0 ritroviamo il punto x, mentre
per β = 1 ritroviamo il punto y; i punti segnati nella figura come xa , xb e xc
corrispondono rispettivamente a valori di β pari a 0.25, 0.5 e 0.75.

Dalla Figura 4.1 risulta ovvio che il concetto di segmento è la generalizzazione, al


caso di IRn del usuale concetto di segmento valido nel piano. Da un altro punto
di vista, se notiamo che l’equazione parametrica della retta che passa per x e
y è data da (1 − β)x + βy, per β ∈ IR, vediamo che il segmento [x, y] è dato da
quei punti della retta che passa per x e y che “giacciono” tra x e y (prendiamo
β ∈ [0, 1] invece che β ∈ IR).
Notiamo anche come, nel caso in cui gli estremi appartengano ad IR e sono
quindi due numeri (scalari), diciamo a e b, il concetto di segmento (chiuso) di
estremi a e b coincida con quello di intervallo [a, b], fatto che giustifica la notazione
[x, y] impiegata per indicare il segmento.
2 Capitolo 4.

Figure 4.1 Esempio di segmento

Usando la semplicissima definizione di segmento appena data, possiamo ora


definire formalmente cosa si intenda per insieme convesso.

Definizione 4.2. Un insieme C ⊆ IRn è convesso se per ogni coppia di punti


appartenenti all’insieme, appartiene all’insieme anche tutto il segmento che li
congiunge. In formule, C è convesso se
x, y ∈ C =⇒ [x, y] ⊆ C.

Dalla definizione segue che l’insieme vuoto, IRn e l’insieme costituito da un solo
punto sono insiemi convessi (banali). Il più semplice insieme convesso non banale
è il segmento di estremi x, y ∈ IRn .

Example 4.2: In IR2 gli insiemi (a) e (b) della Figura 4.2 sono convessi, mentre
gli insiemi (c) e (d) della stessa figura non lo sono. Infatti agli insiemi (c) e
(d) appartengono coppie di punti, quali quelle segnate nella figura, tali che il
segmento che li congiunge contiene dei punti non appartenenti all’insieme; ciò
non avviene invece comunque si prendano coppie di punti negli insiemi (a) e (b).
Convessità 3

Figure 4.2 Insiemi convessi e non convessi

Notiamo che anche se tutti gli esempi che abbiamo fatto fin’ora sono di insiemi
convessi chiusi, gli insiemi convessi non sono necessariamente chiusi. Per esempio,
la parte interna di tutti gli insiemi convessi della Figura 4.2 sono ancora insiemi
convessi. L’intervallo aperto (1, 2) è un altro esempio di insiemi convesso e non
chiuso. Un insieme convesso inoltre può essere né chiuso né aperto: l’intervallo
[1, 2) è un insieme convesso che non è né chiuso né aperto.
~ Attenzione quindi a non confondere insiemi convessi e insiemi chiusi,
sono due concetti indipendenti.
Fatte queste precisazioni, notiamo che in questo corso noi saremo interessati
essenzialmente a insiemi convessi che sono anche chiusi. Infatti gli insiemi con-
vessi che considereremo rappresenteranno, nella maggior parte dei casi, degli
insiemi ammissibili di problemi di ottimizzazione e abbiamo già detto che a noi,
in questo corso, interessano solo insiemi ammissibili chiusi.

Funzioni convesse e funzioni concave


Introduciamo ora la seconda definizione fondamentale, quella di funzione con-
vessa.

Definizione 4.3. Sia dato un insieme C ⊆ IRn convesso. Una funzione f : C →


IR è detta convessa su C se per qualunque coppia di punti x e y appartenenti a
C, risulta
f (βx + (1 − β)y) ≤ βf (x) + (1 − β)f (y), ∀β ∈ [0, 1] (4.1)
Se la disuguaglianza è stretta, se cioè risulta
f (βx + (1 − β)y) < βf (x) + (1 − β)f (y), ∀β ∈ (0, 1) (4.2)
la funzione si dice strettamente convessa.

La definizione è illustrata nella Figura 4.3:la (a) è una funzione strettamente


convessa, la (b) è una funzione convessa ma non strettamente convessa.
Osserviamo come prima cosa che la definizione è ben posta, perché l’insieme
C è convesso e quindi il punto βx + (1 − β)y appartiene a C per ogni β ∈ [0, 1] e
4 Capitolo 4.

Figure 4.3 Funzioni convesse

il primo membro della (4.1) è ben definito. Analizziamo ora meglio il caso di una
funzione di una variabile, n = 1. Una volta disegnato il grafico della y = f (x),
nel piano xy i punti (x, f (x)) e (y, f (y)) sono due punti del grafico della funzione
f . Consideriamo ora la retta che passa per questi due punti; semplici calcoli
mostrano che il grafico di questa retta è dato dai punti (β, βf (x) + (1 − β)f (y)).
Si vede allora che la condizione (4.1) può essere espressa a parole dicendo che
una funzione è convessa se “giace al di sotto di tutte le sue corde”. Notiamo
che questa interpretazione della convessità non è limitata al caso n = 1; noi la
abbiamo illustrata in questo caso solo per comodità di rappresentazione grafica.

Example 4.3: Impareremo più aventi a riconoscere da proprietà analitiche se una


funzione è convessa. Per il momento ci limitiamo a fare qualche esempio classico
di funzioni convesse in una variabile. Vi consiglio di disegnare le varie funzioni e
verificare cosı̀ le proprietà di convessità indicate. Sono funzioni convesse
r x2
r x
r ex
r e−x
r − log x
r |x|
r max{−x, 2x}
Con l’eccezione della funzione x, tutte le funzioni appena viste sono anche stretta-
mente convesse. I seguenti sono esempi di funzioni convesse ma non strettamente
convesse
Convessità 5

r −3x + 5
2

x se x ≤ 0
r f (x) =0 se 0 < x < 1
(x − 1)2 se x ≥ 1

r max{−x − 2, 2x + 10, x}

Notiamo subito che una funzione lineare o, più in generale, affine è sempre una
funzione convessa. Se infatti abbiamo f (x) = c T x + b, risulta ovviamente
c T (βx + (1 − β)y) + b = β(c T x + b) + (1 − β)(c T y + b)
e quindi la (4.1) è sempre soddisfatta con l’uguaglianza. Questo mostra che
f (x) = c T x + b è convessa ma non strettamente convessa. Vale quindi il seguente
risultato.

Proposizione 4.4. Ogni funzione affine è convessa, ma non strettamente con-


vessa.

Un altro esempio di funzione convessa è la norma. Sia k · k una qualunque


norma su IRn , la funzione cioè che associa a ogni vettore x la sua norma kxk.
Questa funzione è convessa. Infatti possiamo scrivere, per ogni β ∈ [0, 1],
kβx1 + (1 − β)x2 k ≤ kβx1 k + k(1 − β)x2 k ≤ βkx1 k + (1 − β)kx2 k,
dove la prima disuguaglianza segue dalla disuguaglianza triangolare, e la seconda
dalla (positiva) omogeneità della norma, tenuto conto che sia β che 1 − β sono
non negativi (si veda l’appendice per le proprietà della norma). Quindi abbiamo
che anche la norma è una funzione convessa.

Proposizione 4.5. La norma k · k è una funzione convessa.

Osservazione 4.6. Ricordiamo che nel seguito di queste dispense, a meno che
non sia altrimenti indicato, indicheremo sempre con k · k la norma euclidea (si
veda l’Appendice).

C’è una connessione molto forte tra la definizione di insieme convesso e quella
di funzione convessa. Per illustrare questa connessione introduciamo la seguente
definizione.

Definizione 4.7. Siano dati un insieme C ⊆ IRn (non necessariamente con-


vesso) e una funzione f : C → IR (non necessariamente convessa). Si definisce
6 Capitolo 4.

Figure 4.4 Definizione di epigrafico

epigrafico della funzione f l’insieme epi(f ) definito da


epi(f ) = {(x, α) ∈ IRn+1 : x ∈ C e α ∈ IR, α ≥ f (x)}.

A parole, l’epigrafico di una funzione è l’insieme di punti che “giace al di sopra


del grafico della funzione”. La definizione è illustrata nella Figura 4.4.
Il seguente risultato stabilisce la preannunciato connessione.

Proposizione 4.8. Siano dati un insieme convesso C ⊆ IRn e una funzione


f : C → IR. La funzione f è convessa se e solo se epi(f ) è un insieme convesso
in IRn+1 .

Dimostrazione. Supponiamo che la f sia convessa e siano (x1 , α1 ) e (x2 , α2 )


due punti nell’epigrafico della funzione. Dobbiamo far vedere che se β ∈ [0, 1]
allora
β(x1 , α1 ) + (1 − β)(x2 , α2 ) = (βx1 + (1 − β)x2 , βα1 + (1 − β)α2 ) ∈ epi(f ).
Per la definizione di epigrafico questo vuol dire far vedere che
f (βx1 + (1 − β)x2 ) ≤ βα1 + (1 − β)α2 .
Ma per la convessità della f e la definizione di epigrafico possiamo scrivere
f (βx1 + (1 − β)x2 ) ≤ βf (x1 ) + (1 − β)f (x2 ) ≤ βα1 + (1 − β)α2 ,
e quindi epi(f ) è convesso.
Convessità 7

Viceversa, supponiamo ora che C sia convesso e mostriamo che la f è con-


vessa sull’insieme (convesso per ipotesi) C. Procediamo per assurdo. Se f non è
convessa allora esistono due punti x1 , x2 in C e un β̄ ∈ [0, 1] tali che
f (β̄x1 + (1 − β̄)x2 ) > β̄f (x1 ) + (1 − β̄)f (x2 ). (4.3)
Chiaramente (x1 , f (x1 )) e (x2 , f (x2 )) appartengono a epi(f ), ma la (4.3) mostra
che la combinazione convessa
β̄(x1 , f (x1 )) + (1 − β̄)(x2 , f (x2 ))
di questi due punti non appartiene a epi(f ), che quindi non è un insieme convesso.
Questo è assurdo e la dimostrazione è completa. 

La Figura 4.4 (a) mostra l’epigrafico di una funzione non convessa, mentre in (b)
abbiamo l’epigrafico di una funzione convessa
Un’altra definizione di cui avremo bisogno è quella di funzione concava.

Definizione 4.9. Sia dato un insieme C ⊆ IRn convesso. Una funzione f : C →


IR è detta concava su C se −f è convessa su C. La funzione si dice strettamente
concava su C se −f è strettamente concava su C. In altre parole, la funzione f
è concava se data una qualunque coppia di punti x e y appartenenti a C, risulta
f (βx + (1 − β)y) ≥ βf (x) + (1 − β)f (y), ∀β ∈ [0, 1] (4.4)
La funzione f è strettamente concava se la disuguaglianza è stretta, se cioè risulta
f (βx + (1 − β)y) > βf (x) + (1 − β)f (y), ∀β ∈ (0, 1). (4.5)

La Figura 4.5 illustra questa definizione.


Notiamo che le funzioni lineari sono funzioni che contemporaneamente con-
vesse e concave (la convessità è stata stabilita nella Proposizione 4.4. Poiché se
c T x + b è una funzione lineare anche −(c T x + b) è una funzione lineare, abbiamo
che −(c T x + b) è anche concava). E notiamo pure che esistono funzioni che non
sono né convesse né concave. Per esempio x3 su IR non è né convessa né concava.

4.2 I problemi di ottimizzazione convessi

Una classe importantissima di problemi di ottimizzazione è quella dei problemi


di ottimizzazione convessi. Un problema MIN(C, f ) è detto convesso se C ⊆
IRn è un insieme convesso e la f : C → IR è convessa su C. Per esempio, un
problema di Programmazione Lineare è un problema di ottimizzazione convessa
8 Capitolo 4.

Figure 4.5 Esempio di funzione concava

(torneremo più avanti su questo punto). Per questa classe di problemi vale il
seguente semplice, ma fondamentale risultato.

Teorema 4.10. Sia dato un problema di minimizzazione MIN(C, f ) dove C ⊆


IRn è un insieme convesso e la f : C → IR è convessa su C. Allora ogni punto
di minimo locale è in effetti un minimo globale. In altre parole, non esistono
minimi locali che non siano globali.

Dimostrazione. La dimostrazione è per assurdo. Supponiamo che x̄ ∈ C sia


un minimo locale ma non un minimo globale. Questo vuol dire che esiste un
punto x̃ ∈ C tale che f (x̃) < f (x̄). Per la convessità di C abbiamo che per ogni
β ∈ [0, 1] il punto β x̄ + (1 − β)x̃ appartiene a C. Inoltre, per la convessità di f ,
abbiamo anche, per ogni β ∈ [0, 1)
f (β x̄ + (1 − β)x̃) ≤ βf (x̄) + (1 − β)f (x̃)
(4.6)
< βf (x̄) + (1 − β)f (x̄) = f (x̄)
Dove la disuguaglianza stretta deriva dal fatto che per ipotesi f (x̃) < f (x̄) e
abbiamo considerato β 6= 1. Siccome i punti β x̄ + (1 − β)x̃ per β prossimo a 1
possono essere resi vicini quanto si vuole a x̄, la catena di disuguaglianze scritta
sopra mostra che posso trovare punti vicini quanto voglio a x̄ in cui il valore della
funzione obiettivo è strettamente inferiore al valore assunto nel minimo locale x̄.
Questo è assurdo è la dimostrazione è cosı̀ conclusa. 
Convessità 9

Abbiamo discusso nel capitolo precedente come quando si minimizza sia sem-
pre preferibile trovare minimi globali a minimi locali, ma come la ricerca dei
minimi globali sia in genere molto più onerosa di quella dei minimi locali. Il
risultato appena illustrato mostra che per i problemi di ottimizzazione convessa
non possano sorgere problemi in quest’ambito: la ricerca di minimo locali porta
automaticamente a un minimo globale. Questa è una prima indicazione che il
problemi di ottimizzazione convessa godono di proprietà favorevoli che ne facili-
tano la risoluzione. Vedremo più avanti che il Teorema 4.10 non è che il primo
di una serie di risultati che rendono i problemi di ottimizzazione convessi parti-
colarmente “favorevoli”, e dal punto di vista teorico e da quello algoritmico.
~ Tutto quanto detto sopra vale per problemi di minimizzazione. Se
consideriamo un problema di massimizzazione MAX(C, f ) non è vero
che se C è un insieme convesso e f una funzione convessa, il massimi
locali sono anche massimi globali.
Se si ripercorre la dimostrazione del Teorema 4.10 si vede che la convessità non
permette di invertire i segni delle disuguaglianza nella (4.6) cosı̀ come sarebbe
necessario per provare che non esistono massimi locali che non siano globali. Ma
è facile trovare la soluzione a questo problema. Basta ricordarsi la definizione
di funzione concava. Supponiamo allora di avere il problema MAX(C, f ) con C
insieme convesso e f funzione concava. I massimi (locali) di questo problema
sono i minimi (locali) del problema MIN(C, −f ) che, per definizione di funzione
concava, è un problema di ottimizzazione convessa. Vale quindi il seguente risul-
tato.

Corollario 4.11. Sia dato un problema di massimizzazione MAX(C, f ) dove


C ⊆ IRn è un insieme convesso e la f : C → IR è concava su C. Allora ogni
punto di massimo locale è in effetti un massimo globale. In altre parole, non
esistono massimi locali che non siano globali.

La stretta convessità della funzione obiettivo di un problema di minimizzazione


convessa aggiunge un’ulteriore importante informazione: il problema può avere
al più una sola soluzione ottima.

Teorema 4.12. Sia dato un problema di minimizzazione MIN(C, f ), dove C ⊆


IRn è un insieme convesso e la f : C → IR è convessa su C. Allora o SOL(C, f )
è vuoto o contiene al più un solo punto.
Analogamente, il problema MAX(C, f ), dove C ⊆ IRn è un insieme convesso
e la f : C → IR è concava su C ha al più una sola soluzione ottima.
10 Capitolo 4.

Dimostrazione. Consideriamo solo il problema MIN(C, f ), l’affermazione per


problemi concavi di massimizzazione deriva immediatamente da questa cam-
biando di segno alla funzione obiettivo.
Sia dato allora il problema convesso MIN(C, f ) e supponiamo per assurdo che
contenga due soluzioni distinte: x̄1 e x̄2 . Abbiamo quindi f (x̄1 ) = f (x̄2 ) = f¯,
dove f¯ è il valore ottimo. per la stretta convessità della f possiamo scrivere
f (0.5x̄1 + 0.5x̄2 ) < 0.5f (x̄1 ) + 0.5f (x̄2 ) = f¯.
Per la convessità di C, il punto 0.5x̄1 + 0.5x̄2 è ammissibile, e per la disug-
uaglianza appena illustrata abbiamo che in questo punto la funzione obiettivo
assume un valore inferiore a quello ottimo. Questo è impossibile e ciò conclude
la dimostrazione. 

Avendo visto delle prime importanti conseguenza della convessità sorge naturale
la domanda: come facciamo a capire se un problema è convesso? Esistono classi
interessanti e ampie di problemi che sono di ottimizzazione convessa? La conves-
sità ha ulteriori implicazioni utili che possiamo sfruttare nell’analisi di problemi
convessi? Per rispondere a queste domande dobbiamo approfondire lo studio e
degli insiemi convessi e delle funzioni convesse. A questo studio sono dedicati i
rimanenti tre paragrafi di questo capitolo.

4.3 Ancora sugli insiemi convessi

La principale domanda cui vogliamo rispondere in questo paragrafo è: come


possiamo costruire o riconoscere un insieme convesso? Come sempre, l’uso della
definizione risulta, nei casi pratici, difficile e comunque molto faticoso. È quindi
opportuno avere altri mezzi per riconoscere che un insieme è convesso.
Il primo risultato di questo genere è il seguente, che mette in luce, ancora una
volta, la stretta connessione esistente tra insiemi convessi e funzioni convesse. Per
enunciare in modo sintetico questo risultato introduciamo gli insiemi di livello.
Sia data un funzione f : C → IR (non necessariamente convessa), si definisce
come insieme di livello relativo al valore α l’insieme L(f, α) di tutti i punti in C
in cui la funzione f assume valori inferiori o uguali ad α. In formule:
L(f, α) = {x ∈ C : f (x) ≤ α}.
Vale il seguente teorema.

Teorema 4.13. Sia dato un insieme convesso C ⊆ IRn e una funzione convessa
f : C → IR. Allora l’insieme di livello della f relativo a un qualunque valore α
Convessità 11

è un insieme convesso. Se poi C è un insieme chiuso e f è continua allora l’


insieme di livello è anche un insieme chiuso.

Dimostrazione. Sia dato α e due punti x1 e x2 appartenenti a L(f, α). Per la


convessità di C abbiamo che per qualunque β ∈ [0, 1], il punto βx1 + (1 − β)x2 ∈
C e inoltre, per la convessità della f su C, possiamo scrivere
f (β 1 x1 + (1 − β)x2 ) ≤ βf (x1 ) + (1 − β)f (x2 ) ≤ βα + (1 − β)α ≤ α
che mostra la convessità di L(f, α).
Per quanto riguarda la chiusura (la seconda affermazione del teorema), sia
{xk } una successione di punti in L(f, α) che tende a un punto x̄. Vogliamo far
vedere che questo punto appartiene a L(f, α). Intanto appartiene a C perché
C è chiuso per ipotesi. Inoltre, per la continuità della f e per l’ ipotesi che xk
appartenga all’insieme di livello α, possiamo scrivere
f (x̄) = lim f (xk ) ≤ α,
k→∞

che mostra come x̄ ∈ L(f, α). 


L’uso principale di questo teorema è il seguente. Se abbiamo una funzione
g1 : IRn → IR che è continua e convessa, allora l’ insiemi di soluzioni della dise-
quazione g1 (x) ≤ 0 è un insieme convesso. Infatti, l’insieme di soluzioni di questa
disequazione non è altro che l’insieme di livello della g1 relativo ad α = 0.

Example 4.4: Consideriamo una funzione affine c T x + b che, per la Proposizione


4.4 è convessa. Allora l’insieme dei punti che soddisfa la disequazione
cT x + b ≤ 0
è un insieme convesso e chiuso. Notiamo che l’insieme di soluzioni di una dise-
quazione affine è usualmente chiamato un semispazio. Con questa terminologia
possiamo quindi dire che i semispazi sono insiemi convessi e chiusi.

Example 4.5: Consideriamo ora l’ insieme B(0; δ) (dove δ è un numero non


negativo) definito da
B(0; δ) = {x ∈ IRn : kxk ≤ δ};
quest’ insieme è definito come la sfera con centro nell’origine e raggio δ. Siccome
abbiamo già verificato nella Proposizione (4.5) che la norma è una funzione
12 Capitolo 4.

convessa e inoltre è anche ovviamente una funzione continua, abbiamo che B(0; δ)
è un insieme convesso è chiuso.

L’utilità del Teorema 4.13 è ancora maggiore se si tiene conto che l’intersezione
di insiemi convessi è ancora un insieme convesso.

Teorema 4.14. L’intersezione di un numero qualunque di insieme convessi è


un insieme convesso.

Dimostrazione. Siano Ci i ∈ I insiemi convessi e sia C = ∩i∈I Ci la loro inter-


sezione. Siano x1 ed x2 due vettori in C, allora x1 , x2 appartengono, per
definizione di intersezione, a tutti gli insiemi Ci . Siccome questi insiemi sono con-
vessi per ipotesi, abbiamo che il segmento [x1 , x2 ] appartiene a tutti gli insiemi
Ci . Ma quindi, per definizione di intersezione, il segmento appartiene anche C,
che è quindi un insieme convesso. 

Example 4.6: L’insieme (e) della Figura 4.2 è dato dall’intersezione di due insiemi
convessi ed è convesso

L’uso principale di questo teorema è il seguente. Se abbiamo m funzioni gi :


IRn → IR, i = 1, . . . , m che sono continue e convesse, allora l’ insiemi di soluzioni
del sistema
g1 (x) ≤ 0
..
.
gm (x) ≤ 0

è un insieme convesso. Infatti, l’insieme di soluzioni di questo sistema è


l’intersezione degli m insiemi {x ∈ IRn : gi (x) ≤ 0}, che sono tutti insiemi con-
vessi e chiusi. In altre parole, abbiamo che se abbiamo un problema di ottimiz-
zazione il cui insieme ammissibile C è definito da un numero finito di vincoli di
disuguaglianza convessi, l’ insieme ammissibile C è convesso.
Notiamo esplicitamente che in generale, se g1 (x) è una funzione convessa,
l’insieme {x ∈ IRn : g1 (x) = α} non è un insieme convesso. L’insiemi del tipo
{x ∈ IRn : g1 (x) = α} li abbiamo già incontrati nel paragrafo 3.3, quando abbi-
amo affrontato la risoluzione grafica di un problema di ottimizzazione non lineare.
Convessità 13

L’insieme {x ∈ IRn : g1 (x) = α} è detto linea di livello α della funzione g1 (atten-


zione a non confondere le linee di livello e gli insiemi di livello!). Quindi, le linee
di livello della funzione kxk = 1 sono, per esempio in IR2 delle circonferenze, che
non sono insiemi convessi. L’unico caso di interesse in cui accade che le linee di
livello di una funzione siano convesse è quando la funzione è affine.

Proposizione 4.15. L’ insieme di punti che soddisfa l’equazione


c T x + b = 0,
cioè la linea di livello 0 della funzione c T x + b, è un insieme convesso.

Dimostrazione. Consideriamo i due insiemi di livello


C1 = {x ∈ IRn : c T x + b ≤ 0}, C2 = {x ∈ IRn : c T x + b ≥ 0}.
Notiamo intanto che possiamo ovviamente scrivere C2 = {x ∈ IRn : −c T x − b ≤
0}. Siccome sia c T x + b che −c T x − b sono funzioni lineari e quindi, per la Propo-
sizione 4.4, convesse, abbiamo per il Teorema 4.14 , che C1 e C2 sono due insiemi
convessi. Ma allora, è convessa anche la loro intersezione C1 ∩ C2 che ovviamente
coincide con l’ insieme di soluzioni dell’equazione c T x + b = 0.
In questa dimostrazione abbia sfruttato i risultati generali dimostrati nelle
pagine precedenti, ma è anche possibile dimostrare la proposizione in maniera
molto semplice e diretta usando la definizione di insieme convesso. Vediamo
questa dimostrazione alternativa. Siano x1 e x2 due punti tali che c T x1 + b = 0
e c T x2 + b = 0. Abbiamo
c T (βx1 + (1 − β)x2 ) + b = β(c T x1 + b) + (1 − β)(c T x2 + b) = 0,
che mostra la convessità desiderata. .
L’insieme {x ∈ IRn : c T x + b = 0} è detto iperpiano. Con questa terminologia,
abbiamo che una qualunque funzione affine c T x + b determina un iperpiano che
divide lo spazio in due semispazi. Tutti questi insiemi sono convessi e chiusi.
Mettendo assieme i risultati fin qui ottenuti otteniamo facilmente la seguente
proposizione, che permette di determinare quando la regione ammissibile di un
problema di ottimizzazione, definita da vincoli di uguaglianza e disuguaglianza
sia convessa.

Proposizione 4.16. Sia dato un insieme C definito come l’ insieme di soluzioni


di un sistema di disequazioni ed equazioni:
C = {x ∈ IRn : g1 (x) ≤ 0, . . . gm (x) ≤ 0, h1 (x) = 0, . . . , hp (x) = 0}.
14 Capitolo 4.

Se tutte le gi , i = 1, . . . , m, sono continue e convesse e tutte le uguaglianze hj ,


j = 1, . . . , p, sono affini, allora l’ insieme C è convesso e chiuso.

4.4 Ancora sulle funzioni convesse

In questo paragrafo approfondiamo lo studio delle funzioni convesse e, di nuovo,


il nostro principale obiettivo è imparare a riconoscere funzioni convesse facendo
a meno della definizione, che risulta in genere di difficile applicazione. Il para-
grafo precedente, inoltre, ci offre un ulteriore motivo per studiare le funzioni
convesse in quanto una volta determinato che una funzione è convessa possiamo
immediatamente affermare che i suoi insiemi di livello sono insiemi convessi.
Tra i criteri più utili per determinare la convessità di una funzione ci sono
quelli basati sull’uso delle derivate della funzione. Oltre a essere di un certa
utilità pratica, questi criteri permettono anche di svelare proprietà delle fun-
zioni convesse che non sono evidenti. Il seguente teorema caratterizza le funzioni
(strettamente) convesse mediante l’uso del gradiente.

Teorema 4.17. Sia dato un insieme convesso C ⊆ IRn e una funzione contin-
uamente differenziabile f : C → IR. La funzione f è convessa su C se e solo se
per ogni coppia di punti x1 e x2 appartenenti a C abbiamo
f (x2 ) ≥ f (x1 ) + ∇f (x1 ) T (x2 − x1 ). (4.7)
Inoltre la f è strettamente convessa su C se e solo se nella (4.7) la disuguaglianza
è stretta, se sioè
f (x2 ) > f (x1 ) + ∇f (x1 ) T (x2 − x1 ). (4.8)

Dimostrazione. Supponiamo che la f sia convessa su C. Quindi, dati due


qualunque punti x1 e x2 appartenenti a C abbiamo, per ogni β ∈ (0, 1],
f (βx2 + (1 − β)x1 ) ≤ βf (x2 ) + (1 − β)f (x1 ).
Da questo si deriva facilmente
f (x1 + β(x2 − x1 ))
≤ f (x2 ) − f (x1 ). (4.9)
β
E quindi, passando al limite per β che tende a zero, abbiamo
∇f (x1 ) T (x2 − x1 ) ≤ f (x2 ) − f (x1 ),
Convessità 15

cioè la (4.7).1
Consideriamo ora la sufficienza: Supponiamo che valga la (4.8) e mostriamo che
la f è convessa. Siano dati due punti x1 e x2 appartenenti a C e consideriamo un
punto z = βx1 + (1 − β)x2 per un qualche fissato β ∈ [0, 1]. Per la (4.8) abbiamo
f (x1 ) ≥ f (z) + ∇f (z) T (x1 − z)

f (x2 ) ≥ f (z) + ∇f (z) T (x2 − z).


Se sommiamo queste due disequazioni moltiplicando la prima per β e la seconda
per 1 − β otteniamo
βf (x1 ) + (1 − β)f (x2 ) ≥ βf (z) + (1 − β)f (z) + ∇f (z) T ()

= f (z) + ∇f (z) T (βx1 + (1 − β)x2 − z) = f (z),


che mostra la convessità della f .
La dimostrazione della condizione per funzioni strettamente convesse è perfet-
tamente analoga e quindi viene omesso. 
Questo teorema è la generalizzazione del fatto ben noto nel caso di funzioni di
una variabile che “una funzione convessa giace tutta al di sopra di ogni sua
tangente”. Si noti infatti che f (x1 ) + ∇f (x1 ) T (x2 − x1 ) è l’equazione del piano
tangente al grafico della f (x) in x1 . Il teorema è illustrato nella Figura 4.6.

Example 4.7: Il teorema precedente può essere usato per dare una nuova
dimostrazione che le funzioni affini sono convesse, ma non strettamente convesse.
Basta notare che il gradiente di c T x + b è c. E quindi ovviamente abbiamo che
la (4.7) è sempre soddisfatta come uguaglianza:
c T x2 + b = c T x1 + b + c T (x2 − x1 ).
Quindi la funzione c T x + b è convessa ma non strettamente convessa.

Se la funzione f è di classe C 2 è anche possibile caratterizzare le funzioni


convesse usando la matrice hessiana.

1 Consideriamo la funzione di una sola variabile β, data da g(β) = f (x1 + β(x2 − x1 )). Siccome
la g è data dalla composizione di due funzione continuamente differenziabili (la f e la x1 +
β(x2 − x1 )) è anch’essa continuamente differenziabile. Per teoremi ben noti sulla derivata
delle funzioni composte abbiamo che g 0 (0) = ∇f (x1 ) T (x2 − x1 ). Poiché il primo membro
della (4.9) è il rapporto incrementale della g in 0, abbiamo che passando al limite il primo
membro di questa relazione dà esattamente g 0 (0) = ∇f (x1 ) T (x2 − x1 ).
16 Capitolo 4.

Figure 4.6 Illustrazione del Teorema 4.17

Teorema 4.18. Sia dato un insieme convesso C ⊆ IRn e una funzione due volte
continuamente differenziabile f : C → IR. Supponiamo che l’insieme C contenga
un punto interno. Allora la funzione f è convessa su C se e solo se la matrice
hessiana ∇2 f (x) è una matrice semi definita positiva per ogni x in C.

Dimostrazione. Sufficienza. Per lo sviluppo di Taylor arrestato al secondo


ordine abbiamo che per ogni coppia di punti x1 e x2 appartenenti a C risulta,
per un opportuno y ∈ [x1 , x2 ],
1
f (x2 ) = f (x1 ) + ∇f (x1 ) T (x2 − x1 ) + (x2 − x1 ) T ∇2 f (y)(x2 − x1 ). (4.10)
2
Notiamo che poiché y appartiene al segmento [x1 , x2 ] appartiene all’insieme C.
Se ora supponiamo che la matrice hessiana sia semi definita positiva in ogni
punto di C, abbiamo allora immediatamente dalla (4.10) che
f (x2 ) ≥ f (x1 ) + ∇f (x1 ) T (x2 − x1 ),
che, per il Teorema 4.17 implica che la f è convessa.
Necessità. Viceversa, supponiamo che la f sia convessa e che esista almeno
un punto x̄ ∈ C tale che, per qualche opportuno d 6= 0, risulti d T ∇2 f (x̄)d ≤ 0.
Siccome ∇2 f (x) è una funzione continua per ipotesi, possiamo assumere, senza
perdita di generalità, che x̄ appartenga all’interno di C. Se infatti x̄ non appar-
tiene alla parte interna di C, possiamo sempre trovare un punto vicino quanto
Convessità 17

vogliamo a x̄, ma nella parte interna di C, per proprietà elementari di topologia.


Inoltre, per continuità, se questo punto x̃ è preso abbastanza vicino a x̄, abbiamo
che d T ∇2 f (x̃)d ≤ 0. Inoltre, sempre senza perdita di generalità, supponiamo che
la norma di d sia abbastanza piccola da far sı̀ che x̄ + d appartenga a C (siccome
x̄ appartiene alla parte interna di C, esiste una sfera abbastanza piccola di raggio
δ e centro in x̄ che è tutta contenuta in C; basta allora eventualmente moltipli-
care d per una costante in modo da rendere la sua lunghezza (=norma) minore
di δ). Sempre per continuità, e sempre senza perdita di generalità, assumiamo
infine che d sia abbastanza piccolo da far sı̀ che
d T ∇2 f (y)d ≤ 0, ∀y ∈ [x̄, x̄ + d]. (4.11)
Utilizzando lo sviluppo (4.10) e la (4.11) abbiamo allora che
f (x̄ + d) < f (x̄) + ∇f (x̄) T ((x̄ + d) − x̄)
che, per il Teorema 4.17 contraddice la convessità della f . 
È anche possibile dare un criterio per la convessità stretta della funzione,
ma questo criterio è solo sufficiente. La dimostrazione del risultato seguente è
identica a quella della parte sufficiente del Teorema 4.18, ed è quindi omessa.

Teorema 4.19. Sia dato un insieme convesso C ⊆ IRn e una funzione due volte
continuamente differenziabile f : C → IR. Se la matrice hessiana ∇2 f (x) è una
matrice definita positiva per ogni x in C allora la funzione f è strettamente
convessa su C

Example 4.8: Non è vero in generale che se una funzione è strettamente convessa
la sua matrice hessiana è definita positiva. Si consideri la funzione x4 su IRn . Si
tratta di una funzione strettamente convessa e la sua matrice hessiana (cioè in
questo caso la sua derivata seconda, che è una matrice 1 × 1) è ∇2 f (x) = 12x2 .
Nell’origine si ha quindi ∇2 f (0) = 0 che non è una matrice definita positiva (per
qualunque d ∈ IR abbiamo d T ∇2 f (0)d = 0).

I due teoremi appena visti forniscono criteri che spesso sono di semplice verifica.
Per esempio, consideriamo una funzione quadratica
1 T
x Qx + b T x + c,
2
dove Q è una matrice quadrata n × n e simmetrica. L’hessiano di questa funzione
è costante e pari a Q (si veda l’appendice). Quindi, per il Teorema 4.18, la
18 Capitolo 4.

funzione è convessa se e solo se Q è semi definita positiva. Per il Teorema 4.19


invece, possiamo affermare che se Q è definita positiva, la funzione quadratica è
strettamente convessa. Nel caso particolare delle funzioni quadratiche, in effetti,
è facile vedere che se f è strettamente convessa allora la matrice Q deve essere
definita positiva. Se infatti cosı̀ non fosse vorrebbe dire che esiste una direzione
d ∈ IRn diversa da 0 per cui abbiamo d T Qd = 0 (notiamo che questo prodotto
non può essere negativo perché comunque la Q è almeno semi definita positiva,
essendo la funzione convessa). Ma allora, dato un qualunque x1 e posto x2 =
x1 + d, possiamo scrivere, per il Teorema 4.17
f (x2 ) > f (x1 ) + ∇f (x1 ) T d
= 21 (x1 ) T Qx1 + c T x1 + b + (Qx1 + c) T d
= 12 (x1 ) T Qx1 + c T (x1 + d) + b + x1 Qd + 12 d T Qd
= f (x2 )
che è chiaramente impossibile. Abbiamo quindi il seguente risultato.

Proposizione 4.20. Sia data una funzione quadratica


1 T
f (x) = x Qx + b T x + c,
2
Allora f è convessa se e solo se Q è semi definita positiva e f è strettamente
convessa se e solo se f è definita positiva.

Concludiamo il paragrafo con mostrando come si possano “comporre” funzioni


convesse e ottenendo in questo modo nuove funzioni convesse.

Proposizione 4.21. Sia C un insieme convesso in IRn . Valgono le seguenti


affermazioni

(a) Se f : C → IR è convessa, allora lo è anche la cf (x) per qualunque c ≥ 0;


(b) Se fi : C → IR, i = 1, . . . , m sono funzioni convesse, allora anche m
P
i=1 ci fi
è una funzione convessa se ci ≥ 0 per ogni i;
(c) Se fi : C → IR, i ∈ I sono funzioni convesse, allora anche maxi∈I {fi (x)} è
una funzione convessa (si noti che a differenza del caso precedente, qui
consideriamo anche la possibilità di fare il max di un numero infinito di
funzioni);
(d) Se fi : C → IR, i ∈ I sono funzioni concave, allora anche mini∈I {fi (x)} è
una funzione concava.

Dimostrazione. Le affermazioni (a) e (b) derivano da una banale appli-


cazione della definizione. Per la (c) basta osservare che l’epigrafico della
Convessità 19

maxi∈I {fi (x)} è dato dall’intersezione degli epigrafici delle fi . Quindi l’epigrafico
della maxi∈I {fi (x)} è un insieme convesso per il Teorema 4.14. La tesi segue
allora immediatamente dalla proposizione 4.8. La (d) si ottiene dalla (c) cam-
biando di segno a tutte le funzioni. 

4.5 Poliedri

I poliedri sono particolari insiemi convessi che rivestono un ruolo importante


nei problemi di ottimizzazione per la frequenza con la quale si incontrano. È
possibile dare risultati molto approfonditi ed eleganti sui poliedri, e lo studio dei
poliedri costituisce un importante capitolo dell’ottimizzazione convessa. Noi qui
ci limitiamo a quei pochi risultati fondamentali che saranno usati nel resto del
corso.

Definizione 4.22. Un poliedro in IRn è l’ insieme di soluzioni di un numero


finito di equazioni e disequazioni (non strette) lineari.

Si noti che le disequazioni nella definizione sono “non strette”, quindi del tipo
≤ o ≥, mentre nella definizione di poliedro non sono possibili disequazioni del
tipo < o >.

Example 4.9: Consideriamo il sistema


2x1 + 3x2 − x3 + 2x4 ≤ 8
3x1 − x2 + 8x3 − 3x4 ≤ 6
−x1 − 2x2 + x3 − x4 ≥ −2
x1 + 2x2 − x3 + x4 = 2.
L’insieme di soluzioni di questo sistema è chiamato poliedro.

Abbiamo visto che geometricamente le soluzioni di un’equazione lineare rapp-


resentano un iperpiano, mentre le soluzioni di una disequazione (non stretta)
rappresenta un semispazio chiuso. Vediamo quindi che, con terminologia più
geometrica, possiamo affermare che un poliedro è l’ intersezione di un numero
finito di iperpiani e semispazi chiusi. Sono esempi di poliedri gli esempi di regione
ammissibile dei problemi di PL risolti graficamente nel paragrafo 3.3.1.
20 Capitolo 4.

Si noti che, come già illustrato nel paragrafo 3.2, ogni sistema di equazioni
e disequazioni può sempre essere riscritto come sistema di sole disequazioni del
tipo ≤. Quindi, per comodità, negli sviluppi teorici di questo paragrafo ci limiti-
amo a considerare poliedri di questo tipo. Quindi nel seguito i poliedri saranno
rappresentati da sistemi del tipo
Ax ≤ b, (4.12)
dove x ∈ IRn , A è una matrice m × n e b ∈ IRm . Inoltre, d’ora in poi, se indichi-
amo un insieme con P intendiamo che quest’insieme sia un poliedro.

Example 4.10: Consideriamo il poliedro descritto nell’Esempio 4.9. Il sistema


che lo definisce può essere riscritto in modo equivalente come
2x1 + 3x2 − x3 + 2x4 ≤ 8
3x1 − x2 + 8x3 − 3x4 ≤ 6
x1 + 2x2 − x3 + x4 ≤ 2
x1 + 2x2 − x3 + x4 ≤ 2
−x1 − 2x2 + x3 − x4 ≤ −2
L’insieme di soluzioni di questo sistema è lo stesso dell’insieme considerato
nell’Esempio 4.9. Quindi i due sistemi definiscono lo stesso poliedro. Questo
da una parte illustra come uno stesso poliedro possa essere rappresentato in
modi diversi come sistema di equazioni e disequazioni, dall’altra come si possa
passare da una rappresentazione che usi equazioni e disequazioni di tutti i tipi a
una rappresentazione con sole disequazioni di tipo ≤. Con riferimento alla (4.12),
qui abbiamo quindi m = 5 (5 disequazioni), n = 4 (quattro variabili) e
2 3 −1 2 8
   
 3 −1 8 −3 6
   
A =   1 2 −1 1  , b =  2 .
 
 1 2 −1 1  2
−1 −2 1 −1 −2

In base alla definizione di poliedro abbiamo che sono poliedri


r gli iperpiani (soluzioni di una sola equazione lineare);
r i semispazi chiusi (soluzioni di una singola disequzione lineare);
r le rette in IRn (soluzioni di un sistema di n − 1 equazioni lineari con rango
n − 1);
Convessità 21

r l’insieme vuoto (soluzione di un sistema impossibile, per esempio il sistema


delle due equazioni: ni=1 xi = 1 e ni=1 xi = −1);
P P
r IRn (soluzione dell’equazione n 0xi = 0).
P
i=1

Per la Proposizione 4.16 abbiamo che i poliedri sono sempre insiemi chiusi e
convessi.

Proposizione 4.23. I poliedri sono insiemi convessi e chiusi.

Vertici
Nell’analisi dei poliedri un ruolo fondamentale è giocato dai “vertici”. Abbiamo
già avuto modo di apprezzare questo ruolo nella risoluzione grafica dei problemi
di PL illustrata nel paragrafo 3.3.1. Lı̀ abbiamo anche conggetturato che, a
meno di casi molto particolari (poliedri senza vertici), se un problema di PL
ha soluzioni ottime, ne ha almeno una su un vertice. Vedremo nel prossimo
capitolo che questo risultato non solo è vero, ma si applica addirittura a una
classe più ampia di problemi di ottimizzazione. Motivati da questa osservazione
approfondiamo lo studio dei vertici.
Come prima cosa ricordiamo la definizione di vincolo attivo (si veda la
Definizione ??), particolarizzata la caso lineare

Definizione 4.24. Vincoli attivi


Se un vettore x̄ ∈ IRn soddisfa aTi x̄ = bi per qualche i ∈ {1, . . . , m} si dice che
il corrispondente vincolo è attivo in x̄. Inoltre, dato x̄ ∈ IRn si indica con I(x̄)
l’insieme degli indici dei vincoli attivi, cioè:
I(x̄) = i ∈ {1, . . . , m} | aTi x̄ = bi .


Per brevità, nel seguito, chiameremo spesso vincoli linearmente indipendenti


quei vincoli per i quali risultano linearmente indipendenti i vettori aTi corrispon-
denti.
Il nostro primo compito è quello di dare una definizione di vertice. Ovvia-
mente vogliamo una definizione che ci faccia ritrovare nei casi di poliedri classici
(triangoli, quadrati, cubi, parallelepipedi) la nozione usuale di vertice, ma che
sia applicabile anche a poliedri in IRn con n > 3. Semplici disegni in IR2 (o, se
siete bravi, in IR3 ) mostrano che in un vertice di un poliedro in IR2 sono sempre
attivi 2 vincoli e in un vertice di un poliedro in IR3 sono attivi 3 vincoli (pensate
ai vertici di un quadrato, che sono i punti dove si intersecano due lati e quelli
di un cubo, dove si intersecano 3 lati). Questo potrebbe suggerire di definire
come vertice di un poliedro, un punto del poliedro dove sono attivi esattamente
n vincoli. Ma se vogliamo essere precisi dobbiamo riconoscere che un numero
22 Capitolo 4.

Figure 4.7 Come definire un vertice?

di vincoli attivi pari alla dimensione dello spazio non è una buona definizione,
infatti è facile costruire degli esempi che, anche se possono apparire artificiali
mostrano le falle di questa possibile definizione. Per esempio, nella figura Figura
4.7 (a), il poliedro è un quadrato e nel punto x̄ sono attivi 3 vincoli. Quindi se
avessimo definito un vertice come punto dove sono attivi n = 2 vincoli questo
non risulterebbe un vertice. Neanche assumere che un punto è un vertice se sono
attivi almeno n vincoli risolve il problema però. Se guardiamo la figura 4.7 (b)
vediamo che in x̄ sono attivi 2 vincoli, ma noi non vorremmo certo che questo
punto fosse classificato come vertice!
La soluzione del problema sta nell’osservare che in un vertice sono sı̀ attivi
almeno n vincoli, ma la questione più importante è che questi vincoli attivi si
intersechino in un solo punto, il vertice appunto. Siamo cioè arrivati a capire che
ciò che caratterizza un vertice x̄ è l’essere l’unica soluzione del sistema ai (x) T =
bi , i ∈ I(x̄). Questo ci porta alla seguente definizione.

Definizione 4.25. Un vettore x̄ appartenente ad un poliedro P =


{x ∈ IRn | Ax ≤ b} è detto vertice se una delle seguenti due condizioni equiv-
alenti2 sono soddisfatte

2 Le due condizioni sono equivalenti per un classico risultato di algebra lineare che dice che
dato un sistema lineare in n incognite, una soluzione è l’unica soluzione del sistema se e solo
se il rango della matrice è pari a n.
Convessità 23

(a) Esistono n righe aTi della matrice A con i ∈ I(x̄) che sono linearmente
indipendenti;
(b) x̄ è soluzione unica del sistema ai (x) T = bi , i ∈ I(x̄).

La maniera più comune di enunciare questa definizione è: un punto x̄ apparte-


nente al poliedro P è un vertice se il rango dei vincoli attivi in x̄ è n. Questa
dizione è da considerarsi semplicemente come una forma abbreviata della (a)
nella definizione appena data.
Per verificare se un punto è un vertice di un poliedro dato basta quindi prima di
tutto verificare l’ammissibilità e, qualora questa risulti soddisfatta, basta verifi-
care qual è il rango dei vincoli attivi.

Example 4.11: Consideriamo il poliedro P definito dal sistema


x1 + x2 + 2x3 + x4 ≤ 5
x1 − x2 + 2x3 − x4 ≤ 1
2x1 + 4x3 ≤6
x2 − 4x3 + x4 ≤ 0
x1 ≥0
x2 ≥0
x3 ≥0
x4 ≥ 0
e i punti (a) (−1, 0, 0, 0), (b) (1, 0, 0, 0), (c) (1, 1, 1, 1), (d) (0, 5/2, 5/4, 0). Deter-
miniamo se questi punti sono vertici o meno. Come primo passo riscriviamo
questo poliedro usando solo disuguaglianze del tipo ≤:
x1 + x2 + 2x3 + x4 ≤ 5
x1 − x2 + 2x3 − x4 ≤ 1
2x1 + 4x3 ≤6
x2 − 2x3 + x4 ≤ 0
−x1 ≤0
−x2 ≤0
−x3 ≤0
−x4 ≤ 0
24 Capitolo 4.

Passiamo quindi ad analizzare i quattro punti.

(a) Il punto non è ammissibile perché, sostituendo questo punto nelle dise-
quazioni che definisco P , non è soddisfatto il quinto vincolo. Non essendo
ammissibile il punto non è quindi nemmeno un vertice.
(b) Il punto soddisfa tutti i vincoli ed è quindi ammissibile. I vincoli attivi sono il
secondo, il quarto, il sesto, il settimo e l’ottavo. Il rango dei vincoli attivi è
quattro, perché, per esempio, il determinante della seconda, sesta, settima
e ottava riga della matrice A è diverso da zero. Il punto è quindi un vertice.
(c) Il punto soddisfa tutti i vincoli ed è quindi ammissibile. Sono attivi i primi
tre vincoli. Il rango dei vincoli attivi può essere al più tre e il punto non è
quindi un vertice.
(d) Il punto soddisfa tutti i vincoli ed è quindi ammissibile. I vincoli attivi sono il
primo, il quarto, il quinto e l’ottavo. Si verifica calcolando il determinante,
che questi quattro vincoli sono linearmente indipendenti e quindi il punto
è un vertice.

Ecco un altro esempio simile.

Example 4.12: Dato il poliedro descritto dalle seguenti disuguaglianze


x1 + 2x2 + 2x3 ≤ 2
x1 + 4x2 + 2x3 ≤ 3
x1 ≥ 0
x2 ≥ 0
x3 ≥ 0
verificare se i punti P1 = (0, 0, 0), P2 = (0, 0, 1/2) e P3 = (0, 0, 1) sono vertici del
poliedro.
In questo esempio la dimensione n è pari a 3 e il numero dei vincoli m è pari a 5.
Riscrivendo i primi due vincoli nella forma di disuguaglianza di minore o uguale,
la matrice A dei coefficienti delle disuguaglianze che descrivono il poliedro è
1 2 2
 
1 4 2
 
A= −1 0 0 

 0 −1 0 
0 0 −1
Convessità 25

Per ogni punto dato, dopo aver verificato l’appartenenza del punto al poliedro,
si deve verificare se esistono tre vincoli attivi in quel punto linearmente indipen-
denti.
Nel punto P1 = (0, 0, 0) (che appartiene al poliedro) sono attivi il terzo, il quarto
e il quinto vincolo e quindi I(P1 ) = {3, 4, 5} e poiché le righe aT3 , aT4 e aT5 della
matrice A sono linearmente indipendenti, il punto P1 è vertice del poliedro.
Nel punto P2 = (0, 0, 1/2) (che appartiene al poliedro) sono attivi solamente due
vincoli (il terzo e il quarto) e quindi il punto P2 non può essere un vertice del
poliedro.
Nel punto P3 = (0, 0, 1) (che appartiene al poliedro) si hanno tre vincoli attivi;
in particolare risulta I(P3 ) = {1, 3, 4} e le corrispondenti righe aT1 , aT3 e aT4 della
matrice A sono linearmente indipendenti e quindi il punto P3 è un vertice del
poliedro.

Dalla definizione discendono in modo immediato due risultati. Il primo è il


seguente e verrà poi approfondito nel Teorema 4.30

Corollario 4.26. Sia dato un poliedro P = {x ∈ IRn | Ax ≤ b}. Se la matrice


A ∈ IRm×n ha un numero di righe linearmente indipendenti minore di n, allora
P non ha vertici. In particolare se m < n allora P non ha vertici.

Il secondo risultato riguarda il numero dei vertici e conferma il fatto intuitivo


che questo numero è sempre finito.

Corollario 4.27. Un poliedro P = {x ∈ IRn | Ax ≤ b} ha al piú un numero


finito di vertici.

Dimostrazione. Dalla Definizione 4.25 (b), abbiamo che ogni vertice deriva da
un sistema di equazioni a rango n “estratto” dal sistema Ax ≤ b. Ora, poiché tali
sistemi sono al più tanti quanti i sottoinsiemi distinti di n righe della matrice A,
m!
abbiamo che un poliedro P = {x ∈ IRn : Ax ≤ b} ha al più vertici. 
n!(m − n)!
La definizione stessa suggerisce un metodo per calcolare i vertici di un poliedro.
La procedura può essere sinteticamente e informalmente essere descritta nel
seguente modo: Si esaminano a uno a uno tutti i sistemi di n equazioni che
si possono ottenere considerando n delle disequazioni del sistema che definisce il
poliedro, prese come equazioni. Per ognuno di questi sistemi si verifica il rango.
Se il rango è minore di n si passa ad esaminare un altro sistema, altrimenti
si calcola la soluzione (unica) del sistema. Se questo soluzione soddisfa tutte le
26 Capitolo 4.

disequazioni del poliedro (cioè se è ammissibile) allora è un vertice, altrimenti


no. Una volta compiute le verifiche indicate per ogni possibile sistema, si sono
ottenuti ovviamente solo dei vertici. Ma qualunque vertice deve essere individu-
ato da questa procedura. Infatti, se x̄ è un vertice, allora è soluzione unica del
sistema ai (x) T = bi , i ∈ I(x̄). Ma questo vuol dire che il rango di questo sistema
è n e che quindi esistono n equazioni tra le I(x̄) che sono linearmente indipen-
denti; esiste cioè un insieme I˜ ⊆ I(x̄) di n equazioni di rango n che hanno x̄
come unica soluzione. Quando nella procedura per il calcolo dei vertici si arriva
a considerare il sistema formato da queste I˜ equazioni, la procedura non potrà
che generare x̄ come vertice.
Tutto quanto appena detto è illustrata nel seguente esempio.

Example 4.13: Determinare i vertici del poliedro descritto dalle disuguaglianze


−3x1 + 2x2 ≤ 30
−2x1 + x2 ≤ 12
−x1 ≤ 0
−x2 ≤ 0
e rappresentarlo geometricamente su un sistema di assi cartesiani Ox1 x2 .
Si osservi innanzitutto che in questo esempio la dimensione n è pari a 2 e
il numero dei vincoli m pari a 4. Si devono determinare tutti i possibili sis-
temi di 2 equazioni  tra le 3x1 − 2x2 = −30, 2x1 − x2 = −12, x1 = 0, x2 = 0,
4
che sono si sono = 6. Si osservi che in alcuni casi abbiamo cambiato per
2
comodità i segni equazioni, questo ovviamente non comporta alcuna differenza
in quanto né la soluzione né il rango dei sistemi di equazioni che consideriamo
vengono in questo modo cambiati. Per ogni punto cosı̀ ottenuto si deve verificare
innanzitutto l’appartenenza del punto al poliedro, e poi, affinché sia un vertice,
l’indipendenza lineare dei vincoli attivi in quel punto.
(
3x1 − 2x2 = −30
1. Il sistema corrispondente al primo e al secondo vincolo
2x1 − x2 = −12
ha come unica soluzione il punto P1 = (6, 24) che si verifica immediatamente
appartenere al poliedro; in questo punto ovviamente risultano attivi il primo
e il secondo vincolo e quindi I(P1 ) = {1, 2} e poiché i vettori aT1 = (3, − 2) e
aT2 = (2, − 1) corrispondenti a questi due vincoli sono linearmente indipen-
denti, allora il punto P1 è un vertice del poliedro.
Convessità 27

(
3x1 − 2x2 = −30
2. Il sistema corrispondente al primo e al terzo vincolo ha
x1 = 0
come unica(soluzione il punto P2 = (0, 15) che non appartiene al poliedro.
x1 − 2x2 = −30
3. Il sistema corrispondente al primo e al quarto vincolo ha
x2 = 0
come unica(soluzione il punto P3 = (−10, 0) che non appartiene al poliedro.
2x1 − x2 = −12
4. Il sistema corrispondente al secondo e al terzo vincolo
x1 = 0
ha come unica soluzione il punto P4 = (0, 12) che si verifica immediatamente
appartenere al poliedro; in questo punto ovviamente risultano attivi il secondo
e il terzo vincolo e quindi I(P4 ) = {2, 3} e poiché i vettori aT2 = (2, − 1) e
aT3 = (1, 0) corrispondenti a questi due vincoli sono linearmente indipendenti,
allora il punto
( P4 è un vertice del poliedro.
2x1 − x2 = −12
5. Il sistema corrispondente al secondo e al quarto vincolo
x2 = 0
ha come unica
( soluzione il punto P5 = (−6, 0) che non appartiene al poliedro.
x1 = 0
6. Il sistema corrispondente al terzo e al quarto vincolo ha come
x2 = 0
unica soluzione il punto P6 = (0, 0) che si verifica immediatamente essere
appartenente al poliedro; in questo punto ovviamente risultano attivi il terzo
e il quarto vincolo e quindi I(P6 ) = {3, 4} e poiché i vettori aT3 = (1, 0) e
aT4 = (0, 1) corrispondenti a questi due vincoli sono linearmente indipendenti,
allora il punto P6 è un vertice del poliedro.

La rappresentazione geometrica di questo poliedro è riportata in Figura 4.8.

Ecco un altro esempio della stessa procedura.

Example 4.14: Determinare i vertici del poliedro descritto dalle seguenti disug-
uaglianze


 x1 + 2x2 + x3 ≤ 3


3x − x + x ≤ 2
1 2 3

2x
 1

 + x 2 + x3 ≤3

4x1 + x2 + 2x3 ≤ 4.

28 Capitolo 4.

Figure 4.8 Poliedro dell’Esempio 4.13

In questo caso si ha n = 3 e m = 4 e quindi si devono determinare punti del


poliedro in cui
 sono attivi tre vincoli linearmente indipendenti. Si devono quindi
4
considerare = 4 sistemi di equazioni in tre variabili:
3
1. il sistema ottenuto dai primi tre vincoli ha come unica soluzione il punto
P1 (1, 1, 0) che non è ammissibile;
2. si consideri ora il sistema ottenuto dal primo, dal secondo e dal quarto vincolo;
la matrice dei coefficienti di questo sistema ha rango 2 in quanto i tre vincoli
considerati (il primo, il secondo e il quarto) non sono linearmente indipendenti
(il vettore corrispondente al quarto vincolo si può ottenere come somma dei
Convessità 29

vettori corrispondenti al primo e al secondo vincolo). Quindi non si può avere


un vertice.
3. il sistema ottenuto dal primo, dal terzo e dal quarto vincolo ha come unica
soluzione il punto P2 = (2, 2, −3) che appartiene al poliedro e poiché i tre
vincoli attivi in P3 sono linearmente indipendenti, P2 è un vertice del poliedro.
4. il sistema ottenuto dal secondo, dal terzo e dal quarto vincolo ha come unica
soluzione il punto P3 = (3, 2, −5) che appartiene al poliedro e poiché i tre
vincoli attivi in P3 sono linearmente indipendenti, P3 è un vertice del poliedro.

Dovrebbe essere a questo punto chiaro che se nella definizione del poliedro com-
paiono dei vincoli di ≥ non è veramente necessario riscriverli come ≤. Tanto sia
nella verifica del fatto che un punto sia un vertice o meno sia nel calcolo di tutti
i vertici, quello che alla fine conta sono il rango di certi sistemi e l’ammissibilità,
e questo scopo il fatto di aver riscritto una disuguaglianza cambiando di segno,
non cambia nulla.
Se invece tra i vincoli che descrivono un poliedro è presente un vincolo di
uguaglianza, si può facilmente verificare che nella determinazione dei vertici ci
si può limitare a considerare solo i sistemi che contengono questo vincolo di
uguaglianza, facendo diminuire considerevolmente il numero dei sistemi da pren-
dere in considerazione. L’esempio che segue mostra una situazione di questo tipo.

Example 4.15: Calcolare tutti i vertici del seguente poliedro:


2x1 − x2 + x3 ≤ 4
x1 − x3 = 1
x ≥ 0.
Bisogna analizzare tutti i possibili sistemi di tre equazioni “estraibili” dal sistema
dato, che ha cinque vincoli. Riportiamo il sistema per esteso:
2x1 − x2 + x3 ≤ 4
x1 − x3 = 1
x1 ≥0
x2 ≥0
x3 ≥ 0.
Per ogni sistema bisogna preliminarmente verificare che il rango sia pari a n, cioè
a 3. Se il rango è 3 si calcola l’unica soluzione del sistema. Se questa appartiene
al poliedro (cioè se soddisfa tutti i vincoli che definiscono il poliedro) si ha un
30 Capitolo 4.

vertice del poliedro. Siccome è presente un vincolo di uguaglianza, ci si può


limitare ad analizzare solo i sistemi che contengono il vincolo di uguaglianza.
I vertici sono 2:
v1 = (5/3, 0, 2/3)T ,
corrispondente al sistema formato dal primo, secondo e quarto vincolo e
v2 = (1, 0, 0)T ,
corrispondente al sistema formato dal secondo, quarto e quinto vincolo.
Per quanto riguarda gli altri sistemi “estraibili” risulta che per il sistema formato
dai vincoli
r primo, secondo e terzo: il rango è 3 ma la soluzione corrispondente non è
ammissibile;
r primo, secondo e quinto: il rango è 3 ma la soluzione corrispondente non è
ammissibile;
r secondo, terzo e quarto: il rango è 3 ma la soluzione corrispondente non è
ammissibile;
r secondo, terzo e quinto: il rango è minore di tre.

Qualora il sistema contenga più di un vincolo di uguaglianza non è difficile verifi-


care che se questi vincoli sono linearmente indipendenti nella determinazione dei
vertici ci si può limitare a considerare solo i sistemi che contengono tutti questi
vincoli di uguaglianza. Comunque ricordiamo che in casi reali non capita mai di
dover calcolare tutti vertici di un poliedro e che nel dubbio non è mai sbagliato
riscrivere il sistema come Ax ≤ b e applicare le procedure già viste.

Quand’è che un poliedro ha almeno un vertice?

Come è facile osservare, non tutti i poliedri hanno almeno un vertice. Un con-
tro esempio banale di poliedro che non ha vertici è un semispazio in IRn con
n > 1. Se il rango della matrice A è k, e k è minore di n, allora il poliedro
P = {x ∈ IRn | Ax ≤ b} non ha vertici (vedi il Corollario 4.26). Se infatti la car-
dinalità dell’insieme più grande di righe della matrice A linearmente indipendenti
è k < n, non potremo sicuramente trovare un punto in cui il rango dei vincoli
attivi è n, perché questo vorrebbe dire che il rango della matrice è n. Risulta che
questa condizione è necessaria è sufficiente per affermare che il poliedro non abbia
vertici. La parte rimanente di questo paragrafo è dedicata alla dimostrazione di
questa affermazione. In effetti non solo dimostreremo che un un poliedro P non
Convessità 31

Figure 4.9 (a) Retta passante per x̄ e direzione d, Semiretta di origine x̄ e direzione d

vuoto non ha vertice se e solo se il rango della matrice A è minore di n, ma


anche che questa condizione è a sua volta equivalente al fatto che il poliedro non
contenga rette. Questo ulteriore punto di vista, prettamente geometrico è molto
importante è verrà poi utilizzato nel seguito.
Ricordiamo che una retta nello spazio può essere descritta in vari modi. Il più
adatto ai nostri scopi è quello di dare una descrizione parametrica dei punti di
una retta, che è identificata come “retta che passa per un punto assegnato x̄ è
che ha una certa direzione d non nulla”.

Definizione 4.28. Sia dato un punto x̄ ∈ IRn e una vettore (“direzione”) d ∈


IRn diverso da zero. La retta che passa per x̄ e ha direzione d è l’insieme
R(x̄, d) = {x ∈ IRn : x = x̄ + λd, per un qualche λ ∈ IR}
La semiretta di origine x̄ e direzione d ∈ IRn (con d 6= 0) è invece l’insieme
S(x̄, d) = {x ∈ IRn : x = x̄ + λd, per un qualche λ ≥ 0}.

Si veda la Figura 4.9 per un’illustrazione di questa definizione.


Quindi, un poliedro P contiene una retta se esiste un punto x̄ ∈ P e una
direzione d diversa da zero tale che la retta che passa per x̄ e ha direzione d è
tutta contenuta in P . Al fine di dimostrare il teorema sull’esistenza dei vertici,
abbiamo bisogno del seguente risultato preliminare.

Lemma 4.29. Sia dato il poliedro P = {x ∈ IRn | Ax ≤ b} e un punto x̄ ∈ P .


Se x̄ non è un vertice di P e P non contiene rette allora esiste una direzione
d 6= 0 tale che:
32 Capitolo 4.

1. Esiste un punto x̃ del poliedro che giace sulla retta R(x̄, d) tale che in x̃ sono
attivi tutti i vincoli attivi in x̄ e almeno un ulteriore vincolo;
2. posso prendere λ̄ > 0 abbastanza piccolo da far sı̀ che tutti i punti del tipo
x̄ + λd, per λ ∈ [−λ̄, λ̄] appartengono a P .

Dimostrazione. Siccome il punto x̄ non è un vertice, il rango dei vincoli attivi


in x̄ è k e k < n. Equivalentemente, questo vuol dire che il sistema omogeneo

aTi d = 0, per ogni i ∈ I(x̄) (4.13)


ammette una soluzione d diversa da 0. Sia allora d una tale soluzione e conside-
riamo al retta R(x̄, d). Per la (4.13), per ogni i ∈ I(x̄) si ha
aTi (x̄ + λd) = aTi x̄ + λaTi d = bi .
Questo mostra che in tutti i punti della retta R(x̄, d)) i vincoli che sono attivi in
x̄ restano attivi.
Poiché per ogni vincolo non attivo in x̄, cioè per ogni i 6∈ I(x̄) si ha
aTi x̄ > bi ,
allora, per continuità, esiste λ̄ > 0 sufficientemente piccolo tale che i punti
x̄ + λd soddisfano la aTi (x̄ + λd ≤ bi per ogni i 6∈ I(x̄), se λ ∈ [λ̄, λ̄]. Questi fatti
dimostrano l’affermazione 2. Completiamo ora la dimostrazione dell’affermazione
1. Siccome la retta R(x̄, d) non è interamente contenuta in P , per qualche valore
di λ dovrà succedere che qualche vincolo che definisce il poliedro non sia soddis-
fatto. Ovviamente, per quanto detto prima si tratta di uno dei vincoli non attivi
in x̄, ché quelli attivi in x̄ sono soddisfatti (come uguaglianza) per ogni valore di
λ. È del tutto intuitivo quindi che deve esistere un punto x̃ sulla retta R(x̄, d) in
cui la retta “colpisce” uno dei vincoli, diciamo il j-esimo, non attivi in x̄ e che se
si prosegue lungo la retta si esce dal poliedro. In questo punto x̃ sono attivi tutti
i vincoli I(x̄) e anche il j-esimo, e questo dimostra il punto 1. Volendo essere più
precisi, possiamo procedere come segue. Consideriamo i punti della retta R(x̄, d).
Il punto generico della retta appartiene a P se
aiT (x̄ + λd) ≤ bi , ∀i 6∈ I(x̄)
(ricordiamo ancora una volta che i vincoli in I(x̄) sono sempre soddisfatti per
qualunque valore di λ). Per ogni i sono possibili tre casi:
1. aiT d = 0, nel qual caso aiT (x̄ + λd) ≤ bi per qualunque λ
Convessità 33

2. aiT d > 0, nel qual caso aiT (x̄ + λd) ≤ bi per ogni λ con
bi − aiT x̄
λ ≤ λi = > 0;
aiT d
3. aiT d < 0, nel qual caso aiT (x̄ + λd) ≤ bi per ogni λ con
bi − aiT x̄
λ ≥ λi = < 0.
aiT d
Siccome la retta non è tutta contenuta in P per almeno un i si presenta o il caso
2 o quello 3. Supponiamo che ci sia almeno un i per cui si verifichi il caso 2. Sia j
l’indice in corrispondenza a cui si ottiene il più piccolo λi che soddisfa il caso 2.
Allora è chiaro, in base alle considerazioni fatte finora che il punto x̃ = x̄ + λj d
è ammissibile e in x̃ sono attivi tutti i vincoli attivi in x̄ (come in tutti i punti
della retta R(x̄, d) e il vincolo j-esimo (per verifica diretta). Se non c’è nessun i
per cui si verifichi il caso 2, allora si procede analogamente considerando i vincoli
che soddisfano il caso 3. Pasta prendere x̃ = x̄ + λr d dove però questa volta r è
l’indice in corrispondenza a cui si ottiene il più grande λi che verifica il caso 3.
Per dimostrare il punto 2 basta osservare che dalla discussione precedente
risulta che basta prendere λ̄ uguale al più piccolo tra λj e |λk |. .
Notiamo che nel teorema seguente, il risultato principale riguardo all’esistenza
dei vertici, utilizziamo solo il punto 1 del Lemma 4.29. Il punto 2 sarà impiegato
successivamente.

Teorema 4.30. Sia P = {x ∈ IRn | Ax ≤ b} un poliedro non vuoto. Le


seguenti tre affermazioni sono equivalenti.

(a) Il rango di A è minore di n;


(b) P non ha vertici;
(c) P contiene una retta.

Dimostrazione.
(a) ⇒ (b). Come già osservato, poiché i vincoli attivi sono un sottoinsieme dei
vincoli che definiscono il poliedro, il rango dei vincoli attivi è minore o uguale a
quello della matrice A. Quindi il rango dei vincoli attivi è sempre minore di n e,
per definizione, nessun punto può essere un vertice.
(b) ⇒ (c). Supponiamo ora che il poliedro P non abbia vertici e mostriamo
che deve contenere una retta. Sia x̄ un punto appartenente al poliedro P e sup-
poniamo al contrario che P non contenga rette. Per il Lemma 4.29 possiamo
trovare un punto x̃ ∈ P in cui sono attivi tutti i vincoli attivi in x̄ e almeno
un ulteriore vincolo. Siccome anche x̃ non è un vertice (perché non ci sono ver-
34 Capitolo 4.

tici per ipotesi) possiamo ripetere la procedura Per induzione abbiamo quindi
che posso trovare un punto x̂ in cui sono attivi tutti i vincoli che definiscono il
poliedro P . Ma se supponiamo che anche x̂ non sia un vertice e che P non con-
tenga rette, un ulteriore applicazione del Lemma 4.29 porta chiaramente a un
assurdo, perché dovremmo trovare un punto in cui è attivo un ulteriore vincolo,
cosa che è chiaramente impossibile.
(c) ⇒ (a). Supponiamo che P contenga una retta; supponiamo cioè che esista
un punto x̄ ∈ P e una direzione d ∈ IRn diversa da zero, tale che il punto x̄ +
λd appartenga a P per ogni valore reale del parametro λ. È facile vedere che
deve essere Ad = 0. Supponiamo infatti che per assurdo esista un indice i per
cui aiT d 6= 0. Può risultare o aiT d > 0 o aiT d < 0. Consideriamo il primo caso.
Siccome il punto x̄ + λd appartiene a P per ogni valore reale del parametro λ
per ipotesi, deve risultare in particolare
aiT (x̄ + λd) ≤ bi ∀λ (4.14)
per ogni valore positivo di λ comunque grande. Ma abbiamo anche
lim [aiT (x̄ + λd)] = aiT x̄ + lim [λaiT d)] = +∞
λ→+∞ λ→+∞

perché aiT d > 0 e questo contraddice la (4.14). In maniera analoga si arriva a


una contraddizione se si assume aiT d < 0 (basta prendere λ che sufficientemente
negativo e ripetere i passi esposti sopra). Questa contraddizione prova che per
nessun i può risultare aiT d 6= 0 e quindi che Ad = 0. Ma se il sistema omogeneo
Ad = 0 ammette la soluzione non banale d questo vuol dire che la matrice A ha
rango minore di n. 

4.6 Esercizi

1. Dire quali dei seguenti insiemi sono convessi


a. {x ∈ IR2 : 0 ≤ x1 ≤ 1, −1 ≤ x2 ≤ 3};
b. {x ∈ IR2 : 0 ≤ x1 ≤ 1, −1 ≤ x2 };
c. L’unione dei due punti (1, 0) e (0, 1);
d. L’insieme di tutti i punti in IR3 che hanno la prima componente nulla;
e. {x ∈ IR2 : 1 ≤ x1 ≤ 2, x2 ≤ log x)1};
f. {x ∈ IR2 : 1 ≤ x1 ≤ 2, x2 ≥ log x)1};
g. In IR2 l’insieme di tutti i punti la cui prima componente è un numero
razionale;
h. {x ∈ IR3 : x21 + x22 ≤ x3 };
i. Nel piano, la corona circolare compresa tra due circonferenze di centro
nell’origine e raggio 1 e 2;
Convessità 35

j. In IR3 un cubo senza i suoi 6 lati.


2. Dato il punto (5/2, 1/2, 3/2) esprimetelo come combinazione convessa dei
punti (2, −1, 3) e (1, 1, 1) (trovare cioè il numero β ∈ [0, 1] che permette di
scrivere (5/2, 1/2, 3/2) = β(2, −1, 3) + (1 − β)(1, 1, 1).
3. Dato il punto (5/2, 1/2, 3/2) mostrate che non è possibile esprimerlo come
combinazione convessa dei punti (2, −1, −3) e (1, 1, 1) (Suggerimento: basta
osservare bene le ultime componenti dei tre vettori... In maniera più sistem-
atica si può scrivere l’equazione della retta che passa per i punti (2, −1, −3) e
(1, 1, 1) e verificare che il punto (5/2, 1/2, 3/2) non vi appartiene).
4. Determinare se le regioni ammissibili dei problemi dei paragrafi 2.2-2.12 sono
convesse.
5. Con riferimento a quanto detto nelle Osservazioni del paragrafo 2.4, mostrare
che la regione definita dai seguenti vincoli
πr2 h ≥ V0
8r ≤ D0 ,
6r ≤ D0 ,
h ≤ D0
r ≥ 0, h ≥ 0,
è convessa.
6. Sia C un insieme convesso in IRn , A una matrice m × n e α un numero.
Mostrare che i seguenti due insiemi sono convessi
{y ∈ IRm : y = Ax, x ∈ C}

{y ∈ IRn : y = αx, x ∈ C}.


7. Mostrare che l’insieme di soluzioni di un sistema di equazioni lineari è un
insieme convesso (Suggerimento: volendo si può utilizzare l’esercizio prece-
dente, ma si può anche procedere direttamente usando la definizione).
8.* Provare che un insieme C in IRn è convesso se e solo se per ogni intero positivo
k è vero che x1 , . . . , xk ∈ C implica che
k
X X
βi xi ∈ C, ∀βi ≥ 0, tali che i = 1k βi = 1.
i=1

(Suggerimento: procedere per induzione).


9. Per ogni insieme rappresentato nella Figura 4.10, dire se si tratta di un
insieme convesso, un poliedro, un insieme limitato.
10. Spiega quali delle seguenti affermazioni sono corrette, giustificando le risposte.
a. (0, 0, 0)T ∪ (1, 1, 1)T è un poliedro in IR3
36 Capitolo 4.

Figure 4.10 Determinare se gli insiemi sono convessi, poliedrali, limitati

b. La sfera di raggio 4 e centro nell’origine è un poliedro


c. Esistono poliedri che hanno un solo vertice
d. Non esistono poliedri che abbiano infiniti vertici
e. Un poliedro è l’insieme di soluzioni di un sistema di equazioni e disequazioni
lineari.
f. L’insieme S = {x ∈ IR2 : x21 + x22 ≤ 1, x1 ≥ 0, x2 ≥ 0} è un poliedro in IR2
g. Esistono poliedri che non hanno vertici
11. Sia dato il seguente poliedro
−2x1 + x2 ≤4
− 41 x1 + x2 ≥ −1
x1 + 2x2 ≤ 11
x1 ≥0
x2 ≥0
Determina quali delle seguenti affermazioni sono corrette.
a. il punto (1, 0)T è ammissibile.
Convessità 37

b. il punto (1, 0)T è un vertice.


c. nel punto (1, 0)T sono attivi due vincoli.
d. nel punto (1, 0)T è attivo un solo vincolo.
12. Calcola tutti i vertici del poliedro dell’esercizio precedente.
13. Calcola tutti i vertici dei seguenti tre poliedri
−2x1 + x2 − x3 ≤ 2 −2x1 + x2 − x3 = 2 2x1 − x2 + x3 = 6
8x1 − x2 + x3 ≥ 6 6x1 − x2 + x3 ≤ 6
(a) (b) (c) x1 − 0.5x2 ≤5
x1 ≥0 x1 ≥0
x2 ≤0 x3 ≥ 0 x ≥ 0.
14. Spiega quali delle seguenti affermazioni sono corrette.
a. (0, 0, 0)T ∪ (1, 1, 1)T è un poliedro in IR3
b. La sfera di raggio 4 e centro nell’origine è un poliedro
c. Esistono poliedri che hanno un solo vertice
d. Non esistono poliedri che abbiano infiniti vertici
e. Un poliedro è l’insieme di soluzioni di un sistema di equazioni e disequazioni
lineari.
f. L’insieme S = {x ∈ IR2 : x21 + x22 ≤ 1, x1 ≥ 0, x2 ≥ 0} è un poliedro in IR2
g. Esistono poliedri che non hanno vertici
15. Sia dato il seguente poliedro
−2x1 + x2 ≤4
− 41 x1 + x2 ≥ −1
x1 + 2x2 ≤ 11
x1 ≥0
x2 ≥0
Determina quali delle seguenti affermazioni sono corrette.
a. il punto (1, 0)T è ammissibile.
b. il punto (1, 0)T è un vertice.
c. nel punto (1, 0)T sono attivi due vincoli.
d. nel punto (1, 0)T è attivo un solo vincolo.
16. Calcola tutti i vertici del poliedro dell’esercizio precedente.
17. Calcola tutti i vertici dei seguenti tre poliedri
−2x1 + x2 − x3 ≤ 2 −2x1 + x2 − x3 = 2 2x1 − x2 + x3 = 6
8x1 − x2 + x3 ≥ 6 6x1 − x2 + x3 ≤ 6
(a) (b) (c) x1 − 0.5x2 ≤5
x1 ≥0 x1 ≥0
x2 ≤0 x3 ≥ 0 x ≥ 0.
38 Capitolo 4.

18. Sia dato il poliedro definito dal sistema


2x1 + x2 − x3 ≤ 1
αx1 + x3 ≤ 5
−x1 + 2x2 + (1/2)x3 ≤ −1/2
x1 ≥ 0
x2 ≥ 0
x3 ≥ 0
Dire quali delle seguenti affermazioni sono corrette
a. Se α = 1, (1, 0, 1)T è un vertice
b. Se α = 1, (1/2, 0, 0)T è un vertice
c. Se α = 0, (3, 0, 5)T è un vertice
d. Se α = −1, (−1, 0, 0)T è un vertice.
19. Si consideri il poliedro descritto dal seguente sistema
−x1 + x2 + x3 + x4 = 1
x1 + x2 + 2x3 − x5 = 4
x1 + 2x2 + 3x3 + x6 = 6
xi ≥ 0, i = 1, . . . , 5
Dire quali delle seguenti affermazioni sono corrette.
a. Il punto (1, 1, 1, 0, 0, 0)T è vertice.
b. le ultime tre colonne della matrice costituiscono una base ammissibile.
c. Il punto (0, 0, 0, 1, −4, 6)T è un vertice.
d. le ultime tre colonne della matrice costituiscono una base.
20. Sia dato il seguente poliedro
2x1 −x2 +x3 ≥ −τ
x1 +x2 −x3 ≥0
x1 ≥1
x1 +2x4 ≥ 1
3x1 +2x3 ≥ 4+τ
Dire quali delle seguenti affermazioni sono vere
a. Se τ = 1, il punto (1, 0, 1, 0) T è un vertice
b. Se τ = −3, il punto (1, 1, 2, 0) T è un vertice
c. Se τ = −3, il punto (1, −1, 0, 0) T è un vertice
d. Per nessun valore di τ il punto (0, 1, 0, 1) è un vertice.
21. Determina quali delle seguenti funzioni sono convesse, quali concave e quali
non sono né convesse né concave.
Convessità 39

a. x21 + 2x1 x2 − 10x)1 + 5x2 ;


b. x1 e−(x1 +x2 ) ;
c. −x21 − 5x22 + 2x1 x2 + 10x1 − 10x2 ;
d. x1 x2 + 2x21 + x22 + 2x23 − 6x1 x2 ;
e. −x21 − 3x22 − 2x23 + 4x1 x2 + 2x1 x3 + 4x2 x3 .
22. Determinare se la funzione
2(x2 − x21 )2 − 10x1 + 20x2
è convessa sull’insieme {x : −1 ≤ x1 ≤ 1, −1 ≤ x2 ≤ 1}. Studiare quindi la
convessità sull’insieme {x : 0 ≤ x1 ≤ 1, −1 ≤ x2 ≤ 0}.
23.* Mostrate che se g(x) è una funzione concava su C (convesso) e g(x) > 0 per
ogni x ∈ C, allora 1/g(x) è un funzione convessa su C. (Suggerimento: usare
la definizione di convessità, concavità e utilizzare il fatto che la funzione 1/t,
per t > 0, è convessa e decrescente.)
24. Per ogni funzione 2 volte continuamente differenziabile nell’Esempio 4.3 veri-
ficare che la matrice hessiana è semidefinita positiva (in questo caso, visto che
si tratta di funzioni a una variabile, questo vuol dire verificare che la derivata
seconda è non negativa).
25.* Sia data la parabola di equazione y = x2 . Per ogni x ∈ IR, sia T (x) la retta
tangente alla parabola nel punto x. Sapete “vedere” a cosa corrisponde la
funzione maxx∈IR {T (x)}? (Suggerimento:aiutatevi con un disegno).
26. Provare che l’insieme di soluzioni di un problema MIN(C, f ) convesso è con-
vesso (Suggerimento: Si sfrutti l’esercizio 7 del Capitolo 3).
27. Il Mar Verde bagna le coste del felice regno di Pescilandia. Le acque del
Mar Verde sono storicamente pescosissime, ma una pesca indiscriminata sta
minando l’equilibrio ecologico e i pesci stanno scomparendo. Il Re di Pescilan-
dia vuole intervenire e commissiona uno studio. Viene stabilito che la popo-
lazione attuale è P e che se alla fine di una qualunque stagione di pesca la
popolazione è y, all’inizio della stagione successiva la popolazione è c(y), dove
c : IR+ → IR+ rappresenta quindi la funzione di crescita della popolazione di
pesci. Se in una stagione i viene pescata una quantità xi di pesce, il profitto
globale per gli abitanti del regno è f (xi ). È chiaro che una pesca molto intensa
in un periodo darà un profitto molto alto, ma farà diminuire i profitti nelle
stagioni successive, a causa della diminuzione della popolazione di pesci, e
viceversa. Formulate il problema che permette di massimizzare i profitti glob-
ali nelle prossime 5 stagioni di pesca, con il vincolo che al termine della quinta
stagione di pesca la popolazione sia 2P .

Potrebbero piacerti anche