Sei sulla pagina 1di 24

WORKING PAPER

No 767
Società italiana di
novembre 2020
economia pubblica

 
IL COEFFICIENTE DI GINI: LE ORIGINI

 
Simone Pellegrino,  Università di Torino

JEL Classification:  D63


Keywords: Indice di Gini, Curva di Lorenz

società italiana di economia pubblica

c/o dipartimento di scienze politiche e sociali – Università di Pavia


Il coefficiente di Gini: le origini
Simone Pellegrino∗

25 novembre 2020

Sommario

Il saggio ripercorre le tappe fondamentali, e analizza le motivazioni teoriche, che hanno influito sulla
definizione dell’indice di Gini cosı̀ come viene applicato ai giorni nostri. In particolare, partendo
dal concetto di differenza media semplice proposta da Corrado Gini nel 1912 per le applicazioni
in ambito statistico ed economico, si evidenziano le diversità tra il rapporto di concentrazione
proposto dallo stesso Gini nel 1914 e l’indice di Gini usualmente utilizzato oggi, alla luce della sua
interpretazione geometrica con la spezzata di Lorenz proposta da Gaetano Pietra nel 1915.

JEL-Codes: D63.
Keywords : Indice di Gini, Curva di Lorenz.

∗ Dipartimento di Scienze economico-sociali e matematico-statistiche – ESOMAS, Università degli Studi di Torino.


ORCID: 0000-0001-8372-1054. Ufficio: 0039 011 670 6060. Email: simone.pellegrino@unito.it. Indirizzo: Corso Unione
Sovietica 218bis, 10134, Torino (IT).

1
1. Introduzione
L’indice di Gini è da oltre un secolo il più usato e studiato indice per valutare la diseguaglianza dei
redditi e della ricchezza. Le sue applicazioni sono vastissime, mentre è sterminata la letteratura che si
è susseguita nel corso dei decenni (Giorgi, 1990; Xu, 2003).
È quantomeno curioso osservare che in molti articoli scientifici internazionali, anche
immediatamente successivi alle pubblicazioni di Corrado Gini, nella bibliografia non si trovano i
riferimenti agli articoli originari. Questo saggio si pone l’obiettivo di ricostruire l’origine storica
dell’indice di Gini, prendendo in considerazione due lavori fondamentali. Il primo è il pionieristico
lavoro di Corrado Gini del 1914, mentre il secondo è la nota pubblicata da Gaetano Pietra l’anno
successivo. Questi due articoli fanno capire nel dettaglio quali siano stati i passaggi e le motivazioni
teoriche da cui deriva la definizione dell’indice di Gini G cosı̀ come viene applicato ai giorni nostri. In
particolare, Gini (1914) propone il rapporto di concentrazione R e cerca di dimostrarne il legame con
la curva di Lorenz; legame che è poi approfondito da Gaetano Pietra (1915).
In estrema sintesi, questo saggio ripercorre i seguenti punti.
Nel 1912 Corrado Gini propone il concetto di differenza media semplice (con e senza ripetizione)
come indice di variabilità di caratteri quantitativi, che diventa ben presto un indicatore fondamentale
per gli studi di statistica e di economia. L’obiettivo del suo lavoro è quello di porre “in luce come i
procedimenti finora seguiti per misurare la variabilità dei fenomeni statistici . . . non rispondano sempre
bene allo scopo che l’indagine statistica si propone.” Gini discute l’applicazione della differenza media
semplice fra le quantità osservate come indicatore che può essere preferibile, in alcuni ambiti di studio,
ad altri indicatori.1
Nel 1914, nella pubblicazione “Sulla misura della concentrazione e della variabilità dei caratteri ”,
Gini presenta tre aspetti fondamentali, che successivamente rivoluzionano il modo di studiare la
diseguaglianza dei redditi e della ricchezza, e non solo.2
In primo luogo egli propone il rapporto di concentrazione (pag. 1203-1228), da cui origina l’indice
di Gini come è applicato oggi. Esso presenta alcune peculiarità. Al denominatore si osserva la somma
delle quote cumulate di unità statistiche, mentre al numeratore la somma delle differenze tra le quote
cumulate delle unità statistiche e le quote cumulate della variabile quantitativa di cui si sta calcolando
la concentrazione. Graficamente, si può notare che tale rapporto è rappresentabile come un rapporto
tra somme di segmenti. Il rapporto di concentrazione, cosı̀ come originariamente ideato da Gini,
assume valore pari a zero in caso di distribuzione perfettamente egualitaria dei caratteri e valore pari
esattamente a uno in caso di massima concentrazione.
In secondo luogo (pag. 1229-1236), egli dedica alcune pagine per osservare che “Al rapporto, che noi
proponiamo in questa nota, come misura appropriata della concetrazione, si giunge anche perfezionando
un metodo grafico che alcuni autori, il Lorenz (1905), il Chatelain (1910), il Séailles (1910), hanno
già proposto per giudicare della maggiore o minore disuguaglianza di distribuzione della ricchezza.”
In realtà Gini, come viene evidenziato in questo saggio, non propone un confronto rigoroso tra i due
approcci, ma si limita a darne l’intuizione. Egli nota che le due metodologie (da una parte il rapporto
di concentrazione e, dall’altra, il rapporto tra l’area compresa tra la retta di equidistribuzione e la curva
di Lorenz e l’area massima) determinano lo stesso risultato quando la numerosità N delle quantità,
che misurano l’intensità di un certo carattere, diviene molto grande.
1 Già negli anni precedenti Gini (1910) aveva iniziato ad occuparsi di indici di concentrazione (Forcina and Giorgi,

2005).
2 I lettori non italiani possono leggere la traduzione in inglese di questo articolo, pubblicata nel 2005 sulla rivista

Metron (Gini, 2005).

2
Infine, nell’ultima parte (pag. 1236-1240), Gini verifica che “il rapporto di concentrazione coincide
col rapporto della differenza media [senza ripetizione] al valore massimo che questa può assumere, o
in altre parole, col rapporto della differenza media al doppio della media aritmetica del carattere.”
L’anno successivo, nel 1915, Gaetano Pietra3 affronta il legame tra il rapporto di concentrazione
proposto da Gini e il rapporto tra l’area di concentrazione osservata e l’area di concentrazione massima,
dandone una elegante interpretazione geometrica. Quest’ultima versione dell’indice, data dal rapporto
tra la differenza media con ripetizione della successione osservata e la differenza media senza ripetizione
della corrispondente successione massimante, è da più di un secolo il più usato indice di diseguaglianza.
Per la prima volta, nello stesso articolo, si trova anche la definizione dell’indice di Gini nel caso continuo4
e l’introduzione del concetto di funzione di graduazione, ovvero l’inversa della funzione di ripartizione.
Si noti infatti che la formula per il calcolo dell’indice di Gini, comunemente applicata oggi, non
N −1
varia tra zero e uno, ma tra zero e N , cosı̀ come definito da Pietra (1915). La comunità scientifica5
ha preferito quest’ultima versione dell’indice di Gini per tre ragioni principali: un po’ perché i lavori di
Corrado Gini non hanno avuto inizialmente ampia diffusione a livello internazionale,6 in quanto scritti
in lingua italiana;7 un po’ perché il rapporto di concentrazione introdotto da Gini nel 1914 non ha
una perfetta corrispondenza con la visione grafica della diseguaglianza di una successione ordinata di
caratteri come proposta da Otto Max Lorenz nel 1905 (Lorenz, 1905; Gini, 1914; Pietra, 1915); un po’
perché la letteratura internazionale si è concentrata sullo studio delle distribuzioni dei redditi e della
ricchezza nel continuo anziché nel discreto.
Il saggio è strutturato come segue. Il Sottoparagrafo 2.1 introduce il concetto di differenza
media semplice, mentre il Sottoparagrafo 2.2 evidenzia alcune peculiarità della sua origine storica.
Il Paragrafo 3 presenta il rapporto di concentrazione di Gini, mentre il Paragrafo 4 analizza il legame
tra il rapporto di concentrazione e la differenza media semplice. Successivamente, il Paragrafo 5
riprende i concetti originali della curva di Otto Max Lorenz; il Paragrafo 6 descrive la curva di
Lorenz alla luce dell’interpratazione di Corrado Gini, mentre il Paragrafo 7 la curva di Lorenz alla
luce dell’interpretazione di Gaetano Pietra. Il Paragrafo 8 conclude.

2. La differenza media semplice

2.1. La proposta negli scritti di Corrado Gini


Gini (1912) si propone di “trovare una formula che esprima la media aritmetica delle differenze
3 I lettori non italiani possono leggere la traduzione in inglese di questo articolo, pubblicata nel 2013 sulla rivista

Statitica & Applicazioni (Pietra, 2013).


4 Più di sessanta anni dopo Dorfman (1979) propone un approccio che lega il calcolo dell’indice di Gini nel continuo

e nel discreto.
5 Nel libro intitolato “Il rapporto di concentrazione di Gini”, Giorgi (1992) dedica un intero capitolo alla bibliografia

della letteratura, sottolineando come dal 1914 siano stati scritti centinaia di contributi sull’argomento, la maggior parte
dei quali a partire dagli anni ’70. Per l’esaustiva bibliografia di tutti gli scritti di Corrado Gini (827 pubblicazioni) si
rimanda a Castellano (1965). Per un racconto della sua personalità si rinvia a Giorgi (2011).
6 Per gli anni immediatamente successivi alla sua introduzione si veda Castellano (1965).
7 Lo stesso Gini (1921) replica all’articolo “Measurement of the Inequality of Income” di Dalton (1920) ringraziandolo

per aver introdotto gli scritti degli statistici italiani agli economisti internazionali e suggerendo una lettura e una
interpretazione più articolata di alcuni scritti, in particolare quelli di Czuber (1914), Gini (1914) e Pietra (1915).
Nelle parole di Gini, “The methods of Italian writers, which are explained by Mr. Dalton, are not, as a matter of
fact, comparable to his own, inasmuch as their purpose is to estimate, not the inequality of economic welfare, but the
inequality of incomes and wealth, independently of all hypotheses as to the functional relations between these quantities
and economic welfare or as to the additive character of the economic welfare of individuals.” Successivamente, “Mr.
Dalton explains these methods with precision and brevity, and Italian writers must be most grateful to him for having
directed the attention of English economists to the subject. Perhaps, however – as a supplement to Mr. Dalton’s article
– I may be permitted to draw the attention of readers of the Economic Journal to certain papers, a perusal of which,
in my opinion, is necessary to enable one to form an exact idea of the applicability and character of the methods in
question.” Dopo i già elencati riferimenti bibliografici, Gini continua dicendo “Probably these papers have escaped Mr.
Dalton’s attention owing to the difficulty of access to the publications in which they appeared.”

3
tra” N “quantità”. A tal fine considera una successione non decrescente di quantità non negative
x1 , x2 , . . . , xN −1 , xN , con xi−1 ≤ xi ∀i.
Egli osserva che la somma delle N − 1 possibili differenze tra x1 e tutte le altre quantità è

(x2 − x1 ) + (x3 − x1 ) + · · · + (xN −1 − x1 ) + (xN − x1 ) =


(x2 + x3 + · · · + xN −1 + xN ) − (N − 1)x1 = (1)
x1 + x2 + x3 + · · · + xN −1 + xN − N x1 .

Analogamente all’Eq. (1), per la modalità x2 si ottiene

(x2 − x1 ) + (x3 − x2 ) + · · · + (xN −1 − x2 ) + (xN − x2 ) =


x3 + · · · + xN −1 + xN − (N − 2)x2 + (x1 − x2 ) + (2x2 − 2x1 ) = (2)
x2 + x3 + · · · + xN −1 + xN − (N − 1)x2 + 2x2 − x1 − x2

e, per la modalità x3 ,

x3 + · · · + xN −1 + xN − (N − 2)x3 + 3x3 − x1 − x2 − x3 . (3)

E cosı̀ via fino all’ultimo valore assunto dalla successione delle N quantità:

xN − xN + N xN − x1 − x2 − · · · − xN −2 − xN −1 − xN . (4)

Sommando le N espressioni cosı̀ ottenute e riarrangiando, Gini (1912) ottiene8 una prima formula
che esprime la media aritmetica delle N (N −1) possibili differenze tra le N quantità, ovvero la differenza
media semplice senza ripetizione ∆:
N +1
2
2 X
∆= (N + 1 − 2i)(xN −i+1 − xi ). (5)
N (N − 1) i=1

La media aritmetica delle N 2 possibili differenze tra le N quantità, ovvero la differenza media
semplice con ripetizione ∆R , è invece espressa come
N +1
2
2 X
∆R = 2 (N + 1 − 2i)(xN −i+1 − xi ) (6)
N i=1

da cui si ricava
N −1
∆R = ∆. (7)
N
Si osservi che le formule originarie, le Eq. (5) e (6), sono oggi in disuso; più frequentemente,
indicando con Y la somma delle differenze in valore assoluto (De Finetti and Paciello, 1930; De Finetti,
8 Nel libro di Gini del 1912 sono successivamente discusse decine di formule alternative per il calcolo della differenza

media (per una raccolta si rinvia a Ceriani and Verme (2012) e Yitzhaki and Schechtman (2013)). Negli anni successivi
nasce il dibattito della scuola italiana di statistica sulla differenza media semplice e il rapporto di concentrazione
(Bresciani-Turroni, 1916; Ricci, 1916; Pietra, 1917, 1932; Yntema, 1933; Pietra, 1935; Castellano, 1935, 1937; Pietra,
1937) e alcuni autori si cimentano nell’individuazione di formule più efficienti e veloci per il calcolo sia della differenza
media semplice (De Finetti and Paciello, 1930; De Finetti, 1931), sia del rapporto di concentrazione (de Vergottini, 1940;
Amato, 1947; de Vergottini, 1950; Pizzetti, 1955; Fortunati, 1955, 1957; Benedetti, 1980). Quest’ultimo saggio presenta
una particolarità: come ricorda Giorgi (1990), infatti, “In anni più prossimi a noi la suddetta tematica è ripresa da
Benedetti (1980) che pone all’attenzione degli studiosi una formula generale da lui desunta agli inizi degli anni ’50 ma
non pubblicata subito per l’ostilità, come sostiene lo stesso Autore, di Gini verso tutto ciò che tende a sminuire il suo
rapporto di concentrazione facendolo sembrare un indice alla stessa stregua di tanti altri.” Da qui l’importanza, ancora
oggi, di studiare gli scritti originari degli autori italiani (Giorgi, 1990, 2005, 2014).

4
1931) (Appendice A)
N X
X N
Y = |xi − xj | (8)
i=1 j=1

si usa esplicitarle, rispettivamente, con

Y
∆= (9)
N (N − 1)

e
Y
∆R = . (10)
N2
Come lo stesso Gini (1912) osserva, “. . . lo scostamento probabile è dato da una quantità che è
superiore in valore assoluto da una metà degli scostamenti e non superata dall’altra metà”; quindi per
il calcolo di Y è sufficiente considerare le differenze che stanno sopra (o sotto) la diagonale principale,
perché la matrice delle differenze è simmetrica (Appendici B e C), da cui:

N X
X N N X
X i
Y = |xi − xj | = 2 (xi − xj ). (11)
i=1 j=1 i=1 j=1

2.2. L’origine storica


L’origine storica e l’effettiva paternità della formula della differenza media semplice merita qualche
ulteriore considerazione. Tale concetto, infatti, si ritrova già nei lavori di alcuni astronomi della
seconda metà del XXIX secolo (Jordan, 1869; von Andrae, 1869; Jordan, 1872; von Andrae, 1872;
Helmert, 1876), ma Corrado Gini propone autonomamente la definizione di differenza media semplice,
sottolineando di essere venuto a conoscenza degli articoli degli astronomi tedeschi quando il suo libro
era già praticamente terminato.
In particolare, nel paragrafo intitolato “La differenza media tra più quantità”, Gini (1912, p. 20-
23) deriva ∆ (formula 5 a pagina 22),9 ovvero la differenza media semplice senza ripetizione, e ∆R ,
ovvero la differenza media semplice con ripetizione (formula 7).10 Più avanti nella trattazione, nel
paragrafo intitolato “Degli indici di variabilità dei caratteri in alcuni tipi di seriazioni ” (pag. 49),
nella nota 2 a pagina 56, disquisendo sulle formule 76 e 77, che definiscono, in modo alternativo, ∆R e
∆, rispettivamente, lo stesso Gini osserva: “Questa formula, e quindi anche la 77 che ne discende, sono
dunque, per ora, formule empiriche. Non mi riuscı̀ infatti finora di darne una dimostrazione generale,
neppure mediante induzione matematica. I numerosi riscontri che ne ho eseguito e il fatto che . . . tali
formule si riducono ad espressioni a cui erano già giunti per altra via von Andrae ed Helmert, fanno
ritenere molto probabile la loro esattezza matematica.”
Nella nota 1 a pagina 58, Gini specifica ulteriormente: “Questo studio era completamente scritto
quando ho potuto conoscere alcune ricerche di W. Jordan, von Andrae e Helmert, che, molti anni or
sono, si sono occupati, da un punto di vista del tutto diverso,11 del calcolo della differenza media tra più
9 Al fine di non creare confusione, le formule discusse in questo saggio sono riportate tra parentesi, mentre le formule

che fanno riferimento al testo originario sono riportate senza parentesi.


10 Nello stesso paragrafo Gini introduce anche il concetto di distanza graduale, l’odierno rank di una distribuzione di

redditi.
11 “Scopo delle loro indagini era, non già di esaminare se la misura della variabilità, eseguita in base alla differenza

media, può condurre a risultati diversi da quelli ottenuti in base allo scostamento quadratico medio o allo scostamento
semplice medio, e di decidere in quali casi la misura appropriata della variabilità dei fenomeni è fornita dall’una, in
quali dalle altre costanti; ma di esaminare, nel caso particolare in cui le quantità osservate sono il risultato di rilevazioni
ugualmente plausibili di una grandezza incognita, se lo scostamento probabile, determinato indirettamente mediante la
differenza media fra le quantità osservate, risente l’influenza del numero limitato delle osservazioni più o meno dello
scostamento probabile determinato indirettamente mediante lo scostamento quadratico medio, e di decidere quindi se,
per caratterizzare la precisione delle rilevazioni, è preferibile attenersi all’uno o all’altro procedimento.”

5
quantità.” Successivamente, egli specifica il campo di indagine degli astronomi tedeschi, e sottolinea
che in questi articoli si trovano alcune delle formule da lui autonomamente ottenute.12
Una medesima cronistoria si ritrova nella nota 2 a pagina 77 di De Finetti (1931) sulla rivista
Metron, di cui all’epoca Corrado Gini era il direttore. In particolare, De Finetti osserva che gli
astronomi tedeschi si erano occupati della differenza media semplice “a proposito di una questione
di calcolo delle probabilità relativa alla teoria degli errori di osservazione.” L’autore conclude la
discussione sull’argomento affermando: “Quanto allo scopo, già accennato, di tali lavori, si comprende
facilmente che esso è ben lontano da quello dello studio statistico della variabilità, nel quale dunque,
come s’è asserito, spetta al Gini il merito d’aver introdotto la differenza media come un utile indice.”

3. Il rapporto di concentrazione
Nella pubblicazione del 1914 Corrado Gini propone subito il rapporto di concentrazione.
Considera N “quantità che misurano l’intensità di un certo carattere in” N “casi ”,
x1 , x2 , . . . , xi , . . . , xl , . . . , xN −1 , xN , ordinati in ordine non decrescente, ovvero in modo che xk−1 ≤ xk
∀k, con k = 1, 2, . . . , N . Egli poi osserva che, considerando due qualsiasi valori, i e l, di k, con i < l,
si ottiene xi ≤ xl e anche Pi
k=1 xki
Pl ≤ . (12)
k=1 xk
l

Quando l = N si ottiene invece


Pi
k=1 xk i
PN ≤ . (13)
k=1 xk N

A questo punto Gini indica con Pi il rapporto tra il numero d’ordine della i -esima quantità e il
numero totale dei casi osservati
i
Pi = (14)
N
e con Li il rapporto tra l’ammontare del carattere spettante alla parte di casi che occupano una
posizione uguale o inferiore alla i -esima e l’ammontare totale del carattere osservato:
Pi
xk
Li = Pk=1
N
. (15)
k=1 xk

Infine sottolinea “. . . che la concentrazione del carattere è tanto più forte quanto più forte, per gli ”
N −1 “valori di i, la diseguaglianza” Pi > Li . Gini (1914) presenta quindi il rapporto di concentrazione
R nel modo seguente:
PN −1
i=1(Pi − Li )
R= PN −1 (16)
i=1 Pi

specificando “. . . che la concentrazione di un carattere è tanto più forte, quanto più è piccola la parte
che, sull’ammontare totale del carattere, spetta a quella parte di casi, in cui l’intensità del carattere
non supera un certo limite.”
12 “Il Jordan aveva ritenuto che, col crescere del numero” N “delle osservazioni, il valore della differenza media

tendesse al suo limite per ” N “infinito più rapidamente che il valore dello scostamento quadratico medio; il von Andrae
invece dimostrò che la rapidità è, per il valore della differenza media, minore che per lo scostamento quadratico medio,
ma maggiore che per lo scostamento semplice medio. Credo doveroso avvertire che in questi articoli si trova già
qualcuna delle formule, a cui, del tutto indipendentemente e per vie differenti, io sono giunto in questo studio. Il von
Andrae perviene, con una dimostrazione diversa della mia, ad una formula equivalente alla 5 per la determinazione
della differenza media fra più quantità e dimostra pure la relazione 31 fra differenza quadratica media e scostamento
quadratico medio. Jordan perviene, in base a una dimostrazione non rigorosa, alla relazione 80 fra differenza media e
scostamento quadratico medio, nell’ipotesi che le quantità tendano a disporsi secondo la legge di Gauss; Andrae dà la
dimostrazione rigorosa di tale relazione ed Helmert la dimostrazione rigorosa della 79.”

6
Si noti che nell’Eq. (16), anche se ogni possibile successione ordinata presenta N valori, il
numeratore può essere convenientemente valutato solo fino a N − 1, poiché PN = 1, LN = 1, da
cui PN − LN = 0. Analogamente, anche il denominatore dell’indice di concentrazione R può essere
PN −1
valutato solo fino a N − 1, dato che PN = 1 e LN = 1. Il denominatore i=1 Pi indica dunque la
sommatoria delle differenze nel caso della massima concentrazione, ovvero una situazione in cui N − 1
unità detengono una quota nulla della somma totale del carattere e una unità detiene la totalità del
PN −1
carattere. Il numeratore i=1 (Pi − Li ) indica invece la sommatoria delle differenze nel caso della
concentrazione osservata. Il rapporto di concentrazione R assume pertanto valore nullo se le quantità
sono equidistribuite, mentre assume valore unitario se N − 1 quantità presentano un valore nullo e
solamente una unità un valore positivo.
La Tabella 1 evidenzia i passaggi per il calcolo dell’indice R per una generica successione ordinata di
PN −1
quantità non negative (3, 4, 5, 6, 7, 8, 9). In particolare, il numeratore dell’Eq. (16) è pari ai=1 (Pi −
PN −1
Li ) = 32 , mentre il denominatore a i=1 Pi = 3. Segue che R = 29 = 0.2̄.

Tabella 1: Il calcolo del rapporto di concentrazione

i xi Pi Qi Li Pi − Li
1 3 0.142857 0.071429 0.071429 0.071429
2 4 0.285714 0.095238 0.166667 0.119048
3 5 0.428571 0.119048 0.285714 0.142857
4 6 0.571429 0.142857 0.428571 0.142857
5 7 0.714286 0.166667 0.595238 0.119048
6 8 0.857143 0.190476 0.785714 0.071429
7 9 1.000000 0.214286 1.000000 0.000000
Fonte: Elaborazione personale.

Per la medesima successione, la Figura 1 offre la visione grafica in cui ogni differenza Pi − Li della
sommatoria presente al numeratore dell’Eq. (16) è rappresentata con un segmento. Considerando
l’i -esimo segmento, il suo estremo superiore è Pi , mentre quello inferiore è Li . I segmenti considerati al
denominatore della Eq. (16) non sono nient’altro che i medesimi segmenti rappresentati nella Figura
1 ma proiettati fino al valore pari a zero di ordinata. Si osservi che l’Eq. (16) è pertanto definita come
un rapporto tra somme di segmenti. I segmenti Pi − Li rappresentano, infatti, per ogni i, la distanza
tra la situazione che si otterrebbe in assenza di diseguaglianza, ovvero Pi , e la situazione osservata,
ovvero Li . La Figura 1 non si ritrova negli scritti originari di Gini, ma è utile per approfondire il
ragionamento che egli presenta con riferimento alla curva di Lorenz.

4. Il rapporto di concentrazione e la differenza media


Gini (1914, pag. 1236-1238) esamina “la relazione, in cui il rapporto di concentrazione sta con gli
indici di variabilità, che si usano per caratterizzare la distribuzione dei caratteri.” In particolare,
egli dimostra “che il rapporto di concentrazione coincide col rapporto della differenza media al valore
massimo che questa può assumere, o in altre parole, col rapporto della differenza media al doppio della
media aritmetica del carattere.” In simboli, Gini, riferendosi alla differenza media senza ripetizione ∆
(definita dall’Eq. (5)), verifica che

P N2+1
∆ i=1 (N + 1 − 2i)(xN −i+1 − xi )
R= = PN (17)
2µ (N − 1) i=1 xi

7
Figura 1: I segmenti al numeratore del rapporto di concentrazione R

1
PN
dove µ = N i=1 xi e 2µ = ∆M AX indica la differenza media semplice senza ripetizione della
successione massimante, ovvero una successione in cui tutte le modalità sono nulle (Appendice D)
fatta eccezione per una a cui sono trasferite tutte le quantità delle restanti N − 1 modalità.13
Più nello specifico, sostituendo le Eq. (14) e (15) nell’Eq. (16), Gini (1914, pag. 1208) ottiene
PN −1
2 i=1(N − i)xi
R=1− PN (18)
(N − 1) i=1 xi

che riscrive come14 PN PN −1


(N − 1) i=1xi − 2 i=1 (N − i)xi
R= PN . (19)
(N − 1) i=1 xi

Per provare l’uguaglianza tra R e 2µ , Gini osserva che è sufficiente dimostrare che il numeratore
dell’Eq. (17) e il numeratore dell’Eq. (19) sono uguali, dato che i rispettivi denominatori sono identici.
Tale dimostrazione è puntualmente fornita (Gini, 1914, pag. 1238).
13 Si ∆ ∆R
può anche dimostrare che R = ∆M AX
= , dove ∆M AX indica, similmente, la differenza media semplice
∆M
R
AX R
con ripetizione della successione massimante.
14 Si osservi che
PN N (N +1) PN −1 N (N −1) PN −1 PN −1 i
i=1 i = 2
; si ricava pertanto i=1 i = 2
e quindi i=1 Pi = i=1 N
=
1 P N −1 N (N −1) N −1
N i=1 i = 2N
= 2 . Alla luce dell’Eq. (16), l’Eq. (18) può pertanto essere anche riscritta come
N −1
2 X
R=1− Li .
N − 1 i=1
PN −1 N −1
Similmente, ricordando che i=1 Pi = 2
, dall’Eq. (16) si ricava subito
PN −1
(Pi − Li )
R = 2 i=1 .
N −1
Quest’ultima relazione evidenzia che R è pari al doppio della media aritmetica delle N − 1 differenze tra Pi e Li ,
ovvero al doppio della media aritmetica delle quote percentuali di intensità cumulata che dovrebbero essere aggiunte ad
ogni intensità cumulata osservata per ottenere l’equidistribuzione.

8
5. La curva e la spezzata di Lorenz
Otto Max Lorenz (1905) escogita15 una visione grafica16 della diseguaglianza, proponendo di
confrontare la quota cumulata Li di una variabile quantitativa17 con la quota cumulata delle frequenze
Pi , avendo ordinato tali frequenze dalla più povera alla più ricca.18 Nonostante dal punto di vista
pratico sottolinei che spesso le informazioni su redditi e ricchezza siano disponibili solo per dati
aggregati, ipotizza di avere a disposizione dati puntuali sui redditi o sulla ricchezza di una popolazione e
presenta le prime due curve di Lorenz in due casi specifici: la prima con riferimento ai redditi prussiani
nel 1892 e nel 1901, dove le due curve non si intersecano, sottolineando una maggiore concentrazione
dei redditi nel 1901 rispetto a quelli del 1982; la seconda con riferimento ad un esempio teorico di
distribuzione di dieci redditi che determinano due curve che, invece, si intersecano (e afferma che anche
in questa situazione si può comunque trarre qualche conclusione sulla variazione della diseguaglianza
osservata).
Anche se la numerosità N nelle distribuzioni considerate nel suo saggio originario è relativamente
piccola (dieci modalità nell’esempio teorico), Lorenz rappresenta comunque il suo grafico con una curva,
ragionando quindi nel caso continuo. Anche Gini (1914) rappresenta sempre la curva di concentrazione
(nel suo articolo sinonimo di curva di Lorenz) e osserva che, per N sufficientemente grande, facendo
“. . . passare una linea continua per le estremità delle ordinate che misurano i valori di ” Li , “. . . si
ottiene . . . una curva (curva di concentrazione) ascendente da sinistra a destra, convessa verso l’asse
delle ascisse”. La curva di concentrazione tende ad essere tanto più convessa quanto più grande è la
diseguaglianza nella distribuzione, mentre si appiattisce al suo diminuire.
Tuttavia, concludendo le sue osservazioni circa le relazioni tra la curva di Lorenz e il suo rapporto di
concentrazione R, l’autore prende in esame l’aspetto della curva di Lorenz nel caso di valori raggruppati
in classi. In tale occasione presenta una “spezzata” composta da tanti segmenti quante sono le classi
e si cimenta nel calcolo approssimato dell’area racchiusa nella curva di Lorenz attraverso il calcolo
della corrispondente area racchiusa in quella che oggi indichiamo con “spezzata” di Lorenz. Infine,
Gini osserva che “la spezzata sarà iscritta nell’area di concentrazione” precisando che la differenza tra
l’area di concentrazione delimitata dalla spezzata e quella delimitata dalla curva di concentrazione è
tanto più grande quanto più è elevata la concentrazione osservata. Pietra (1915) considera da subito in
modo esplicito la spezzata di concentrazione: “Nel caso generale in cui non tutti gli ” xi “sono uguali,
congiungendo con dei segmenti rettilinei i punti di coordinate” Pi e Li “. . . avremo una spezzata
 di cui
1 x
l’estremo più basso sarà evidentemente il punto di coordinate” P1 = N , L1 = PN x “e l’estremo
1

 i=1 i
superiore è il punto di coordinate” PN = 1, LN = 1 .
Seguendo l’interpretazione di Pietra (1915), quando N non è particolarmente grande, la curva di
Lorenz può dunque essere approssimata attraverso la corrispondente spezzata. Si consideri la medesima
successione (3, 4, 5, 6, 7, 8, 9) già discussa in precedenza. Le coordinate della spezzata di Lorenz sono le
coppie (Pi , Li ) unite tra loro da rette. La linea nera della Figura 2 rappresenta la spezzata di Lorenz,
mentre la linea grigia è la curva di Lorenz che si otterrebbe qualora Li fosse uguale a Pi ∀i, ovvero
una situazione in cui tutte le quantità fossero uguali (retta di equidistribuzione). L’area al di sotto
della retta di equidistribuzione e al di sopra della spezzata di Lorenz (si indichi questa area con A)
15 Nella prima parte del suo articolo, Lorenz critica i metodi fino ad allora usati per valutare la diseguaglianza,

consistenti solitamente nel confronto per classi tra la quota di reddito o di ricchezza con le corrispondenti quote di
popolazione.
16 La quota cumulata della variabile quantitativa è rappresentata sull’asse delle ascisse, mentre la quota cumulata della

popolazione su quello delle ordinate, contrariamente a quanto solitamente avviene oggi.


17 Nell’articolo originario Lorenz applica il ragionamento indistintamente alla distribuzione dei redditi o della ricchezza.

Si rinvia a Schneider (2004) per la discussione dell’origine storica della curva di Lorenz.
18 Nel medesimo anno, Money (1905) discute (nel capitolo terzo) della diseguaglianza dei redditi e della ricchezza

nel Regno Unito utilizzando un approccio, stilizzato e non rigoroso, simile a quello proposto da Otto Max Lorenz nel
medesimo anno.

9
dà una visione grafica di quanto una generica successione si allontani da una situazione in cui tutte
le modalità del carattere sono uguali. Si indichi con B l’area al di sotto della spezzata di Lorenz. Si
osservi che A + B = 12 . Nel proseguo del saggio, se non diversamente specificato, si fa riferimento alla
spezzata di Lorenz (caso discreto) e non alla corrispondente curva (caso continuo).

Figura 2: La spezzata di Lorenz con N = 7

Sia Lorenz sia Gini discutono il caso della massima eguaglianza; nessuno dei due affronta
direttamente la situazione di massima diseguaglianza. È opportuno soffermarsi su questo caso estremo,
utile per comprendere tutta la parte restante del saggio.
Mentre il caso della massima eguaglianza non presenta problemi interpratativi, poiché l’area A è
banalmente nulla e quindi l’area B è conseguentemente pari a 21 , il caso della massima diseguaglianza
presenta una peculiarità quando le modalità non sono sufficientemente numerose. Considerando,
nel caso discreto, una generica successione massimante, X M AX = (0, 0, 0, 0, . . . , 0, 0, xN ), dove xN
1
è chiaramente positivo, l’area A massima della spezzata di Lorenz non è pari ad 2, ma è minore.
Specularmente, l’area B minima non è nulla, ma è positiva. Si veda la Figura 3 per N = 7. Si può
verificare (si vedano le Appendici E e F) che B = 12 N1 , A = 12 − B = 12 − 12 N1 = 12 1 − N1 = 21 NN−1 ; da


cui A + B = 12 .

6. La curva di Lorenz, il rapporto di concentrazione e


l’interpretazione di Gini
Per avvalorare la bontà del rapporto di concentrazione R, Gini (1914, p. 1230-1231) sottolinea due
incovenienti della visione grafica della diseguaglianza proposta da Lorenz: quando si devono confrontare
due o più distribuzioni, se le corrispondenti curve (o spezzate) di concentrazione si intersecano non è
possibile determinare un ordinamento tra queste concentrazioni;19 la rappresentazione grafica, di per sè,
non consente neppure di riassumere e quantificare in un unico scalare la dimensione della concentrazione
osservata in una distribuzione. Gini prosegue affermando che “L’uno e l’altro inconveniente scompaiono
19 Queste limitazioni sono oggetto di studio decenni dopo, per opera di Atkinson (1970), Shorrocks (1983), Shorrocks

and Foster (1987), Kakwani (1984) e Dardanoni and Lambert (1988).

10
Figura 3: La spezzata di Lorenz di massima diseguaglianza con N = 7

se si conviene di assumere a misura della concentrazione il rapporto dell’area compresa tra la curva di
concentrazione e la retta di equidistribuzione (area di concentrazione) all’area . . . di concentrazione nel
caso di concentrazione massima.” Tali aree sono, rispettivamente, l’area A e la somma delle aree A e
B definite nel Paragrafo 5 con riferimento al caso discreto. Ciò che Gini conviene di assumere come
misura della concentrazione è il rapporto
A
(20)
A+B
a proposito del quale afferma che “. . . è facile mostrare che tale rapporto altro non è che il limite, a cui
tende il rapporto di concentrazione R, quando cresce il numero” N “dei casi osservati, mantenendosi
però uguale la loro distribuzione.”
Questa osservazione merita una attenta discussione. Come osservato nel Paragrafo 3, il rapporto
di concentrazione R proposto da Gini è, di fatto, un rapporto tra somme di segmenti. I segmenti
al numeratore rappresentano il grado di diseguaglianza osservato (Figura 1). L’estremo superiore di
questi segmenti appartiene alla retta di equidistribuzione e quello inferiore alla spezzata di Lorenz. I
segmenti al denominatore rappresentano la massima disuguaglianza osservabile; anche in questo caso
l’estremo superiore giace sulla retta di equidistribuzione, mentre l’estremo inferiore giace sull’asse
delle ascisse. All’aumentare di N , i segmenti diventano sempre più numerosi e, se il numero delle
osservazioni aumenta indefinitamente, essi formano due aree: quella rappresentante la diseguaglianza
osservata, racchiusa tra la diagonale di equidistribuzione e la curva di Lorenz (l’area A), e l’area
rappresentante la massima diseguaglianza (la somma dell’area A e dell’area B, ovvero 21 ).
Di fatto, però, Gini non fornisce una dimostrazione rigorosa della sua affermazione, ma ne avvalora
la bontà servendosi di un ragionamento puramente geometrico, che può essere reinterpretato come
segue. Si riconsideri l’Eq. (16). L’originario rapporto di concentrazione R, espresso come rapporto
tra somme di segmenti, può essere opportunamente esplicitato come rapporto tra somme di aree di
rettangoli:
PN −1 PN −1
∗ i=1 (Pi − Li ) (i+1)−i
N
1
N i=1 (Pi − Li )
R = PN −1 (i+1)−i
= 1
PN −1 . (21)
i=1 Pi N N i=1 Pi
Gini non esplicita direttamente l’Eq. (21), ma è utile considerarla per interpretare la visione

11
grafica che egli propone su questo punto. Come sottolineato, egli considera una figura in cui è
rappresentata la curva di concentrazione; qui si preferisce presentare l’argomento considerando la
spezzata di concentrazione, come illustrato nella Figura 4 per N = 7.
1
Nello specifico, Gini considera dapprima gli N − 1 rettangoli, aventi base N, limitati dall’asse delle
ascisse e dalla spezzata di concentrazione. L’altezza di ognuno di questi rettangoli è pari a Li e la
PN −1
somma delle loro aree è pari a N1 i=1 Li .

Figura 4: I rettangoli considerando Li

Successivamente egli considera gli N − 1 rettangoli limitati dall’asse delle ascisse e dalla retta di
equidistribuzione (Figura 5). Questi rettangoli hanno base sempre pari a N1 e altezza pari invece a Pi .
PN −1 PN −1
La somma delle loro aree è pari a N1 i=1 Pi . La differenza tra le due somme, ovvero N1 i=1 (Pi −Li ),
è pari alla somma delle aree dei rettangoli parzialmente iscritti nell’area di concentrazione.
Non sembra che Gini aggiunga altro di rilevante su questo punto. Si limita a concludere che al
crescere di N le due aree descritte mediante la somma di rettangoli tendono a coincidere con l’area di
concentrazione osservata e con l’area di concentrazione massima, rispettivamente, e che il loro rapporto
coincide col rapporto di concentrazione R. La somma delle aree dei triangoli, ovvero la parte di area
non calcolata per mezzo della somma dei rettangoli, diviene via via più piccola al crescere di N .
Quando N diviene sufficientemente grande, allora si osserva una sostanziale corrispondenza tra l’area
colcolata con l’Equazione (16) oppure con l’Equazione (21) e l’area effettivamente osservata.
Per concludere questa discussione, si può osservare quanto segue. In caso di massima diseguaglianza
(si veda la Figura 5), l’area sotto la retta di equidistribuzione, l’area B massima, che indichiamo con
PN −1
B M AX , è pari a 21 . Si indichi invece N1 i=1 Pi con BR
M AX M AX
. BR non considera N triangoli ciascuno
1 1
con base pari a e altezza pari sempre a
N N. Col metodo di Gini l’area complessiva non considerata
2
è pertanto pari a N2 N1 = 2N 1
.
M AX
Segue che BR , calcolata con l’Eq. (21), ovvero la somma delle aree degli N − 1 rettangoli, è
1 1 1 1 N −1
pari a 2 − 2N = 2 N < 12 . L’area B M AX , invece, è esattamente pari a 21 . In caso di distribuzione
non egualitaria, il ragionamento è il medesimo (Figura 4). Al crescere di N la somma delle aree dei
rettangoli tendono a coincidere con l’area di concentrazione, ovvero

M AX
lim BR = B M AX . (22)
N →+∞

12
Figura 5: I rettangoli considerando Pi

Infatti, al crescere di N , “. . . diminuisce l’area delle piccole superfici compresa tra la retta di
equidistribuzione e la sommità dei rettangoli di altezza” Pi “e diminuisce analogamente l’area delle
piccole superfici tra la curva di concentrazione e la sommità dei rettangoli di altezza” Li (Gini, 1914).
A
Da qui l’affermazione di Gini secondo cui R tende ad essere pari a A+B .

7. La spezzata di Lorenz, l’intuizione di Pietra e l’odierno


indice di Gini
Un anno dopo la pubblicazione del lavoro di Gini (1914), Gaetano Pietra (1915), un suo allievo,
pubblica una nota riguardante le relazioni tra gli indici di variabilità. Il lavoro dell’allievo non ha certo
raggiunto la notorietà di quello del maestro; tuttavia contiene risultati veramente importanti per il
futuro della statistica descrittiva e per le sue applicazioni nello studio della diseguaglianza economica.
Nella prima parte della nota, considerando la spezzata di Lorenz per una generica successione, come
descritto con riferimento al commento della Figura 2, Pietra (1915) propone un metodo elegante, oggi
noto come metodo dei trapezi, per il calcolo dell’area di concentrazione (l’area A) nel caso discreto.
Fatto questo, all’autore sembra naturale rapportare l’area A al suo valore massimo teorico che si
1
otterrebbe nel caso continuo, ovvero la somma delle aree A e B, che vale 2. La forza della sua
A
intuizione sta nel fatto di aver legato il rapporto A+B col rapporto tra differenze medie (al numeratore
la differenza media con ripetizione della successione osservata e al denominatore la differenza media
senza ripetizione della successione massimante), ottenendo cosı̀ una formula alternativa per il calcolo
preciso del rapporto di concentrazione nel caso discreto: la misura sintetica della diseguaglianza può
A
pertanto essere espressa in modo preciso da A+B = 2A, che assume valore pari a zero in caso di massima
N −1
uguaglianza e valore pari a N in caso di massima diseguaglianza (si vedano le considerazioni del
Paragrafo 5).
Nel corso della dimostrazione, Pietra suggerisce l’espressione oggi utilizzata per calcolare quello
che usualmente indichiamo come indice di Gini G, che differisce dal rapporto di concentrazione R
originariamente proposto dallo stesso Gini quando le modalità del carattere non sono sufficientemente

13
numerose. Egli, inoltre, fornisce, per la prima volta, la definizione del rapporto di concentrazione nel
caso continuo, indicando che R è il limite a cui tende G quando N diviene molto grande.
L’autore inizia rappresentando la spezzata di Lorenz per una generica successione e osserva che
l’area A, ovvero l’area al di sotto della retta di equidistribuzione e al di sopra della spezzata di
1
concentrazione, è calcolabile come l’eccedenza rispetto ad 2 della somma delle aree di un triangolo
e N − 1 trapezi, come illustrato nella Figura 6.

Figura 6: L’area al di sopra della spezzata di Lorenz

Il triangolo ha come lati P1 (dato che P1 − P0 = P1 ) e L1 (dato che L1 − L0 = L1 ), mentre il


trapezio i-esimo ha come base maggiore Pi , come base minore Pi−1 e come altezza Li − Li−1 .
L’area A è dunque calcolabile come (APPENDICE E)

N
X (Pi + Pi−1 )(Li − Li−1 ) 1
A= − . (23)
i=1
2 2

i i−1 2i−1
Dall’Eq. (23), Pietra (1915) osserva che Pi = N e Pi−1 = N , da cui Pi + Pi−1 = N .
Inoltre, egli constata che Li − Li−1 = PNxi . L’area del trapezio i-esimo può essere riscritta come
i=1 xi

(Pi + Pi−1 )(Li − Li−1 ) 1 2i − 1 xi


= PN (24)
2 2 N i=1 xi

e per questa via esprime l’intera area A come

N
1 X 1
A= PN (2i − 1)xi − . (25)
2N i=1 xi i=1
2

A questo punto rapporta l’area A con B M AX = 12 . Dividendo l’Eq. (25) per 1


2 egli ottiene

N
1 X
2A = PN (2i − 1)xi − 1. (26)
N i=1 xi i=1

14
PN
Sviluppando l’Eq. (26) e ricordando che i=1 xi = N µ, Pietra (1915) arriva a definire20 quello che
ancora oggi è noto come indice di Gini:

N N
∆R ∆R 1 XX
G= = M AX = |xi − xj | (27)
2µ ∆ 2µN 2 i=1 j=1

pari al rapporto tra la differenza media con ripetizione della successione osservata e la differenza media
senza ripetizione della successione massimante. L’odierno indice di Gini G presenta il valore minimo
N −1
pari a zero e il valore massimo pari a N , che tende asintoticamente a 1 all’aumentare di N .21 Si
N −1
noti, pertanto, che G e R sono legati dal fattore N :

N −1
G= R. (28)
N

La ragione è intuitiva: valutando le aree dei rettangoli, come interpretato con la Eq. (21), non
1
si calcola la somma delle aree di N triangoli, che si è argomentato essere pari a 2N . Per mantenere
invariata l’interpretazione originaria, dandone comunque una rappresentazione grafica precisa nel caso
∆R
discreto, è necessario questo accorgimento: G = 2µ .
Infine, Pietra (1915) osserva: “Qualora il numero dei casi osservati è grandissimo la spezzata di
concentrazione finisce col confondersi nella curva continua che passa per i vertici della spezzata stessa.”
Rapresentando analiticamente la curva di concentrazione con y = ϕ(x), Pietra definisce l’indice di Gini
nel caso continuo, esprimendolo come il rapporto tra l’area A e la somma delle aree A e B:
Z 1
A
=1−2 ϕ(x)dx. (29)
A+B 0

Osservando, dall’Eq. (7), che


lim ∆R = ∆ (30)
N →+∞

egli ricava, nel caso continuo,


∆R ∆
G= = =R (31)
2µ 2µ
20 Ricordando le Eq. (10) e (11), si può scrivere

Y =2 N
P Pi
i=1 j=1 (xi − xj ) =
= 2(x2 − x1 ) + [(x3 − x1 ) + (x3 − x2 )] + · · · + [(xN − x1 ) + (xN − x2 ) + · · · + (xN − xN −1 )] =
=2 N
P PN
i=1 ixi − (N + 1 − i)xi = 2 i=1 [2ixi − (N + 1)xi ]

da cui, dividendo per N 2 ,


PN
∆R = NY2 = N22 i=1 [2ix − (N + 1)xi ] =
N PNi PN
= N22 2ixi − N22 N xi − N22
P
i=1 i=1 i=1 xi =
N
= N22 (2i − 1)xi − N22 N W =
P
PNi=1
= N22 2W
i=1 (2i − 1)xi − N .
PN 2W W
dove W = i=1 xi = N µ. Raccogliendo N
e notando che
è pari a µ si ottiene
N

N N
" #
2 X 2W 2W 1 X
∆R = 2 (2i − 1)xi − = (2i − 1)xi − 1
N i=1 N N N W i=1

da cui
∆R = 2µ2A
e quindi
∆R
2A = .

21 Per la solita successione utilizzata come esempio in questo saggio (3, 4, 5, 6, 7, 8, 9), cosiderando i risultati della Tabella
112
49
2 e la definizione riportata nell’Eq. (27), si ottiene G = 12
= 0.190476.

15
avvalorando dunque il risultato raggiunto da Gini. Grazie a quest’ultima espressione, Pietra riesce a
dimostrare, nel continuo, che il rapporto di concentrazione R è esattamente uguale al rapporto tra
l’area di concentrazione osservata e l’area di massima diseguaglianza, relazione che Gini afferma ma
non dimostra in modo rigoroso.

8. Conclusioni
Il saggio si è posto l’obiettivo di riprendere i due pionieristici lavori che hanno consentito la definizione
dell’indice di Gini cosı̀ come lo applichiamo oggi. Molto spesso questi lavori non sono citati nella
letteratura sull’argomento e, soprattutto, il contributo di Gaetano Pietra non è mai sufficientemente
avvalorato.
Mentre la scuola italiana ha sempre concentrato l’analisi nel discreto, la letteratura internazionale
ha focalizzato subito l’interesse per l’analisi nel continuo (molto spesso non riconoscendo la paternità
N −1
a Gaetano Pietra), dove per forza di cose, dall’Eq. (30), N perde rilevanza e di conseguenza anche
la distinzione tra differenza media con e senza ripetizione.
Sono tuttavia i primordiali studi analizzati in questo saggio ad aver reso possibile l’applicazione
dell’indice di Gini come lo conosciamo e applichiamo noi oggi. Storicamente, si è preferito calcolare
il valore dell’indice come ottenuto nell’Eq. (27) perché questo può essere perfettamente interpretabile
come rapporto tra aree sottostanti la spezzata di Lorenz, nonostante la proposta originaria di Gini
fosse lievemente differente. Di fatto, pertanto, è stato Corrado Gini a dover specificare la bontà del
suo indice alla luce della curva di Lorenz, e non viceversa.

Ringraziamenti
Si ringrazia Maria Giovanna Monti per le numerose e utili discussioni e per gli esaustivi commenti che
hanno contribuito a migliorare questo saggio. Ogni imprecisione è responsabilità unica dell’autore.

16
Riferimenti bibliografici
Amato, V. (1947): “Sulla differenza media,” Statistica, VII, 31–37.

Atkinson, A. B. (1970): “On the Measure of Inequality,” Journal of Economic Theory, 2, 244–263.

Benedetti, C. (1980): “Contro-esempi in statistica e probabilità,” in Studi in onore di Paolo


Fortunati, Clueb, Bologna, 23–39.

Bresciani-Turroni, C. (1916): “Recenti pubblicazioni: Gini C. (1914). Sulla misura della


concentrazione e della variabilità dei caratteri,” Giornale degli Economisti e Rivista di Statistica,
XXVII (serie III), 68–70.

Castellano, V. (1935): “Recente letteratura sugli indici di variabilità,” Metron, XII, 101–131.

——— (1937): “Sugli indici relativi di variabilità e sulla concentrazione dei caratteri con segno,”
Metron, XIII, 31–49.

——— (1965): “Corrado Gini: a memoir,” Metron, 24, 3–84.

Ceriani, L. and P. Verme (2012): “The origins of the Gini index: extracts from Variabilità e
Mutabilità (1912) by Corrado Gini,” The Journal of Economic Inequality, 10, 421–443.

Chatelain, E. (1910): “Le tracé de la courbe des successions en France,” Journal de la Société
Statistique de Paris, 51, 352–356.

Czuber, E. (1914): “Beitrag zur Theorie statistischer Reihen,” Versicherungswissenschaftlichen


Mitteilungen, IX, 101.

Dalton, H. (1920): “The measurement of the inequality of incomes,” The Economic Journal, 30,
348–361.

Dardanoni, V. and P. Lambert (1988): “Welfare rankings of income distributions: A role for the
variance and some insights for tax reform,” Social Choice and Welfare, 5, 1–17.

De Finetti, B. (1931): “Sui metodi proposti per il calcolo della differenza media,” Metron, IX, 47–52.

De Finetti, B. and U. Paciello (1930): “Calcolo della differenza media,” Metron, VIII, 1–6.

de Vergottini, M. (1940): “Sul significato di alcuni indici di concentrazione,” Giornale degli


Economisti e Annali di economia, 2, 317–347.

——— (1950): “Sugli indici di concentrazione,” Statistica, X, 445–454.

Dorfman, R. (1979): “A Formula for the Gini Coefficient,” The Review of Economics and Statistics,
61, 146.

Forcina, A. and G. Giorgi (2005): “Early Gini’s contributions to inequality measurement and
statistical inference.” Journal lectronique d’Histoire des Probabilits et de la Statistique, 1, 3–15.

Fortunati, P. (1955): “Schema di graduazione, misure di variabilità e valori medi,” in Studi in onore
di Gaetano Pietra, Cappelli, Bologna, 403–430.

——— (1957): “Rapporto di concentrazione, valori medi e schemi teorici di distribuzione massimante
e minimante della variabilità,” Statistica, XVII, 143–157.

17
Gini, C. (1910): “Indici di concentrazione e di dipendenza,” Atti della riunione della società italiana
per il progresso delle scienze, 453–469.

——— (1912): Variabilità e Mutuabilità. Contributo allo Studio delle Distribuzioni e delle Relazioni
Statistiche, C. Cuppini, Bologna.

——— (1914): “Sulla misura della concentrazione e della variabilità dei caratteri,” Atti del Reale
Istituto Veneto di Scienze, Lettere ed Arti, 73, 1203–1248.

——— (1921): “Measurement of Inequality of Incomes,” The Economic Journal, 31, 124–126.

——— (2005): “On the measurement of concentration and variability of characters,” Metron, 63, 3–38.

Giorgi, G. (1990): “Bibliographic portrait of the Gini concentration ratio,” Metron, XLVIII, 183–221.

——— (1992): Il rapporto di concentrazione di Gini. Genesi, evoluzione ed una bibliografia


commentata, Università degli Studi di Siena.

——— (2005): “Gini’s scientific work: an evergreen,” Metron, LXIII, 299–315.

——— (2011): “Corrado Gini: the man and the scientist,” Metron, 69, 1–28.

——— (2014): “A couple of good reasons to translate papers of the Italian statistical tradition,”
Metron, 72, 1–3.

Helmert, F. (1876): “Die Berechnung des wahrscheinlichen Beobachtungsfehlers aus der ersten
Potenzen der Differenzen gleichgenauer direkter Beobachtungen,” Astronomische Nachrichten, 88,
127–132.

Jenkins, S. (1988): “Calculating Income Distribution Indices from Micro-data,” National Tax Journal,
41, 139–142.

Jordan, v. (1869): “Ueber die Bestimmung der Genauigkeit mehrfach wiederholter Beobachtungen
einer Unbekannten,” Astronomische Nachrichten, 74, 209–226.

——— (1872): “Ueber die Bestimmung des mittleren Fehlers durch Wiederholung der Beobachtungen,”
Astronomische Nachrichten, 79, 219–222.

Kakwani, N. (1984): “On the measurement of tax progressivity and redistributive effects of taxes with
applications to horizontal and vertical equity,” in Economics inequality, measurement and policy,
ed. by G. Rhodes and R. Basmann, 149–168.

Lerman, R. I. and S. Yitzhaki (1984): “A note on the calculation and interpretation of the Gini
index,” Economics Letters, 15, 363–368.

Lorenz, O. (1905): “Methods of Measuring the Concentration of Wealth,” Publications of the


American Statistical Association, 9, 209–219.

Milanovic, B. (1997): “A simple way to calculate the Gini coefficient, and some implications,”
Economics Letters, 56, 45–49.

Money, L. G. C. (1905): Riches and Poverty, London: Methuen & Co. Ltd.

Pietra, G. (1915): “Delle relazioni tra gli indici di variabilità,” Atti del Reale Istituto Veneto di
Scienze, Lettere ed Arti, 74, 775–804.

18
——— (1917): “Recenti pubblicazioni di metodologia statistica,” Rivista italiana di sociologia, XXI,
308–322.

——— (1932): “Nuovi contributi alla metodologia degli indici di variabilità e di concentrazione,” Atti
del Reale Istituto Veneto di Scienze, Lettere ed Arti, a.a. 1931-32, XCI, 989–1008.

——— (1935): “A proposito della misura della variabilità e della concentrazione dei caratteri,”
Supplemento Statistico ai Nuovi Problemi di Ferrara, I, 3–12.

——— (1937): “Ancora sulle discordanze fra gli indici di variabilità e di concentrazione,” Giornale
degli Economisti e Rivista di Statistica, LII(serie IV), 666–673.

——— (2013): “On the relations between variability indices,” Statistica & Applicazioni, 11, 7–22.

Pizzetti, E. (1955): “Osservazioni sul calcolo aritmetico del rapporto di concentrazione,” 580–593,
studi in Onore di Gaetano Pietra, Biblioteca di Statistica, n. 1, Cappelli, Bologna.

Ricci, U. (1916): “L’indice di variabilità e la curva dei redditi,” Giornale degli Economisti e Rivista
di Statistica, 53, 177–228.

Schneider, M. (2004): “Measuring Inequality: The Origins of the Lorenz Curve and the Gini
Coefficient,” Mimeo.

Séailles, J. (1910): La repartition des fortunes en France., Alcan.

Shorrocks, A. (1983): “Ranking Income Distributions,” Economica, 50, 3–17.

Shorrocks, A. and J. Foster (1987): “Transfer Sensitive Inequality Measures,” The Review of
Economic Studies, 54, 485.

Stuart, A. (1954): “The correlation between variate-values and ranks in samples from a continuos
distribution,” British Journal of Statistical Psychology, 7, 37–44.

von Andrae, H. (1869): “Schreiben des Herrn Geheimen Etatsrath von Andrä an der Herausgeber,”
Astronomische Nachrichten, 74, 283–284.

von Andrae, V. (1872): “Ueber die Bestimmung des wahrscheinlichen Fehlers durch die gegebenen
Differenzen von m gleich genauen Beobachtungen einer Unbekannten,” Astronomische Nachrichten,
79, 257–272.

Xu, K. (2003): “How has the Literature on Gini’s Index Evolved in the Past 80 Years?” SSRN
Electronic Journal.

Yitzhaki, S. and E. Schechtman (2013): The Gini Methodology. A Primer on a Statistical


Methodology, Springer New York.

Yntema, D. (1933): “Measures of the Inequality in the Personal Distribution of Wealth or Income,”
Journal of the American Statistical Association, 28, 423–433.

19
Appendice A
De Finetti and Paciello (1930) propongono, per l’epoca, una metodologia di calcolo molto più veloce:

N −1
2 X
∆= k(N − k)(xk+1 − xk ). (32)
N (N − 1)
k=1

Oggi sono noti metodi ancora più veloci: come dimostrato da Stuart (1954) e ripreso da Lerman
and Yitzhaki (1984), l’indice di Gini può essere calcolato come

2
G= cov[X, F (X)]
µx

1
PN
dove cov indica la covarianza, F (X) la funzione di ripartizione, cov[X, F (X)] =
PN N k=1 (xk −µ)(Fk −F̄ )
Fk
e F̄ = k=1
N . Segue che ∆R = 4cov[X, F (X)] e che, dall’Eq. (7), ∆ = 4cov[X, F (X)] NN−1 . Si
vedano Jenkins (1988) e Milanovic (1997) per le applicazioni empiriche. Si rinvia al Paragrafo 7 per
la discussione su G.

Appendice B
Svolgendo alcuni passaggi algebrici si ottiene

PN PN
"i=1 j=1 |xi − xj | = #
PN PN PN PN
2 i=1 (xi − x1 ) + i=2 (xi − x2 ) + · · · + i=N −1 (xi − xN −1 ) + i=N (xi − xN ) =
" #
PN PN PN PN
2 i=1 xi − N x1 + i=2 xi − (N − 1)x2 + · · · + i=N −1 xi − 2xN −1 + i=N xi − 1xN .

Notando che

−N x1 − (N − 1)x2 − · · · − 2xN −1 − 1xN =


(−x1 − x2 − · · · − xN −1 − xN ) + (−(N − 1)x1 − (N − 2)x2 − · · · − 1xN −1 ) =
PN
− j=1 xj − (N − 1)x1 − (N − 2)x2 − · · · − 1xN −1

e ripetendo lo stesso ragionamento per −(N − 1)x1 − (N − 2)x2 − · · · − 1xN −1 e cosı̀ via, si ricava

−1
" N 1 N 2 N N N N
#
X X X X X X X X
2 xi − xj + xi − xj + · · · + xi − xj + xi − xj
i=1 j=1 i=2 j=1 i=N −1 j=1 i=N j=1

da cui si ottiene l’Eq. (11).

20
Appendice C
A titolo esemplificativo, si consideri la solita successione (3, 4, 5, 6, 7, 8, 9). Come illustrato nella Tabella
112 112
2, per questa successione ∆ è pari a 42 = 2.6̄ e ∆R a 49 = 2.285714.22

Tabella 2: Il calcolo della differenza media semplice

|xk − xj | 3 4 5 6 7 8 9
3 0 1 2 3 4 5 6
4 1 0 1 2 3 4 5
5 2 1 0 1 2 3 4
6 3 2 1 0 1 2 3
7 4 3 2 1 0 1 2
8 5 4 3 2 1 0 1
9 6 5 4 3 2 1 0
Fonte: Elaborazione personale.

Appendice D
Per capire quest’ultimo concetto, facendo riferimento alla successione (3, 4, 5, 6, 7, 8, 9), la successione
massimante da considerare è X M AX = (0, 0, 0, 0, 0, 0, 42), evidenziata nella Tabella 3. Ricordando l’Eq.
(4), il numeratore dell’Eq. (9) ammonta a 2N (N − 1)xN = 504 e il denominatore a N (N − 1) = 42,
quindi ∆M AX = 2µX = 12. Dall’Eq. (7) si ricava che ∆M R
AX
= NN−1 ∆M AX , pertanto nell’esempio
72
considerato ∆M
R
AX
= 7 . Il rapporto di concentrazione R anche in questo caso è pari a 1, ovvero il
112
∆S
suo valore massimo teorico. Considerando l’esempio della Tabella 2, si ottiene R = ∆M AX
= 42
12 =
112
∆R 2
∆M AX = 49
72 = 9 = 0.2̄, il medesimo risultato ricavato con l’Eq. (16). Si noti che R è pari al suo
R 7
valore minimo, ovvero zero, quando Li = Pi ∀i < N e al suo valore massimo, ovvero 1, quando Li = 0
∀i < N .

Tabella 3: Differenza media semplice e massima concentrazione

|xi − xj | 0 0 0 0 0 0 42
0 - 0 0 0 0 0 42
0 0 - 0 0 0 0 42
0 0 0 - 0 0 0 42
0 0 0 0 - 0 0 42
0 0 0 0 0 - 0 42
0 0 0 0 0 0 - 42
42 42 42 42 42 42 42 -
Fonte: Elaborazione personale.

22 I possibili valori con ripetizione di |x − x | sono N 2 = 49, mentre i possibili valori senza ripetizione sono N (N − 1) =
i j
42: la matrice è simmetrica e la diagonale principale presenta tutti elementi nulli, perché |xi − xj | = |xj − xi | ∀i, j; le
possibili differenze tra xi e sé stesso sono infatti N . La differenza media semplice con ripetizione ∆R considera dapprima
la somma dei valori assoluti di tutte le possibili differenze tra una quantità (compresa sé stessa) e tutte le altre quantità
e poi ne calcola il valore medio dividendo per tutte le possibili combinazioni (N 2 ). Analogamente, la differenza media
senza ripetizione ∆ considera dapprima la somma dei valori assoluti di tutte le possibili differenze tra una quantitá
(esclusa sé stessa) e tutte le altre quantità e poi ne calcola il valore medio dividendo per tutte le possibili combinazioni
(N (N − 1)).

21
Appendice E
Specularmente, sottostanti la spezzata di Lorenz ci sono un triangolo e N −1 trapezi (Figura 7). L’area
P1 L1 (Li +Li−1 )(Pi −Pi−1 )
del triangolo è 2 (poiché P0 = 0 e L0 = 0), mentre l’area del trapezio i-esimo è 2 .
Sommando tutte queste aree si ottiene l’area sottostante la spezzata di Lorenz (area B) che è pari a

N
X (Pi − Pi−1 )(Li + Li−1 )
B= . (33)
i=1
2

Figura 7: L’area al di sotto della spezzata di Lorenz

1
Notando che Pi − Pi−1 = N si può scrivere

N
1X 1
B= (Li + Li−1 ) (34)
2 i=1 N

da cui si ricava
N N
1 1 1X 1 1 1X 1
A= −B = − (Li + Li−1 ) = − (Li + Li−1 ). (35)
2 2 2 i=1 N 2 2 i=1 N

Per la successione (3, 4, 5, 6, 7, 8, 9) si può agevolmente verificare che A = 0.095238 e che B =


0.404762, con A + B = 12 .

22
Appendice F
Si consideri la successione X EQ = (6, 6, 6, 6, 6, 6, 6). La spezzata di Lorenz è riportata nella Figura
8. In caso di massima eguaglianza, l’area B è la massima possibile 12 , mentre l’area A è la minima


possibile (0). In questo caso, infatti, tutti i redditi sono uguali. Segue che Pi = Li ∀i, da cui

N N
1X 1X
B= (Pi − Pi−1 )(Li + Li−1 ) = (Pi − Pi−1 )(Pi + Pi−1 ). (36)
2 i=1 2 i=1

Figura 8: La retta di equidistribuzione

Notando che

N
X
(2i − 1) = N 2 (37)
i=1

1 i i−1 2i−1
e ricordando che Pi − Pi−1 = N, si ottiene Pi + Pi−1 = N + N = N ∀i. Pertanto, segue che

N
1 X 1 2i − 1 1
B= = . (38)
2 i=1 N N 2

L’area A è conseguentemente pari a zero.

23

Potrebbero piacerti anche