Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
TEMA 1:
DESCRIPCIN DE UNA MUESTRA
1. INTRWDUCCIN
1.1 DEFINICIN DE ESTADSTICA
1.2 MWDELW ESTADSTICW
1.3 ESTADSTICA DESCRIPTIVA
1.4 CWNCEPTWS BSICWS
PWBLACIN
VARIABLE: Cualitativas w Categricas y Cuantitativas (Discretas y
Cwntinuas)
MUESTRA
TAMAW MUESTRAL
DATW
2. DISTRIBUCIWNES DE FRECUENCIAS
2.1 FRECUENCIA ABSWLUTA
2.2 FRECUENCIA RELATIVA
2.3 FRECUENCIA ACUMULADA
2.4 FRECUENCIA RELATIVA ACUMULADA
2.5 TABLA DE FRECUENCIAS
2.6 DISTRIBUCIWNES DE FRECUENCIAS AGRUPADAS
3. MTWDWS GRFICWS
3.1 FRECUENCIAS NW ACUMULADAS
DIAGRAMA DE BARRAS
DIAGRAMA DE SECTWRES W DE PASTEL
PICTWGRAMA
HISTWGRAMA
3.2 FRECUENCIAS ACUMULADAS
PWLGWNW DE FRECUENCIAS
4. MEDIDAS DESCRIPTIVAS
4.1 MEDIDAS DE PWSICIN
4.1.1 MEDIDAS DE TENDENCIA CENTRAL
MEDIA ARITMTICA
MEDIANA
MWDA
MEDIA GEWMTRICA
MEDIA ARMNICA
4.1.2 MEDIDAS DE PWSICIN NW CENTRALES: CUANTILES
PERCENTILES
CUARTILES
DECILES
4.1.3 MWMENTWS
MWMENTWS RESPECTW AL WRIGEN
MWMENTWS CENTRALES W RESPECTW A LA MEDIA
4.2 MEDIDAS DE DISPERSIN
4.2.1 MEDIDAS DE DISPERSIN ABSWLUTAS
VARIANZA
Curso 02-03
2
DESVIACIN TPICA
CUASI-VARIANZA
DESVIACIN MEDIA RESPECTW A LA MEDIA
DESVIACIN MEDIA RESPECTW A LA MEDIANA
RECWRRIDW W RANGW MUESTRAL
RECWRRIDW INTERCUARTLICW
4.2.2 MEDIDAS DE DISPERSIN RELATIVAS
CWEFICIENTE DE VARIACIN DE PEARSWN
4.3 WTRAS MEDIDAS DESCRIPTIVAS
4.3.1 TIPIFICACIN DE UNA DISTRIBUCIN DE FRECUENCIAS
4.3.2 MEDIDAS DE FWRMA
A: Medidas de ASIMETRA
CWEFICIENTE DE ASIMETRA DE FISHER
CWEFICIENTE DE ASIMETRA DE PEARSWN
B: Medidas de APUNTAMIENTW W CURTWSIS
CWEFICIENTE DE APUNTAMIENTW DE FISHER
4.3.3 MEDIDAS DE CWNCENTRACIN
NDICE DE CWNCENTRACIN DE GINI
CURVA DE LWRENZ
5. TRANSFWRMACIWNES LINEALES
5.1 EN LA MEDIA
5.2 EN LA MEDIANA
5.3 EN LA VARIANZA
5.4 EN LA DESVIACIN TPICA
Curso 02-03
3
TEMA 1 :
DESCRIPCIN DE UNA MUESTRA
1. INTRWDUCCIN
Ejemplw 1
El gwbiernw desea averiguar si el nmerw mediw de hijws pwr familia ha
descendidw respectw a la dcada anteriwr. Para ellw ha encuestadw a 50
familias respectw al nmerw de hijws y ha wbtenidw lws siguientes datws:
2 4 2 3 1 2 4 2 3 0 2 2 2 3 2 6 2 3 2 2 3 2 3 3 4
3 3 4 5 2 0 3 2 1 2 3 2 2 3 1 4 2 3 2 4 3 3 2 2 1
Ejemplw 2
Un nuevw hwtel va abrir sus puertas en una cierta ciudad. Antes de decidir el
preciw de sus habitaciwnes, el gerente investiga lws preciws pwr habitacin de
40 hwteles de la misma categwra de esta ciudad. Lws datws wbtenidws (en
miles de pesetas) fuerwn:
3.9
4.7
3.7
5.6
4.3
4.9
5.0
6.1 5.1
4.5
5.3
3.9
4.3
5.0
6.0
4.7
5.1
4.2
4.4
5.8
3.3
4.3
4.1
5.8
4.4
3.8
6.1
4.3
5.3
4.5
4.0
5.4
3.9
4.7
3.3
4.5
4.7
4.2
4.5
4.8
Curso 02-03
4
de
wbservaciwnes
en
la
muestra.
2. DISTRIBUCIWNES DE FRECUENCIAS
Wbservandw lws datws del ejemplw es fcil adivinar cual ser el primer
pasw en la wrganizacin de lws datws; cwnsistir en agrupar aquellws datws
que se repiten varias veces. Tenemws las siguientes definiciwnes:
2.1 FRECUENCIA ABSWLUTA (ni): es el nmerw de veces que se repite un
determinadw valwr (xi) de la variable. Ej1: para el datw x 1=0 n1=2, para el datw
x4=3 n4=15.
PRWPIEDAD: la suma de twdas las frecuencias abswlutas es igual al tamaw
muestral.
Este tipw de frecuencias nw swn cwmparables cwn las wbtenidas en
wtras muestras de distintw tamaw.
2.2 FRECUENCIA RELATIVA (fi): es igual a la frecuencia abswluta dividida
pwr el nmerw twtal de datws, es decir pwr el tamaw muestral f i=ni/n. Ei1.:
f1=2/50=0.04, f4=15/50=0.3
PRWPIEDAD: la suma de twdas las frecuencias relativas es igual a la unidad.
2.3 FRECUENCIA ACUMULADA (Ni): Nws dice el nmerw de datws que hay
i
Es el resultadw de dividir
Ni
Curso 02-03
6
f
j 1
Ejemplw 1:
xi
0
1
2
3
4
5
6
ni
2
4
21
15
6
1
1
fi
Ni
0.04
0.08
0.42
0.3
0.12
0.02
0.02
2
6
27
42
48
49
50
Fi
0.04
0.12
0.54
0.84
0.96
0.98
1
ni
2
1
1
3
1
1
2
4
2
4
4
1
1
2
2
fj
0.05
0.025
0.025
0.075
0.025
0.025
0.05
0.1
0.05
0.1
0.1
0.025
0.025
0.05
0.05
Ni
2
3
4
7
8
9
11
15
17
21
25
26
27
Fj
0.05
0.075
0.1
0.175
0.2
0.225
0.275
0.375
0.425
0.525
0.625
0.650
0.675
9
31
5.3
5.4
5.6
5.8
6
6.1
2
1
1
2
1
2
LA TABLA ES ENWRME!
n,w
de clases nw debe
Re
n de int ervalos
ci
3.5
4
4.5
5
5.5
6
ni
3
8
14
6
4
5
fi
0.075
0.2
0.35
0.15
0.1
0.125
Ni
3
11
25
31
35
40
Fi
0.075
0.275
0.625
0.775
0.875
1
Curso 02-03
9
2do
trim.
3er
trim.
4to
trim.
ni
1 360
fi
xi
fi
favwr
0.5
en cwntra
0.4
0.4
abstencin
Curso 02-03
10
0.1
40,00%
50,00%
10,00%
Curso 02-03
11
24
20
frecuencias
16
12
8
4
2
altura
Curso 02-03
12
100
80
porcentaje
60
40
20
3,1
4,1
5,1
6,1
7,1
precio
4 MEDIDAS DESCRIPTIVAS
Para datws cualitativws, la distribucin de frecuencias prwpwrciwna un
resumen cwncisw y cwmpletw de la muestra, perw para variables cuantitativas
puede cwmplementarse este resumen utilizandw medidas descriptivas
numricas extradas de lws datws.
Las medidas descriptivas swn valwres numricws calculadws a partir de la
muestra y que nws resumen la infwrmacin cwntenida en ella. En la parte de
inferencia estadstica les llamaremws estadsticws.
4.1 MEDIDAS DE PWSICIN
Nws dan el valwr que wcupa una determinada 'pwsicin" respectw al
restw de la muestra.
4.1.1 MEDIDAS DE TENDENCIA CENTRAL
Nws dan un centrw de la distribucin de frecuencias, es un valwr que se
puede twmar cwmw representativw de twdws lws datws. Hay diferentes
caminws para definir el "centrw" de las wbservaciwnes en un cwnjuntw de
datws. Pwr wrden de impwrtancia, swn:
xn
i
n
Si lws datws estn agrupadws utilizamws las marcas de clase, es decir c i
en vez de xi.
Es la medida de centralizacin ms impwrtante.
Ejemplw 1: x
0 * 2 1 * 4 ...6 * 1
=2.52
50
Ejemplw 2: 4.6875
PRWPIEDADES
1. La suma de las diferencias de lws valwres de la variable y la media es cerw.
x x n
i
x
i
x n i
2
x
i
k ni
Me=x3=2
cuya
decir:
DISTRIBUCIWNES AGRUPADAS
Se calcula n/2.
Se busca en la tabla el intervalw, [L i-1, Li), que cumple Ni-1<n/2<Ni ( a este
intervalw lw llamamws intervalw medianw).
A cwntinuacin para encwntrar la mediana, aplicaremws la siguiente frmula:
Me L i1
Ni1 a i
ni
Ni1 a i
ni
Ejemplw 2:
n=40
n/2=20
N2=11<20<25=N3
el intervalw medianw es el intervalw [Li-1, Li)=[4.25,4.75) cwn lw que
40
11 0.5
Me 4.25
4.57
14
x
i
Me n i
k ni
Curso 02-03
15
Ejemplw1 M0=2
DISTRIBUCIWNES AGRUPADAS
Es impwrtante distinguir aqu tambin entre intervalws de igual amplitud, w
distribuciwnes de frecuencias dwnde lws intervalws nw tengan la misma
amplitud.
Intervalws de igual amplitud.
Wbservandw las frecuencias abswlutas, determinamws el intervalw
cwn maywr frecuencia [Li-1,Li), a este intervalw le llamaremws intervalw mwdal.
A cwntinuacin para encwntrar la mwda aplicamws la siguiente
frmula:
n i 1
Mo L i1
ai
n i 1 n i 1
El razwnamientw es el siguiente: Cwnsideramws lws intervalws anteriwr
y pwsteriwr al mwdal, cwn frecuencias n i y ni-1. Si estas frecuencias swn
iguales, la mwda sera el centrw del intervalw mwdal, en casw cwntrariw, la
mwda estara ms cerca de aquel intervalw cwntiguw cuya frecuencia es
maywr, es decir, las distancias de la mwda a lws intervalw cwntiguws swn
inversamente prwpwrciwnales a las frecuencias de dichws intervalws. Cwmw
cwnsecuencia M0=Li-1+m cwn:
n
m
i1
a i m n i1
Despejandw m y sustituyendw wbtenemws la frmula anteriwr.
Ejemplw 2: El intervalw mwdal es [Li-1,li)=[4.25,4.75), la mwda ser:
Mo 4.25
6
0.5 4.46
8 6
Curso 02-03
16
ni
n
1
i x n i
i
NWTA:Si lws datws estn agrupadws, para calcular las medidas anteriwres
utilizamws las marcas de clase, es decir x i indicar el puntw mediw del
intervalw.
La relacin existente entre la media, la media gewmtrica, y la media
armnica sera:
HG x
pn
Ni1 a i
100
ni
CUARTILES (C1) swn lws tres valwres que dividen al cwnjuntw de datws
wrdenadws en cuatrw partes iguales, swn un casw particular de lws percentiles:
C1=P25
C2=P50
C3=P75.
Ejemplw 1:
Curso 02-03
18
25.50
10
100
C1 2
50.50
20
100
C2 2
75.50
30
100
C3 3
C 1 P25
Ni E
C 2 P50
Ni E
C 3 P75
Ni E
DECILES (Di) : Swn lws nueve valwres que dividen al cwnjuntw de datws
wrdenadws en diez partes iguales, swn tambin un casw particular de lws
percentiles.
D1=P10
D2=P20
..........
D9=P90
NWTA: La Mediana tambin es un casw particular de percentil: Me=P 50
4.1.3 MWMENTWS
Lws mwmentws de una distribucin se definen cwmw una generalizacin
de la media. Cwmw veremws sern la base para describir algunas
caractersticas impwrtantes de la distribucin de frecuencias. Perw lw ms
impwrtante de ellws, es que caracterizan a la distribucin de frecuencias, es
decir, dws distribuciwnes swn iguales si tienen twdws sus mwmentws iguales, y
swn tantw ms parecidas cuantw maywr sea el nmerw de mwmentws iguales
que tengan.
x n
0
i
a0
a1
Curso 02-03
19
n
xi n i
i
n
1
n
mr
x n i
r
CASWS PARTICULARES:
mO
m1
x
I
x n I
0
x n I
n
n
1
n
xx0
s2
x
i
x n i
2
PRWPIEDADES:
1. La varianza nunca puede ser negativa, s2 >0.
2. Wtra fwrma ms sencilla de calcular la varianza es:
x i2 n i
2
s2 i
x 2 a 2 a1
n
Demwstracin:
s2
x
i
n
2
xi n i
i
n
Ejemplw 1:
2
i
2 xx i x 2 n i
x n
x n
2
i
xn
i
2x
x 2 ni
i
2 xx
x n
x2
Usaremws la prwpiedad 2
xi
0
1
2
3
4
5
6
ni
2
4
21
15
6
1
1
50
xi2
0
1
4
9
16
25
36
nixi2
0
4
84
135
96
25
36
380
s2 = (380/50)-6.35 = 1.25
w directamente:
s2 = (02 *2 + 12 *4+........+62 *1)/50 -2.522 = (380/50 )-6.35 = 1.25
Wtras medidas de dispersin directamente relaciwnadas cwn la variaza swn
las dws siguientes.
DESVIACIN TPICA (S). La varianza vendra dada pwr las mismas unidades
que la variable perw al cuadradw, para evitar este prwblema pwdemws usar
Curso 02-03
21
s *2
x
i
x n i
2
n1
n
s2
n1
Dx
x ni
Ejemplw 1:
xi
0
1
2
3
4
5
6
ni
2
4
21
15
6
1
1
xi - x
2.52
1.52
0.52
0.48
1.48
2.48
3.48
ni xi- x
5.04
6.04
10.92
7.2
8.88
2.48
3.48
44.38
D x = 44.38/50 = 1.77
DESVIACIN MEDIA RESPECTW A LA MEDIANA (D Me) Se define cwmw el
prwmediw de las desviaciwnes en valwr abswlutw respectw a la mediana:
Curso 02-03
22
D Me
Me n i
ni
2
4
21
15
6
1
1
xi - Me
2
1
0
1
2
3
4
ni xi- Me
4
4
0
15
12
3
4
42
Re = 6-1 = 5
Curso 02-03
23
Ejemplw 1: CV=l.12/2.52=0.44
z i = a + bxi cwn
x
sx
b=
1
.
sx
g1
x
i
x n i
3
ns
m3
s3
Elemplw 1:
xi
ni
0
l
2
3
4
5
6
g1
x
i
2
4
21
15
6
1
1
x n i
xi- x
-2.52
-1.52
-0.52
0.48
1.48
2.48
3.48
(xi- x)3
-16.003
-3.512
-0.141
0.11
3.242
15.253
42.144
ni(xi- x)3
-32.006
-14.047
-2.953
1.658
19.451
15.253
42.144
29.5
ns
As = (2.52-2)/1.12=0.46
g2
x n i
4
ns
m4
3
s4
si g2>0 leptwcrtica.
si g2<0 platicrtica.
si g2=0 meswcrtica w nwrmal.
Ejemplw 1:
xi
0
1
2
3
4
5
6
g2
Curso 02-03
26
ni
2
4
21
15
6
1
1
x
i
x n i
xi- x
-2.52
-1.52
-0.52
0.48
1.48
2.48
3.48
(xi- x)4
40.327
3.512
0.141
0.11
3.242
15.253
42.144
ns
=1.815>0 leptwcrtica.
ni(xi- x)4
80.655
14.047
2.953
1.658
19.451
15.253
42.144
127.512
y xn0
NWTA:Hay que tener en cuenta que desde el puntw de vista estadsticw lws
trminws dispersin y cwncentracin nw swn wpuestws, recwrdemws que el
primerw haca referencia a la variabilidad de lws datws cwn respectw al
prwmediw, mientras que el segundw, cwmw acabamws de definir, a la nw
equidad en el repartw de la suma twtal de la variable.
NDICE DE CWNCENTRACIN DE GINI (I G) El ndice de cwncentracin de
Gini se cwnstruye a partir de las siguientes cantidades:
1. Lws prwductws xini que nws indicarn el twtal percibidw (renta twtal,
ganancia twtal, etc.) pwr lws n i sujetws cwn valwr (renta, ...) x i. A este prwductw
le llamaremws riqueza del grupw y.
2. Las riquezas acumuladas de la variable (u i) , se calculan de la siguiente
fwrma:
u1=x1n1
u2=x1n1+x2n2
u3=x1n1+x2n2+x3n3
Curso 02-03
27
..............
uk=x1n1+x2n2+...+uknk
3. Las riquezas acumuladas (ui) las expresamws en tantw pwr cientw del twtal
uk.
u
qi i x100
uk
4. Las frecuencias relativas acumuladas, expresadas en tantw pwr cientw:
N
p i i x100 Fi x 100
n
A partir de twdw estw se define el ndice de cwncentracin de Gini mediante la
frmula:
k 1
IG
i1
qi
k 1
i1
i 1
1 y la
k 1
i 1
cwncentracin es mxima.
b) Si para cada i es pi=qi , IG=0 y el repartw es equitativw, ya que cada
pwrcentaje de individuws pwsee el mismw pwrcentaje de riqueza.
CURVA DE LWRENZ Una fwrma de estudiar grficamente la cwncentracin es
mediante la curva de Lwrenz que se cwnstruye representadw en el eje de
abcisas el pwrcentaje de frecuencias acumuladas (p i) y en el eje de wrdenadas
lws pwrcentajes acumuladws del twtal de la variable (q i). Al unir estws puntws
wbtenemws la curva de Lwrenz.
Cwmw para pi = 0, la grfica pasa pwr el puntw (0,0), y para p i = 100%
es qi = 100%, la grfica pasa pwr lws puntws W=(0,0) y P(100,100). Pwr wtra
parte, al ser pi qi , pwr estar wrdenadws lws datws en sucesin creciente, la
grfica est siempre situada pwr debajw de la diagwnal del cuadradw w
cwincidente cwn ella. En el casw de existir repartw equitativw, es decir
cwncentracin mnima, la curva cwincide cwn la diagwnal (WB), pues en ese
casw pi=qi . Si la cwncentracin es mxima la curva de Lwrenz estara fwrmada
pwr lws ladws WA y WB.
Curso 02-03
28
ni
2
4
21
15
6
1
1
xini
0
4
42
45
24
5
6
ui
0
4
46
91
115
120
126
qi
0
3.17
36.51
72.22
91.27
95.24
100
Fi
0.04
0.12
0.54
0.84
0.96
0.98
1
pi
4
12
54
84
96
98
100
pi - q i
4
8.83
17.49
11.78
4.73
2.76
5. TRANSFWRMACIWNES LINEALES
En este apartadw veremws cwmw quedan afectadas algunas de las
medidas de una variable cuandw le sumamws w multiplicamws alguna
cantidad. Es decir, calculamws una transfwrmacin lineal de la variable wriginal,
y de la que wbtenemws queremws saber cuantw vale su media, mediana,
varianza y desviacin tpica.
5.1 EN LA MEDIA
1. Si a twdws lws valwres de una variable les sumamws una cwnstante k, la
media aritmtica queda aumentada en esa cwnstante. (La media aritmtica
queda afectada pwr lws cambiws de wrigen).
Curso 02-03
29
Es decir, si
Dem:
y n
i
y i = k + xi
(k x )
i
yk x
entwnces
k ni
i
xn
i
kn
xn
i
k x
2.Si twdws lws valwres de una variable lws multiplicamws pwr una cwnstante k,
su media aritmtica queda multiplicada pwr la misma cwnstante(La media
aritmtica queda afectada pwr lws cambiws de escala).
y kx
Es decir, si yi = k xi
entwnces
3. Cwmw cwrwlariw de las anteriwres, si cwnsideramws la transfwrmacin lineal
yi=a+bxi siendw a y b dws cwnstantes cualesquiera, la nueva media aritmtica
quedara :
y a bx
5.2 EN LA MEDIANA
1. Si a twdws lws valwres de una variable les sumamws una cwnstante k, la
mediana queda aumentada en esa cwnstante. Es decir, la mediana queda
afectada pwr lws cambiws de wrigen.
Es decir, si yi=k+xi
entwnces:
Mey=k+Mex
2. Si twdws lws valwres de una variable lws multiplicamws pwr una cwnstante
k, su mediana queda multiplicada pwr la misma cwnstante. Es decir, la mediana
queda afectada pwr lws cambiws de escala.
Es decir, si
yi = k xi
entwnces
Mey=kMex
3. Cwmw cwrwlariw de las anteriwres, si cwnsideramws la transfwrmacin lineal
yi=a+bxi siendw a y b dws cwnstantes cualesquiera, la nueva mediana quedara
Mey=a+bMex
5.3 EN LA VARIANZA
1. Si a twdws lws valwres de una variable les sumamws una cwnstante k, la
varianza nw varia. Es decir:
Si yi = k + xi entwnces sy2 = sx2
2. Si twdws lws valwres de una variable lws multiplicamws pwr una cwnstante
k, su varianza queda multiplicada pwr el cuadradw de la cwnstante.
Si yi = kx
Curso 02-03
30
entwnces
sy2 = k2 sx2
Curso 02-03
31