Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
1 Estadística Descriptiva.
2 Cálculo de Probabilidades.
4 Test Chi-cuadrado.
Conceptos generales
• Frecuencia absoluta de xi : ni
ni
• Frecuencia relativa de xi : fi =
n
Si además asumimos que x1 < x2 < . . . < xn , se definen:
• Frecuencia absoluta acumulada de xi : Ni = n1 + n2 + . . . + ni
Ni
• Frecuencia relativa acumulada de xi : Fi = f1 + f2 + . . . + fi =
n
Distribuciones unidimensionales de
frecuencias
NO NS/NC
10% 5%
SÍ
10% 85%
5%
SÍ NO NS/NC
Representaciones gráficas
Variables cuantitativas discretas: diagrama de barras o también
el de sectores (cuando los valores
Var. cuantitativas quediagrama
discretas: toma X son
de pocos)
barras
Frecuencia
200
180
160
140
120
100
80
60
40
20
8 12 14 15 16 17 18 19 20 21
Nivel educativo
Nivel educativo
Representaciones gráficas
Variables cuantitativas continuas agrupadas: histograma. El área
de cada rectángulo equivale al número de datos dentro del intervalo,
Var.
por lo tanto lacuantitativas continuas:de
altura es la densidad histograma
datos y no la frecuencia.
d1=n1/a1
di=ni/ai
L0 L1 L2 L3 L4 L5 L6
Representaciones gráficas
(Li−1 , Li ] ni ai di
(13,15] 12 2 6
(15,16] 7 1 7
(16,17] 5 1 5
(17,19] 7 2 3.5
Ŷŝ Ěŝ
ϭϮ ϭϮ
ϭϬ ϭϬ
ϴ ϴ
ϲ ϲ
ϰ ϰ
Ϯ Ϯ
ϭϯϭϰϭϱϭϲϭϳϭϴϭϵ ϭϯϭϰϭϱϭϲϭϳϭϴϭϵ
Medidas de posición
• De tendencia central:
• Media
• Mediana
• Moda
k k
1X X
x= xi ni = xi fi
n
i=1 i=1
Propiedades
1 mín xi ≤ x ≤ máx xi
k
P
2 (xi − x)ni = 0
i=1
3 Linealidad: a + bx = a + bx
4 Si la distribución de frecuencias es simétrica respecto a un valor
c, entonces x = c.
Media aritmética
Ejemplo
Edad ni
Edad ni
8 5
8 5
9 10
9 10
10 5
10 5
45 1
Ejemplo
Si calculamos la media como
6+5+8
= 6,33 no sería correcto.
Grupo Ti xi 3
A 20 6 Debemos tener en cuenta el número
B 50 5 de individuos en cada grupo y
C 15 8 ponderar
20 · 6 + 50 · 5 + 15 · 8
= 5,76
20 + 50 + 15
x 1 T1 + x 2 T2 + . . . + x L TL
x=
T1 + T2 + . . . + TL
Moda
Ejemplo
no de crías ni temperatura ni ai di
3 8 (13,15] 12 2 6
4 20 (15,16] 7 1 7
5 28 (16,17] 5 1 5
6 24 (17,19] 7 2 3.5
Mediana
Una vez ordenados los valores de menor a mayor, la mediana Me(x )
es aquel valor que divide la distribución de frecuencias en dos partes
iguales. Es decir, excluida la Mediana, el 50 % de los datos son
inferiores a ésta y el otro 50 % superiores.
Ejemplo
Dados los siguientes valores, calcula su mediana: 45, 20, 10, 80, 7,
30, 100. Para ello es necesario ordenarlos primero.
7, 10, 20, Me(x)=30, 45, 80, 100
1, 7, 10, 20, 30, 45, 80, 100.
Cálculo de la mediana:
Ejemplo
no hijos ni Ni
0 10 10
1 20 30
2 23 53
3 5 58
4 2 60
Mediana
Mientras que la media era una medida muy poco robusta, la mediana
sí que lo es. Retomando el ejemplo anterior:
Ejemplo
Edad ni Ni
Edad ni Ni
8 5 5
8 5 5
9 10 15
9 10 15
10 5 20
10 5 20
45 1 21
Principales cuantiles:
Ejemplo
no hijos ni Ni
0 10 10
1 20 30
2 23 53
3 15 68
4 12 80
Datos atípicos y cómo detectarlos
LI = C1 − 1,5(C3 − C1 ) >^
LS = C3 + 1,5(C3 − C1 )
ϯ
Ϯ
Todos aquellos datos
que se salgan de ϭ
dichos bigotes se >/
considerarán atípicos.
Medidas de Dispersión
p
Desviación típica: raiz cuadrada de la varianza S(x ) = S 2 (x ).
Propiedades
• NUNCA son negativas S 2 (x ) ≥ 0, S(x ) ≥ 0.
1P k
• S 2 (x ) = x 2 ni − x 2 .
n i=1 i
• SS2 (ax + b) = a2 S 2 (x ) y por tanto S(ax + b) = aS(x ).
Varianza en subpoblaciones
La población está divida en grupos de los cuales conocemos:
cuántos individuos hay en cada uno de ellos y la media y la varianza
de una determinada variable dentro de cada grupo.
Grupo Ti xi Si2
1 20 6 1
2 50 5 1.6
3 15 8 3
n 3 3
ni (xi − x)2 Ti Si2 ni (x i − x )2
P P P
i=1 i=1 i=1
Varianza = = +
n 3
P 3
P
Ti Ti
i=1 i=1
Varianza en subpoblaciones
Ejemplo
Grupo Ti xi Si2
1 20 6 1
La media global es X = 5,76.
2 50 5 1.6
3 15 8 3
1
S2 = [20 · 1 + 15 · 1,6 + 15 · 3]
85
1
20(6 − 5,76)2 + 50(5 − 5,76)2 + 15(8 − 5,76)2
+
85
= 1,2388 + 1,7059 = 2,9447.
Medidas de Dispersión relativas
Estas medidas no llevan unidades asociadas, son adimensionales.
S(x )
V (x ) =
x
Ejemplo
En un estudio sobre la merluza, se ha observado que el ejemplar
adulto tiene un peso medio de 2000gr con una dispersión de 250gr,
en cambio, en el caso del ejemplar joven (pescadilla) el peso medio
es de 500gr con una dispersión de 80gr. ¿En qué grupo hay mayor
variabilidad?
250gr 80gr
250gr > 80gr sin embargo = 0,125 < = 0,16
2000gr 500gr
Medidas de Forma: asimetria
Interpretación
• g1 > 0: asimetría positiva o por la derecha.
• g1 < 0: asimetría negativa o por la izquierda.
• g1 = 0: la distribución es simétrica.
Medidas de Forma: asimetria
Coeficiente de asimetría de Fisher
1P k
ni (xi − x)3
n i=1
g1 =
S(x )3
Interpretación
• g2 > 0: Distribución leptocúrtica: más apuntamiento que la
distribución normal.
• g2 = 0: Distribución mesocúrtica: apuntamiento equivalente a la
distribución normal.
• g2 < 0: Distribución platicúrtica: menos apuntamiento que la
distribución normal.
Medidas de forma: apuntamiento o
curtosis
Coeficiente de curtosis de Fisher
1Pk
ni (xi − X )4
n i=1
g2 = 4
−3
Sn,X
0,80
0,60
g2> 0
g2= 0
0,40
g2< 0
0,20
0,00
10
8
frecuencias
6
4
2
0
0 10 20 30 40
1 2 3 4
ln(x)
Transformaciones no lineales
40 x ln(x)
3.5
3.0
30
2.5
20
2.0
1.5
10
1.0
0.5