Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Profesor de teora:
Andrs M. Alonso
Despacho 10.1.32
E. Mail: andres.alonso@uc3m.es
Web: www.est.uc3m.es/amalonso
Web docente: http://www.est.uc3m.es/amalonso/esp/docencia.html
Profesores de prctica:
Concepcin Molina (Grupo 30)
Javier Reques (Grupo 31)
Natalia Fojo (Grupo 32)
1
Estadstica I
Temario de la asignatura
Probabilidad.
Distribuciones muestrales.
Estimacin puntual.
Contrastes de hiptesis.
2
Estadstica I
Bibliografa bsica
Newbold, P., Carlson, W.L. y Thorne, B. (2008)
Estadstica para Administracin y Economa,
Editorial Prentice Hall, Madrid.
Pea, D. (2001) Fundamentos de Estadstica, Alianza
Editorial, Madrid.
Pea, D. y Romo, J. (1997) Introduccin a la
Estadstica para las Ciencias Sociales, Editorial
McGraw Hill, Madrid.
3
Estadstica I
Bibliografa complementaria
Levin, R.I. y Rubin, D.S. (2004) Estadstica para
Administracin y Economa, Editorial Prentice Hall,
Madrid.
Newbold, P. (2001) Estadstica para los Negocios y la
Economa, Editorial Prentice Hall, Madrid.
Martn Pliego, F.J. (2004) Introduccin a la Estadstica
Econmica y Empresarial, Thomson Editores,
Madrid.
Moore, D.S. (1998) Estadstica Aplicada Bsica,
Editorial Antoni Bosch, Barcelona.
4
Tablas de frecuencias
Diagrama de barras, Diagrama de sectores, Histograma, y
Diagrama de caja
3. Resumen numrico
Medidas de localizacin
Medidas de dispersin
Medidas de forma
Lecturas recomendadas:
Captulos 1 al 3 del libro de Newbold, Carlson, y Thorne (2008).
Captulos 1 y 2 del libro de Pea (2001).
Captulos 1 al 5 del libro de Pea y Romo (1997).
5
Definiciones bsicas
Poblacin
a b cd
ef gh i jk l m n
o p q rs t u v w
x y
z
Muestra
c
gi
o
r
y
n
u
Ejemplos de poblaciones
Muestreo aleatorio
aleatoria simple
12
Estadstica Descriptiva
Inferencia Estadstica
Numricos
Categricos
Ejemplos:
Estado Civil
Es mayor de edad?
Color de Ojos
(Categoras definidas o
grupos)
Discretos
Ejemplos:
Continuos
Ejemplos:
Nmero de hijos
Peso
Voltaje
(Caractersticas Medibles)
14
Niveles de medida
Diferencias entre
medidas, dado que
existen ceros
verdaderos
Diferencias entre
medidas pero no
existe un cero
verdadero
Categoras ordenadas
(rangos, orden, o
escalamientos)
Datos de Razn
Datos Cuantitativos
Datos de Intervalo
Datos Ordinales
Datos Cualitativos
Datos Nominales
15
Representaciones y grficos
Representaciones y grficos
Tcnicas que se presentan en este tema
Variables
Categricas
Distribucin Frecuencias
Diagrama de Barras
Diagrama de Tarta
Variables
Numricas
Distribucin Frecuencias
Histograma
Diagrama de Caja
17
Tabulacin Datos
Tabla
Distribucin
Frequencias
Graficos Datos
Diagrama
Barras
Diagrama
Tarta
18
Tabla de frecuencias
Resumir datos por categoras
Ejemplo: Pacientes de un Hospital segn Servicio
Indice
Clase
i=
Servicio
Hospital
Clase
ci
1,...,k
1
2
3
4
5 (=k)
Cardiologa
Emergencias
UCI
Maternidad
Ciruga
Nmero de Pacientes
Frequencia Absoluta
ni = nmero de
observaciones clase ci
1052
2245
340
552
4630
Proporcin de
Pacientes
Frequencia
Relativa
f i = ni / n
0.12
0.25
0.04
0.06
0.53
Surgery
Maternity
Intensive
Care
0
Emergency
1052
2245
340
552
4630
Cardiac
Care
Cardiac Care
Emergency
Intensive Care
Maternity
Surgery
Nmero
Pacientes
Number of
patients per year
Hospital
Unidad
21
Numero
Pacientes
% de
Total
1052
2245
340
552
4630
11.93
25.46
3.86
6.26
52.50
Surgery
53%
(Porcentajes
se redondean
al valor ms
cercano)
Emergency
25%
Intensive Care
4%
Maternity
6%
22
Datos
Numricos
Distribuciones de
Frecuencias y
Distribuciones
Acumuladas
Histogramas
23
Distribucin de frecuencias
24
25
27
Calcular el rango: 58 - 12 = 46
28
Intervalos
10 y menos que 20
20 y menos que 30
30 y menos que 40
40 y menos que 50
50 y menos que 60
Total
Frecuencias
3
6
5
4
2
20
Freq.
Relativas
.15
.30
.25
.20
.10
1.00
Porcentaje
15
30
25
20
10
100
29
Histograma
30
Ejemplo de Histograma
Intervalo
Frecuencia
2
1
(Sin huecos
entre barras)
6
Frequency
10 y menos que 20
20 y menos que 30
30 y menos que 40
40 y menos que 50
50 y menos que 60
0
0
10
20 30 40
50
Temperature in Degrees
60
31
bloques
2
1.5
1
0.5
60
More
56
52
48
44
40
36
32
28
24
20
16
12
Temperature
12
10
Frequency
2.5
3.5
Frequency
8
6
4
2
0
0
30
60
More
Temperature
33
Clase
Frecuencia Porcentaje
Frecuencia Porcentaje
Acumulada Acumulada
10 y menos que 20
15
15
20 y menos que 30
30
45
30 y menos que 40
25
14
70
40 y menos que 50
20
18
90
50 y menos que 60
10
20
100
20
100
Total
34
Forma de la distribucin
La forma de la distribucin se dice que es
simtrica si las observaciones estn
equilibradas, o distribuidas simtricamente
respecto al centro.
Frequency
Symmetric Distribution
10
9
8
7
6
5
4
3
2
1
0
1
35
Forma de la distribucin
La forma de la distribucin se dice que es asimtrica
si las observaciones NO estn equilibradas, o
distribuidas simtricamente respecto al centro.
Positively Skewed Distribution
12
10
Frequency
8
6
4
2
0
1
8
6
4
2
0
1
36
Resumen numrico
Descripcin numrica de datos
Tendencia Central
Variacin
Media Aritmtica
Rango
Mediana
Rango Intercuartlico
Moda
Varianza
Desviacin estndar
Coeficiente de Variacin
37
Media
Mediana
Moda
x
x=
i=1
Media
Aritmtica
Punto central
de los valores
ordenados
Valor observado
ms frecuente
38
Media aritmtica
La media aritmtica (media) es la medida ms
comn de tendencia central
Para una poblacin de N valores:
N
x1 + x 2 + + x N
=
=
N
N
i=1
Valores
Poblacin
Tamao Poblacin
x
x=
i=1
Valores
observados
x1 + x 2 + + x n
=
n
Tamao muestra
39
Media aritmtica
Es la medida ms comn de tendencia central
Es una medida de fcil clculo
Afectada por valores extremos (outliers)
0 1 2 3 4 5 6 7 8 9 10
Media = 3
1 + 2 + 3 + 4 + 5 15
=
=3
5
5
0 1 2 3 4 5 6 7 8 9 10
Media = 4
1 + 2 + 3 + 4 + 10 20
=
=4
5
5
40
Mediana
En una lista ordenada, la mediana es valor
central (50% por encima, 50% por debajo)
0 1 2 3 4 5 6 7 8 9 10
Mediana = 3
0 1 2 3 4 5 6 7 8 9 10
Mediana = 3
41
Clculo de la mediana
La localizacin de la mediana:
Posicin Mediana =
n +1
posicin en los datos ordenados
2
n +1
no es el valor de la mediana, slo es
2
la posicin de la mediana en los datos ordenados
Ntese que
42
Moda
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Moda = 9
0 1 2 3 4 5 6
Sin Moda
43
Ejemplo
Cinco casas en una colina cerca de la playa
$2,000 K
Precios Casas:
2.000.000
500.000
300.000
100.000
100.000
$500 K
$300 K
$100 K
$100 K
44
Ejemplo
Precios Casas:
2.000.000
500.000
300.000
100.000
100.000
Suma 3.000.000
Media:
(3.000.000/5)
= 600.000
46
Forma de la distribucin
Describe cmo se distribuyen los datos
Medidas de forma
Simtrica o asimtrica
Asim. Izquierda
Media < Mediana
Simtrica
Asim. Derecha
Media = Mediana
47
Medidas de variacin
Variacin
Rango
Rango
Intercuartlico
Varianza
Desviacin
estndar
Coeficiente
de Variacin
48
Rango
Medida ms simple de variacin
Diferencia entre la mayor y la menor de las
observaciones:
13 14
Rango = 14 - 1 = 13
49
10
11
12
Rango = 12 - 7 = 5
10
11
12
Rango = 12 - 7 = 5
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120
Rango = 120 - 1 = 119
50
Rango intercuartlico
Se pueden eliminar algunos problemas de
outliers usando el rango intercuartlico
Elimina valores muy grandes y muy pequeos
calculando el rango de la parte central formada
por el 50% de los datos
Rango Intercuartlico = 3er cuartil 1er cuartil
IQR = Q3 Q1
51
Rango intercuartlico
Ejemplo:
X
mnimo
Q1
25%
12
Mediana
(Q2)
25%
30
25%
45
Q3
mximo
25%
57
70
Rango Intercuartlico
= 57 30 = 27
52
Cuartiles
Cuartiles dividen los datos ordenados en 4 segmentos
con igual nmero de valores por segmento
25%
25%
Q1
25%
Q2
25%
Q3
Q1 = 0.25(n+1)
Q2 = 0.50(n+1)
Q3 = 0.75(n+1)
54
Varianza poblacional
Media de las desviaciones al cuadrado de los
valores a la media
N
(x
2
=
donde
i =1
= media poblacin
N = tamao poblacin
xi = iesimo valor de la variable x
56
Varianza muestral
Promedio de las desviaciones al cuadrado de
los valores a la media
n
(x
Varianza Muestral:
2
s =
donde
x)
i =1
n -1
x = media aritmtica
n = tamao muestral
xi= iesimo valor de la variable x
57
(x
=
i =1
N
58
2
(x
x
)
i
s=
i =1
n -1
59
Medida de variacin
60
Ejemplo
Datos
Muestrales (xi): 10
12
14
15
n=8
s =
17
18
18
24
Media = x = 16
126
7
+ (12 16)
4 . 2426
+ (14 16)
7
+ + (24 16)
SC = Suma de Cuadrados:
n
SC(x) = (x i x) = x nx
2
i =1
2
i
i =1
x
s=
2
i
nx
i =1
n -1
62
12
13
14
15
16
17
18
19
20 21
Media = 15.5
s = 3.122
20 21
Media = 15.5
s = 0.866
20 21
Media = 15.5
s = 4.275
Datos B
11
12
13
14
15
16
17
18
19
Datos C
11
12
13
14
15
16
17
18
19
63
64
Coeficiente de variacin
Medida de la variacin relativa
Se expresa en porcentaje (%)
Muestra la variacin relativa respecto a la media
Se puede usar para comparar dos o ms conjuntos de
datos, medidos en diferentes unidades
s
100%
CV =
x
65
s
CVA =
x
5
100% = 10%
100% =
50
Stock B:
Precio medio ltimo ao = 100
Desviacin estndar = 5
s
CVB =
x
5
100% = 5%
100% =
100
Ambos stocks
tienen la misma
desviacin
estndar, pero
el stock B es
menos variable
en relacin a su
precio
66