Sei sulla pagina 1di 47

Estadstica Descriptiva

Textos guas
Estadstica para Ingenieros y
cientficos
William Navidi
McGrawHill
Estadsitica y Probabilidad.
Montgomery
Henry Lamos D
7/14/15

Estadstica Descriptiva. Doctor en


Matemticas Lamos H

1-1

Descripcin de los datos:


distribuciones de
frecuencias y
representaciones grficas
Distribucin de frecuencias: agrupamiento
de datos en categoras que muestran el
nmero de observaciones en cada categora
mutuamente excluyente.

7/14/15

PROFESOR LAMOS H

Estadstica Descriptiva. Doctor en


Matemticas Lamos H

2-3

Elaboracin de una distribucin de frecuencias

p r e g u n ta q u e
se desea
re s p o n d e r

r e c o le c c i n
d e d a to s
( d a to s o rig in a le s )

o rg a n iz a c i n
d e d a to s

p r e s e n ta c i n
d e d a to s
(g r fic a )

d is tr ib u c i n
d e fr e c u e n c ia s

7/14/15

Estadstica Descriptiva. Doctor en


Matemticas Lamos H

o b te n c i n
de
c o n c lu s io n e s

2-5

EJEMPLO 1
Un profesor de estadstica
matemtica y desea determinar
cuntas horas estudian los alumnos.
Selecciona una muestra aleatoria de
30 estudiantes y determina el nmero
de horas por semana que estudia cada
uno: 15.0, 23.7, 19.7, 15.4, 18.3, 23.0,
14.2, 20.8, 13.5, 20.7, 17.4, 18.6,
12.9, 20.3, 13.7, 21.4, 18.3, 29.8,
17.1, 18.9, 10.3, 26.1, 15.7, 14.0,
17.8, 33.8, 23.2, 12.9, 27.1, 16.6
Descriptiva. Doctor en
Organice losEstadstica
7/14/15
datos
en una distribucin
4
Matemticas Lamos H

2-6

Considere las clases 8-12 y 13-17. Las marcas de clase son


10 y 15. El intervalo de clase es 5 (13 - 8).

EJEMPLO 1

7/14/15

continuacin

Estadstica Descriptiva. Doctor en


Matemticas Lamos H

2-9

Distribucin de frecuencia relativas


La frecuencia relativa de una clase se obtiene
dividiendo la frecuencia de clase entre la
frecuencia total.
Horas

7/14/15

Estadstica Descriptiva. Doctor en


Matemticas Lamos H

2-10

Representaciones de tallo y
hoja

Representaciones de tallo y hoja: tcnica


estadstica para representar un conjunto
de datos. Cada valor numrico se divide
en dos partes: los dgitos principales son el
tallo y el dgito siguiente es la hoja.
Nota: una ventaja de la representacin de
tallo y hoja comparado con la distribucin
de frecuencias es que no se pierde la
identidad de cada observacin.
7/14/15

Estadstica Descriptiva. Doctor en


Matemticas Lamos H

2-11

EJEMPLO 2

CAROLINA logr las siguientes


calificaciones en el doceavo
examen de matemticas del
semestre: 86, 79, 92, 84, 69, 88,
91, 83, 96, 78, 82, 85. Construya
una representacin de tallo y hoja
para los datos.

7/14/15

Estadstica Descriptiva. Doctor en


Matemticas Lamos H

2-12

Representacin grfica de los datos


Las tres formas de grficas ms
usadas son histogramas, polgonos
de frecuencia y distribuciones de
frecuencias acumuladas (ojiva).
Histograma: grfica donde las clases
se marcan en el eje horizontal y las
frecuencias de clase en el eje
vertical. Las frecuencias de clase se
representan por las alturas de las
barras y stas se trazan adyacentes

7/14/15

Estadstica Descriptiva. Doctor en


Matemticas Lamos H

2-13

Representacin grfica de los datos

Un polgono de frecuencias
consiste en segmentos de lnea
que conectan los puntos
formados por el punto medio de
la clase y la frecuencia de clase.
Una distribucin de frecuencias
acumulada (ojiva) se usa para
determinar cuntos o qu
proporcin de los valores de los

7/14/15

Estadstica Descriptiva. Doctor en


Matemticas Lamos H

10

2-14

Histograma para los datos Horas de estudio

7/14/15

Estadstica Descriptiva. Doctor en


Matemticas Lamos H

11

2-15

Polgono de frecuencias
para las horas de estudio

7/14/15

Estadstica Descriptiva. Doctor en


Matemticas Lamos H

12

2-16

Distribucin de frecuencias
acumuladas menor que
para las horas de estudio

7/14/15

Estadstica Descriptiva. Doctor en


Matemticas Lamos H

13

2-17

Grfica de los datos medidos en escalas ordinal /nominal

Grfica de barras: construir una


grfica de barras para el nmero de
personas desempleadas por cada
100 000 habitantes de ciertas
ciudades en 1995.

7/14/15

Estadstica Descriptiva. Doctor en


Matemticas Lamos H

14

2-18

Representacin grfica de los datos

7/14/15

Estadstica Descriptiva. Doctor en


Matemticas Lamos H

15

2-19

Grfica de barras para los


datos de desempleados

7/14/15

Estadstica Descriptiva. Doctor en


Matemticas Lamos H

16

MATRICULADOS TOTAL

7/14/15

Estadstica Descriptiva. Doctor en


Matemticas Lamos H

17

2-20

Representacin grfica de los datos

Una grfica circular es en


especial til para desplegar una
distribucin de frecuencias
relativas. Se divide un crculo de
manera proporcional a la
frecuencia relativa y las
rebanadas representan los
diferentes grupos.
Se pidi a una muestra de 200
corredores que indicaran su tipo

7/14/15

Estadstica Descriptiva. Doctor en


Matemticas Lamos H

18

2-21

EJEMPLO 4

continuacin

Dibuje una grfica circular basada en la


siguiente informacin.
Tipo de zapato
# de corredores

7/14/15

Nike

92

Adidas

49

Reebok

37

Asics

13

Otros

9
Estadstica Descriptiva. Doctor en
Matemticas Lamos H

19

2-22

Grfica circular para tipos


de zapatos

7/14/15

Estadstica Descriptiva. Doctor en


Matemticas Lamos H

20

Cruce variables: Relacin trabajo


profesin vs Trabajo desarrollar

7/14/15

Estadstica Descriptiva. Doctor en


Matemticas Lamos H

21

4-18

Coeficientes de Asimetra y de apuntamiento


Asimetra (sesgo) es la medida de la falta de simetra
en una distribucin.
El coeficiente de asimetra se calcula mediante la
siguiente frmula:

7/14/15

22

Simetra y curtosis
n

1
simestra
n

3
(
x

x
)
i
i 1

s3
n

4
(
x

x
)
i

1 i 1
n
s4
Una medida adimension al : valor z
simetra
z simetria =
6/N
Curtosis
Curtosis

z cusrtosis =

curtosis
24 / N

3-26

Distribucin simtrica
sesgo cero
= media

7/14/15

moda = mediana

24

3-27

Distribucin con asimetra positiva


sesgo a la derecha: media y
mediana se
encuentran a la
derecha de la moda.

7/14/15

moda < mediana < media

25

3-28

Distribucin con asimetra negativa


sesgo a la izquierda: media y
mediana
estn a la izquierda de la
moda.

7/14/15

26

3-29

NOTA
Si se conocen dos promedios de una
distribucin de frecuencias con sesgo
moderado, el tercero se puede
aproximar.
moda = media - 3(media - mediana)
media = [3(mediana) - moda]/2
mediana = [2(media) + moda]/3

7/14/15

27

4-26

Diagrama de caja
Un diagrama de caja es una ilustracin
grfica, basada en cuartiles, que ayuda
a visualizar un conjunto de datos.
Se requieren cinco tipos de datos para
construir un diagrama de caja: el valor
mnimo, el primer cuartil, la mediana, el
tercer cuartil, y el valor mximo.

7/14/15

28

4-26

Diagramas de caja
Calcule la mediana, el primero y tercer
cuartil de la muestra. Indique stos con
lneas horizontales. Dibuje lneas
verticales para completar la caja.
Encuentre el valor de la muestra ms
grande que no est a ms de 1.5IQR
arriba del tercer cuartil y el valor de la
muestra ms pequeo que no est a
ms de 1.5 IQR debajo del primer cuartil.
Extienda lneas verticales (bigotes)
7/14/15

29

4-26

Diagramas de caja
Puntos a ms de 1.5IQR arriba del tercer
cuartil, o a mas de 1.5IQR del primer
cuartil, se denominan datos atpicos.

7/14/15

30

Edad

7/14/15

Estadstica Descriptiva. Doctor en


Matemticas Lamos H

31

7/14/15

Estadstica Descriptiva. Doctor en


Matemticas Lamos H

32

Tabla de Frecuencias para Edad


Lmite
Clase Inferior
1
2
3
4

Lmite
Superior

Frecuencia Frecuencia Frecuencia


Punto Medio
Frecuencia Relativa
Acumulada Rel. Acum.

menor o igual
19,0
19,0 20,0 19,5
9
20,0 21,0 20,5
6
21,0 22,0 21,5
3
22,0 23,0 22,5
1
mayor de 23,0

6
0,2308
0,3462
15
0,2308
21
0,1154
24
0,0385
25
1
0,0385

6
0,2308
0,5769
0,8077
0,9231
0,9615
26
1,0000

Media = 20,5 Desviacin Estndar = 1,30384

7/14/15

Estadstica Descriptiva. Doctor en


Matemticas Lamos H

33

Ejemplo en clase
Se lleva a cabo un experimento para probar la capacidad
de un determinado polmero para eliminar desechos
txicos del agua. Se considera que la temperatura es un
factor importante en la eliminacin de desechos. Se mide
el porcentaje de impurezas eliminadas por el polmero.

34

DATOS

TRATAMIENTOS.
A baja
temperatura
42

A temperatura A Alta
media
temperatura
36
33

41

35

44

37

32

40

29

38

36

35

39

44

40

42

37

32

34

45

REPLICA 1

35

36

Resumen Estadstico
Temperat Recuent Promedi Desviacin
o
o
Estndar
1
7
36,5714 4,85994

Coeficiente de
Variacin
13,2889%

Mnimo Mximo Rango


29,0

42,0

13,0

36,5714 3,35942

9,18592%

32,0

42,0

10,0

39,8571 4,67007

11,717%

33,0

45,0

12,0

Total

21

37,6667 4,41965

11,7336%

29,0

45,0

16,0

37

3-18

Media de datos agrupados


La media de una muestra de datos
organizados en una distribucin de
frecuencias se calcula mediante la
siguiente frmula:
k

x
7/14/15

f
i 1

xk

Estadstica Descriptiva. Doctor en


Matemticas Lamos H

38

3-19

EJEMPLO 9
Una muestra de diez cines en una
gran rea metropolitana dio el
nmero total de pelculas exhibidas
la semana anterior. Calcule la media
de las pelculas proyectadas.

7/14/15

Estadstica Descriptiva. Doctor en


Matemticas Lamos H

39

3-20

EJEMPLO 9

continuacin

61/10 = 6.1 pelculas


7/14/15

Estadstica Descriptiva. Doctor en


Matemticas Lamos H

40

3-25

Moda de datos agrupados


La moda de los datos agrupados se
aproxima por el punto medio de la
clase que contiene la frecuencia de
clase mayor.
Las modas en el EJEMPLO 10 son 5.5
y 9.5. Cuando dos valores ocurren
una gran cantidad de veces, la
distribucin se llama bimodal, como
en el ejemplo 10.
7/14/15

Estadstica Descriptiva. Doctor en


Matemticas Lamos H

41

4-25

Frmula para percentiles

P
Lp = ( n + 1)
100
7/14/15

Estadstica Descriptiva. Doctor en


Matemticas Lamos H

42

Taller en clase 1.

7/14/15

Estadstica Descriptiva. Doctor en


Matemticas Lamos H

43

x
G
F
E
D
C
B
A
5
4
3
2
1

Empresa
s
A
B
C
D
E
F
G
MEDIA
desv
estandar
desv
estandar
1
7/14/15

x1
30
40
10
5
50
15
30
25,71

x2
180
220
50
30
200
80
150
130

x3
2
6
7
4
2
8
5
4,85

x4
3
10
9
4
2
7
5
5,71

x5
5
16
15
12
20
10
5
11,85

15,21 70,50 2,16

2,81

5,2

16,4

3,039 5,63

76,15 2,34
Estadstica Descriptiva. Doctor en
Matemticas Lamos H

44

1)
2)
3)
4)
5)
6)
7)
8)
9)

7/14/15

Encuentre la media para cada una de las variables


Encuentre la desviacin estndar
Encuentre la mediana
Encuentre la media recortada a 10%
Encuentre el primer cuartil
Encuentre el rango intercuartil
Construya un diagrama de caja
Determine el valor de A y K.
Presente un informe ejecutivo sobre las empresas.

Estadstica Descriptiva. Lamos H

45

Trabajo de clase
Con el propsito de comparar los precios del pan (de una
determinada marca) se llevo a cabo un estudio en cuatro zonas del
rea metropolitana: Caaveral, Centro, Cabecera y Girn. En cada
zona de la ciudad se tomaron muestra de 8 tiendas, pero en Girn,
debido a una omisin, se tom una muestra solamente 7 tiendas.
Cul zona seleccionara para comprar pan?
En cul zona considera que existe mayor variabilidad en los
precios? Podra explicar la variacin de los precios en las diferentes
zonas.
Realizar una grfica de perfiles del precio en funcin de la zona.
Calcular la media armnica y geomtrica y compararlas con la
media aritmtica.
Calcular el promedio de las desviaciones cuadrticas respecto a las
tres medidas de tendencia central.
46

Zona
Caaver
al
Centro
Cabecer
a
Girn

Precio del pan


59
63
65

61

64

58

60 61

58
55

61
59

64
55

63
58

57
59

60
56

63 60
60 55

69

70

65

70

66

71

69

47

Potrebbero piacerti anche