Sei sulla pagina 1di 37

Medidas de Tendencia Central

PI-2610 Probabilidad y Estadstica I


Marco Alvarado Pea
Sesin 2

Saludos estimado (a), estudiante.


En la sesin de hoy bsicamente nos planteamos los siguientes
objetivos

Objetivos de Aprendizaje
Que el estudiante sea capaz de:
1. Aprender a hacer una distribucin de frecuencias.
2. Reconocer los conceptos bsicos entorno a las medidas de
tendencia central y de dispersin.

ndice
Medidas de Tendencia Central..................................................1
Objetivos de Aprendizaje...................................................... 2
Anlisis de Datos.................................................................... 5
Conceptos y definiciones...................................................... 6
Medidas de Tendencia Central............................................. 7
Datos no agrupados.............................................................. 10
Datos agrupados................................................................... 13
Desviacin Estndar.............................................................. 14
Medidas de Tendencia Central y de Dispersin
para datos agrupados........................................................... 21
Medidas de Tendencia Central y Dispersin para
datos agrupados y no agrupados, demanda semanal de
televisores............................................................................. 23
Anlisis de datos, definiciones............................................. 24
Rango....................................................................................24
Varianza y Covarianza.......................................................... 25
Varianza................................................................................ 26
Covarianza............................................................................ 28
Interpretacin de la covarianza............................................. 28
3

Coeficiente de variacin........................................................ 29
Kurtosis................................................................................... 31
Lnea base: la distribucin normal........................................ 32
Datos de picos altos.............................................................. 33
Datos de picos bajos............................................................. 33
Anotaciones a recordar......................................................... 34
Referencias............................................................................. 37

Anlisis de Datos
Medidas de tendencia central
- Media aritmtica simple y ponderada
- Mediana
- Moda



Fig 1. Anlisis de Datos

Conceptos y definiciones
- Medidas de variabilidad
- Rango
- Varianza y covarianza
- Desviacin estndar
- Coeficiente de variacin
- Kurtosis

Medidas de Tendencia Central


Hay dos medidas estadsticas que caracterizan a las Distribuciones de
Frecuencia de las variables aleatorias:

Medidas de Tendencia Central


Media Aritmtica
Mediana
Moda

Medias de Dispersin
Desviacin Estndar Variabilidad

Ejemplo
Para reconocer las medidas de tendencia central y de dispersin
tenemos el siguiente ejemplo:
Nmero de televisores vendidos por semana.
Demanda Semanal de Televisores
1

10

10

10

10

10

Distribucin de frecuencias del nmero de televisores


Frecuencia

Frecuencia

absoluta

relativa (%)

02

10

0,10

24

20

0,20

46

40

0,40

68

20

0,20

8 10

10

0,10

Demanda semanal

Datos no agrupados
Cuando no se tienen los datos agrupados como en el caso de la
demanda de televisores se puede calcular la media aritmtica de la
siguiente manera:
- Media aritmtica

! =

!
!!!

- Varianza poblacional

!
!!!(!

)!

Tarea: Investigue y explique las frmulas de la media muestral y la


varianza.
Responda:Porqu para la varianza se eleva al cuadrado?

10

Para el caso de los televisores la media es un simple promedio que


resulta de sumar todos los datos y dividirlos entre el total de datos que
se tengan en la muestra.
- Media aritmtica
Xp = 1+7+3+8+.....+5+3+3 = 5,46
100
R/ La media aritmtica de demanda semanal de televisores es de 5.46.
Claro est que no se venden 5.46 televisores, as que segn criterio
experto lo puede redondear siguiendo las reglas del redondeo. Para
ste caso podramos hablar de 6 televisores por ser una variable
aleatoria discreta.

11

- Varianza poblacional

! = (1- 5,46)2 + (7- 5,46)2 +.... + (3- 5,46)2 + (3- 5,46)2 = 5,1802
100 1
En el caso de la varianza se aplica la frmula antes citada y resulta
en 5,1802. Este valor deriva en:

! = 2,276

De dnde viene este valor?

Este valor viene de sacar la raz cuadrada de la varianza y trabajar


en trminos de la desviacin estndar.

12

Datos agrupados
Si usted cuenta con los datos ya agrupados en una
distribucin de frecuencias puede tambin obtener
la media aritmtica y la varianza con las siguientes
frmulas:
- Media aritmtica: ! es el punto medio de
cada uno de los intervalos o clases que
componen la distribucin de frecuencias, : !
es la frecuencia absoluta de cada uno de los
intervalos de clase y k es el nmero de
intervalos de la distribucin de frecuencias.

- Varianza de una poblacin de datos


agrupados: se denotar al promedio
ponderado de las desviaciones cuadrticas
que se producen con respecto a la media
aritmtica ponderada donde: k representa el
nmero de intervalos de la distribucin. ! es
el punto medio del intervalo de K; !
frecuencia del intervalo k; N es el total de los
datos de la poblacin y ! promedio
aritmtico ponderado.
2 = = ( )! /

= = 1 /
= = 1

13

Desviacin Estndar
La medida es la medida de dispersin ms comn, que indica cun
separados de la media (o del valor especificado como target) estn
los datos, la desviacin estndar estima aproximadamente la distancia
promedio de las observaciones individuales con respecto a la media.
Mientras mayor sea la desviacin estndar, mayor ser la dispersin
de los datos.
Por ejemplo, los administradores hacen seguimiento al tiempo de
egreso de los pacientes tratados en las reas de Urgencia de dos
hospitales. Aunque los tiempos de egreso promedio son
aproximadamente iguales (35 minutos), las desviaciones estndar son
significativamente diferentes.

14

Hospital 1

Hospital 2

La desviacin estndar es

La desviacin estndar es

aproximadamente 6. En

aproximadamente 20. En

promedio, el tiempo para dar de

promedio, el tiempo para dar de

alta aun paciente se desva de

alta a un paciente se desva de

la media (lnea azul)

la media (lnea azul)

aproximadamente 6 minutos.

aproximadamente 20 minutos.

Fig 2. Hospital 1 y 2

15

La desviacin estndar se calcula tomando la raz cuadrada positiva de


la varianza (otra medicin de la dispersin de los datos). Sin embargo,
comnmente es ms conveniente e intuitivo trabajar con la desviacin
estndar, porque sta utiliza las mismas unidades que los datos de
origen. Por ejemplo, si una pieza de una mquina se pesa en gramos,
la desviacin estndar de su peso tambin se calcula en gramos,
mientras que su varianza se calcula en gramos2 y si se deja as su
anlisis se hace imprctico.
En una distribucin normal (datos en forma de campana), las
desviaciones estndar sucesivas con respecto a la media proveen
valores de referencia tiles para estimar el porcentaje de observacin
de datos. Unidad:

Fig 3. Desviacin

16

Alrededor del 95% de las observaciones estn dentro de 2


desviaciones estndar de la media, indicadas por el rea sombreada
en gris en la figura anterior.
Aproximadamente el 68% de las observaciones estn dentro de 1
desviacin estndar de la media (-1, + 1), y alrededor del 99.7% de las
observaciones estaran dentro de 3 desviaciones estndar de la media
(-3, + 3).

17

La desviacin estndar (s) es la


raz cuadrada de la varianza.

1
=

(! )!
!!!

As la varianza es la media de
los cuadrados de las diferencias
entre cada valor de la variable x
y la media aritmtica de la
distribucin.

18

Es imperioso recordar que en la vida diaria, en la prctica interesa


realizar inferencias poblacionales, por lo que en el denominador de la
frmula de varianza arriba reflejada, en vez de n, se usa n 1 grados
de libertad, (Correccin de Bessel), ya que se est infiriendo a partir de
muestras y por tanto los grados de libertad es importante tomarlos en
cuenta. Esta ocurre cuando la media de la muestra se utiliza para
centrar los datos, en lugar de la media de la poblacin.
Puesto que la media de la muestra es una combinacin lineal de los
datos, el residual a la muestra media se extiende ms all del nmero
de grados de libertad por el nmero de ecuaciones de restriccin en
este caso uno.
Dado esto a la muestra as obtenida de la poblacin se le aplica esta
correccin con la frmula desviacin estndar muestral.
Cuando los casos tomados son iguales al total de la poblacin se
aplica la frmula de desviacin estndar poblacional.

19

La frmula de varianza para una muestra a utilizar es:

! =

!
!!!(!

)!
1

Tambin hay otra funcin ms sencilla de realizar y con menos riesgo


de tener equivocaciones:

! =

!
!

!!! !

!
1

20

Medidas de Tendencia Central y de Dispersin para datos agrupados


Algunas medidas importantes si se est trabajando con datos agrupados (ordenados en una distribucin de
frecuencias), son las que se presentan a continuacin. Suponga que se tiene la Distribucin de frecuencias
de demanda semanal de televisores como lo establece la siguiente tabla:

Distribucin de Frecuencias
Xi

Xi 2

N%

X in k

Xi2-nk

11

102

10

10

20

60

180

25

40

200

1000

49

20

140

980

81

10

90

810

100

500

2980

TOTAL

1- Puntos medios de los intervalos de la distribucin


2- Frecuencia de ocurrencia de la demanda

A continuacin se presentan los clculos para media y desviacin para datos agrupados.
Resultados para el clculo de la varianza para la distribucin de la demanda
semanal de televisores, usando la frmula descrita para agrupados.

21

- Media aritmtica demanda semanal de televisores


Xp = 1 * 0,1 + 3 * 0,2 + 5 *0,4 + 7 * 0,2 + 9 *0,1
(0,1+0,2+0,4+0,2+0,1)
Xp = 5

- Varianza poblacional demanda semanal de televisores


Sp2 = (1- 5)2 *10 +(3- 5) 2 *20 *(5- 5) 2*40 +(7- 5) 2*20 +(9-5) 2 * 10
99
Sp2 = 4,8485
Sp = 2,202

22

Cmo se puede ver en este cuadro resumen con los clculos de la


media y varianza para datos agrupados y no agrupados, las diferencias
son nfimas e ilustran que para datos agrupados hay una ligera
diferencia dato que al estar agrupados se arrastra un error dado que al
trabajar con el punto medio de clase, no se tiene certeza en qu punto
caen los datos de dicho intervalo, solo asumimos que cae en el centro.
Medidas de Tendencia Central y Dispersin para datos agrupados
y no agrupados, demanda semanal de televisores.

Medida

Datos no agrupados

Datos agrupados

Media X

5.46001

5.00002

Varianza S2

5.1802

4.8485

Desviacin estndar

2.2760

2.2020

Qu conclusiones tenemos de lo visto hasta aqu? Qu se puede


concluir de la informacin suministrada de demanda semanal de
televisores para datos agrupados y no agrupados? Por favor elabore
sus propias conclusiones al respecto.
1- Valor verdadero 2- Valor aproximado

23

Anlisis de datos, definiciones


Otras definiciones importantes en el anlisis de datos son:
Rango
Es la diferencia entre los valores de datos ms grandes y ms
pequeos en un grupo de datos recolectados.
En grficas de control y anlisis de capacidad, usted puede utilizar el
rango promedio en todos los subgrupos (Grficos Rbarra por ejemplo)
para estimar la desviacin estndar de su proceso.
Cul es el rango en los datos de edad de la clase de probabilidad?
Favor indicarlo a su profesor
20

20

20

20

19

18

20

21

19

19

19

20

19

21

20

20

20

19

19

19

19

19

20

20

22

20

19

20

20

43

21

24

Varianza y Covarianza
Una medida de dispersin que representa el grado en que un conjunto
o distribucin de datos aparece disperso alrededor de su media.
Debido a que la varianza (s2) es una cantidad elevada al cuadrado, sus
unidades tambin estn elevadas al cuadrado y pueden ser confusas
para discutir en la prctica. Por ejemplo, una muestra del tiempo de
espera en una parada de autobuses puede tener una media de 15
minutos y una varianza de 9 minutos2. Para resolver esta confusin,
con frecuencia se muestra la varianza con su raz cuadrada, la
desviacin estndar (s), que es una medicin ms intuitiva. Una
varianza de 9 minutos2 es equivalente a una desviacin estndar de 3
minutos.

25

Varianza
La reduccin de la varianza de procesos incrementa la precisin y
reduce el nmero de defectos.
Por ejemplo, una fbrica produce clavos para carpintera que tienen
50mm de longitud y un clavo cumple con las especificaciones si la
longitud est dentro de 2 mm del valor objetivo de 50 mm. La fbrica
utiliza dos tipos de mquinas para fabricar clavos. Ambas mquinas
producen clavos con longitudes normalmente distribuidas y una
longitud media de 50 mm. Sin embargo, los clavos de cada mquina
tienen varianzas diferentes: La mquina A, con la distribucin de lnea
de puntos que se muestra abajo, produce clavos con una varianza de
9mm2 y la mquina B con la distribucin de lnea continua que se
muestra abajo, produce clavos con una varianza de 1 mm2. Las
distribuciones de la longitud de los clavos para cada mquina estn
sobrepuestas, junto con los lmites de especificacin verticales
inferiores y superiores.

26

Distribuciones de la longitud de los clavos en mm


Fig 4. Longitud de los clavos

La longitud de los clavos de la mquina A tiene una varianza ms


grande que la longitud de los clavos de la mquina B. Por lo tanto,
cualquier clavo de la mquina A tiene una mayor probabilidad de estar
fuera de los lmites de especificacin que un clavo de la mquina B.
27

Covarianza
Cuando se definen dos o ms variables aleatorias en un espacio de
probabilidad, resulta conveniente describir la forma en que varan en
conjunto, es decir, es til medir la relacin entre las variables. Una
medida comn de la relacin entre dos variables aleatorias es la
covarianza. Para definir la covarianza es necesario describir el valor
esperado de una funcin de dos variables aleatorias h(x,y).

Interpretacin de la covarianza
- Si covarianza > 0, hay dependencia directa (positiva), es decir, a
grandes valores de x corresponden grandes valores de y.
- Si covarianza = 0, una covarianza o se interpreta como la no
existencia de una relacin lineal entre las dos variables
estudiadas.
- Si covarianza < 0, hay dependencia inversa o negativa, es decir,
a grandes valores de x corresponden pequeos valores de y.

28

Coeficiente de variacin
Medida de variabilidad relativa, igual a la desviacin estndar dividida
entre la media (Minitab multiplica el cociente por 100). Debido a que se
trata de un nmero sin dimensiones, es til para comparar la
dispersin de poblaciones con medias significativamente diferentes.
Por ejemplo, usted es el inspector de control de calidad de una planta
embotelladora de leche, la cual embotella el producto en recipientes
pequeos y grandes. Usted toma una muestra de cada producto y
observa que el volumen medio de los recipientes pequeos es de 1
taza, con una desviacin estndar de 0.08 tazas, y el volumen medio
de los recipientes grandes es de 1 galn (16 tazas) con una desviacin
estndar de 0.4 tazas. Aunque la desviacin estndar del recipiente de
un galn es cinco veces mayor que la desviacin estndar del
recipiente pequeo, sus coeficientes de variacin (COVs) apoyan una
conclusin diferente:

29

Recipiente grande
COV = 100 * 0.4 tazas / 16 tazas = 2.5
Recipiente pequeo
COV = 100 * 0.08 tazas / 1 taza = 8
El coeficiente de variacin del recipiente pequeo es ms de tres
veces mayor que el coeficiente de variacin del recipiente grande. En
otras palabras, aunque el recipiente grande presenta una mayor
desviacin estndar, el recipiente pequeo presenta una variabilidad
mucho mayor con respecto a su media.

30

Kurtosis
El grado en el cual un conjunto
de datos alcanza su valor
mximo. Como muchas otras
estadsticas bsicas, la kurtosis
puede ayudar a establecer un
entendimiento inicial de los
datos. Puede evaluar la kurtosis
visualmente mediante una
grfica (como un histograma) o
matemticamente a travs de la
estadstica de valores de
kurtosis. Recordar que las
distribuciones pueden ser:
Platocrticas (planas),
Mesocrticas (normal), y
Leptocrticas (puntiagudas).

31

Lnea base: la distribucin


normal
Los datos normalmente
distribuidos establecen la lnea
base para la kurtosis: con picos
no demasiado bajos ni
demasiado altos. Los datos que
siguieron una distribucin
normal perfectamente tendran
un valor de kurtosis de 0.
Debido a que una kurtosis
significativa indica que los datos
no son normales, usted pudiera

Fig 5. Distribucin normal

considerar la estadstica como


una primera verificacin de la
normalidad.

32

Datos de picos altos


Una distribucin con un pico
ms alto de lo normal tendr un
valor de kurtosis positivo.

Datos de picos bajos


Una distribucin con un pico
ms bajo de lo normal tendr un
valor de kurtosis negativo.

Fig 6. Picos altos

Fig 7. Picos bajos

33

Anotaciones a recordar
- Estadstico: es una funcin matemtica asociada a parmetros o
condiciones establecidas para generar un resultado de inters.
- Variables: Cuantitativas y Cualitativas.
- Cuantitativas: Continuas y Discretas.
- Distribucin de datos agrupados, requisito n > = 30 datos.
- Objetivo de las medidas de tendencia central es: resumir en un
solo punto numrico la posicin o localizacin de los datos que
se estn analizando.
- Se llama medidas de tendencia central debido a que se ha
procedido a escoger como valores tpicos a medidas de posicin
situadas en la parte central de la distribucin.

34

- Una distribucin es simtrica cuando la media aritmtica, es igual


a la mediana y a la moda.
- Kurtosis:
K > 0,263 distribucin leptocrtica
K < 0,263 distribucin platictica
K = 0,263 distribucin normal
- La varianza indica la distancia total del conjunto de datos.
- Desviacin estndar indica la diferencia promedio que existe
entre la media aritmtica y el conjunto de datos.
- Rango es la medida de variabilidad que se utiliza para ver en
forma rpida la distancia total de los datos.

35

- Coeficiente de variacin
- CV < 5% no tiene cambios o comportamientos bruscos de
variabilidad con respecto a la media aritmtica.
- 5% < CV < 10% una alerta el proceso tiende a tener una
variabilidad pronunciada.
- CV > 10% Problemas serios de variabilidad.

36

Referencias

37

Potrebbero piacerti anche