Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Objetivos de Aprendizaje
Que el estudiante sea capaz de:
1. Aprender a hacer una distribucin de frecuencias.
2. Reconocer los conceptos bsicos entorno a las medidas de
tendencia central y de dispersin.
ndice
Medidas de Tendencia Central..................................................1
Objetivos de Aprendizaje...................................................... 2
Anlisis de Datos.................................................................... 5
Conceptos y definiciones...................................................... 6
Medidas de Tendencia Central............................................. 7
Datos no agrupados.............................................................. 10
Datos agrupados................................................................... 13
Desviacin Estndar.............................................................. 14
Medidas de Tendencia Central y de Dispersin
para datos agrupados........................................................... 21
Medidas de Tendencia Central y Dispersin para
datos agrupados y no agrupados, demanda semanal de
televisores............................................................................. 23
Anlisis de datos, definiciones............................................. 24
Rango....................................................................................24
Varianza y Covarianza.......................................................... 25
Varianza................................................................................ 26
Covarianza............................................................................ 28
Interpretacin de la covarianza............................................. 28
3
Coeficiente de variacin........................................................ 29
Kurtosis................................................................................... 31
Lnea base: la distribucin normal........................................ 32
Datos de picos altos.............................................................. 33
Datos de picos bajos............................................................. 33
Anotaciones a recordar......................................................... 34
Referencias............................................................................. 37
Anlisis de Datos
Medidas de tendencia central
- Media aritmtica simple y ponderada
- Mediana
- Moda
Fig
1.
Anlisis
de
Datos
Conceptos y definiciones
- Medidas de variabilidad
- Rango
- Varianza y covarianza
- Desviacin estndar
- Coeficiente de variacin
- Kurtosis
Medias de Dispersin
Desviacin Estndar Variabilidad
Ejemplo
Para reconocer las medidas de tendencia central y de dispersin
tenemos el siguiente ejemplo:
Nmero de televisores vendidos por semana.
Demanda Semanal de Televisores
1
10
10
10
10
10
Frecuencia
absoluta
relativa (%)
02
10
0,10
24
20
0,20
46
40
0,40
68
20
0,20
8 10
10
0,10
Demanda semanal
Datos no agrupados
Cuando no se tienen los datos agrupados como en el caso de la
demanda de televisores se puede calcular la media aritmtica de la
siguiente manera:
- Media aritmtica
! =
!
!!!
- Varianza poblacional
!
!!!(!
)!
10
11
- Varianza poblacional
! = (1- 5,46)2 + (7- 5,46)2 +.... + (3- 5,46)2 + (3- 5,46)2 = 5,1802
100 1
En el caso de la varianza se aplica la frmula antes citada y resulta
en 5,1802. Este valor deriva en:
! = 2,276
12
Datos agrupados
Si usted cuenta con los datos ya agrupados en una
distribucin de frecuencias puede tambin obtener
la media aritmtica y la varianza con las siguientes
frmulas:
- Media aritmtica: ! es el punto medio de
cada uno de los intervalos o clases que
componen la distribucin de frecuencias, : !
es la frecuencia absoluta de cada uno de los
intervalos de clase y k es el nmero de
intervalos de la distribucin de frecuencias.
= = 1 /
= = 1
13
Desviacin Estndar
La medida es la medida de dispersin ms comn, que indica cun
separados de la media (o del valor especificado como target) estn
los datos, la desviacin estndar estima aproximadamente la distancia
promedio de las observaciones individuales con respecto a la media.
Mientras mayor sea la desviacin estndar, mayor ser la dispersin
de los datos.
Por ejemplo, los administradores hacen seguimiento al tiempo de
egreso de los pacientes tratados en las reas de Urgencia de dos
hospitales. Aunque los tiempos de egreso promedio son
aproximadamente iguales (35 minutos), las desviaciones estndar son
significativamente diferentes.
14
Hospital 1
Hospital 2
La desviacin estndar es
La desviacin estndar es
aproximadamente 6. En
aproximadamente 20. En
aproximadamente 6 minutos.
aproximadamente 20 minutos.
Fig 2. Hospital 1 y 2
15
Fig 3. Desviacin
16
17
1
=
(! )!
!!!
As la varianza es la media de
los cuadrados de las diferencias
entre cada valor de la variable x
y la media aritmtica de la
distribucin.
18
19
! =
!
!!!(!
)!
1
! =
!
!
!!! !
!
1
20
Distribucin de Frecuencias
Xi
Xi 2
N%
X in k
Xi2-nk
11
102
10
10
20
60
180
25
40
200
1000
49
20
140
980
81
10
90
810
100
500
2980
TOTAL
A continuacin se presentan los clculos para media y desviacin para datos agrupados.
Resultados para el clculo de la varianza para la distribucin de la demanda
semanal de televisores, usando la frmula descrita para agrupados.
21
22
Medida
Datos no agrupados
Datos agrupados
Media X
5.46001
5.00002
Varianza S2
5.1802
4.8485
Desviacin estndar
2.2760
2.2020
23
20
20
20
19
18
20
21
19
19
19
20
19
21
20
20
20
19
19
19
19
19
20
20
22
20
19
20
20
43
21
24
Varianza y Covarianza
Una medida de dispersin que representa el grado en que un conjunto
o distribucin de datos aparece disperso alrededor de su media.
Debido a que la varianza (s2) es una cantidad elevada al cuadrado, sus
unidades tambin estn elevadas al cuadrado y pueden ser confusas
para discutir en la prctica. Por ejemplo, una muestra del tiempo de
espera en una parada de autobuses puede tener una media de 15
minutos y una varianza de 9 minutos2. Para resolver esta confusin,
con frecuencia se muestra la varianza con su raz cuadrada, la
desviacin estndar (s), que es una medicin ms intuitiva. Una
varianza de 9 minutos2 es equivalente a una desviacin estndar de 3
minutos.
25
Varianza
La reduccin de la varianza de procesos incrementa la precisin y
reduce el nmero de defectos.
Por ejemplo, una fbrica produce clavos para carpintera que tienen
50mm de longitud y un clavo cumple con las especificaciones si la
longitud est dentro de 2 mm del valor objetivo de 50 mm. La fbrica
utiliza dos tipos de mquinas para fabricar clavos. Ambas mquinas
producen clavos con longitudes normalmente distribuidas y una
longitud media de 50 mm. Sin embargo, los clavos de cada mquina
tienen varianzas diferentes: La mquina A, con la distribucin de lnea
de puntos que se muestra abajo, produce clavos con una varianza de
9mm2 y la mquina B con la distribucin de lnea continua que se
muestra abajo, produce clavos con una varianza de 1 mm2. Las
distribuciones de la longitud de los clavos para cada mquina estn
sobrepuestas, junto con los lmites de especificacin verticales
inferiores y superiores.
26
Fig
4.
Longitud
de
los
clavos
Covarianza
Cuando se definen dos o ms variables aleatorias en un espacio de
probabilidad, resulta conveniente describir la forma en que varan en
conjunto, es decir, es til medir la relacin entre las variables. Una
medida comn de la relacin entre dos variables aleatorias es la
covarianza. Para definir la covarianza es necesario describir el valor
esperado de una funcin de dos variables aleatorias h(x,y).
Interpretacin de la covarianza
- Si covarianza > 0, hay dependencia directa (positiva), es decir, a
grandes valores de x corresponden grandes valores de y.
- Si covarianza = 0, una covarianza o se interpreta como la no
existencia de una relacin lineal entre las dos variables
estudiadas.
- Si covarianza < 0, hay dependencia inversa o negativa, es decir,
a grandes valores de x corresponden pequeos valores de y.
28
Coeficiente de variacin
Medida de variabilidad relativa, igual a la desviacin estndar dividida
entre la media (Minitab multiplica el cociente por 100). Debido a que se
trata de un nmero sin dimensiones, es til para comparar la
dispersin de poblaciones con medias significativamente diferentes.
Por ejemplo, usted es el inspector de control de calidad de una planta
embotelladora de leche, la cual embotella el producto en recipientes
pequeos y grandes. Usted toma una muestra de cada producto y
observa que el volumen medio de los recipientes pequeos es de 1
taza, con una desviacin estndar de 0.08 tazas, y el volumen medio
de los recipientes grandes es de 1 galn (16 tazas) con una desviacin
estndar de 0.4 tazas. Aunque la desviacin estndar del recipiente de
un galn es cinco veces mayor que la desviacin estndar del
recipiente pequeo, sus coeficientes de variacin (COVs) apoyan una
conclusin diferente:
29
Recipiente grande
COV = 100 * 0.4 tazas / 16 tazas = 2.5
Recipiente pequeo
COV = 100 * 0.08 tazas / 1 taza = 8
El coeficiente de variacin del recipiente pequeo es ms de tres
veces mayor que el coeficiente de variacin del recipiente grande. En
otras palabras, aunque el recipiente grande presenta una mayor
desviacin estndar, el recipiente pequeo presenta una variabilidad
mucho mayor con respecto a su media.
30
Kurtosis
El grado en el cual un conjunto
de datos alcanza su valor
mximo. Como muchas otras
estadsticas bsicas, la kurtosis
puede ayudar a establecer un
entendimiento inicial de los
datos. Puede evaluar la kurtosis
visualmente mediante una
grfica (como un histograma) o
matemticamente a travs de la
estadstica de valores de
kurtosis. Recordar que las
distribuciones pueden ser:
Platocrticas (planas),
Mesocrticas (normal), y
Leptocrticas (puntiagudas).
31
32
33
Anotaciones a recordar
- Estadstico: es una funcin matemtica asociada a parmetros o
condiciones establecidas para generar un resultado de inters.
- Variables: Cuantitativas y Cualitativas.
- Cuantitativas: Continuas y Discretas.
- Distribucin de datos agrupados, requisito n > = 30 datos.
- Objetivo de las medidas de tendencia central es: resumir en un
solo punto numrico la posicin o localizacin de los datos que
se estn analizando.
- Se llama medidas de tendencia central debido a que se ha
procedido a escoger como valores tpicos a medidas de posicin
situadas en la parte central de la distribucin.
34
35
- Coeficiente de variacin
- CV < 5% no tiene cambios o comportamientos bruscos de
variabilidad con respecto a la media aritmtica.
- 5% < CV < 10% una alerta el proceso tiende a tener una
variabilidad pronunciada.
- CV > 10% Problemas serios de variabilidad.
36
Referencias
37