Sei sulla pagina 1di 57

¡La Universidad para todos!

Unidad: 2 Semana: 2

CONTROL ESTADÍSTICO DE LA CALIDAD

Tema: ESTADÍSTICA DESCRIPTIVA

Docente: Mag. Ing. Gustavo Manuel Yáñez Wendorff

Escuela Profesional Periodo académico: 2018-2


INGENIERÍA INDUSTRIAL Semestre:
Unidad:
¡La universidad para todos!

ESTADÍSTICA DESCRIPTIVA
• Es una herramienta matemática que permite recopilar,
organizar, presentar y analizar datos obtenidos de un
estudio estadístico.

• Es una ciencia que analiza series de datos (por ejemplo,


edad de una población, altura de los estudiantes de una
escuela, temperatura en los meses de verano, etc) y
trata de extraer conclusiones sobre el comportamiento
de estas variables.

http://www.youtube.com/watch?v=OPkGxnEXLsI
2
¡La universidad para todos!

VARIABLES
• Las variables pueden ser de dos tipos:

• Variables cualitativas o atributos:


• No se pueden medir numéricamente (Ejemplo:
nacionalidad, color de la piel, sexo).

• Variables cuantitativas:
• Tienen valor numérico (Ejemplo: edad, precio de un
producto, ingresos anuales).
¡La universidad para todos!

VARIABLES
• Las variables también se pueden clasificar en:

• Variables unidimensionales:
• Sólo recogen información sobre una característica
(Ejemplo: edad de los alumnos de una clase).

• Variables bidimensionales:
• Recogen información sobre dos características de la
población (Ejemplo: edad y altura de los alumnos de una
clase).

• Variables pluridimensionales:
• Recogen información sobre tres o más características
(Ejemplo: edad, altura y peso de los alumnos de una 4
clase).
¡La universidad para todos!

VARIABLES
• Por su parte, las variables cuantitativas se pueden
clasificar en discretas y continuas:

• Discretas: sólo pueden tomar valores enteros (1, 2, 8,


-4, etc.). (Ejemplo: número de hermanos puede ser 1,
2, 3....,etc, pero nunca podrá ser 3,45).

• Continuas: pueden tomar cualquier valor real dentro


de un intervalo. (Ejemplo, la velocidad de un vehículo
puede ser 80,3 km/h, 94,57 km/h...etc.)
¡La universidad para todos!

VARIABLES
¡La universidad para todos!

COMPORTAMIENTO DE UNA VARIABLE

• Cuando se estudia el comportamiento de una variable


hay que distinguir los siguientes conceptos:

• Individuo
• Población
• Muestra
¡La universidad para todos!

COMPORTAMIENTO DE UNA VARIABLE


• Individuo:

• Cualquier elemento que porte información sobre el


fenómeno que se estudia. (Ejemplo: si estudiamos la
altura de los niños de una clase, cada alumno es un
individuo; si estudiamos el precio de la vivienda, cada
vivienda es un individuo.
¡La universidad para todos!

COMPORTAMIENTO DE UNA VARIABLE


• Población:

• Conjunto de todos los individuos (personas, objetos,


animales, etc.) que porten información sobre el
fenómeno que se estudia.

• Ejemplo
• Si estudiamos el precio de la vivienda en una
ciudad, la población será el total de las viviendas de
dicha ciudad
• Si estudiamos las intención de voto en una elección
en el Perú, la población será: por país, región,
departamento, provincia o distrito.
¡La universidad para todos!

COMPORTAMIENTO DE UNA VARIABLE


• Muestra:

• Subconjunto de la población.

• Así, si se estudia el precio de la vivienda de una ciudad,


lo normal será no recoger información sobre todas las
viviendas de la ciudad (sería una labor muy compleja),
sino que se suele seleccionar un subgrupo (muestra)
que se entienda que es suficientemente representativo.
¡La universidad para todos!

COMPORTAMIENTO DE UNA VARIABLE


• Muestreo estratificado
• Es una forma de representación estadística que muestra
como se comporta una característica o variable en una
población a través de hacer evidente el cambio de dicha
variable en sub-poblaciones o estratos.

• Consiste en la división previa de la población de estudio en


grupos o clases que se suponen homogéneos respecto a
característica a estudiar y que no se solapen.

• Según la cantidad de elementos de la muestra que se han


de elegir de cada uno de los estratos, existen dos técnicas
de muestreo estratificado:
¡La universidad para todos!

HISTOGRAMAS
• Es un resumen gráfico de un conjunto de datos.

• Objetivo
• Estudiar la capacidad de los procesos y mantenerlos
bajo control.
• Permite ver esquemas y comportamientos que son
difíciles de captar en una tabla numérica.

• Su éxito radica en que conjuga dos tipos de técnicas:


• La estadística: Permite sacar conclusiones del conjunto
de los datos.
• Los gráficos: Permite representar los datos y hace
sencilla su interpretación.
¡La universidad para todos!

HISTOGRAMA

• Con los datos que se presentan a continuación de la


presencia de hierro en la redes de agua potable de la
ciudad ABCD.

• Elabore la hoja de verificación y calcule valores


máximo, mínimo y promedio
• Elabore el histograma
¡La universidad para todos!

HISTOGRAMA
(*) =0,300
0,045 0,060 0,154 0,076 0,040 0,232 0,050 0,044
0,034 0,048 0,075 0,043 0,090 0,074 0,075 0,064
0,056 0,066 0,122 0,079 0,065 0,087 0,137 0,092
0,017 0,105 0,081 0,069 0,033 0,235 0,082 0,054
0,028 0,050 0,065 0,044 0,049 0,053 0,058 0,070
0,024 0,219 0,039 0,022 0,027 0,018 0,012 0,115
0,089 0,053 0,120 0,112 0,036 0,133 0,073 0,040
0,089 0,080 0,103 0,057 0,089 0,053 0,120 0,112
0,090 0,299 0,060 0,269 0,058 0,041 0,047 0,232
0,058 0,041 0,047 0,032 0,065 0,287 0,137 0,092
0,053 0,033 0,042 0,110 0,045 0,060 0,154 0,076
0,139 0,028 0,035 0,068 0,090 0,074 0,075 0,064
0,065 0,048 0,067 0,099 0,056 0,066 0,122 0,079
0,025 0,002 0,042 0,045 0,224 0,019 0,039 0,022
0,056 0,047 0,033 0,031 0,089 0,053 0,120 0,112

Máximo 0.299
Mínimo 0.002
Promedio 0.078
¡La universidad para todos!

HISTOGRAMA
¡La universidad para todos!

HISTOGRAMA
¡La universidad para todos!

HISTOGRAMA
¡La universidad para todos!

HISTOGRAMA
¡La universidad para todos!

MEDIDAS DE TENDENCIA CENTRAL

• Son medidas estadísticas que se usan para describir como


se puede resumir la localización de los datos.
• Ubican e identifican el punto alrededor del cual se centran
los datos.
• Las medidas de tendencia central nos indican hacia donde
se inclinan o se agrupan más los datos.
• Las más utilizadas son: la media, la mediana y la moda.
¡La universidad para todos!

LA MEDIA

• La media o media aritmética o media muestral,


usualmente se le llama promedio.
• Se obtiene sumando todos los valores de los datos y
dividiendo el resultado entre la cantidad de datos.
• Si los datos proceden de una muestra, el promedio se
representa con X.
• Si los datos proceden de la población, se utiliza la letra
griega µ.
¡La universidad para todos!

LA MEDIA
• La fórmula matemática para calcular la media o
promedio es la siguiente:
X = promedio
 = signo de sumatoria  x
x
N = numero de datos N

Media poblacional =

La media muestral x¯ es un estimador puntual de la media


poblacional μ.
¡La universidad para todos!

LA MEDIA
A continuación se presenta una muestra de las
puntuaciones en un examen de un curso de estadística:
70 90 95 74
58 70 98 72
75 85 95 74
80 85 90 65
90 75 90 69
Podemos calcular el promedio de las puntuaciones para
conocer cuántos estudiantes obtuvieron puntuaciones por
encima y por debajo del promedio . Veamos
¡La universidad para todos!

LA MEDIA
• Primero, sumamos todos los valores de los datos y el
resultado lo divide entre el total de datos o tamaño de
la muestra.
• Al sumar todas las puntuaciones en el ejemplo anterior
obtendrás un total de 1600, que dividido por 20(total
de datos), es igual a 80.
• Si empleamos la fórmula obtenemos:

x
 x
x
1600
 80
N 20
¡La universidad para todos!

LA MEDIA
• Sueldos mensuales iniciales en una muestra de 12 recién
egresados de la carrera de Ingeniería Industrial:

Egresado Sueldo S/.


1 1,950
2 2,050
3 2,150
4 1,980
5 1,855 = 1,950 + 2,050 + ….. + 1980
6 1,810 12
7 1,990
8 2,230 2,040
9 2,040
10 2,425
11 2,020
12 1,980
¡La universidad para todos!

LA MEDIANA
• La segunda medida de tendencia central que analizaremos
es la mediana, en ocasiones se le llama media posicional,
porque queda exactamente en la mitad de un grupo de
datos, luego de que los datos se han colocado de forma
ordenada.

• En este caso la mitad (50%) de los datos estará por


encima de la mediana y la otra mitad (50%) estará por
debajo de ella.

• La mediana es el valor intermedio cuando los valores de


los datos se han ordenado.
¡La universidad para todos!

LA MEDIANA

• La mediana es la medida de localización más empleada


cuando se trata de ingresos anuales y valores de
propiedades, debido a que la media puede inflarse por
unos cuantos ingresos o valores de propiedades muy
altos.

• En tales casos, la mediana es la medida de localización


central preferida.
¡La universidad para todos!

LA MEDIANA

• Existen dos formas para obtener la mediana.

• Primero, si la cantidad de los datos es impar, la mediana


es el valor que se encuentra en la posición (n+1)÷2
donde, n es el número de datos.

• Por ejemplo, se tiene una muestra de tamaño 5 con los


siguientes valores: 46, 54, 42, 48 y 32. Veamos como se
determina la mediana.
¡La universidad para todos!

LA MEDIANA
• Primer paso, ordenar los datos:
32 42 46 48 54

• Como la cantidad de datos es impar


(5 datos), la mediana es el valor del dato que se
encuentra ubicado en la posición (5+1)÷2=3, la
mediana es 46.

• Segundo, si la cantidad de datos es par, la mediana es


el valor promedio de los datos que se encuentran en
las posiciones (n÷2) y (n÷2) + 1.
¡La universidad para todos!

LA MEDIANA
• Se ha obtenido una muestra con los valores de datos: 27,
25, 27, 30, 20 y 26. ¿cómo se determina la mediana en
este caso?.
• Primer paso, ordenar los datos de forma ascendente:
20 25 26 27 27 30
Como el número de datos es par (6), la mediana es el
promedio de los datos que se encuentran en las
posiciones (6÷2) = 3 y (6÷2) +1 = 4. por lo tanto la
mediana es:
26  27
= 26.5
2
¡La universidad para todos!

LA MEDIANA
• Sueldos mensuales iniciales en una muestra de 12 recién
egresados de la carrera de Ingeniería Industrial:
Egresado Sueldo S/.
1 1,950 6 1,810
2 2,050 5 1,855
3 2,150 1 1,950 1,990 + 2,020 = 2,005
4 1,980 4 1,980
2
5 1,855 12 1,980
6 1,810 7 1,990
7 1,990 11 2,020
8 2,230 9 2,040
9 2,040 2 2,050
10 2,425 3 2,150
11 2,020 8 2,230
12 1,980 10 2,425

1,810 1,855 1,950 1,980 1,980 1,990 2,020 2,040 2,050 2,150 2,230 2,425
¡La universidad para todos!

LA MODA

• La moda es el dato que más se repite o el dato que


ocurre con mayor frecuencia.

• En el ejemplo anterior la moda es el 27 .

• Un grupo de datos puede tener más de una moda.

• Veamos el siguiente ejemplo: se tiene una muestra con


valores 20, 23, 20, 24, 25, 25, 26 y 30. El 20 y 25 son la
moda entonces, se dice que es bimodal.
¡La universidad para todos!

LA MODA
• El único salario mensual inicial que se presenta más de
una vez
Egresado Sueldo S/.
1 1,950 6 1,810
2 2,050 5 1,855
3 2,150 1 1,950 • 1,980 como este valor tiene la
4 1,980 4 1,980
frecuencia mayor, es la moda.
5 1,855 12 1,980
6 1,810 7 1,990
7 1,990 11 2,020
8 2,230 9 2,040
9 2,040 2 2,050
10 2,425 3 2,150
11 2,020 8 2,230
12 1,980 10 2,425

1,810 1,855 1,950 1,980 1,980 1,990 2,020 2,040 2,050 2,150 2,230 2,425
¡La universidad para todos!

EJEMPLO
• Ejemplo de distribución de frecuencias, media, mediana
y moda
https://www.youtube.com/watch?v=m98364i9yRo
¡La universidad para todos!

PERCENTILES

• Un percentil nos provee información de como se


distribuyen los valores de los datos desde el menor
hasta el mayor.

• El percentil divide los datos en dos partes, más o


menos el (p) por ciento de los datos tienen valores
menores que el percentil y aproximadamente (100-p)
por ciento de los datos tienen valores mayores que el
percentil.
¡La universidad para todos!

PERCENTILES

• Para calcular el percentil debe seguir los siguientes pasos:


Paso 1. Ordene los datos de manera ascendente.

Paso 2. Calcule un índice (i)


 P 
i n
 100 

en donde:
(p) es el percentil de interés
(n) es el número de datos u observaciones.
¡La universidad para todos!

PERCENTILES
Paso 3.

a) Si (i) no es entero, utilizando las reglas de redondeo, se


lleva al próximo numero entero.
El valor entero inmediato mayor que (i) indica la posición
donde se encuentra el percentil.
Esto significa que si (i) = 3.5, el percentil se encuentra
en la posición 4 de los datos.

b) Si (i) es entero, el percentil es el promedio de los valores


de los datos ubicados en los lugares i e (i + 1).
¡La universidad para todos!

PERCENTILES
• Como ejemplo de este procedimiento, determina el percentil
75 de los datos sobre las edades del siguiente un grupo de
ciudadanos: 25, 20, 26, 21, 19, 23, 22, 30, 28, 27.

• Paso 1.
Ordene los datos en orden ascendente:
19 20 21 22 23 25 26 27 28 30

• Paso 2.
Calcule el índice (i):
 P   75 
i n i 10  7.5
 100   100 
¡La universidad para todos!

PERCENTILES
• Paso 3.
Como (i) no es entero, redondeamos al próximo entero mayor
que 7.5, o sea, el lugar 8.
Al referirnos a los datos del ejemplo, vemos que el percentil 75
es el valor del dato ubicado en la posición número 8, que en
este caso es 27.

19 20 21 22 23 25 26 27 28 30

• Nota.
Recuerda que (i) nos indica el lugar del dato donde se
encuentra el percentil que estamos buscando.

• Interpretación
Significa que el 75% de las edades son menores de 27 años y el
25% restante (100-p) es mayor de 27 años.
¡La universidad para todos!

CUARTILES
• Los cuartiles dividen los datos en cuatro partes.

• Cada una de las partes representa una cuarta parte, o el


25% de las observaciones.

• Los cuartiles son percentiles específicos; por


consiguiente, los pasos para calcular los percentiles los
podemos emplear para calcular los cuartiles.
¡La universidad para todos!

CUARTILES
• Los cuartiles se definen de la siguiente manera

• Q1 = primer cuartil, o percentil 25

• Q2 = segundo cuartil, o percentil 50


(también la mediana)

• Q3 = tercer cuartil, o percentil 75


¡La universidad para todos!

CUARTILES
• A continuación se presenta un conjunto de datos con los
siguientes valores; 10, 5, 12, 8, 14, 11, 15, 20, 18, 30 y 25.
• ¿ Cómo identificamos los cuartiles en este ejemplo?
• Utilizarás los mismos pasos para identificar los
percentiles:

• Primero, ordenamos los datos


5 8 11 12 14 15 18 20 25 30

• Segundo, determinamos (i) para cada cuartil:


Q1 = primer cuartil, o percentil 25
Q2 = segundo cuartil, o percentil 50, (también la mediana)
Q3 = tercer cuartil, o percentil 75

¡La universidad para todos!

CUARTILES
• Cuartiles:
Q1 = primer cuartil, o percentil 25
 25 
i 10 = 2.5
 100 
• Como (i) no es un número entero, se redondea al
próximo entero mayor que 2.5, o sea 3.
• Al referirnos a los datos vemos que el primer cuartil está
ubicado en la posición 3 de los datos que este caso es
11.
• El primer cuartil en los datos se divide de la siguiente
forma:
5 8 11 12 14 15 18 20 25 30
Q1=11
¡La universidad para todos!

CUARTILES
• Segundo cuartil:
Q2 = segundo cuartil, o percentil 50 (también la mediana)

 50  =5
i 10
 100 
• Como (i) es un número entero, el segundo cuartil es el
promedio de los valores de los datos que están en las
posiciones i e (i+1), que en este caso es, (14+15)÷2=14.5,
entonces, el segundo cuartil en los datos se divide así:

5 8 11 12 14 15 18 20 25 30
Q1=11 Q2=14.5
¡La universidad para todos!

CUARTILES
• Tercer cuartil:
Q3 = tercer cuartil, o percentil 75

 75  = 7.5
i 10
 100 
• Como (i) no es un número entero, se redondea al próximo entero
mayor que 7.5, o sea 8. Al referirnos a los datos , vemos que el
tercer cuartil está ubicado en posición 8 de los datos que en este
caso es el 20. Finalmente, los cuartiles en este caso se presentan
de la siguiente forma:
5 8 11 12 14 15 18 20 25 30
Q1=11 Q2=14.5 Q3=20

https://www.youtube.com/watch?v=s0DYmg45ywQ
¡La universidad para todos!

MEDIDAS DE DISPERSIÓN
• Existe otro tipo de medidas que indican la tendencia de
los datos a dispersarse respecto al valor central

• Rango, amplitud o recorrido (R)

• Desviación media (DM).

• Varianza (s² , σ ² )

• Desviación estándar (s,muestral y σ, poblacional ).

• Coeficiente de Variación (C. V.)


¡La universidad para todos!

RANGO
• Rango
Es la diferencia entre el dato mayor y el dato menor.
R= Xmáx. - Xmín.
¡La universidad para todos!

DESVIACIÓN MEDIA
Se conoce también como promedio de
desviación.
Para una serie de N valores se puede
calcular a través de la siguiente expresión:

Valor absoluto de las desviaciones de los x


valores, respecto de la media.

Y para datos agrupados se tiene:


¡La universidad para todos!

DESVIACIÓN MEDIA
• EJEMPLO:
Hallar la desviación media de: 4,6,12,16,22.
_
x = 4 + 6+12+16+22 = 12
5
4-12 = 8
6-12 = 6
12-12 = 0
16-12 = 4
22-12= 10

= 28

D.M. = 28/ 5 = 5.6


¡La universidad para todos!

VARIANZA
• Es la suma de las desviaciones medias al cuadrado.

EJEMPLO:
Hallar la desviación estándar y la varianza de la siguiente
serie de datos.
10, 18, 15, 12, 3,6,5,7

Para datos no agrupados

Para datos agrupados


¡La universidad para todos!

VARIANZA
EJEMPLO:
Hallar la desviación estándar y la varianza de la siguiente
serie de datos.

10, 18, 15, 12, 3,6,5,7

10, 18, 15, 12, 3,6,5,7 


8
¡La universidad para todos!

VARIANZA
2
(x – x) (x – x)
(10-9.5) 0.5 0.25
(18-9.5) 8.5 72.25
(15-9.5) 5.5 30.25
(12-9.5) 2.5 6.25
(3-9.5) -6.5 42.25
(6-9.5) -3.5 12.25
(5-9.5) -4.5 20.25
(7-9.5) -2.5 6.25
190.00
¡La universidad para todos!

VARIANZA
¡La universidad para todos!

DESVIACIÓN ESTÁNDAR
• Es la raíz cuadrada de la varianza.

• La desviación estándar o desviación tipo se define como


la raíz cuadrada de los cuadrados de las desviaciones de
los valores de la variable respecto a su media.
¡La universidad para todos!

COEFICIENTE DE VARIACIÓN
• Es la relación que existe entre la Desviación Estándar (S)
y la Media Aritmética (X), expresada en términos de
porcentaje y se expresa:
C.V. = S (100)
X
• Ejemplo
• Hallar el coeficiente de variación de una serie de datos
cuya S= 2 y X = 16.

: C.V. = 2 * (100)= 12.5%


16
¡La universidad para todos!

DESVIACIÓN ESTÁNDAR
• Es la raíz cuadrada de la varianza.

• La desviación estándar o desviación tipo se define como


la raíz cuadrada de los cuadrados de las desviaciones de
los valores de la variable respecto a su media.
¡La universidad para todos!

DESVIACIÓN ESTÁNDAR
¡La universidad para todos!

¡Gracias!

Potrebbero piacerti anche