Sei sulla pagina 1di 37

REVISIN DE TERMINOLOGIA Y

CONCEPTOS ESTADISTICOS
CURSO: CONTROL ESTADISTICO DE PROCESOS
PROFESORA: ING. PERCY MARN LIRA
2013
UNI- FIIS
ESPECIALIDAD: INGENIERIA INDUSTRIAL
Qu es la Estadstica?
Es la ciencia que proporciona un conjunto de mtodos,
tcnicas y procedimientos para recopilar, organizar,
presentar y analizar datos con el fin de describirlos o
realizar generalizaciones vlidas.
Presentar
datos
Analizar
datos
Organizar
datos
Recopilar
datos
Subdivisin de la Estadstica
Estadstica Descriptiva
Se encarga de la descripcin de un
conjunto de datos obtenidos de
una muestra o una poblacin.
Estadstica Inferencial
Se encarga de generalizar los
resultados hallados en una
muestra, hacindolos vlidos hacia
toda la poblacin.
Definiciones Bsicas
Poblacin Es el conjunto de personas u objetos que
presentan caractersticas comunes que los identifican y
que pueden ser medidas.
Muestra Es cualquier subconjunto de una poblacin que
se selecciona para ser analizada.
Unidad de anlisis Tambin llamada unidad elemental o
unidad estadstica. Es cada uno de los elementos de la
poblacin sobre el cual se hace la medicin.
Definiciones Bsicas
Unidad de muestreo Esta determinada por el
agrupamiento de una o ms unidades de anlisis. Las
unidades de muestreo deben cubrir toda la poblacin y
no traslaparse. Adems cada unidad de muestreo debe
estar perfectamente definida, ser identificable y
observable.
Marco de muestreo Es una lista de las unidades de
muestreo que estn disponibles para poder ser elegidas.
Definiciones Bsicas
Ejemplo: Si la unidad de anlisis en una encuesta son las
familias de un distrito, la unidad de muestreo podra ser
una manzana del distrito. En este caso el marco de
muestreo ser .
Ejemplo: Supongamos que recibimos un lote de 4000
cajas que contienen 25 artculos cada una. Para realizar
una inspeccin por muestreo, el marco de muestreo est
dado por la lista de todas las 4000 cajas recibidas. La
unidad de muestreo ser un caja y la unidad de anlisis
es...
Definiciones Bsicas
Parmetro Representa una caracterstica de la
poblacin. Para obtener su valor se hace necesario
contar con toda la informacin que brindan los
elementos de una poblacin.
Estadgrafo o Estimador Representa una caracterstica
de la muestra. Para obtener su valor se utiliza la
informacin muestral.
Estimacin Es el valor que se obtiene al aplicar un
estadgrafo o estimador a los datos de una muestra.
Definiciones Bsicas
Ejemplo: Segn los Censos Nacionales X de Poblacin y V de
Vivienda 2005 ejecutados por el INEI, el 50.06% de los
peruanos es mujer, esta informacin es un parmetro o un
estimador?
Ejemplo: El viernes 7 de marzo se difundi el estudio
realizado por la Universidad Catlica en base a una muestra
de adultos, la cual registraba una aprobacin presidencial
de 33%, esta informacin es un parmetro o un
estimador?, cul es el valor de la estimacin?
Variables estadisticas
Variable es toda caracterstica que presentan los
elementos de una poblacin y que puede asumir
diferentes valores cuando se realiza su medicin.
Ejemplo: Edad, Gnero, Grado de instruccin,
Ingreso mensual, Preferencia electoral, etc.
La medicin de una variable consiste en asignar un valor a
la caracterstica o propiedad observada.
Ejemplo: Gnero, al clasificar a una persona como
de sexo femenino le estamos asignando un valor, estamos
haciendo una medicin de la caracterstica.
Tipos de variables
Cualitativas Aquellas que al ser medidas quedan
expresadas por etiquetas que identifican una
caracterstica o atributo. Utilizan la escala nominal u
ordinal.
Cuantitativas Se expresan en escala de intervalo o de
razn. Estas a su vez pueden ser:
Discretas solo asume un nmero finito o infinito
numerable de valores.
Continuas asume un nmero infinito no numerable de
valores.
Ejercicio:
A la asociacin estadounidense National Health Care le preocupa un informe
recientemente publicado por una revista especializada en salud que estima una
escasez de enfermeras a futuro. Para investigar el grado actual de satisfaccin con la
profesin entre las enfermeras, se ha patrocinado un estudio en hospitales por todo
Estados Unidos. Como parte de este estudio se pidi a 300 enfermeras, elegidas
aleatoriamente, que indicaran su grado de satisfaccin en el trabajo y con las
oportunidades que tienen de ascender. Cada uno de los dos aspectos de satisfaccin
fue medido en una escala de 0 a 100 puntos donde los mayores valores representan
mayores niveles de satisfaccin. Los datos reunidos mostraron tambin la clase de
hospital donde laboran las enfermeras: privado, administracin de veteranos y
universitario. Se registr adems la edad, lugar de residencia (dividido en sectores) y
el tiempo que demora en llegar a su centro de trabajo.

Identifique la poblacin y el marco de muestreo.
Identifique las variables involucradas y su tipo
Mencione 2 parmetros y un estadgrafo de utilidad en el caso propuesto.

Gran conjunto de datos
(construccion de Tableros de Frecuencia)
Distribucin de frecuencias:
Variables cuantitativas continuas
Los datos se agrupan en intervalos de clase.
El rango: R = Xmax X min
Nmero de intervalos (regla de Sturges):
k = 1 + 3.322 log
10
n
(redondeo al entero ms cercano)
La amplitud o ancho de cada intervalo:
w = R / k
(redondeo por exceso a la misma cantidad de
decimales que tienen los datos)
Distribucin de frecuencias:
Variables cuantitativas continuas
Adems de las frecuencias simples, se agregan las
frecuencias acumuladas.
Histograma de frecuencia
Distribucin de f recuencia de los ingresos de los trabajadores de la empresa EPE
61
95
92
26
24
12
1
10
8
0
10
20
30
40
50
60
70
80
90
100
50 - 1103 2156 3209 4262 5315 6368 7421 8474 9527
Ingresos (S/)
N

m
e
r
o

d
e

t
r
a
b
a
j
a
d
o
r
e
s


o


f
i
50 1103 2156 3209 4262 5315 6368 7421 8474 9527
Media aritmtica
Para datos no agrupados:
1
n
i
i
x
x
n
=
=

Para datos agrupados:


1
k
i i
i
x f
x
n
=
=

Mediana para datos agrupados


Se identifica el intervalo que contiene a la
mediana (intervalo mediano)
Me Me 1
Me
Me L
2
w n
F
f

| |
= +
|
\ .
Lmite inferior del intervalo mediano: L
Me
Frecuencia absoluta simple del intervalo mediano: f
Me
Frecuencia acumulada absoluta anterior a la del
intervalo mediano: F
Me-1
Amplitud de los intervalos: w
Moda para datos agrupados
Identifique el intervalo con mayor frecuencia
(intervalo modal).
1
Mo
1 2
Mo L
d
w
d d
| |
= +
|
+
\ .
Lmite inferior del intervalo modal: L
Mo
Diferencia entre la frecuencia absoluta simple del
intervalo modal y la anterior: d
1
Diferencia entre la frecuencia absoluta simple del
intervalo modal y la siguiente: d
2

Amplitud del intervalo: w
A dos grupos diferentes de estudiantes (A y B) se les
pregunt cunto deseaban pagar como cuota de
graduacin.
Los datos para ambos grupos fueron:
Grupo A: 75, 50, 35, 24, 16, 12, 11, 10, 10, 7.
Grupo B: 30, 20, 15, 35, 25, 28, 22, 26, 24.
En ambos casos el promedio fue de 25 dlares.

Medidas de Dispersin
Cuando se inform al grupo A la decisin
hubo una fuerte reaccin negativa de parte
de unos alumnos, mientras que en el grupo B
la decisin fue aceptada con buena
disposicin.
Qu pudo haber causado la diferencia en las respuestas
finales de los grupos si se sigui el mismo procedimiento para
la toma de la decisin?
Es importante completar la
informacin proporcionada por
las medidas de tendencia
central con alguna medida de
dispersin que mida el grado de
variabilidad que presentan los
datos.
Las medidas de dispersin ms comunes son:
Rango
Rango intercuartilico
Varianza
Desviacin estndar y
Coeficiente de variacin

Varianza y desviacin estndar
La varianza es el promedio de los cuadrados de las
desviaciones de los datos con respecto a su media
aritmtica.
Tiene unidades de medicin al cuadrado.
La desviacin estndar es la raz cuadrada de la
varianza.
Poblacin Muestra
( )
N
x
N
i
i
=

=
1
2
2

o
( )
1
1
2
2

=
n
x x
s
n
i
i
Varianza para datos agrupados
( )
N
x f
k
i
i i
=

=
1
2
/
2

o
Para datos agrupados con marcas de clase
x
/
1
, x
/
2
, ... , x
/
k
y frecuencias absolutas simples
f
1
, f
2
, ... , f
k
:
Poblacin Muestra
( )
1
1
2
/
2

=
n
x x f
s
k
i
i i
Estadstica Inferencial

Es la rama de Estadstica que se ocupa de los
procesos de estimacin (puntual y por
intervalos), anlisis y pruebas hiptesis. La
finalidad de la estadstica inferencial es
llegar a conclusiones que brinden una
adecuada base cientfica para la toma de
decisiones, considerando la informacin
muestral recolectada.

Estimacin Puntual: Es la estimacin del valor del parmetro
por medio de un nico valor obtenido mediante el clculo o
evaluacin de un estimador para una muestra especfica.

Estimacin por intervalos: Es la estimacin del valor de un
parmetro mediante un conjunto de valores contenidos en un
intervalo. Para la obtencin de intervalos de confianza se
debe considerar el coeficiente de confianza que es la
probabilidad de que el intervalo contenga al parmetro
poblacional.

Prueba de Hiptesis: Es el procedimiento estadstico de
comprobacin de una afirmacin y se realiza a travs de las
observaciones de una muestra aleatoria.
Parmetro Estimador puntual

x
2
o
S
2

p
p



Intervalos de confianza
Es la estimacin de un parmetro dentro de un intervalo
de extremos cerrados |a , b|
Se establece un nivel de confianza (1 o)
Interpretacin: Si se seleccionan muchas muestras
muestras de tamao n, y para cada muestra se obtiene el
intervalo de confianza correspondiente, entonces
aproximadamente el (1 o) de estos intervalos
contendr el verdadero valor del parmetro.
n
z x
n
z x
o

o
o o 2 1 2 1
+ s s
error m x error m x . arg . arg + s s
Prueba de hiptesis
Conceptos generales
Hiptesis estadstica: es cualquier afirmacin que se hace
sobre los parmetros en una o ms poblaciones.

Hiptesis nula (Ho): la hiptesis que se contrasta usando
la informacin muestral se llama hiptesis nula.
Hiptesis alterna (H
1
): es la hiptesis que debe ser
aceptada si se rechaza la hiptesis nula. El no rechazar la
hiptesis nula no implica que sta sea cierta.
Tipos de error
Situacin
Decisin estadstica
No rechazar Ho Rechazar Ho
Ho es
verdadera
Decisin correcta Error tipo I
Ho es
falsa
Error tipo II Decisin correcta
Conceptos generales
Error tipo I: ocurre cuando se rechaza una hiptesis Ho
verdadera.
Nivel de significancia (o): es la probabilidad de cometer
error tipo I. El valor es fijado por la persona que realiza la
investigacin .
Error tipo II: ocurre cuando no se rechaza una hiptesis
Ho falsa. La probabilidad de cometer un error de este tipo
se denota por |.
Potencia de la prueba (1 |): es la probabilidad de
rechazar una hiptesis nula que es falsa.
Conceptos generales
Valor de probabilidad (p): es una medida de
concordancia entre los datos observados en la muestra
y Ho.
Un valor de probabilidad bajo indica que lo ms
probable es que dicha hiptesis sea falsa.
Tambin se le conoce como p-value o significancia de la
prueba.
Regla de decisin: rechazar Ho si p < o .
Conceptos generales
0 0
H : s
0 1
: H >
REGION DE RECHAZO
) 1 ( calculado o
> z z
n
X
Z
/
0
c
o

=
SE RECHAZARA H0 SI:
ESTADISTICO DE PRUEBA:
o <
value
p
Conceptos generales

Potrebbero piacerti anche