Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
ESTADSTICOS
MUESTREO E
INTERVALOS DE
CONFIANZA
ya
por
motivos
de
tiempo,
dinero
Mtodos de Muestreo
Muestreo es la actividad por la cual se toman ciertas
muestras de una poblacin de elementos de los
cuales vamos a tomar ciertos criterios de decisin, el
muestreo es importante porque a travs
de l
Muestreos no Probabilsticos
No sirven para realizar generalizaciones, pues no se
tienes la certeza de que la muestra extrada sea
representativa, ya que no todos los sujetos de la
poblacin tienen la misma probabilidad de ser
elegidos.
a)Muestreo
intencional
conveniencia:
de
deliberado
"representativas"
de
mediante
obtener
la
muestras
inclusin
en
la
zonas
que
en
anteriores
votaciones
han
b) Bola de nieve
Se
localiza
algunos
individuos,
los
cuales
con
delincuentes,
enfermos, etc.
poblaciones
sectas,
"marginales",
determinados
tipos
de
Muestreos Probabilsticos
Los muestreos probabilsticos son aquellos en los que
todos los individuos tienen la misma probabilidad de
ser elegidos para formar parte de una muestra. Dentro
de los mtodos de muestreo probabilstico encontramos
los siguientes tipos:
1. Muestreo aleatorio simple.
2. Muestreo sistemtico.
3. Muestreo estratificado.
4. Muestreo por conglomerados.
de
nmeros
aleatorios,
nmeros
completar
el
tamao
de
muestra
requerido.
Este procedimiento, atractivo por su simpleza,
tiene poca o nula utilidad prctica cuando la
poblacin que estamos manejando es muy
grande.
Ejemplo:
En una compaa de 150 trabajadores se quiere
obtener una muestra aleatoria de 15 elementos para
un
chequeo
mdico.
Se
sigue
el
siguiente
procedimiento:
1. Los trabajadores son enumerados del 1 al 150
2. Mediante una tabla de nmeros aleatorios se
procede a seleccionarlos
Ejemplo:
3. El punto de arranque en la tabla se fija mediante
la hora de ese momento 4 : 03, por lo tanto se
inicia en la fila 4 y la columna 3
4. Como los nmeros de los trabajadores van desde
1 hasta 150 solo se toman en cuenta las primeras
3 cifras de cada nmero y se registran los
nmeros que se vayan encontrando es ese rango
2. Muestreo Sistemtico
Este procedimiento exige, como el anterior, numerar
todos los elementos de la poblacin, pero en lugar de
extraer n nmeros aleatorios slo se extrae uno. Se
parte de ese nmero aleatorio i, que es un nmero
elegido al azar, y los elementos que integran la
muestra son los que ocupa los lugares i, i+k, i+2k,
i+3k,...,i+(n-1)k, es decir se toman los individuos de
k en k,
Muestreo Sistemtico
Siendo k el resultado de dividir el tamao de la
poblacin entre el tamao de la muestra: k= N/n.
El nmero i que empleamos como punto de
partida ser un nmero al azar entre 1 y k.
Muestreo Sistemtico
El riesgo de este tipo de muestreo est en los casos
en que se dan periodicidades en la poblacin ya que
al elegir a los miembros de la muestra con una
periodicidad constante (k)
Podemos introducir una homogeneidad que no se da en
la poblacin.
Ejemplo:
Suponga que la poblacin de inters consiste de
2000 expedientes en un archivo. Para seleccionar
una muestra de 100 con el mtodo aleatorio simple
primero
se
tendra
que
numerar
todos
los
entre
(estratos)
que
poseen
gran
funcin
de
ciertas
variables
seleccionadas,
Ejemplo
Se quiere obtener una muestra de 50 estudiantes de
la universidad, se pretende que la muestra sea
representativa en relacin al lugar de origen de los
estudiantes (si son de la localidad o son forneos).
Se sabe que en esta universidad el 30% de los
estudiantes son forneos.
Solucin
Primero debemos identificar los estratos de la
poblacin y sus respectivas proporciones:
Estudiantes locales: 0.7
Estudiantes forneos: 0.3
La muestra deber mantener esas mismas
proporciones, para lo cual es preciso multiplicar el
tamao de la muestra (n)
Solucin
Por las proporciones de los estratos y obtenemos el
nmero de elementos que sern seleccionados de
cada estrato
Estudiantes locales: 0.7(50)=35
Estudiantes forneos: 0.3(50)=15
Luego se procede a seleccionarlos por medio de
alguno mtodos estudiados anteriormente.
unidades primarias de
muestreo.
Su desventaja radica en que una muestra de
conglomerados, usualmente produce un mayor error
muestral (por lo tanto da menor precisin de las
estimaciones acerca de la poblacin) que una
aleatoria simple del mismo tamao.
Ejemplo
Se quiere conocer la opinin de los padres de familia
sobre los temas educacin sexual tratados en los
libros de texto
dispersa, es
dividimos
en
sectores
geogrficos
Ejemplo
Luego en cada uno de ellos hacemos una seleccin
aleatoria de escuelas primarias, y por ltimo en las
escuelas seleccionadas obtenemos una muestra
aleatoria de padres de familia.
Tamao de muestra
Para estudios cuya variable principal es de
Tipo cuantitativo
a) Cuando no se conoce el tamao de la poblacin
Donde:
) n: Tamao de muestra
) Z: Nivel de confianza
) h: Tolerancia de error
) 2: varianza de la poblacin (en caso de no
conocerse, se estima mediante una muestra
piloto)
Donde:
n: Tamao de muestra
Z: Nivel de confianza
h: Tolerancia de error
2: varianza de la poblacin (en caso de no
conocerse, se estima mediante una muestra
piloto)
N: Tamao de la poblacin
Ejemplo:
Se
quiere estimar la facturacin mensual promedio
por luz elctrica en el mes de julio en casas de
familia de la cuidad de Chiclayo. Se sabe que la
deviacin estndar es de $20. Se quiere estimar la
facturacin promedio de julio con aproximacin
del
Datos
Z= 95 % = 1.96
h= 5
Frmula
n=
n=
n= 61.4656
Donde:
) n: Tamao de muestra
) Z: Nivel de confianza
) h: Tolerancia de error
) p: Proporcin de la poblacin que tiene la
caracterstica de inters
) q: complemento de P
Ejemplo
Se quiere estudiar la preferencia de un nuevo
partido poltico en una poblacin sobre el cual nunca
se ha hecho ningn estudio anterior, el margen de
error mximo a aceptar es del 2 % . Determine el
tamao de la muestra para un nivel de confianza del
90 %.
Solucin
Datos
Z= 90 %= 1.65
h= 2 %=0.02
p = 0.5
q = 0.5
Solucin
Luego
n = 1701.5625
Tamao de muestra de 1702 personas.
Donde:
n: Tamao de muestra
Z: Nivel de confianza
h: Tolerancia de error
p: Proporcin de la poblacin que tiene la
caracterstica de inters
q: complemento de P
N: Tamao de la poblacin
Ejemplo
Se harn elecciones para elegir el director de cierta
Universidad, que consta de 5 facultades, el total de
alumnos es de 10 100. Se desea
realizar
una
Solucin
Datos:
N = 10 100
Z = 95% = 1.96
h = 3% = 0.03
p = 0.5
q= 0.5
Solucin
Luego
= 965
Rpta: como tamao de muestra optimo
Intervalo de Confianza
a) Estimador puntual:
Utiliza un nmero nico o valor para localizar una
estimacin del parmetro.
Intervalo de Confianza
Limites de confianza:
Son los lmites del intervalo de confianza inferior
(LIC) y superior (LSC), se determinan sumando y
restando a la media de la muestra un cierto nmero
Z (dependiendo del nivel o coeficiente de confianza)
de errores estndar de la media .
Intervalo de Confianza
Intervalo
poblacional conocida
(1- ) 100% para
es:
Donde:
b) Segundo Caso:
Varianza poblacional () desconocida y n30.
Donde:
S estndar de la muestra
1-
Ejemplo
Como consecuencia de la falta de gas registrada en
la ciudad de Chiclayo, en los meses de invierno, la
empresa de Gas decide hacer un estudio para
determinar las cantidad gastada es este combustible
para calefaccin casera en una ao en particular.
Con tal motivo se selecciona una muestra de 64
hogares de la ciudad. La media muestral del gasto
en gas para la calefaccin
Ejemplo
Result de $ 83.6. se sabe por experiencia que la
desviacin de la poblacin es $17.8
a) Halle un intervalo de confianza del 95 % para el
gasto promedio anual en este tipo de
combustible en las viviendas de la ciudad de
Chiclayo.
b) Calcule un intervalo de confianza del 99% para
este gasto promedio anual
c) Qu conclusiones puede sacar de a) y b)
Datos
n = 64
= 83.6
Z= 95% =1.96
Solucin
a) z= 95 %
83.6
79.239<
con una confianza del 95 %
Solucin
b)
Z= 99%
n = 64
= 83.6
entonces 0.01
Tabla
Solucin
77.8<< 89.33
[77.8 , 89.33]
Conclusin
Se
observa que:
La longitud del intervalo del 95 % de confianza es
L1: 8.71
La longitud del intervalo del 99 % de confianza es
L2: 11.53
El nivel de confianza establece en alguna medida la
longitud del correspondiente intervalo de confianza.
Aumentando el nivel de confianza (mayor certeza),
aumenta la longitud (menor precisin). Entonces
podemos decir que
el intervalo con 95 % de
Ejemplo
Los vuelos de una empresa de aviacin tienen una
duracin bimestral aproximadamente distribuida de
forma normal con una desviacin de 40 horas. Si una
muestra de 30 vuelos tienes una duracin promedio
de 780 horas, encuentre los intervalos de confianza
de 95 % para la media de la poblacin de todos los
vuelos de esta empresa.
Solucin
Datos:
n = 30
=780
Z= 95%=1.96
Solucin
780
765.68<794.31
Con un nivel de confianza de 95 % se sabe que la
duracin media de los vuelos est entre 766 y 794
horas.
c) Tercer caso:
Varianza
poblacional (
Donde:
1 S= desviacin tpica
Ejemplo:
Las ventas diarias de cierta oficina comercial que
supone que siguen una distribucin normal. Para
estimar el volumen medio de ventas por da se
realiza una muestra de 10 das escogidos al azar,
resultando que la media de las ventas de esos 10
das es 100 u.m con una desviacin tpica de 4 u.m.
dar un intervalo de estimacin para el volumen
medio de ventas por da con una confianza de 95 %
Solucin
Datos:
n= 10
S= 4
=100
Tabla
100 100)
Ejemplo
Una mquina produce piezas metlicas de forma
cilndrica. Se toma una muestra de piezas cuyos
dimetros son: 1.01 - 0.97 -1.03 - 1.04 - 0.99 - 0.98 0.99 - 1.01 - 1.03, con una desviacin de 0.02455.
Encuentre un intervalo de confianza del 99% para el
dimetro promedio de piezas de esta mquina si se
supone una distribucin aproximadamente normal.
Solucin
Datos
Calculo de la media:
=
= 1.0055
S= 0.02455
Datos
n= 9
Tabla
Solucin
Conclusin
La mquina est produciendo cilindros con un
dimetro entre 0.978 cm y 1.032 cm con un nivel de
confianza del 99%
poblacin infinita
Donde:
= valor de la tabla normal para una confianza 1 p = proporcin de la muestra
q = 1-p
n = tamao muestral
Ejemplo:
De una muestra aleatoria de 2100 personas de una
poblacin hay 630 que leen un determinado diario.
Calcular el intervalo de confianza para la proporcin
poblacional para un nivel de confianza del 99 %
Solucin
n= 2100
La proporcin de la muestra es: p=
q = 1-p = 1-0.3= 0.7
Sabemos que: 1- = 99% = 0.99 entonces
= = 2.575
Tabla
Luego
Luego
LA PRUEBA DE
HIPTESIS
Y LA ASOCIACIN DE
DOS VARIABLES
Pruebas de Hiptesis
Otra manera de hacer inferencia es haciendo una
afirmacin acerca del valor del parmetro de la
poblacin bajo estudio. Esta afirmacin, puede estar
basada en alguna creencia o experiencia pasada,
que ser contrastada con la evidencia que nosotros
obtengamos, a travs de la informacin contenida
en la muestra. Esto es a lo que llamamos Prueba de
Hiptesis
Definiciones
Prueba estadstica:
Tcnica que permite tomar una decisin, en la
aceptacin o rechazo de una hiptesis estadstica.
Hiptesis estadstica:
Es una afirmacin respecto a los parmetros de una
poblacin.
Pruebas de Hiptesis
Una prueba de hiptesis comprende cuatro
componentes principales:
a) Hiptesis Nula
b) Hiptesis Alternativa
c) Estadstica de Prueba
d) Regin de Rechazo
Hiptesis Nula()
La
Hiptesis
especifica
un
Nula,
solo
denotada
valor
del
como
parmetro
siempre
de
la
diferencias
tratamientos.
no
hay
efecto
en
los
Hiptesis Alternativa
La
Hiptesis Alternativa, denotada como es la que
responde nuestra pregunta, la que se establece en
base a la evidencia que tenemos. Es decir
la
Hiptesis Alternativa
Existen dos tipos de hiptesis alternativa:
La Unilateral: Se especifica una direccin: > <
La Bilateral: No se especifica una direccin:
Conclusiones Incorrectas
Como las conclusiones a las que lleguemos se basan
en una muestra, entonces existen posibilidades de
que nos equivoquemos. Podra llegarse a una
conclusin incorrecta en varios casos:
Error del Tipo I :
Rechazo de la hiptesis nula, cuando en realidad es
verdadera
Error del Tipo II:
Aceptacin de la hiptesis nula, cuando en realidad
es falsa.
Prueba de Hiptesis
Sea
Grafica
Prueba de Hiptesis
La Probabilidad de cometer un error Tipo I se conoce
como Nivel de Significancia, se denota como y es
el tamao de la regin de rechazo
El complemento de la regin de rechazo es 1 y es
conocido como el Coeficiente de Confianza
En una prueba de Hiptesis de dos colas la regin de
no rechazo corresponde a un intervalo de confianza
para el parmetro en cuestin
Regin de Rechazo
La Regin de Rechazo es el conjunto de valores tales
que si la prueba estadstica cae dentro de este
rango, decidimos rechazar la Hiptesis Nula. Su
localizacin depende de la forma de la Hiptesis
Alternativa:
Estadstica de Prueba
La Estadstica de Prueba es una estadstica que se
deriva del estimador puntual del parmetro que
estemos probando y en ella basamos nuestra decisin
acerca de si rechazar o no rechazar la Hiptesis Nula
Varianza conocida:
Donde
x= media muestral
n = muestra
Ejemplo:
Se somete a prueba a la totalidad de los integrantes
del magisterio para enseanza bsica primaria de un
pas y un experto en educacin afirma que el
promedio de la calificacin, sobre una base de 100,
fue de 76. Un representante del alto gobierno pone
en duda dicha afirmacin, por lo cual se toma una
muestra aleatoria de 400 maestros cuya media fue
de 74 con desviacin estndar de 16. Probar la
hiptesis con un nivel de significacin del 1%.
Solucin
Datos
n= 400
x= 74
= 16
Solucin
Paso2:
(Frmula)
Z=
Z= -2.5
Paso3: Nivel de significancia.
Solucin
Paso
4: Punto crtico.
=
Puesto que
-2.5 (no cumple)
-2.5
(no cumple)
Paso 5 : conclusin
Se acepta la hiptesis se rechaza
Ejemplo
Ejemplo
Para decidir si se debiera comprar la nueva mquina,
a la gerencia de la fbrica se le permite hacer un
ensayo durante 35 horas, hallndose un promedio
de 160 unidades por hora. Con sta informacin qu
decisin se debe tomar si se asume un nivel de
confianza del 99 por ciento.
Solucin
Segn
Solucin
8
Z = 99 %
Luego :
Z = 7.395
Solucin
Nivel
de significancia.
1- = 0.99
Punto crtico.
=
Puesto que
7.395 (cumple)
Conclusin
La estadstica de trabajo est en la zona de rechazo
de la hiptesis nula, por lo tanto, se acepta que la
produccin promedio por hora es superior a las 150
unidades y asumiendo un riesgo del 1 por ciento se
puede comprar la nueva mquina.
Varianza desconocida: