Sei sulla pagina 1di 107

MTODOS

ESTADSTICOS

Mag. Helga Kelly Quiroz Chavil

MUESTREO E
INTERVALOS DE
CONFIANZA

Introduccin a la Inferencia Estadstica


Podemos definir Inferencia Estadstica como el
conjunto de tcnicas estadsticas que nos permiten
extraer conclusiones de una poblacin a partir de una
muestra representativa de la misma. El muestreo es
necesario

ya

por

motivos

de

tiempo,

dinero

naturaleza del experimento (prueba de una vacuna,


resistencia de materiales, etc ) no podemos hacer el
estudio de la poblacin completa.

Mtodos de Muestreo
Muestreo es la actividad por la cual se toman ciertas
muestras de una poblacin de elementos de los
cuales vamos a tomar ciertos criterios de decisin, el
muestreo es importante porque a travs

de l

podemos hacer anlisis de situaciones de una


empresa o de algn campo de la sociedad

Razones del Muestreo


1. La naturaleza destructiva de algunas pruebas
2. La imposibilidad fsica de observar todos los
elementos de la poblacin.
3. El costo de estudiar a toda la poblacin es muy
alto.
4. El tiempo para contactar a toda la poblacin es
inviable.

Razones del Muestreo


Por las razones anteriores, en muchos casos es
conveniente el uso de muestras, pero para que
podamos extraer conclusiones, es importante que
elijamos bien las muestras para nuestros estudios.
Hay cuestiones que debemos especificar a la hora de
elegir una muestra:
1. El tipo de muestreo que se va a utilizar.

Razones del Muestreo


2. El tamao de la muestra.
3. El nivel de confianza de las conclusiones que
vamos a presentar.

Clasificacin de los muestreos


Los mtodos de muestreo pueden dividirse en dos
grandes grupos:
1. Mtodos de muestreo probabilstico
2. Mtodos de muestreo no probabilstico

Muestreos no Probabilsticos
No sirven para realizar generalizaciones, pues no se
tienes la certeza de que la muestra extrada sea
representativa, ya que no todos los sujetos de la
poblacin tienen la misma probabilidad de ser
elegidos.

En general se selecciona a los sujetos

siguiendo determinados criterios procurando que la


muestra sea representativa

a)Muestreo
intencional
conveniencia:

de

Este tipo de muestreo se caracteriza por un


esfuerzo

deliberado

"representativas"

de

mediante

obtener
la

muestras

inclusin

en

la

muestra de grupos supuestamente tpicos. Es muy


frecuente su utilizacin en sondeos preelectorales
de

zonas

que

en

anteriores

marcado tendencias de voto.

votaciones

han

b) Bola de nieve
Se

localiza

algunos

individuos,

los

cuales

conducen a otros, y estos a otros, y as hasta


conseguir una muestra suficiente. Este tipo se
emplea muy frecuentemente cuando se hacen
estudios

con

delincuentes,
enfermos, etc.

poblaciones

sectas,

"marginales",

determinados

tipos

de

Muestreos Probabilsticos
Los muestreos probabilsticos son aquellos en los que
todos los individuos tienen la misma probabilidad de
ser elegidos para formar parte de una muestra. Dentro
de los mtodos de muestreo probabilstico encontramos
los siguientes tipos:
1. Muestreo aleatorio simple.
2. Muestreo sistemtico.
3. Muestreo estratificado.
4. Muestreo por conglomerados.

1. Muestreo aleatorio simple.


El procedimiento empleado es el siguiente:
Se asigna un nmero a cada individuo de la
poblacin y a travs de algn medio mecnico
(como una urna, bolas dentro de una bolsa,
tablas

de

nmeros

aleatorios,

nmeros

aleatorios generados con una calculadora u


ordenador, etc.)

Muestreo aleatorio simple.


Se eligen tantos sujetos como sea necesario
para

completar

el

tamao

de

muestra

requerido.
Este procedimiento, atractivo por su simpleza,
tiene poca o nula utilidad prctica cuando la
poblacin que estamos manejando es muy
grande.

Ejemplo:
En una compaa de 150 trabajadores se quiere
obtener una muestra aleatoria de 15 elementos para
un

chequeo

mdico.

Se

sigue

el

siguiente

procedimiento:
1. Los trabajadores son enumerados del 1 al 150
2. Mediante una tabla de nmeros aleatorios se
procede a seleccionarlos

Ejemplo:
3. El punto de arranque en la tabla se fija mediante
la hora de ese momento 4 : 03, por lo tanto se
inicia en la fila 4 y la columna 3
4. Como los nmeros de los trabajadores van desde
1 hasta 150 solo se toman en cuenta las primeras
3 cifras de cada nmero y se registran los
nmeros que se vayan encontrando es ese rango

2. Muestreo Sistemtico
Este procedimiento exige, como el anterior, numerar
todos los elementos de la poblacin, pero en lugar de
extraer n nmeros aleatorios slo se extrae uno. Se
parte de ese nmero aleatorio i, que es un nmero
elegido al azar, y los elementos que integran la
muestra son los que ocupa los lugares i, i+k, i+2k,
i+3k,...,i+(n-1)k, es decir se toman los individuos de
k en k,

Muestreo Sistemtico
Siendo k el resultado de dividir el tamao de la
poblacin entre el tamao de la muestra: k= N/n.
El nmero i que empleamos como punto de
partida ser un nmero al azar entre 1 y k.

Muestreo Sistemtico
El riesgo de este tipo de muestreo est en los casos
en que se dan periodicidades en la poblacin ya que
al elegir a los miembros de la muestra con una
periodicidad constante (k)
Podemos introducir una homogeneidad que no se da en
la poblacin.

Ejemplo:
Suponga que la poblacin de inters consiste de
2000 expedientes en un archivo. Para seleccionar
una muestra de 100 con el mtodo aleatorio simple
primero

se

tendra

que

numerar

todos

los

expedientes, luego se divide 2000/100= 20 y se


selecciona un expediente cada 20 hasta llegar a 100
expedientes.

Muestreo Aleatorio Estratificado:


Trata de obviar las dificultades que presentan los
anteriores ya que simplifican los procesos y suelen
reducir el error muestral para un tamao dado de la
muestra. Consiste en considerar categoras tpicas
diferentes

entre

(estratos)

que

poseen

gran

homogeneidad respecto a alguna caracterstica (se


puede estratificar, por ejemplo, segn la profesin, el
municipio de residencia, el sexo, el estado civil, etc.).

3. Muestreo Aleatorio Estratificado:


Para ello debemos conocer la composicin
estratificada de la poblacin objetivo a muestrear.
Una vez calculado el tamao muestral apropiado,
este se reparte de manera proporcional entre los
distintos estratos definidos de la poblacin usando
una simple regla de tres.

Muestreo Aleatorio Estratificado:


Entre sus ventajas, este mtodo asegura que la
muestra representa adecuadamente a la poblacin
en

funcin

de

ciertas

variables

seleccionadas,

adems de obtener estimaciones ms precisas.


La desventaja es que se ha conocer como se
distribuye la poblacin de acuerdo a las variables
utilizadas para la estratificacin.

Ejemplo
Se quiere obtener una muestra de 50 estudiantes de
la universidad, se pretende que la muestra sea
representativa en relacin al lugar de origen de los
estudiantes (si son de la localidad o son forneos).
Se sabe que en esta universidad el 30% de los
estudiantes son forneos.

Solucin
Primero debemos identificar los estratos de la
poblacin y sus respectivas proporciones:
Estudiantes locales: 0.7
Estudiantes forneos: 0.3
La muestra deber mantener esas mismas
proporciones, para lo cual es preciso multiplicar el
tamao de la muestra (n)

Solucin
Por las proporciones de los estratos y obtenemos el
nmero de elementos que sern seleccionados de
cada estrato
Estudiantes locales: 0.7(50)=35
Estudiantes forneos: 0.3(50)=15
Luego se procede a seleccionarlos por medio de
alguno mtodos estudiados anteriormente.

4. Muestreo Aleatorio por


Conglomerados
El muestreo por conglomerados consiste en dividir la
poblacin en sectores o conglomerados, seleccionar
una muestra aleatoria de esos sectores, y finalmente
obtener una muestra aleatoria de cada uno de los
sectores seleccionados.
Entre sus ventajas se encuentra que es muy
eficiente cuando la poblacin es muy grande y
dispersa.

Muestreo Aleatorio por Conglomerados


Adems que no es preciso tener un listado de toda la
poblacin, solo de las

unidades primarias de

muestreo.
Su desventaja radica en que una muestra de
conglomerados, usualmente produce un mayor error
muestral (por lo tanto da menor precisin de las
estimaciones acerca de la poblacin) que una
aleatoria simple del mismo tamao.

Ejemplo
Se quiere conocer la opinin de los padres de familia
sobre los temas educacin sexual tratados en los
libros de texto

de educacin primaria en el pas.

Como la poblacin es muy grande y

dispersa, es

necesario hacer un muestreo por conglomerados en


varias etapas.
Primero

dividimos

en

sectores

geogrficos

seleccionamos una muestra aleatoria de ellos.

Ejemplo
Luego en cada uno de ellos hacemos una seleccin
aleatoria de escuelas primarias, y por ltimo en las
escuelas seleccionadas obtenemos una muestra
aleatoria de padres de familia.

Tamao de muestra
Para estudios cuya variable principal es de
Tipo cuantitativo
a) Cuando no se conoce el tamao de la poblacin

Donde:
) n: Tamao de muestra
) Z: Nivel de confianza
) h: Tolerancia de error
) 2: varianza de la poblacin (en caso de no
conocerse, se estima mediante una muestra
piloto)

b) Cuando se conoce el tamao de la


poblacin

Donde:
n: Tamao de muestra
Z: Nivel de confianza
h: Tolerancia de error
2: varianza de la poblacin (en caso de no
conocerse, se estima mediante una muestra
piloto)
N: Tamao de la poblacin

Ejemplo:
Se
quiere estimar la facturacin mensual promedio
por luz elctrica en el mes de julio en casas de
familia de la cuidad de Chiclayo. Se sabe que la
deviacin estndar es de $20. Se quiere estimar la
facturacin promedio de julio con aproximacin

del

promedio real, con 95 % de confianza. Qu tamao


de muestra se necesita?

Datos

Z= 95 % = 1.96
h= 5
Frmula

n=
n=
n= 61.4656

Para estudios cuya variable principal es de


tipo cualitativo

a) Cuando no se conoce el tamao de la poblacin

Donde:
) n: Tamao de muestra
) Z: Nivel de confianza
) h: Tolerancia de error
) p: Proporcin de la poblacin que tiene la
caracterstica de inters
) q: complemento de P

Ejemplo
Se quiere estudiar la preferencia de un nuevo
partido poltico en una poblacin sobre el cual nunca
se ha hecho ningn estudio anterior, el margen de
error mximo a aceptar es del 2 % . Determine el
tamao de la muestra para un nivel de confianza del
90 %.

Solucin
Datos
Z= 90 %= 1.65
h= 2 %=0.02
p = 0.5
q = 0.5

Solucin
Luego

reemplazando en la frmula, tenemos:

n = 1701.5625
Tamao de muestra de 1702 personas.

b) Cuando se conoce el tamao de la poblacin

Donde:
n: Tamao de muestra
Z: Nivel de confianza
h: Tolerancia de error
p: Proporcin de la poblacin que tiene la
caracterstica de inters
q: complemento de P
N: Tamao de la poblacin

Ejemplo
Se harn elecciones para elegir el director de cierta
Universidad, que consta de 5 facultades, el total de
alumnos es de 10 100. Se desea

realizar

una

encuesta para saber cul es la tendencia del voto


entre los alumnos. Se requerir de un porcentaje de
confianza del 95% y un porcentaje de error de 3
%

Solucin
Datos:
N = 10 100
Z = 95% = 1.96
h = 3% = 0.03
p = 0.5
q= 0.5

Solucin
Luego

reemplazando en la frmula tenemos:

= 965
Rpta: como tamao de muestra optimo

Intervalo de Confianza
a) Estimador puntual:
Utiliza un nmero nico o valor para localizar una
estimacin del parmetro.

b) Estimador por intervalo de confianza:


Denota un rango dentro del cual se puede encontrar
el parmetro y el nivel de confianza que el intervalo
contiene al parmetro.

Intervalo de Confianza
Limites de confianza:
Son los lmites del intervalo de confianza inferior
(LIC) y superior (LSC), se determinan sumando y
restando a la media de la muestra un cierto nmero
Z (dependiendo del nivel o coeficiente de confianza)
de errores estndar de la media .

Intervalo de Confianza
Intervalo

de Confianza para la Media


a) Primer caso:
Varianza poblacional () conocida y n30.
Si

es el valor de la media que se obtiene de


; para una muestra con varianza

poblacional conocida
(1- ) 100% para

es:

; el intervalo de confianza del

Intervalo de Confianza para la Media

Donde:

= es el valor de la media muestral

b) Segundo Caso:
Varianza poblacional () desconocida y n30.

Donde:

= es el valor de la media muestral

S estndar de la muestra
1-

Ejemplo
Como consecuencia de la falta de gas registrada en
la ciudad de Chiclayo, en los meses de invierno, la
empresa de Gas decide hacer un estudio para
determinar las cantidad gastada es este combustible
para calefaccin casera en una ao en particular.
Con tal motivo se selecciona una muestra de 64
hogares de la ciudad. La media muestral del gasto
en gas para la calefaccin

Ejemplo
Result de $ 83.6. se sabe por experiencia que la
desviacin de la poblacin es $17.8
a) Halle un intervalo de confianza del 95 % para el
gasto promedio anual en este tipo de
combustible en las viviendas de la ciudad de
Chiclayo.
b) Calcule un intervalo de confianza del 99% para
este gasto promedio anual
c) Qu conclusiones puede sacar de a) y b)

Datos

n = 64

= 83.6

Z= 95% =1.96

Solucin
a) z= 95 %

83.6
79.239<
con una confianza del 95 %

Solucin
b)
Z= 99%
n = 64

= 83.6

Nivel de confianza: 1- =0. 99


Luego === 2.575

entonces 0.01

Tabla

Solucin

77.8<< 89.33
[77.8 , 89.33]

Conclusin
Se
observa que:
La longitud del intervalo del 95 % de confianza es
L1: 8.71
La longitud del intervalo del 99 % de confianza es
L2: 11.53
El nivel de confianza establece en alguna medida la
longitud del correspondiente intervalo de confianza.
Aumentando el nivel de confianza (mayor certeza),
aumenta la longitud (menor precisin). Entonces
podemos decir que

el intervalo con 95 % de

Ejemplo
Los vuelos de una empresa de aviacin tienen una
duracin bimestral aproximadamente distribuida de
forma normal con una desviacin de 40 horas. Si una
muestra de 30 vuelos tienes una duracin promedio
de 780 horas, encuentre los intervalos de confianza
de 95 % para la media de la poblacin de todos los
vuelos de esta empresa.

Solucin
Datos:

n = 30
=780

Z= 95%=1.96

Solucin

780
765.68<794.31
Con un nivel de confianza de 95 % se sabe que la
duracin media de los vuelos est entre 766 y 794
horas.

c) Tercer caso:
Varianza

poblacional (

) desconocida y n < 30.

Donde:

= es el valor de la media muestral

1 S= desviacin tpica

Ejemplo:
Las ventas diarias de cierta oficina comercial que
supone que siguen una distribucin normal. Para
estimar el volumen medio de ventas por da se
realiza una muestra de 10 das escogidos al azar,
resultando que la media de las ventas de esos 10
das es 100 u.m con una desviacin tpica de 4 u.m.
dar un intervalo de estimacin para el volumen
medio de ventas por da con una confianza de 95 %

Solucin
Datos:

n= 10

S= 4

=100

1 Grados de libertad= n-1 = 10-1 = 9


2.26

Tabla

Luego el intervalo es:

100 100)

Ejemplo
Una mquina produce piezas metlicas de forma
cilndrica. Se toma una muestra de piezas cuyos
dimetros son: 1.01 - 0.97 -1.03 - 1.04 - 0.99 - 0.98 0.99 - 1.01 - 1.03, con una desviacin de 0.02455.
Encuentre un intervalo de confianza del 99% para el
dimetro promedio de piezas de esta mquina si se
supone una distribucin aproximadamente normal.

Solucin
Datos

Calculo de la media:

=
= 1.0055

S= 0.02455

Datos
n= 9

Grados de libertad= n-1 = 9-1 = 8


1- 1
3.355

Tabla

Solucin

Conclusin
La mquina est produciendo cilindros con un
dimetro entre 0.978 cm y 1.032 cm con un nivel de
confianza del 99%

Intervalo de confianza para la proporcin


Para

poblacin infinita

Donde:
= valor de la tabla normal para una confianza 1 p = proporcin de la muestra
q = 1-p

n = tamao muestral

Ejemplo:
De una muestra aleatoria de 2100 personas de una
poblacin hay 630 que leen un determinado diario.
Calcular el intervalo de confianza para la proporcin
poblacional para un nivel de confianza del 99 %

Solucin
n= 2100
La proporcin de la muestra es: p=
q = 1-p = 1-0.3= 0.7
Sabemos que: 1- = 99% = 0.99 entonces

= = 2.575

Tabla

Luego
Luego

el intervalo de confianza ser:

LA PRUEBA DE
HIPTESIS
Y LA ASOCIACIN DE
DOS VARIABLES

Pruebas de Hiptesis
Otra manera de hacer inferencia es haciendo una
afirmacin acerca del valor del parmetro de la
poblacin bajo estudio. Esta afirmacin, puede estar
basada en alguna creencia o experiencia pasada,
que ser contrastada con la evidencia que nosotros
obtengamos, a travs de la informacin contenida
en la muestra. Esto es a lo que llamamos Prueba de
Hiptesis

Definiciones
Prueba estadstica:
Tcnica que permite tomar una decisin, en la
aceptacin o rechazo de una hiptesis estadstica.
Hiptesis estadstica:
Es una afirmacin respecto a los parmetros de una
poblacin.

Pruebas de Hiptesis
Una prueba de hiptesis comprende cuatro
componentes principales:
a) Hiptesis Nula
b) Hiptesis Alternativa
c) Estadstica de Prueba
d) Regin de Rechazo

Hiptesis Nula()
La

Hiptesis

especifica

un

Nula,
solo

denotada
valor

del

como
parmetro

siempre
de

la

poblacin. Es decir la Hiptesis Nula afirma que no


hay

diferencias

tratamientos.

no

hay

efecto

en

los

Hiptesis Alternativa
La
Hiptesis Alternativa, denotada como es la que
responde nuestra pregunta, la que se establece en
base a la evidencia que tenemos. Es decir

la

hiptesis alternativa afirma que hay diferencias o


si hay efecto en los
cuatro formas:

tratamientos. Puede tener

Hiptesis Alternativa
Existen dos tipos de hiptesis alternativa:
La Unilateral: Se especifica una direccin: > <
La Bilateral: No se especifica una direccin:

Conclusiones Incorrectas
Como las conclusiones a las que lleguemos se basan
en una muestra, entonces existen posibilidades de
que nos equivoquemos. Podra llegarse a una
conclusin incorrecta en varios casos:
Error del Tipo I :
Rechazo de la hiptesis nula, cuando en realidad es
verdadera
Error del Tipo II:
Aceptacin de la hiptesis nula, cuando en realidad
es falsa.

Prueba de Hiptesis
Sea

. Dado que la unin de las dos hiptesis

cubre todos los posibles valores de la media, se tiene


que slo una de las dos hiptesis debe ser verdadera.

Grafica

Conclusiones de una Prueba de Hiptesis


Si rechazamos la Hiptesis Nula, concluimos que
hay suficiente evidencia estadstica para inferir
que la hiptesis nula es falsa
Si no rechazamos la Hiptesis Nula, concluimos
que no hay suficiente evidencia estadstica para
inferir que la hiptesis nula es falsa

Prueba de Hiptesis
La Probabilidad de cometer un error Tipo I se conoce
como Nivel de Significancia, se denota como y es
el tamao de la regin de rechazo
El complemento de la regin de rechazo es 1 y es
conocido como el Coeficiente de Confianza
En una prueba de Hiptesis de dos colas la regin de
no rechazo corresponde a un intervalo de confianza
para el parmetro en cuestin

Regin de Rechazo
La Regin de Rechazo es el conjunto de valores tales
que si la prueba estadstica cae dentro de este
rango, decidimos rechazar la Hiptesis Nula. Su
localizacin depende de la forma de la Hiptesis
Alternativa:

Estadstica de Prueba
La Estadstica de Prueba es una estadstica que se
deriva del estimador puntual del parmetro que
estemos probando y en ella basamos nuestra decisin
acerca de si rechazar o no rechazar la Hiptesis Nula

Siempre se calcula considerando la Hiptesis Nula


como si fuera verdadera.

Prueba de hiptesis para la media


Definicin de regin de rechazo para hiptesis
estadstica referente a un promedio poblacional ().
Vlido para el caso de una variable normalmente
distribuida y para una muestra grande (n>30).

Varianza conocida:

Donde
x= media muestral
n = muestra

Ejemplo:
Se somete a prueba a la totalidad de los integrantes
del magisterio para enseanza bsica primaria de un
pas y un experto en educacin afirma que el
promedio de la calificacin, sobre una base de 100,
fue de 76. Un representante del alto gobierno pone
en duda dicha afirmacin, por lo cual se toma una
muestra aleatoria de 400 maestros cuya media fue
de 74 con desviacin estndar de 16. Probar la
hiptesis con un nivel de significacin del 1%.

Solucin
Datos

n= 400
x= 74
= 16

Paso 1: Contraste de hiptesis.


(hiptesis nula )
(Hiptesis alternativa)

Solucin
Paso2:

(Frmula)

Z=

Z= -2.5
Paso3: Nivel de significancia.

Solucin
Paso

4: Punto crtico.
=
Puesto que
-2.5 (no cumple)
-2.5

(no cumple)

Paso 5 : conclusin
Se acepta la hiptesis se rechaza

Ejemplo

Un proceso manufacturero usado por una fbrica


durante los ltimos aos da una produccin media
de 100 unidades por hora con una desviacin
estndar de 8 unidades. Se acaba de introducir en el
mercado una nueva mquina para realizar ese tipo
de producto. Aunque es muy cara comparada con la
que est ahora en uso, si la media de produccin de
la nueva mquina es de ms de 150 unidades por
hora, su adopcin dara bastantes beneficios.

Ejemplo
Para decidir si se debiera comprar la nueva mquina,
a la gerencia de la fbrica se le permite hacer un
ensayo durante 35 horas, hallndose un promedio
de 160 unidades por hora. Con sta informacin qu
decisin se debe tomar si se asume un nivel de
confianza del 99 por ciento.

Solucin
Segn

el enunciado, solo se compra la mquina si la


produccin es de mas de 150 unidades por hora, por
lo tanto las hiptesis son:
H0:= 150
H1:> 150
Datos
n= 35
x= 160

Solucin
8
Z = 99 %
Luego :

Z = 7.395

Solucin
Nivel

de significancia.
1- = 0.99

Punto crtico.
=
Puesto que
7.395 (cumple)

Conclusin
La estadstica de trabajo est en la zona de rechazo
de la hiptesis nula, por lo tanto, se acepta que la
produccin promedio por hora es superior a las 150
unidades y asumiendo un riesgo del 1 por ciento se
puede comprar la nueva mquina.

Varianza desconocida:

Potrebbero piacerti anche