Sei sulla pagina 1di 7

Estadística II

Estadística II Estadística II

ÍNDICE

Q INTRODUCCIÓN
1. Definiciones
2. Tipos de muestreo

TEMA 3: Q

ESTADÍSTICOS
Ejemplos
• Media muestral

INTRODUCCIÓN A
• Varianza y cuasivarianza muestral

LA TEORÍA DE Q

DISTRIBUCIONES DE LOS ESTADÍSTICOS
Cambio de variable
MUESTRAS. • Función generatriz de momentos
• Muestreo artificial (Método de Montecarlo)
• Aproximación asintótica (T. C. L.)
MuestreoVariables aleatorias continuas
1. TAMAÑO DE LA MUESTRA

2. ANEXO: MUESTREO EN POBLACIONES


FINITAS
MUESTREO ESTRATIFICADO

1 2
Muestreo Muestreo

Estadística II Estadística II

INTRODUCCIÓN INTRODUCCIÓN

Comienzo de la parte inferencial del curso INFERENCIA ESTADÍSTICA


INFERENCIA: Dados unos valores de una (Temas 3, 4, 5, 6 y 7)
población, ¿qué se puede decir del modelo? Q Nociones básicas de muestreo
• Comparar resultados con modelos reales
Tema 3
Q Resultados teóricos acerca del muestreo
• Obtener conclusiones
ENFOQUE PARAMÉTRICO
Esquema de trabajo:
Q Problema: Dada una población, la existencia de
Partiendo de una población en la que se ha definido parámetros (valores poblacionales) desconocidos
un modelo probabilístico de los estudiados hasta
Q Soluciones:
ahora se desea averiguar alguna característica
(parámetro) desconocida. • Dar un único valor (Estimación puntual) Tema 4
• Dar un intervalo (Estimación por intervalos) Tema 5
Se extrae una muestra de tal población y con los
• Creencia a priori de que el parámetro tiene algún valor
resultados obtenidos se realizan inferencias sobre o rango de valores, y confirmarlo mediante técnicas
el modelo (valores del parámetro).
MuestreoVariables aleatorias continuas estadísticas (Test de hipótesis)
MuestreoVariables aleatorias continuas Tema 6
ENFOQUE NO PARAMÉTRICO
ENFOQUE PARAMÉTRICO Q Otras características del modelo que es necesario
confirmar (Test no paramétricos) Tema 7

3 4
Muestreo Muestreo

1
Estadística II

Estadística II Estadística II

INTRODUCCIÓN INTRODUCCIÓN

EJEMPLO INTRODUCTORIO MUESTREO: Herramienta de la investigación


Una máquina produce piezas que se pueden científica cuya función básica es determinar qué
clasificar en defectuosas y válidas; se quiere saber parte de una población en estudio debe examinarse
cuál es la proporción de piezas defectuosas que con el fin de hacer inferencias sobre dicha
produce la máquina población.
POBLACIÓN: Conjunto o colección de elementos Intentaremos responder a las siguientes cuestiones:
sobre los cuales se quiere estudiar alguna • ¿Por qué tomar muestras?
característica. • ¿Cómo se toman muestras?
• ¿Qué hacer con las muestras?
EJEMPLOS
• ¿Qué tipo de variables son las muestras?
Población finita e infinita
• ¿Cuántas muestras tomar?
MUESTRA: Solo se realiza el estudio de dicha ¿POR QUÉ TOMAR MUESTRAS?
característica en una parte de la población. A ese
Q Poblaciones infinitas
subconjuntoMuestreoVariables
se le denomina muestra.
aleatorias continuas MuestreoVariables aleatorias continuas
Q Costes de la toma de muestras
Q Destrucción de las unidades estudiadas

5 6
Muestreo Muestreo

Estadística II Estadística II

INTRODUCCIÓN TIPOS DE MUESTREO

EJEMPLO INTRODUCTORIO ¿CÓMO SE TOMAN MUESTRAS?


POBLACIÓN: Infinitas piezas que produce la
máquina. TIPOS DE MUESTREO
MODELO: Una variable aleatoria Bernoulli 1) Muestreo aleatorio simple o con reposición
X=Pieza defectuosa X≈ Be(p)
2) Muestreo sin reposición
MUESTRA: Número de piezas que se seleccionan
para comprobar si son defectuosas. 3) Muestreo Sistemático
PROBLEMA: No sabemos el porcentaje de piezas 4) Muestreo Estratificado
defectuosas, por lo tanto “p” es el parámetro 5) Muestreo por conglomerados
desconocido. Queremos hacer inferencias acerca
6) Otros tipos de muestreo (polietápico, MUM,...)
del verdadero valor de p
NOTA: Nunca se sabe el valor real de p
Solo es posiblealeatorias
MuestreoVariables estimarlo
continuas MuestreoVariables aleatorias continuas

NOTA: Con la información muestral se quiere


conocer toda la pblación

7 8
Muestreo Muestreo

2
Estadística II

Estadística II Estadística II

TIPOS DE MUESTREO TIPOS DE MUESTREO

1) MUESTREO ALEATORIO SIMPLE O CON 2) MUESTREO ALEATORIO SIN REPOSICIÓN


REPOSICIÓN (m.a.s.) Se TOMA un elemento al azar, se ESTUDIA y NO
se DEVUELVE para próximas extracciones
Se TOMA un elemento al azar, se ESTUDIA y se
DEVUELVE antes de extraer el siguiente NO todos los elementos tienen la misma
probabilidad de ser extraídos
Todos los elementos tienen la misma probabilidad
Las extracciones NO son independientes
de ser extraídos
EJEMPLOS: Urna sin reposición (p. finita)
Las extracciones son independientes
Elección de un comité (p. finita)
EJEMPLOS: Urna con reposición (p. finita) Una m.a. sin reposición de tamaño n (X1, ..., Xn) es
Máquina produce piezas (p. infinita) una v.a. n-dimensional donde todas las Xi:
Una m.a.s. de tamaño n (X1, ..., Xn) es una v.a. n- • Son dependientes
dimensionalMuestreoVariables
donde todasaleatorias
las Xcontinuas
i:
MuestreoVariables
• Tienen la misma aleatorias continuas
distribución
• Son independientes • Su distribución coincide con la de población
• Tienen la misma distribución Q NOTA: Si la población es grande (infinita) este
• Su distribución coincide con la de población muestreo se puede considerar como el anterior

9 10
Muestreo Muestreo

Estadística II Estadística II

TIPOS DE MUESTREO TIPOS DE MUESTREO

3) MUESTREO SISTEMÁTICO 4) MUESTREO ESTRATIFICADO


Para tomar una muestra de tamaño n: Dividir la población en L estratos (subgrupos) t. q:
• Elementos homogéneos dentro del estrato
Numerar las unidades de la población de 1 hasta N.
• Estratos heterogéneos entre sí
Dividir la población en n bloques de k elementos Muestra total = Unión de las muestras de cada
cada uno k = N / n estrato. Cada submuestra independiente del resto.
Tomar un elemento al azar del primer bloque Ventajas:
(elemento h: 1≤h≤k). Repetir de forma sistemática: • Permite aplicar técnicas de selección diferentes dentro
de cada estrato
La muestra queda formada por los elementos:
• Permite obtener estimaciones separadas en cada estrato
h + i•k i = 0,..., n-1 • Consigue mayor precisión
EJEMPLO: Elección de jurados • Disminuye el tamaño de la muestra
Para seleccionar el tamaño de cada submuestra:
Q NOTA: Solo pueden tomarse k muestras distintas
MuestreoVariables aleatorias continuas • Afijación uniforme aleatorias continuas
MuestreoVariables
Q NOTA: Los elementos de la muestra son
• Afijación proporcional (más usado)
dependientes
• Afijación de mínima varianza
Q NOTA: NO es válido si los elementos mantienen • Afijación óptima (costes asociados al muestreo)
una cierta periodicidad cíclica
EJEMPLO: Estudios de mercado

11 12
Muestreo Muestreo

3
Estadística II

Estadística II Estadística II

TIPOS DE MUESTREO TIPOS DE MUESTREO

5) MUESTREO POR CONGLOMERADOS 6) OTROS TIPOS DE MUESTREO


Sustituir los elementos de la población por grupos MUESTREO EN VARIAS ETAPAS:
Cada unidad es ahora un grupo: conglomerado Es común que se necesite utilizar conjuntamente
Se seleccionan los conglomerados y dentro de ellos varias de las técnicas vistas hasta ahora
se realiza el estudio
EJEMPLO: Centros de enseñanza dentro de una MUESTREO DE LA UNIDAD MONETARIA:
encuesta escolar
Usado en Auditoría. Consiste en tomar como
Municipios rurales dentro de una encuesta agrícola
unidades, no los expedientes sino la cantidad
NOTA: Cada grupo es heterogéneo dentro de él
monetaria que cada uno de ellos tiene. Así tienen
Los grupos deben ser homogéneos entre sí
más probabilidades de ser seleccionados los
MuestreoVariables aleatorias continuas expedientes MuestreoVariables
de mayor cantidad monetaria.
aleatorias continuas

13 14
Muestreo Muestreo

Estadística II Estadística II

ESTADÍSTICOS ESTADÍSTICOS

Q Estadístico: Cualquier función de la muestra Q Ejemplo: Muestra de tamaño 3 (X1, X2, X3).
3
totalmente especificada, es decir, que no dependa
de parámetros desconocidos T: ℜn → ℜ
Y= Nº de piezas defectuosas Y= ∑x j =1
j

( x1 ,...,x n ) a T ( x1 ,...,x n ) Distribución muestral: g(x1, x2, x3 /p) =


• Medida de información de la muestra
0 p3 0 0 .008
• Sirve para inducir valores de parámetros desconocidos  1
1 3p 2 q  0 .096
• Es una variable aleatoria = 2
sup oniendo p = 0 , 2 ⇒ 
Q En general, sea X una población (variable
2 3 pq 2 0 .384
 3 q 3  3 0 .512
aleatoria) que tiene un parámetro desconocido (θ).
Q Estadísticos más usuales:
Su función de densidad / cuantía depende, por lo 1 n

tanto, de dicho parámetro f(x / θ) Q Media muestral x=


n
∑x
i =1
i

n
Se toma una m.a.s. (X1, ..., Xn). Su distribución 1
muestral será g(x1, ..., xn / θ) (por ser una v.a.)
Q Varianza muestral s2 =
n
∑ (x
i =1
i − x)2
n
Q Ejemplo: Máquina que produce piezas buenas o 1
MuestreoVariables aleatorias continuas
defectuosas X = Pieza defectuosa X≈ Be(p) (θ = p)
Q Cuasivarianza muestral
MuestreoVariables aleatorias ∑(xi − x)2
s12 =continuas
n −1 i=1
f(x / θ) = p(X = i / p) = pi * (1-p)(1-i) i = 0,1 Q NOTA: Son los más usados pero sirve
n

g(x1, ..., xn / θ) = ∏ p(X


j =1
j = i / p) i = 0,1 cualquiera, también los momentos muestrales

15 16
Muestreo Muestreo

4
Estadística II

Estadística II Estadística II

ESTADÍSTICOS DISTRIBUCIONES DE LOS


ESTADÍSTICOS
Estadístico = Variable aleatoria ¿Qué tipo de variables aleatorias son los
Suponemos un m.a.s. (X1, ..., Xn) donde E[X] = µ estadísticos que hemos calculado hasta ahora?
Var [X] = σ2. Vamos a calcular los momentos de
los estadísticos
¿CÓMO SABER SU DISTRIBUCIÓN?

Var [ x ] = σ
2
Q Media muestral E[ x ] = µ
n 1) Método del cambio de variable
n −1 2 Habitualmente la distribución muestral no es
Q Varianza muestral E[s 2 ] = σ
n reconocida como uno de los modelos que
habitualmente se utilizan.
Q Cuasivarianza muestral E[s12 ] = σ 2 Una solución sería realizar un cambio de variable
para que la nueva variable fuera alguna función
Q CASO PARTICULAR: Proporción X≈Be(p) conocida.
n
1 Suele ser unMuestreoVariables
método que en continuas
la práctica apenas se
Q Proporción muestral p̂ =
n
∑x
MuestreoVariables aleatorias continuas

i =1
i
aleatorias
utiliza debido a su complejidad.
p (1 − p )
E [ p̂ ] = p Var [ p̂ ] =
n

17 18
Muestreo Muestreo

Estadística II Estadística II

DISTRIBUCIONES DE LOS DISTRIBUCIONES DE LOS


ESTADÍSTICOS ESTADÍSTICOS
Ejemplo:
1 n
2) Método de la función generatriz de momentos Dado x= ∑ xi
n i =1
y usando los teoremas
Teorema: Si (X1, ..., Xn) son independientes ⇒ anteriores: M X ( t ) = [M X ( t n )]
n

Función generatriz conjunta = Producto de las


funciones generatrices de las marginales
Ejemplo:
n

Teorema (Adición de v. a. independientes) Dado Y = nx = ∑ x i y usando los teoremas


i =1
M Y ( t ) = [M X ( t )]
n
Función generatriz de la suma de n v. a. anteriores:
independientes = Producto cada una de sus n
funciones generatrices
Ejercicios: Si X≈N(µ,σ) ⇒ X ≈ N( µ , σ n)
Este método consiste en calcular la función
generatriz de momentos del estadístico y,
recordando que esta función define de forma única Si X ≈P(λ) ⇒ Y = nx ≈ P(λn )
MuestreoVariables aleatorias continuas MuestreoVariables aleatorias continuas
a una v.a., intentar conocer su distribución.
Este método sirve únicamente en situaciones muy
específicas por lo que hay que buscar otras
alternativas.

19 20
Muestreo Muestreo

5
Estadística II

Estadística II Estadística II

DISTRIBUCIONES DE LOS DISTRIBUCIONES DE LOS


ESTADÍSTICOS ESTADÍSTICOS
3) Muestreo artificial 4) Aproximaciones asintóticas
Este método consiste en simular muestras En muchos estudios se toman muestras de tamaño
aleatorias de la población de partida, construir elevado. Es conveniente conocer las distribuciones
histogramas de del estadístico objeto del estudio y límite de algunos estadísticos (n→∝)
a partir de ahí obtener aproximadamente su Teorema Central del Límite (T.C.L.)
distribución. Dadas Xi i = 1, ..., n variables aleatorias t. q.
Para ello se necesita simular variables aleatorias • Independientes
(Práctica 1 de ordenador) • Idénticamente distribuidas
Q Para cada muestra: • Media y varianza finitas E[X] = µ Var [X] = σ2 .
1º) Valores de una U(0,1) n

2º) Utilizar que Y= F(x) ≈ U(0,1)


∑X i − nµ
X−µ
⇒ 1) i =1

σ n
→ N(0,1)
n →∞
2) → N(0,1)
σ n n →∞
3º) Realizar la transformación inversa X = F-1(Y)
4º) Calcular MuestreoVariables
los estadísticos que
aleatorias se necesiten
continuas Es decir, la suma de variables
MuestreoVariables se puede aproximar a
aleatorias continuas

Q Repetir estos pasos con un número elevado de una distribución N(µ,σ√n) y la media muestral se
muestras puede aproximar a una distribución N(µ,σ/ √n)
Q Realizar los histogramas de todas las muestras Q Nota: Se usa esta aproximación cuando n > 30

21 22
Muestreo Muestreo

Estadística II Estadística II

TAMAÑO DE LA MUESTRA TAMAÑO DE LA MUESTRA

¿QUÉ TAMAÑO DE MUESTRA TOMAR? CASO 2): X≈N(µ, σ)⇒ X ≈ N(µ , σ n)


Desigualdad de Tchebycheff • Fijado el nivel de confianza, mediante las tablas de la
distribución normal se calcula zα/2.
Sea X con E[X] = µ Var [X] = σ2 . zα2 2σ 2
• Se obtiene el tamaño mediante n=
e2
p{X − µ < kσ } ≥ 1 −
1
∀k > 0
k2
Q Nota 1: Si para el caso 1) n sale suficientemente
Problema: Establecido el parámetro que se quiere grande, mediante el T.C.L.se pasa al caso 2)
estimar (media), el grado de precisión (error) Q Nota 2: El tamaño muestral (n) es directamente

necesario y el nivel de confianza deseado, ¿qué proporcional a la varianza de la población y al


nivel de confianza, e inversamente proporcional al
tamaño de muestra debemos tomar?
error que estemos dispuestos a cometer.
CASO 1): X v. a. con distribución desconocida. Se
aplica la desigualdad de Tchebycheff Q Nota 3: Caso particular, proporciones X≈Be(p).
• Fijado el nivel de confianza se calcula k Aplicando el TCL se obtiene p̂ ≈ N(p, p(1 − p) n)
MuestreoVariables aleatorias continuas MuestreoVariables aleatorias continuas
• Se obtiene el tamaño mediante zα 2 p(1 − p)
2

n=
k 2σ 2 e2
n= 2 En caso de no tener ninguna estimación de p, se
e
toma el peor de los casos posible y se toma p = 1/2

23 24
Muestreo Muestreo

6
Estadística II

Estadística II Estadística II

TAMAÑO DE LA MUESTRA MUESTREO EN


POBLACIONES FINITAS
Es un muestreo sin reposición donde E[X] = µ y
Q Nota 4: En caso de desconocer la varianza, ésta Var [X] = σ2 . Las variables Xi están idénticamente
se sustituye por una estimación, habitualmente la distribuidas pero son dependientes:
cuasivarianza muestral (s12 ) Q Covarianza: Para 2 variables cualesquiera Xi y Xj

σ2
Cov ( X 1 , X 2 ) = −
Q Nota 5: Para el caso de poblaciones finitas se N −1
calcula lo que se denomina la “corrección para
poblaciones finitas” 1 n
n=
n∞ Q Media muestral x= ∑ xi
n i =1
n
1+ ∞
N E[ x ] = µ
• Esperanza
donde n ∞ es el tamaño calculado para el caso de una
población infinita (o para un m.a.s.)
σ2
MuestreoVariables aleatorias continuas • Varianza Var [ x ] = (1 − f )
MuestreoVariables aleatorias continuas
n

donde f es la fracción de muestreo (f = n/N)


• Ejercicio: Demostrar estas igualdades

25 26
Muestreo Muestreo

Estadística II

MUESTREO
ESTRATIFICADO
Sea X población con E[X] = µ y Var [X] = σ2
dividida en L estratos
L
Media muestral: X = ∑ Wi X i
i =1
Wi = proporción de elementos del estrato i-ésimo
(Ni/N) Xi = media muestral de dicho estrato
Q Características de la media muestral
L
σ i2
E[ X ] = µ Var[ X ] = ∑ Wi2 (1 − f i )
i =1 ni
σ i2 = varianza dentro de cada estrato
fi = fracción de muestreo del estrato i-ésimo (ni/N)
Q Para la afijación proporcional nh = Nh * n/N y la
fracción de muestreo fh = n/N = constante
Q Entonces, la varianza de la media muestral es:
MuestreoVariables aleatorias continuas
L
σi 2
Var[ X ] = (1 − f )∑ Wi2 L
ni k2
i =1

e2 ∑W σ
i =1
2 2
i i

Q Tamaño muestral: n= L
2

∑W σ
k 2 2
1+ i i
Ne 2 i =1

27
Muestreo

Potrebbero piacerti anche