Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Por ejemplo, hemos mencionado que las poblaciones estn formadas por individuos, pero sera mejor denominarlas unidades de muestreo o unidades de estudio:
Personas, clulas, familias, hospitales, pases
Probabilidad y Estadstica
Si llamamos por telfono excluimos a los que no tienen. Si elegimos indiv. en la calle, olvidamos los que estn trabajando...
El grupo que en realidad podemos estudiar (v.g. los que tienen telfono) se denomina poblacin de estudio.
Muestreo y Estimacin 2
Probabilidad y Estadstica
Fuentes de sesgo
Las poblaciones objetivo y de estudio pueden diferir en cuanto a las variables que estudiamos.
El nivel econmico en la poblacin de estudio es mayor que en la objetivo,... Los individuos que se eligen en la calle pueden ser de mayor edad (mayor frecuencia de jubilados p.ej.)
En este caso, diremos que las muestras que se elijan estarn sesgadas. Al tipo de sesgo debido a diferencias sistemticas entre poblacin objetivo y poblacin de estudio se denomina sesgo de seleccin.
Aunque no podamos saber cul es la verdad en cada individuo, podemos hacernos una idea porcentual sobre la poblacin, viendo en cunto se alejan las respuestas del 50%.
Probabilidad y Estadstica Muestreo y Estimacin 4
Tcnicas de muestreo
Cuando elegimos individuo de una poblacin de estudio para formar muestras podemos encontrarnos en las siguientes situaciones:
Muestreos probabilistas
Conocemos la probabilidad de que un individuo sea elegido para la muestra. Interesantes para usar estadstica matemtica con ellos.
Muestreos no probabilistas
Con respuesa aleatorizada
40% No 60% S
Diferencia entre los que han dicho s y los que deban hacerlo por que as lo indicaba la moneda
No se conoce la probabilidad. Son muestreos que seguramente esconden sesgos. En principio no se pueden extrapolar los resultados a la poblacin.
A pesar de ello una buena parte de los estudios que se publican usan esta tcnica.
No son mitad y mitad! El porcentaje estimado de ind. que tom drogas es:
p*
En adelante vamos a tratar exclusivamente con muestreos con la menor posibilidad de sesgo (probabilistas): aleatorio simple, sistemtico, estratificado y por grupos.
Probabilidad y Estadstica Muestreo y Estimacin 6
Muestreo sistemtico
Se tiene una lista de los individuos de la poblacin de estudio. Si queremos una muestra de un tamao dado, elegimos individuos igualmente espaciados de la lista, donde el primero ha sido elegido al azar. CUIDADO: Si en la lista existen periodicidades, obtendremos una muestra sesgada.
Un caso real: Se eligi una de cada cinco casas para un estudio de salud pblica en una ciudad donde las casas se distribuyen en manzanas de cinco casas. Salieron con mucha frecuencia las de las esquinas, que reciben ms sol, estn mejor ventiladas,
Probabilidad y Estadstica
Muestreo y Estimacin
Muestreo estratificado
Se aplica cuando sabemos que hay ciertos factores (variables, subpoblaciones o estratos) que pueden influir en el estudio y queremos asegurarnos de tener cierta cantidad mnima de individuos de cada tipo:
Hombres y mujeres, Jvenes, adultos y ancianos
Se realiza entonces una m.a.s. de los individuos de cada uno de los estratos. Al extrapolar los resultados a la poblacin hay que tener en cuenta el tamao relativo del estrato con respecto al total de la poblacin.
Probabilidad y Estadstica Muestreo y Estimacin 9
Al igual que en el muestreo estratificado, al extrapolar los resultados a la poblacin hay que tener en cuenta el tamao relativo de unos grupos con respecto a otros.
Regiones con diferente poblacin pueden tener probabilidades diferentes de ser elegidas, ciudades, hospitales grandes frente a pequeos,
Probabilidad y Estadstica Muestreo y Estimacin 10
Estimacin
Un estimador es una cantidad numrica calculada sobre una muestra y que esperamos que sea una buena aproximacin de cierta cantidad con el mismo significado en la poblacin (parmetro). En realidad ya hemos trabajado con estimadores cada vez que hacamos una prctica con muestras extradas de una poblacin y suponamos que las medias, etc eran prximas de las de la poblacin.
Para la media de una poblacin:
El mejor estimador es la media de la muestra.
Estimacin
Consideraremos que es un buen estimador de cumple con las siguientes caractersticas: si
Ser insesgado lo que significa que el valor esperado del estimador coincide con el parmetro.
E( ) =
Ser de varianza mnima: la varianza del estimador deber tender a cero a medida que crece el tamao de la muestra
V ( ) 0 , si n
Ser el ms eficiente: si hay ms de un estimador puntual se prefiere a aquel cuyo desvo estndar es menor
En el ejemplo anterior la situacin no era muy realista, pues como de todas maneras no conozco desconocer el intervalo exacto para . Sin embargo tambin hay estimadores para y puedo usarlo como aproximacin. Para tener una idea intuitiva, analicemos el siguiente ejemplo. Nos servir como introduccin a la estimacin puntual y por intervalos de confianza.
X =
Es decir si por ejemplo =60 y =5, y obtenemos muestras de tamao n=100, 5 La desv. tpica de la media muestral (error estndar) es X = = 0,5 100
como la media muestral es aproximadamente normal, el 95% de los estudios con muestras ofreceran estimaciones entre 601 Dicho de otra manera, al hacer un estudio tenemos una confianza del 95% de que la verdadera media est a una distancia de 1.
Probabilidad y Estadstica Muestreo y Estimacin 13
Probabilidad y Estadstica
Muestreo y Estimacin
14
Ejemplo: Una muestra de n=100 individuos de una poblacin tiene media de peso 60 kg y desviacin 5kg.
Dichas cantidades pueden considerarse como aproximaciones (estimaciones puntuales)
60 kg estima a 5 kg estima a 5 = 0 , 5 estima el error estndar (tpico)
100
Estas son las llamadas estimaciones puntuales: un nmero concreto calculado sobre una muestra es aproximacin de un parmetro.
P( I < < S ) = 1 , I = E
S = + E
E es el error mximo que podemos tener al utilizar el estimador puntual en lugar del parmetro y es igual a
Una estimacin por intervalo de confianza es una que ofrece un intervalo como respuesta. Adems podemos asignarle una probabilidad aproximada que mida nuestra confianza en la respuesta:
Hay una confianza del 68% de que est en 600,5 Hay una confianza del 95% de que est en 601.
E = z 2 .
Obsrvese que la probabilidad de error (no contener al parmetro) es . En el siguiente tema se llamar prob. de error de tipo I o nivel de significacin. Valores tpicos: =0,10 ; 0,05 ; 0,01 En general el tamao del intervalo disminuye con el tamao muestral y aumenta con 1-. En todo intervalo de confianza hay una noticia buena y otra mala: La buena: hemos usado una tcnica que en % alto de casos acierta. La mala: no sabemos si ha acertado en nuestro caso.
Probabilidad y Estadstica
Muestreo y Estimacin
16
Aplicacin
Descriptivos para Nmero de hijos Media Intervalo de confianza para la media al 95% Estadstico 1,90 Lmite inferior Lmite superior 1,81 1,99 Error tp. ,045
Al final del tema 2 dejamos sin interpretar parte de los resultados que obtenamos con SPSS. Sabras interpretar lo que falta por sombrear? Puedes dar un intervalo de confianza para la media al 68% de confianza? Observa la asimetra. Crees probable que la asimetra en la poblacin pueda ser cero ya que la obtenida en la muestra es aprox. 1?
Qu hemos visto?
Sesgo de seleccin
Poblacin objetivo Poblacin de estudio
Otros sesgos
Tcnica de respuesta aleatorizada
Tcnicas de muestreo
No probabilistas Probabilistas
m.a.s. Sistemtico Estratificado Conglomerados
Media recortada al 5% 1,75 Mediana Varianza Desv. tp. Mnimo Mximo Rango Amplitud intercuartil 2,00 3,114 1,765 0 8 8 3,00 Asimetra Curtosis
Probabilidad y Estadstica
Estimacin
Estimador
Estimacin puntual Error estndar
1,034 1,060
,063 ,126
Muestreo y Estimacin 17