Sei sulla pagina 1di 19

Curso de Estadstica Aplicada a las Ciencias Sociales

Tema 10. Estimacin de una proporcin

Cap. 20 del manual

Tema 10. Estimacin de una proporcin


Introduccin
1. 2. 3. 4. 5. 6. Distribucin en el muestreo de una proporcin Estimadores centrados El error tpico de la estimacin Intervalos de confianza Estimaciones en poblaciones pequeas Determinacin del tamao muestral Resumen Ejercicios
2

Tema 10, Estimacin de una proporcin

Introduccin
Hasta ahora: estadstica descriptiva (para describir datos) Ahora: estadstica inferencial Para inferir datos sobre una poblacin de la cual no tenemos todos los datos, a partir de los datos de una muestra, que s tenemos

Tema 10, Estimacin de una proporcin

Introduccin (2)
En este tema: estimacin de una proporcin Cul es la proporcin de los elementos de una poblacin que tiene una caracterstica (votar a partido A, tener tal opinin, consumir tal producto, ir a la iglesia los domingos....)

Tema 10, Estimacin de una proporcin

Introduccin (3)
Procedimiento:
tomar una muestra aleatoria simple (lo vimos en el tema 8); Calcular la proporcin que tiene la caracterstica en la muestra (estimador) Calcular el valor del parmetro en la poblacin, para lo que tenemos que tener una idea sobre la precisin del estimador
Tema 10, Estimacin de una proporcin 5

Introduccin (4)
El mismo estimador puede tener niveles de precisin muy diferentes Ejemplo, estimador del 30% (0,30) calculado
Encuestando a 2.000 personas de una poblacin de varios millones (600 dicen votarn a partido A) Encuestando a 60 de 90 estudiantes (18 aficionados al teatro)
Tema 10, Estimacin de una proporcin 6

1. Distribucin en el muestreo de una proporcin


Cmo calcular cunto se puede alejar el estimador del parmetro? Imaginamos situacin ficticia
Poblacin muy grande (N) Una cierto nmero de personas, n1 tiene una caracterstica La proporcin de personas que tienen la caracterstica es p=n1/N (la frecuencia relativa). Supongamos p=0,4 La proporcin de personas que no tienen la caracterstica es q=1-p. Sera en este caso q=0,6

Tema 10, Estimacin de una proporcin

1. Distribucin en el muestreo de una proporcin


En una urna (la urna A) ponemos una bola por cada persona Si tiene la caracterstica: un 1. Si no la tiene: un 0 Nmero de personas con la caracterstica es igual al sumatorio de los valores de las bolas

= n1 1 + ( N n1 )0 = n1

Media es igual a la proporcin de personas que tienen la caracterstica

x x=
N

n1 =p N
8

Tema 10, Estimacin de una proporcin

1. Distribucin en el muestreo de una proporcin


Sacamos de la urna A una muestra de 10 bolas. Escribimos proporcin en una papeleta: otra urna distinta (urna B) Devolvemos bolas a urna A y seguimos sacando muestras de 10 bolas, apuntando proporciones en papeletas en urna B Al final, urna B, llena de papeletas con resultados de muestreo
Tema 10, Estimacin de una proporcin 9

1. Distribucin en el muestreo de una proporcin


Qu tendramos en urna B? Una variable aleatoria La mayor parte de los valores: en torno a p (0,4) Si las muestras han sido pequeas (10, 15, 25): habr algunas muestras con valores alejados de p Si muestras ms grandes (ms de 30 elementos): casi todas las muestras con poca variacin de p Lo que es crucial: Distribucin normal
Tema 10, Estimacin de una proporcin 10

1. Distribucin en el muestreo de una proporcin


1.000 muestras de 10 elementos
300
251

250
215 201

200 150
121 111

100 50 0 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9
40 42 11 2 0

1
11

Tema 10, Estimacin de una proporcin

1. Distribucin en el muestreo de una proporcin


1.000 muestras de 100 elementos 200 180 160 140 120 100 80 60 40 20
0 16 2 6
0,3 0,32 0,34 0,36 0,38 0,4 0,42 0,44 0,46 0,48 0,5

161 144

153 124

108 86 69 51 37 26 11 4 1 0 0
0,6

0
0,22 0,24 0,26 0,28 0,52 0,54 0,56 0,58

Tema 10, Estimacin de una proporcin

12

1. Distribucin en el muestreo de una proporcin


1.000 muestras de 1.000 elementos
300

250

243

238

200

166
150

155

100

76
50

68

23 0
0 0,32 0,33 0,34 0,35 0,36 0,37 0,38 0,39 0,4 0,41 0,42 0,43

20 4
0,44 0,45

1
0,46

0
0,47

0
0,48

0
0,49

Tema 10, Estimacin de una proporcin

13

2. Estimadores centrados
La variable proporcin muestral estimada (la variable cuyos valores estn en la urna B) es una variable aleatoria, como las vistas en el tema 9 Media de la urna B = media de la urna A Lgico: media urna B = media valores urna A contados muchas veces Media de la urna B = proporcin en la urna A (recordar cuando 0,1, media= proporcin)
Tema 10, Estimacin de una proporcin

14

3. El error tpico
En la vida real no tenemos la urna B, para calcular su media (y eso nos dara la media=proporcin de la poblacin) Tenemos slo un estimador (una papeleta de la urna B) Cunto puede alejarse el estimador de su media (y por tanto, del parmetro)? La respuesta: la desviacin tpica de los valores de la urna B Error tpico de la estimacin: la desviacin que en promedio podemos esperar entre un estimador y el parmetro en la poblacin (que es la media de los estimadores)
Tema 10, Estimacin de una proporcin 15

3. El error tpico
Intuitivamente: el error tpico de la estimacin ser menor cuanto mayor sea la muestra Frmula (aqu no demostramos). Si llamamos n al tamao de la muestra: s

ET =

Es decir, el error tpico es siempre menor que la desviacin tpica en la poblacin Y ser menor cuanto mayor sea la muestra Pero no disminuye proporcionalmente, sino proporcionalmente a la raz de n
Tema 10, Estimacin de una proporcin 16

3. El error tpico
En una variable con valores 0,1 se puede demostrar que s = p (1 p ) = pq
x

sx =
2

(ci xc ) 2 f i =
2

((1 p) p ) + ((0 p) (1 p)) = ((1 + p 2 p) p ) + ((0 + p 0 p)(1 p)) =


2 2 2 2

p + p3 2 p 2 + p 2 p3 = p (1 p ) =
Tema 10, Estimacin de una proporcin

p p2 =

pq
17

3. El error tpico
El error tpico ser entonces

ET =

pq n

Ejemplo: poblacin con proporcin de 0,4, y extraemos muestras de 10 elementos

0,4(1 0,4) 0,40,6 0,24 ET = = = = 0,024= 0,15 10 10 10


El ET ser 0,15

Tema 10, Estimacin de una proporcin

18

3. El error tpico
Pero entonces, si la frmula del ET incluye p y q, y si precisamente hemos hecho muestra para calcular p y q crculo vicioso? No: podemos ver en tabla que n es mucho ms importante que p y q para calcular ET

Tema 10, Estimacin de una proporcin

19

3. El error tpico
Valores del ET segn valores de n y p

n
0,01 0,05 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 10 0,031 0,069 0,095 0,126 0,145 0,155 0,158 0,155 0,145 0,126 50 0,014 0,031 0,042 0,057 0,065 0,069 0,071 0,069 0,065 0,057 100 0,010 0,022 0,030 0,040 0,046 0,049 0,050 0,049 0,046 0,040 500 0,004 0,010 0,013 0,018 0,020 0,022 0,022 0,022 0,020 0,018 1.000 0,003 0,007 0,009 0,013 0,014 0,015 0,016 0,015 0,014 0,013 3.000 0,002 0,004 0,005 0,007 0,008 0,009 0,009 0,009 0,008 0,007 5.000 0,001 0,003 0,004 0,006 0,006 0,007 0,007 0,007 0,006 0,006
20

Tema 10, Estimacin de una proporcin

3. El error tpico
Para un mismo valor de p error vara mucho segn tamao de n Para un mismo tamao de n error no vara mucho con cambios en p (ms alto error cuanto mayor es p, hasta mximo en 0,5) (Por cierto): ET es bastante bajo incluso para muestras de slo 1.000 elementos
Tema 10, Estimacin de una proporcin 21

3. El error tpico
En resumen: podemos hacer estimacin de ET con dos supuestos:
Suponiendo el caso ms desfavorable, que es p=q=0,5 Suponer, para calcular el ET, que p fuera igual a la estimacin

Tema 10, Estimacin de una proporcin

22

3. El error tpico
Ejemplo: muestra de 1.000 encuestados, 0,28 dicen que van a votar a partido A. Dos estimaciones de ET

0,280,72 0,2016 ET = = = 0,0002016 = 0,0142 1000 1000


ET =

0,50,5 0,25 = = 0,00025 = 0,0158 1000 1000


23

Tema 10, Estimacin de una proporcin

4. Intervalos de confianza
Dado un estimador, y un ET, podemos calcular en qu intervalo debe estar el parmetro en la poblacin, con un cierto nivel de confianza Ejemplo: muestra de 1.000 personas, estimador de 0,20

ET =

0,20,8 0,16 = = 0,00016 = 0,0126 1000 1000


24

Tema 10, Estimacin de una proporcin

4. Intervalos de confianza
La distribucin de las variables aleatorias derivadas de un experimento aleatorio con ms de 30 elementos es una distribucin normal Propiedad de las distribuciones normales (tema 9) :
68,3% de los casos a menos de 1dt de la media 95,5% de los casos a menos de 2dt de la media 99,7% de los casos a menos de 3 dt de la media

Tema 10, Estimacin de una proporcin

25

4. Intervalos de confianza
Por esa razn, cuando tenemos una muestra, en la que hemos calculado una proporcin y un ET (que es la desviacin tpica de las muestras) Podemos decir que la proporcin media de todas las muestras (y, por tanto, la de la poblacin) estar con un
68,3% de confianza (o de probabilidad) en el intervalo: estimador 1 ET 95,5% de confianza (o de probabilidad) en el intervalo: estimador 2ET 99,7% de confianza (o de probabilidad) en el intervalo: estimador 3ET

Tema 10, Estimacin de una proporcin

26

4. Intervalos de confianza
El intervalo de confianza es un rango de valores que incluye el valor del parmetro en la poblacin, con una determinada probabilidad En el ejemplo que ponamos (estimacin es 0,20 y ET es 0,0126) Podemos decir que el verdadero parmetro, con un 68,3% de confianza est en en el intervalo de 0,20 0,0126 (es decir, entre 0,1874 y 0,2126) 95,5% de confianza est en el intervalo de 0,20 0,0252 (es decir, entre 0,1748 y 0,2252) 99,7% de confianza est en el intervalo de 0,20 0,0378 (es decir, entre 0,1622 y 0,2378)

Tema 10, Estimacin de una proporcin

27

4. Intervalos de confianza
Dicho de otra forma, el ET nos permite calcular el error muestral (la diferencia entre el estimador y el parmetro) Podemos decir que el error muestral ser, con:
68,3% de confianza (o de probabilidad), menor o igual a 1ET 95,5% de confianza (o de probabilidad), menor o igual a 2ET 99,7% de confianza (o de probabilidad), menor o igual a 3ET

Tema 10, Estimacin de una proporcin

28

5. Estimacin en poblaciones pequeas


Cuando tamao poblacin es pequeo comparado con tamao de la muestra y muestreo sin reposicin (60 alumnos de clase de 90): la frmula del ET cambia La distribucin de los errores de estimacin sigue siendo aproximadamente normal El estimador sigue centrado (igual al parmetro)
Tema 10, Estimacin de una proporcin 29

5. Estimacin en poblaciones pequeas


Pero: la desviacin tpica de la distribucin de los estimadores muestrales es menor que el caso de poblacin infinita Frmula: siendo la fraccin de muestreo, f= n/N

ET =

pq x 1 f n
30

Tema 10, Estimacin de una proporcin

5. Estimacin en poblaciones pequeas


Ejemplo. Si en poblacin de 500 personas tomamos muestra de 100 (f = 100/500=0,2) y obtenemos estimador de 0,3

ET =

0,30,7 x 1 0, 2 = 0,0458 0,894 = 0,040 100

Correspondiente, los intervalos de confianza sern tambin ms pequeos


Tema 10, Estimacin de una proporcin 31

6. Determinacin del tamao muestral


Hemos visto que a partir de n se pueden estimar ET, y el intervalo de confianza Pero podemos operar tambin al revs: a partir del intervalo de confianza que queremos, podemos calcular el ET, y a partir de l podemos calcular qu tamao debe tener la muestra

Tema 10, Estimacin de una proporcin

32

6. Determinacin del tamao muestral


Ejemplo: queremos hacer encuesta con un intervalo no mayor de 0,04, con el 95,5% de confianza El intervalo con el 95,5% de confianza es el parmetro obtenido 2 ET Por tanto, si el intervalo que admitimos es 0,04, el ET ser 0,02
Tema 10, Estimacin de una proporcin 33

6. Determinacin del tamao muestral


Para calcular el tamao de la muestra, despejamos su valor en la frmula del error muestral o error tpico
ET = pq n pq ET 2 = n pq n= ET 2
34

Tema 10, Estimacin de una proporcin

6. Determinacin del tamao muestral


Cuando no sabemos los valores de p y q de antemano (normalmente)
n= (0,5)(0,5) 0,25 = 2 ET ET 2

Entonces, en el ejemplo puesto:


n= 0,25 0,25 = = 625 0,02 2 0,0004
35

Tema 10, Estimacin de una proporcin

6. Determinacin del tamao muestral


Otra manera de decir lo mismo Cuando buscamos un intervalo con una confianza del 95,5%: amplitud del intervalo=2ET Por tanto: ET=Amplitud intervalo/2 Retomando la frmula anterior:
n= 0,25 0,25 0,25 = = = ET 2 amplitud del intervalo 2 (amplitud del intervalo)2 4 2 40,25 1 = (amplitud del intervalo)2 (amplitud del intervalo)2
Tema 10, Estimacin de una proporcin 36

Resumen
Distribucin en el muestreo Media = proporcin Desviacin tpica = error tpico Frmula del ET Intervalos de confianza Estimacin en poblaciones pequeas Clculo de muestra a partir de objetivo de error y nivel de confianza
Tema 10, Estimacin de una proporcin 37

Ejercicios recomendados
Del manual: 20.4 20.5 b) y c) 20.6 De exmenes: Feb02, Jun02: 10 Feb03, Sep03: 12 Feb04: 11 Jul04: 10 Feb05, Jul05: 12 Ene07, Ene08, Jun08: 8

Tema 10, Estimacin de una proporcin

38