Sei sulla pagina 1di 38

Tutora: Diseos y Anlisis de datos

TEMA 1: Estimacin de
parmetros y contraste de
hiptesis
Objetivos:
Saber cmo es la distribucin muestral de los estadsticos
media, varianza y proporcin.
Calcular intervalos de confianza de los parmetros
poblacionales media, varianza y proporcin.
Calcular el tamao de la muestra en funcin de la
precisin de la estimacin.
Comprender e interpretar la lgica de la metodologa del
contraste de hiptesis.
Reconocer e identificar los errores y riesgos de todo
contraste de hiptesis.
Pedro Rodrguez-Min

Tutora: Diseos y Anlisis de datos

Conceptos fundamentales

Inferencia estadstica
Error de estimacin
Distribucin en la muestra
Estadsticos

Distribucin poblacional
Parmetros

Distribucin muestral
Propiedades de un buen estimador
Estimacin puntual y estimacin por intervalos
Nivel de confianza y nivel de significacin
Procedimiento general del contraste de hiptesis
Pedro Rodrguez-Min

Tutora: Diseos y Anlisis de datos

Conceptos fundamentales

Inferencia estadstica: conocer las caractersticas


de la poblacin a partir del conocimiento de las
caractersticas de la muestra. Se hacen siempre en
trminos probabilsticos (no hay certeza, solo
probabilidad razonable de acertar), siempre y cuando
la muestra sea representativa de la poblacin
(m.a.s.)
Error de estimacin: la diferencia entre el
resultado obtenido en la muestra y el que se habra
obtenido si hubisemos hecho el estudio sobre toda
la poblacin.

Pedro Rodrguez-Min

Conceptos fundamentales
Tutora: Diseos y Anlisis de datos

Distribucin en la muestra: Es la distribucin de los datos


recogidos de una variable medida en una muestra . Puede ser una
distribucin uniforme, normal, asimtrica, etc.

ESTADSTICOS son los valores numricos que describen las


caractersticas de la muestra (su distribucin):

= estadstico media de la muestra de la variable Y

S x2

= estadstico varianza de la muestra en la variable X

rXY = es la correlacin entre las variables x e y de la muestra


Pedro Rodrguez-Min

Conceptos fundamentales
Tutora: Diseos y Anlisis de datos

Distribucin poblacional:
Distribucin de los datos individuales de una poblacin. Puede ser
una distribucin uniforme, normal, asimtrica, etc.

PARMETROS POBLACIONALES son los ndices numricos que


se calculan para describir a la distribucin poblacional (media,
varianza, mediana, correlacin, etc), reciben este nombre y se
representan con letras griegas:

= media de la poblacin (puede llevar subndice)


= varianza de la poblacin.

XY = Correlacin de Pearson

Pedro Rodrguez-Min

Tutora: Diseos y Anlisis de datos

Distribucin muestral

Distribucin muestral de la media:


Supongamos que una poblacin est formada nicamente
por cuatro elementos cuyas puntuaciones en una variable
Y son Y1=4; Y2=5; Y3=6; Y4= 7 cuya media y varianza
son:
1,2
1
0,8
0,6
0,4

0,2
0
4

2 =
Pedro Rodrguez-Min

Tutora: Diseos y Anlisis de datos

Distribucin muestral de la media

Extraemos, con reemplazamiento, todas las posibles


muestras de dos elementos (de tamao n=2). Con
cuntas muestras contaremos?. Sabemos por el clculo
combinatorio que en total sern las variaciones con
repeticin de los cuatro elementos de la poblacin,
tomados de dos en dos: VR4,2 =
muestras distintas.

muestra

muestra

muestra

muestra

Pedro Rodrguez-Min

Distribucin muestral de la media


Tutora: Diseos y Anlisis de datos

f ( y)

2
y f ( y) y f ( y)

4
4.5
5
5.5
6
6.5
7

E ( y ) = = y f ( y)
y

V ( y ) = 2 = E ( y 2 ) [E ( y )]2 =
y
16

88/16

494/16
Se comprueba que:
la media de la dM de la media, coincide
con la media poblacional.
La varianza poblacional y la varianza de
la dM:

2
2
=
=
x
n

Pedro Rodrguez-Min

Tutora: Diseos y Anlisis de datos

Distribucin muestral de la media

15
1 muestra

10

22

17,3

15,3
16

y=

18

y=

2 muestra

15

12

3 muestra

17

14

21

y=

.................

POBLACIN
Pedro Rodrguez-Min

Tutora: Diseos y Anlisis de datos

Distribucin muestral de la media

Si conocemos la desviacin tpica poblacional , y podemos


asumir que la variable en la poblacin se distribuye normalmente, o
bien, que, n>30 entonces consideramos que la dM del estadstico
media es tambin normal, cuya media y desviacin tpica (o error
tpico de la media) son, respectivamente:

=
y

Si se desconoce la varianza de la variable en la poblacin, la


dM de la media es la distribucin t de StudenT, siendo la media de
esta distribucin igual que la media de la poblacin y su desviacin
tpica igual a:

=
y

= n 1
y

Pedro Rodrguez-Min

Tutora: Diseos y Anlisis de datos

Distribucin muestral

Podemos obtener todas las muestras posibles de un


determinado tamao y procedentes de esa poblacin,
calcular para cada una de ellas un estadstico l; la
distribucin de probabilidad de estos valores constituye la
distribucin muestral del estadstico l.
Los parmetros de la misma se designarn por letras
latinas con su correspondiente subndice:

l , l2 = media y varianza de la distribucin muestral del


estadstico l

Pedro Rodrguez-Min

Tutora: Diseos y Anlisis de datos

Distribucin muestral

La desviacin tpica de la distribucin muestral de un estadstico


se la conoce como ERROR TPICO de ese estadstico.

Objetivo: El estadstico l nos sirve para estimar una


caracterstica poblacional L y, por ello, se dice que l es un
estimador de L, que se simbolizara como

l = L
Pedro Rodrguez-Min

Tutora: Diseos y Anlisis de datos

Inferencia o Estimacin

POR PUNTOS

De
De
De
De
De

la
la
la
la
la

POR INTERVALOS

Media poblacional
proporcin
varianza
correlacin
regresin, etc
Pedro Rodrguez-Min

Tutora: Diseos y Anlisis de datos

Estimador y Estimacin

En la estimacin puntual se utiliza el valor del estadstico obtenido


en la muestra como estimacin del parmetro poblacional.
El resultado numrico de cada uno de los valores estadsticos que
se obtienen en la muestra es lo que se conoce como estimacin.
Cuando tengamos un estadstico l tal que la media de su
distribucin muestral (l ) coincida con el parmetro poblacional (l =
) se dir que l es un:
ESTIMADOR INSESGADO

Objetivo: obtener estimadores insesgados


propiedades.

adems de otras

Pedro Rodrguez-Min

Tutora: Diseos y Anlisis de datos

Propiedades de los estimadores

Insesgados: Un estimador l de un parmetro poblacional L es


insesgado, si la media de su dM coicide con el parmetro
poblacional

Eficientes o precisos: Cuanto menor es la varianza de la dM del


estimador, mayor es la eficiencia

Suficientes: Cuanto mayor informacin utiliza en la muestra para


estimar el parmetro.

Consistentes: Si al aumentar el tamao de la muestra aumenta la


probabilidad de que la estimacin coincida con el parmetro.
Pedro Rodrguez-Min

Tutora: Diseos y Anlisis de datos

Estimacin por intervalos


En lugar de indicar simplemente un nico valor como estimacin
puntual del parmetro poblacional , lo que haremos es ofrecer un
intervalo de valores en el que se tiene cierta probabilidad (confianza)
de que se encuentre el verdadero valor de .

li < < Ls

Emax < < + Emax

Intervalo de confianza: Es el intervalo de las estimaciones


(probables) sobre el parmetro.

Lmites de los intervalos de confianza: Son los dos valores


extremos del intervalo de confianza.
Pedro Rodrguez-Min

Tutora: Diseos y Anlisis de datos

Amplitud y precisin del IC


La idea es crear unos intervalos de confianza de manera
que sepamos en qu porcentaje de casos el valor del
parmetro poblacional estar dentro del intervalo crtico.
Es decir, cuantificar la probabilidad de que el valor real
del parmetro se encuentre dentro del intervalo.

P( Emax < < + Emax ) = 1

Grado
o nivel de
confianza

Nivel de significacin (N. S.)


Pedro Rodrguez-Min

Tutora: Diseos y Anlisis de datos

Intervalo de confianza para la


media
Supongamos que la variable en la poblacin sigue una distribucin normal, o
aproximadamente normal, con cierta media . Utilizaremos como estimador
puntual para la media poblacional la media muestral:
(1) Si conocemos la varianza poblacional 2, la dM de la media es normal y:
La media de la distribucin muestral de medias coincide con la media poblacional
y su varianza es:

=
y

2 =
y

2
n

(2) Pero si se desconoce la varianza poblacional 2, entonces la distribucin


muestral de la media es la distribucin t de Student cuya media coincide
tambin con la media poblacional pero su varianza, es:

Veremos dos casos para calcular intervalos de confianza, bajo las condiciones en las que:

conocemos la varianza poblacional 2 y

no la conocemos.

Pedro Rodrguez-Min

Tutora: Diseos y Anlisis de datos

Poblacin normal con varianza


conocida

P z / 2 <
< z1 / 2 = 1
/ n

Pedro Rodrguez-Min

Tutora: Diseos y Anlisis de datos

Ejemplo:

n = 100

y = 20

=5

Entre qu valores se encontrar la media


poblacional con una seguridad del 95%?

Nivel de Confianza = 0.95

= 0.05

Buscamos en las tablas N(0,1) los valores de z que dejan 0.05 /


2 = 0.025 de probabilidad por abajo y 0.05 / 2 = 0.025 de
probabilidad por arriba:

(19.02; 20.98)
Pedro Rodrguez-Min

Tutora: Diseos y Anlisis de datos

Poblacin con varianza


desconocida
Sabemos que la distribucin muestral del estadstico
media muestral no es una distribucin normal, sino una
distribucin t de Student con n -1 grados de libertad.:

y
t=
/ n

Pedro Rodrguez-Min

n = 81

Tutora: Diseos y Anlisis de datos

Ejemplo

y = 20 Sn 1 = 5

Entre qu valores se encontrar la media


poblacional con una seguridad del 95%?

Nivel de Confianza = 0.95

= 0.05

Buscamos en las tablas ..los valores de t que


dejan 0.05 / 2 = 0.025 de probabilidad por abajo y 0.05 / 2 =
0.025 de probabilidad por arriba:

Pedro Rodrguez-Min

Tutora: Diseos y Anlisis de datos

Varianza poblacional
desconocida y n>100
Si n es grande (n > 100), la distribucin muestral de la
media se aproxima a la distribucin normal N(0;1). Pero
en todo caso el intervalo de confianza es:

P y t / 2
< < y + t1 / 2
= 1
n
n

y los valores de t, cuando n>100 hay que buscarlos en la


tabla de Z.

Pedro Rodrguez-Min

Tutora: Diseos y Anlisis de datos

Resumen
Si conocemos la varianza poblacional (situacin poco
habitual en la prctica), el intervalo de confianza es:

P( y Emax < < y + Emax ) = 1


Emax = z1 / 2

Pedro Rodrguez-Min

Tutora: Diseos y Anlisis de datos

Resumen
Pero si no conocemos la varianza poblacional (el caso
realista), tenemos como intervalo de confianza:

P( y Emax < < y + Emax ) = 1


Emax = t1 / 2

que se aproxima a la distribucin normal a medida que


aumenta el tamao, n, de la muestra.
Pedro Rodrguez-Min

Tutora: Diseos y Anlisis de datos

Precisin del IC
La precisin del Intervalo de confianza de la media
poblacional, depende del:

Nivel de confianza

Tamao de la muestra

Error tpico de la distribucin muestral


Pedro Rodrguez-Min

Nivel de confianza y precisin del


Intervalo
Tutora: Diseos y Anlisis de datos

Vamos a comparar dos situaciones variando el NC.


Caso 1. Media muestral = 10, varianza poblacional = 4, tamao muestral = 12.
Intervalo al 95%

Caso 2. Media muestral = 10, varianza poblacional = 4, tamao muestral = 12.


Intervalo al 99%

En tal caso, tendremos ms seguridad de que el parmetro de inters se halle


en los lmites del intervalo. El problema es que incrementar la confianza
aumenta la amplitud del intervalo.
Pedro Rodrguez-Min

Tutora: Diseos y Anlisis de datos

Tamao de la muestra y precisin


del IC
Observemos cmo a medida que el tamao muestral aumenta, la amplitud
del intervalo disminuye. Dejamos el mismo 1- = 0.95:
Caso 1: Media muestral =10, varianza poblacional = 4, tamao muestral =12.

Caso 2. Media muestral =10, varianza poblacional = 4, tamao muestral = 20.

Pedro Rodrguez-Min

Tutora: Diseos y Anlisis de datos

Error tpico

La amplitud de un intervalo de confianza depende de varios factores:


el nivel de confianza, el tamao de la muestra, n, y el error tpico de la
distribucin muestral del estadstico. Este ltimo factor est en
proporcin inversa al tamao de la muestra: cuanto mayor es el
tamao de la muestra, menor es el error tpico. Esta relacin es
fundamental, pues permite ajustar el intervalo de confianza el grado
de precisin que se desee

IC = y Emax = y Z

Emax

li = y z1 / 2

l = y + z
1 / 2
s

2
Z
=Z
n =2 2
Emax
n

Ver cuadro 1.1.

Pedro Rodrguez-Min

Tutora: Diseos y Anlisis de datos

Ejemplo

En una ciudad se quiere estimar, mediante un IC con un NC del 95%


el peso medio de sus habitantes mayores de 18 aos. Por estudios
anteriores se sabe que la desviacin tpica poblacional estimada vale
12kg. Cul debe ser el tamao de la muestra necesario para que el
error mximo de estimacin no supere los 4kg?.

Pedro Rodrguez-Min

Tutora: Diseos y Anlisis de datos

IC de la proporcin poblacional
Disponemos de una variable dicotmica o dicotomizada con
valores xito y fracaso. Llamando:
A: al nmero de elementos de la poblacin que presentan
el atributo considerado (total de xitos)
a: total de xitos en la muestra

: la proporcin de xitos en la poblacin

P: la proporcin de xitos en la muestra P = a/n


ai es una variable aleatoria que toma dos valores
ai = 1 si es xito
ai = 0 si es fracaso
La dM de la proporcin, P, es una distribucin
binomial con parmetros

E ( P) = P =

=
2
P

(1 )
n

Pedro Rodrguez-Min

Tutora: Diseos y Anlisis de datos

La Distribucin Muestral de la
proporcin
En una distribucin binomial.

Sabemos que la distribucin binomial se aproxima a la


normal a medida que aumenta el tamao de la
muestra, n. Esta aproximacin es bastante buena a
partir de n>25

E ( P) = P =

=
2
P

(1 )
n
Pedro Rodrguez-Min

Tutora: Diseos y Anlisis de datos

IC de la proporcin

li = p Emax

ls = p + Emax
Emax = Z1 / 2 p
p = Z1 / 2

p (1 p )
n

p (1 p)
li = p Z1 / 2
n

p (1 p)
ls = p + Z1 / 2
n
Pedro Rodrguez-Min

Tutora: Diseos y Anlisis de datos

Distribucin muestral de la
varianza
En una muestra distinguimos dos tipos de varianza:

La cuasi-varianza muestral:

Sn21 =

2
y

y
(
)
i

n 1

La varianza muestral

Sn2 =

2
y
y
(

)
i

2
n
S

n
Sn21 =
n 1

La VARIANZA es un estimador SESGADO mientras que la


CUASIVARIANZA es el estimador INSESGADO de la varianza
poblacional
Pedro Rodrguez-Min

Tutora: Diseos y Anlisis de datos

IC de la varianza
Varianza :
Sn2

Cuasi - varianza :

(y

2
y
)

Sn21 =

2
(
)

y
y
i

n 1

Se define una nueva variable aleatoria:

n2-1 =

( n 1) Sn21

n Sn2

Intervalo de confianza:

( n 1) sn21

n21;1 / 2

n sn2

n21;1 / 2

( n 1) sn21

n21; / 2

n sn2

n21; / 2
Pedro Rodrguez-Min

Tutora: Diseos y Anlisis de datos

Ejemplo n = 31 sn 1 = 4

1- = 0.95

Estimar el intervalo de confianza de la varianza poblacional

30 ; 0.975

30 ; 0.025

( n 1) s

2
n 1

2
n 1;1 / 2

ns

2
n

2
n 1;1 / 2

( n 1) s

2
n 1

n21; / 2
ns

2
n

n21; / 2

Pedro Rodrguez-Min

Tutora: Diseos y Anlisis de datos

IC de la varianza poblacional con


muestras grandes
Ejemplo: Un grupo de 150 alumnos de secundaria seleccionados al azar
en una determinada Comunidad realizan un test de comprensin verbal
de la lengua de su comunidad autnoma. Las puntuaciones obtenidas se
distribuyen normalmente con media 120 y varianza 36. Con una
probabilidad de 090, entre que valores se encontrar la varianza en
comprensin verbal de todos los alumnos de secundaria de esa
Comunidad?

Pedro Rodrguez-Min

Tutora: Diseos y Anlisis de datos

Tamao de la muestra
TEMA 1: Cuadro 1.1. Calculo del tamao de la muestra en funcin
de la precisin de la estimacin

Media

Varianza
poblacional
conocida
Varianza
poblacional
desconocida

Varianza
(n>100)
Proporcin

Pedro Rodrguez-Min

Potrebbero piacerti anche