Sei sulla pagina 1di 16

1 | P a g e

Inferencia estadstica para una sola muestra


La prueba de hiptesis es una parte importante de la inferencia estadstica.La inferencia estadstica
se refiere al proceso de estimacin de resultados para la poblacin basado en mediciones de una
muestra. En las siguientes secciones, la inferencia estadstica para una sola muestra se analiza
brevemente.

Inferencia sobre la media de una poblacin cuando la varianza es conocida
La prueba estadstica utilizada en este caso se basa en la distribucin normal estndar. Si es la
muestra calculada decir, entonces la estadstica de prueba estndar normal es:

donde es la media poblacional hipottica, es la desviacin estndar de la poblacin y es
el tamao de la muestra.
A veces es necesario saber si la estadstica de prueba fue slo en la regin crtica, o estaba muy
lejos en la regin. Esta informacin puede ser proporcionada mediante el valor.
La valor es la probabilidad de ocurrencia de los valores de la estadstica de prueba que son o
bien igual a la obtenida a partir de la muestra o ms desfavorable a que la obtenida a partir de
la muestra. Es el nivel ms bajo de importancia que llevara al rechazo de la hiptesis nula, ,
En el valor dado de la estadstica de prueba. El valor de la estadstica de prueba se conoce como
significativo cuando se rechaza. La valor es el ms pequeo en el que el dato es
significativo y se rechaza.

Por ejemplo, . Los valores que son ms desfavorables para en este caso son valores
mayores que 3. Entonces, la probabilidad requerida es la probabilidad de obtener un valor
estadstico de prueba sea igual o mayor que 3 (esto es abreviado como ). Esta
probabilidad se muestra como el rea oscura sombreada en la cola derecha de la distribucin y es
igual a 0,0013 o 0,13% (es decir ). Como se trata de una prueba a doble cara
de la valor es:
Por lo tanto, el ms pequeo (Correspondiente al valor de ensayo esttico de 3) que dara lugar
al rechazo de es 0,0026.
2 | P a g e

Inferencia en medio de una poblacin Cuando varianza es desconocida
Cuando la varianza, , De una poblacin (que se puede suponer que se distribuye
normalmente) es desconocida la varianza de la muestra, , Se utiliza en su lugar en el clculo
de la estadstica de prueba. La estadstica de prueba utilizado en este caso se basa en el
distribucin y se obtiene mediante la siguiente relacin:

La estadstica de prueba sigue el distribucin con grados de libertad.


Inferencia sobre la varianza de una poblacin normal
La prueba estadstica utilizada en este caso se basa en la distribucin de Chi-cuadrado. Si es
la muestra calculado varianza y La hiptesis de la varianza de la poblacin entonces la prueba
estadstica de chi-cuadrado es:
(11)
La estadstica de prueba sigue la distribucin chi-cuadrado con grados de libertad.












3 | P a g e

La inferencia Estadstica comprende los mtodos que son usados para obtener conclusiones de la
poblacin en base a una muestra tomada de ella. Incluye los mtodos de:
-Estimacin de parmetros
-Las pruebas de hiptesis




4 | P a g e

El estadstico a usar en el contraste de medias depende de:
La naturaleza de las muestras
Si se conocen las varianzas poblacionales
Si las varianzas poblacionales son iguales o diferentes
Muestras independientes
Varianzas poblacionales conocidas
La inferencia se basa en el estadstico:



Usualmente las varianzas son desconocidas
Varianzas poblacionales desconocidas
Cmo son las varianzas poblacionales?
Son iguales o diferentes?


Muestras independientes: Varianzas poblacionales desconocidas e iguales
La inferencia acerca de las medias se basa en el estadstico:
Prueba T para muestras independientes
cuando las varianzas son homogneas




( ) ( )
1 2 1 2
2 2
1 2
1 2
~ (0,1)
X X
Z N
n n

o o

=
| |
+
|
\ .
2 2
1 1 2
: H o o =
2 2
0 1 2
: H o o =
( ) ( )
1 2
1 2 1 2
2
2
1 2
~
1 1
n n
p
X X
T T
S
n n

+

=
| |
+
|
\ .
2 2
2 1 1 2 2
1 2
( 1) ( 1)
2
p
n S n S
S
n n
+
=
+
5 | P a g e

Intervalo de confianza bilateral para la diferencia de medias est dado por:


Muestras independientes: Varianzas poblacionales desconocidas diferentes
La inferencia acerca de las medias se basa en el estadstico:






Intervalo de confianza bilateral 1-o para la diferencia de medias :


Ejemplo:
Se desea determinar si al usar fertilizacin nitrogenada en maz, se modifica el promedio del peso
del grano. Se realiza un ensayo en el cual se aplica fertilizacin a 24 parcelas experimentales y
otras 24 parcelas no se fertilizan. Al finalizar el ensayo se registran los valores de la variable en
estudio en mg.
Las hiptesis propuestas son
H
0
:
1
=
2
vs H
1
:
1
=
2
Los resultados del ensayo son los siguientes:
Fertilizacin n x S
2

Con fertilizante 24 311.00 1953.25
Sin fertilizante 24 261.98 1722.82
( )
1 2
2
1 2 (1 / 2); 2
1 2
1 1
n n p
x x t s
n n
o +
| |
+
|
\ .
( ) ( )
1 2 1 2
2 2
1 2
1 2
~
v
X X
T t
S S
n n

=
| |
+
|
\ .
2
2 2
1 2
1 2
2 2
2 2
1 2
1 2
1 2
2
1 1
S S
n n
S S
n n
n n
v
| |
+
|
\ .
=
| | | |
| |
\ . \ .
+
+ +
( )
2 2
1 2
1 2 (1 / 2);
1 2
s s
x x t
n n
o v
| |
+
|
\ .
6 | P a g e

Las varianzas poblacionales son iguales o diferentes?
Hiptesis Estadstico



Contraste para la homogeneidad de varianzas

Bajo H
0
se distribuye como una F con 23 y 23 grados de libertad


2 2
1 1 2
: H o o =
2 2
0 1 2
: H o o =
1 2
2
1
( 1, 1) 2
2
~
n n
s
F F
s

=
1953.95
1.13
1722.82
F = =
7 | P a g e

Como F=1.13 est en el intervalo (0.43; 2.31) se acepta H
0
: o
1
2
= o
2
2

Se concluye que no hay diferencias entre las varianzas poblacionales.
Se cumple el supuesto de homogeneidad de varianzas



Reemplazando:






Como T=3.96 no pertenece al intervalo (-2.013; 2.013) se rechaza H
0
:
1
=
2

Se concluye que hay diferencias entre las medias.
El intervalo de confianza [24.11;73.94] construido con una confianza del 95% incluye al verdadero
valor de la diferencia entre las medias

( ) ( )
1 2
1 2 1 2
2
2
1 2
~
1 1
n n
p
X X
T T
S
n n

+

=
| |
+
|
\ .
2
(23) 1953.95 (23) 1722.82
1838.385
24 24 2
p
S
+
= =
+
( ) ( ) 311 261.98 0
3.96
1 1
1838.385
24 24
T

= =
| |
+
|
\ .
8 | P a g e

Prueba T de Student para datos no relacionados (muestras independientes)

Todas las pruebas paramtricas, en las cuales se incluye la t de Student y la F de Fischer, se basan
en supuestos tericos para utilizarse. Dichos supuestos matemticos las hacen vlidas, pues al
analizar las mediciones de las observaciones, se tienen procedimientos de gran potencia-eficiencia
para evitar error del tipo I.
En tales pruebas paramtricas se exige una serie de requisitos para aplicarlas como instrumento
estadstico:
- Las observaciones deben ser independientes.
- Las observaciones se deben efectuar en universos poblacionales distribuidos
normalmente.
- Las mediciones se deben elaborar en una escala de intervalo, entendiendo que una escala
de intervalo exige que puedan efectuarse todas las operaciones aritmticas admisibles.
Tambin se requiere que los intervalos entre las mediciones tengan la misma magnitud.
- Las varianzas de los grupos deben ser homogneas, de modo que cabe aclarar que en las
mediciones realizadas en biomedicina, es poco probable encontrar varianzas iguales. Por
ello, se utiliza la prueba ji cuadrada de Barlett para decidir si las diferencias observables en
la magnitud de las varianzas son significativas o no.

El modelo matemtico que en seguida se presenta, corresponde a dos muestras independientes.

Ecuacin para obtener la desviacin estndar ponderada:


9 | P a g e

Pasos:

Ejemplo:
Un investigador ha obtenido la talla de 20 nios de 5 aos de edad, de dos condiciones
socioeconmicas contrastantes (alta y baja). Considera que ambos grupos de poblacin tienen
estaturas diferentes.
Eleccin de la prueba estadstica.
Tenemos un modelo experimental con dos muestras independientes.
Planteamiento de la hiptesis.
- Hiptesis alterna (Ha). Las tallas de nios de 5 aos de las dos muestras, de condiciones
socioeconmicas contrastantes, son distintas.
- Hiptesis nula (Ho). Las diferencias observadas en las tallas de nios de las dos muestras
de condicin socioeconmica similar se deben al azar.
Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Talla en cm de nios de condiciones socioeconmicas baja y alta.





10 | P a g e

Aplicacin de la prueba estadstica.
Suma de cuadrados.

Desviacin estndar ponderada.

Ecuacin t.

gl = N1 + N2 -2 = 10 + 10 - 2 = 18
El valor de to se compara con los valores crticos de la tabla (tt) con 18 grados de libertad, y se
obtiene que en el valor ms cercano al calculado, la probabilidad es de 0.001 (valor crtico de t:
3.92).
Decisin.
Como el valor de to (3.99) tiene una probabilidad de significancia menor que 0.001, tambin es
menor que 0.05, propuesto como nivel de significancia, por lo cual se acepta Ha y se rechaza Ho.
Interpretacin.
Las diferencias en talla de ambos nios de condiciones socioeconmicas antagnicas (alta y baja)
difieren notoriamente en el nivel de confianza de p menor que 0.001.







11 | P a g e

Prueba T de Student para datos relacionados (muestras dependientes)

La prueba estadstica t de Student para muestras dependientes es una extensin de la utilizada
para muestras independientes. De esta manera, los requisitos que deben satisfacerse son los
mismos, excepto la independencia de las muestras; es decir, en esta prueba estadstica se exige
dependencia entre ambas, en las que hay dos momentos uno antes y otro despus. Con ello se da
a entender que en el primer perodo, las observaciones servirn de control o testigo, para conocer
los cambios que se susciten despus de aplicar una variable experimental.
Con la prueba t se comparan las medias y las desviaciones estndar de grupo de datos y se
determina si entre esos parmetros las diferencias son estadsticamente significativas o si slo son
diferencias aleatorias.
Consideraciones para su uso
- El nivel de medicin, en su uso debe ser de intervalo o posterior.
- El diseo debe ser relacionado.
- Se deben cumplir las premisas paramtricas.
En cuanto a la homogeneidad de varianzas, es un requisito que tambin debe satisfacerse y una
manera prctica es demostrarlo mediante la aplicacin de la prueba ji cuadrada de Bartlett. Este
procedimiento se define por medio de la siguiente frmula:

La media aritmtica de las diferencias se obtiene de la manera siguiente:

La desviacin estndar de las diferencias se logra como sigue:



12 | P a g e

Pasos:

Ejemplo:
Objetivo. Comparar los niveles de ansiedad de jvenes no asertivos antes y despus de participar
en un entrenamiento de habilidades sociales.
Especificaciones. 10 jvenes no asertivos que asisten a la Clnica Universitaria de Salud Integral
(CUSI) del campus Iztacala. Se evalu el nmero de comportamientos ansiosos que reportaban los
jvenes antes y despus del entrenamiento.
Eleccin y justificacin de la prueba estadstica T de Student para grupos relacionados.
- Las mediciones son cuantitativas con variables continuas y una escala de intervalo.
- Nmero de observaciones N=10.
- Una VD numrica: puntajes de 10 jvenes no asertivos que asisten a la CUSI.
- Una VI con 2 niveles: Antes y despus del entrenamiento.
- Dos muestras relacionadas: los mismos sujetos evaluados en dos momentos diferentes.

Planteamiento de la hiptesis.
- Hiptesis alterna (Ha). El nivel de ansiedad de jvenes no asertivos disminuye despus de
participar en un entrenamiento en habilidades sociales, existiendo diferencias
significativas entre antes y despus. Ha: X1 < X2.
- Hiptesis nula (Ho). Los cambios observados antes y despus del entrenamiento en
habilidades sociales se deben al azar, y no hay diferencias entre ambos perodos. Ho:
X1 X2.

Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza Ho. a = 0.05
13 | P a g e

Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Si la to tt se rechaza Ho.
Si la p(to) a se rechaza Ho.
Puntaje obtenido de 10 jvenes no asertivos que asisten a la CUSI.

Clculo de la prueba estadstica.

El valor calculado o obtenido de t (5.79) se compara con los valores crticos de la distribucin t
(tabla), y se observa que a una probabilidad de 0.05 le corresponde 2.262 de t. Por tanto, el
calculo tiene un probabilidad menor que 0.05.
Decisin.
Como to es de 5.79, con 9 grados de libertad, tiene un valor de probabilidad menor que 0.05,
14 | P a g e

entonces se acepta Ha y se rechaza Ho.
to > tt se rechaza Ho. Hay una reduccin en los niveles de ansiedad en 10 jvenes no asertivos que
asisten a la CUSI despus de un entrenamiento.
P(0.05) < a = 0.05 se rechaza Ho.
Interpretacin.
El nivel de ansiedad de jvenes no asertivos disminuye despus de participar en un entrenamiento
en habilidades sociales, existiendo diferencias significativas entre antes y despus.
PRUEBAS PARA LA IGUALDAD DE DOS VARIANZAS.

Presentaremos ahora pruebas para comparar dos varianzas. Supngase que son dos las
poblaciones de inters, por ejemplo X
1
y X
2
, donde
2
2 2
2
1 , 1
, , o o , se desconocen.
Deseamos probar hiptesis relativas a la igualdad de las dos varianzas,
2
2
2
1 0
: o o = H .
Considrese que se disponen dos muestras aleatorias de tamao n
1
de la poblacin 1 y
de tamao n
2
de la poblacin 2, y sean
2
2
2
1
yS S las varianzas de muestra. Para probar la
alternativa de dos lados


2
2
2
1 0
: o o = H

2
2
2
1 1
: o o = H

Utilizamos el hecho de que la estadstica

2
2
2
1
0
S
S
F =

Se distribuye como F, con n
1
-1 y n
2
1 grados de libertad.
Rechazaramos H
0
si

1 , 1 , 2 0
2 1

>
n n
F F
o

o si

1 , 1 , 2 1 0
2 1

<
n n
F F
o

15 | P a g e

Donde
1 , 1 , 2
2 1
n n
F
o
y
1 , 1 , 2 1
2 1
n n
F
o
son los puntos porcentuales 2 o superior e inferior de la
distribucin F con n
1
-1 y n
2
-2 grados de libertad. La tabla F proporciona slo los puntos de
la cola superior de F, por lo que para determinar
1 , 1 , 2 1
2 1
n n
F
o
debemos emplear

1 , 1 , 2 1
2 1
n n
F
o
=
1 , 1 , 2
2 1
1
n n
F
o

La misma estadstica de prueba puede utilizarse para probar hiptesis alternativas de un
lado. La hiptesis alternativa de un lado es:

2
2
2
1 0
: o o = H
2
2
2
1 1
: o o > H
Si
1 , 1 , 0
2 1

>
n n
F F
o
, rechazaramos
2
2
2
1 0
: o o = H .
Ejemplo : Los siguientes son tiempos de quemado (en minutos) de seales luminosas de
dos tipos diferentes.







Pruebe la hiptesis de que las dos varianzas sean iguales.
Use 05 . = o
2
2
2
1 0
: o o = H
2
2
2
1 1
: o o = H
44 . 100
71 . 88
70
6 . 70
2
2
2
1
2
1
=
=
=
=
S
S
X
X


Tipo 1 Tipo 2
63 64
81 72
57 83
66 59
82 65
82 56
68 63
59 74
75 82
73 82
16 | P a g e

2
2
2
1
0
S
S
F = = 877 .
44 . 100
71 . 88
=
1 , 1 , 2
2 1
n n
F
o
= F
.025,9,9=
4.03
1 , 1 , 2 1
2 1
n n
F
o
=.248
.877 no es mayor que 4.03, por lo cual no se rechaza la hiptesis nula
2
2
2
1 0
: o o = H .

Potrebbero piacerti anche