Sei sulla pagina 1di 10

Preguntas ms frecuentes (FAQs)

A continuacin se presentan las preguntas ms frecuentes de la asignatura. Dicho listado se ir ampliando a lo largo del curso.

Qu diferencias existe entre una distribucin poblacional, una distribucin en la muestra y una distribucin muestral? ............................................................................... 2 Qu es el error tpico? ..................................................................................................... 2 Qu es la cuasivarianza de la muestra o varianza insesgada?......................................... 3 Qu es la cuasi-desviacin tpica de la muestra o desviacin tpica insesgada? ............ 4 Por qu a la hora de calcular intervalos de confianza o de realizar contraste de hiptesis se suele utilizar la cuasi-desviacin tpica de la muestra o desviacin tpica insesgada en vez de la desviacin tpica? .............................................................................................. 4 Por qu hay ejercicios en los que para el clculo de intervalos de confianza o para la realizacin de contrastes de hiptesis se utiliza la desviacin tpica de la muestra (que es un estimador sesgado de la desviacin tpica poblacional) en vez de la cuasi-desviacin tpica o desviacin tpica insesgada (que es el estimador insesgado de la desviacin tpica poblacional)?........................................................................................................... 5 Cmo se calculan probabilidades utilizando las tablas. Ejemplo de uso de la distribucin normal tipificada ............................................................................................................... 6 Cules son los elementos necesarios para hacer un contraste de hiptesis y cmo se realiza un contraste de hiptesis? ..................................................................................... 9

Qu diferencias existe entre una distribucin poblacional, una distribucin en la muestra y una distribucin muestral? La distribucin poblacional se refiere a cmo se distribuye una determinada caracterstica (por ejemplo nivel de ansiedad) en una poblacin de tamao N (estudiantes de la UNED). La distribucin en la muestra hace referencia a cmo se distribuye dicha caracterstica (nivel de ansiedad) en una muestra, esto es, en un subconjunto de n elementos tomados de una Poblacin de tamao N (por ejemplo, 1500 estudiantes de la UNED). La distribucin muestral hace referencia a la distribucin muestral de un determinado estadstico (media, proporcin, varianza, correlacin, etc) y es la base de la estadstica inferencial. Para entender qu es la distribucin muestral de un estadstico tenemos que situarnos en un escenario hipottico en el que pudiramos extraer todas las muestras posibles de tamao n (por ejemplo, 1.500) de una poblacin (por ejemplo estudiantes de la UNED); obteniendo para cada muestra su estadstico correspondiente (por ejemplo media del nivel de ansiedad). Como resultado de todo este proceso, el valor del estadstico obtenido en cada una de las muestras se comportar como una variable aleatoria, de tal modo que los diferentes valores tomados por la variable aleatoria (estadstico) les corresponder una determinada probabilidad. Pues bien, a dicha funcin de probabilidad se le denominar distribucin muestral.

Qu es el error tpico? El error tpico corresponde a la desviacin tpica de la distribucin muestral de un estadstico. Su clculo es imprescindible para la construccin de los intervalos de confianza y de los estadsticos de contraste. A lo largo de la presente asignatura estudiaremos cmo se calcula el error tpico de diferentes estadsticos, como por ejemplo, el error tpico de la media: y o el error tpico de la proporcin: p

Qu es la cuasivarianza de la muestra o varianza insesgada? La cuasivarianza de la muestra es el estimador insesgado de la varianza poblacional, por lo que tambin se le denomina varianza insesgada (recordemos que la varianza de la muestra no es un estimador insesgado de la varianza poblacional, mientras que la cuasivarianza s lo es). A continuacin se muestra cmo obtener el clculo de ambas: Varianza de la muestra
2 Sn =

Cuasivarianza de la muestra o varianza insesgada


2 Sn 1 =

( y y)
n

( y y)
n 1

Obsrvese, sin embargo que entre varianza y cuasivarianza de la muestra existe la siguiente relacin: S
2 n

( y y) =
n

( y y)
2

2 = n Sn
2 2 (n 1) S n 1 = n S n

2 n 1

( y y) =
n 1

( y y)

2 = (n 1) S n 1

Por lo que la cuasivarianza de la muestra se puede calcular a partir de la varianza de la muestra de acuerdo a la siguiente expresin:
2 Sn 1 =

n 2 Sn n 1

Qu es la cuasi-desviacin tpica de la muestra o desviacin tpica insesgada?


La cuasi-desviacin tpica de la muestra es el estimador insesgado de la desviacin tpica poblacional, por lo que tambin se le denomina desviacin tpica insesgada (recordemos que la desviacin tpica de la muestra no es un estimador insesgado de la desviacin tpica poblacional, mientras que la cuasidesviacin tpica s lo es). A continuacin se muestra cmo obtener el clculo de ambas: Desviacin tpica de la muestra Cuasi-desviacin tpica de la muestra o Desviacin tpica insesgada

Sn =

( y y)
n

S n1 =

( y y)
n 1

Por qu a la hora de calcular intervalos de confianza o de realizar contraste de hiptesis se suele utilizar la cuasi-desviacin tpica de la muestra o desviacin tpica insesgada en vez de la desviacin tpica?
Esto es as porque la cuasi-desviacin tpica de la muestra es el estimador insesgado de la desviacin tpica poblacional, por lo que tambin se le denomina desviacin tpica insesgada (recordemos que la desviacin tpica de la muestra no es un estimador insesgado de la desviacin tpica poblacional, mientras que la cuasi-desviacin tpica s lo es). No obstante, tal y como se seala en la siguiente FAQ tambin se podr utilizar la desviacin tpica de la muestra si se realizan las correcciones oportunas.

Por qu hay ejercicios en los que para el clculo de intervalos de confianza o para la realizacin de contrastes de hiptesis se utiliza la desviacin tpica de la muestra (que es un estimador sesgado de la desviacin tpica poblacional) en vez de la cuasi-desviacin tpica o desviacin tpica insesgada (que es el estimador insesgado de la desviacin tpica poblacional)?
Aunque la desviacin tpica de la muestra es un estimador sesgado se podr utilizar para el clculo de intervalos y realizacin de intervalos siempre y cuando se realicen las correcciones oportunas en la frmula, pues, recurdese cmo la cuasivarianza de la muestra y la varianza se podan relacionar a travs de la siguiente equivalencia:
2 Sn 1 =

n 2 Sn n 1

Por ejemplo, para calcular el error tpico de la media: y cuando la varianza poblacional es desconocida, habr que estimarla a partir de su estimador: Puesto que el estimador insesgado de la varianza poblacional es la cuasivarianza de la muestra, se obtendr mediante la siguiente frmula:

y =
-

S n1 n

Sin embargo, y puesto que la desviacin tpica de la muestra puede equipararse a la cuasidesviacin tpica mediante las debidas correcciones, podremos obtener tambin el error tpico de la media haciendo para ello uso de su estimador sesgado (desviacin tpica de la muestra), teniendo en cuenta que ahora esta se divide por n 1 en vez de n

y =

Sn n 1

Cmo se calculan probabilidades utilizando las tablas. Ejemplo de uso de la distribucin normal tipificada
Aunque el alumno ya ha aprendido a utilizar las tablas para el clculo de probabilidades en la asignatura de Introduccin al Anlisis de Datos, a continuacin ofrecemos un breve repaso partiendo del texto del Tema 7 de dicha Asignatura- con el fin de garantizar un buen manejo de las mismas.

DISTRIBUCIN NORMAL TIPIFICADA (TABLAS III Y IV)


Las Tablas III y IV recogen la funcin de distribucin de la distribucin normal tipificada. Tal y como se explic en la asignatura de Introduccin al Anlisis de Datos: en ellas se presentan todas las puntuaciones tpicas desde -3,59 hasta +3,59 con intervalos de 0,01. La primera columna encabezada con la letra z consta de n nmero con un decimal que corresponde a la puntuacin tpica, mientras que la primera fila (a la derecha de la letra z) corresponde al segundo decimal de la puntuacin z. Todos los valores interiores representan probabilidades. La tabla III corresponde a las puntuaciones tpicas negativas (por debajo de la media; recurdese que la media de la distribucin es 0) y la tabla IV a las positivas (por encima de la media). Tal y como hemos dicho las tablas recogen la funcin de distribucin de la variable aleatoria Z, por lo que nos indican la probabilidad de obtener valores iguales o menores a un determinado valor z dado (o probabilidad acumulada), lo que se representa como: P (Z z). As, por ejemplo, la puntuacin tpica z=-0,31 deja por debajo de s una probabilidad de 0,3783. Por otra parte, y puesto que la distribucin es simtrica, puede comprobarse que la probabilidad que queda por debajo de z=-0,31 es igual a la probabilidad que queda por encima de z=0,31 (1-0,6217=0,3783)

Clculo de la probabilidad para valores menores o iguales que una determinada puntuacin tpica.
Por ejemplo: si una variable se distribuye normalmente, cul es la probabilidad de obtener valores menores o iguales que z=-0,31? Se trata de un valor negativo, por lo que se encontrar en la parte izquierda de la grfica (recurdese que la media es 0). En la Tabla III buscaremos la interseccin entre el valor -0,3 de la primera columna y el valor 0,01 de la primera fila, obteniendo de este modo una probabilidad de 0,3783. De este modo, la probabilidad de obtener valores iguales o inferiores a -0,31 es de 0,3783; o dicho de otro modo, el 37,83% de los valores son iguales o inferiores a -0,31. P (Z -0,31)= 0,3783

0,3783

-0,31

Clculo de la probabilidad para valores mayores que una determinada puntuacin


Por ejemplo: si una variable se distribuye normalmente, cul es la probabilidad de obtener valores mayores que z=0,65? Tal y como hemos visto ms atrs, las tablas nos proporcionan la probabilidad de obtener valores iguales o inferiores a un determinado valor z: P (Z z); mientras que en este caso nos estn pidiendo cul es la probabilidad de obtener valores mayores a un valor z: P (Z >z). En primer lugar calcularemos: P (Z 0,65), esto es, la probabilidad de obtener valores menores o iguales a z=0,65. Consultado la Tabla IV obtenemos que dicha probabilidad es de 0,7422. Y puesto que lo que nos interesa es obtener la probabilidad que queda por encima de dicho valor, lo que calcularemos ser: 1-0,7422=0,2578 (recurdese que 1 es la probabilidad total que corresponde al conjunto de la distribucin. De este modo: P (Z >0,65)=1-P (Z 0,65)=1-0,7422=0,2578. De este modo, la probabilidad de encontrar en la distribucin valores por encima de 0,65 es de 0,2578, o dicho de otro modo, el 25,78%de los valores de la distribucin son superiores a 0,65

0,2578

0,65

Clculo de la probabilidad entre dos puntuaciones determinadas


Si una variable se distribuye normalmente cul es la probabilidad de obtener valores comprendidos entre z=-0,31 y z=0,65? En este caso bastar con restar la probabilidad de la puntuacin menor a la probabilidad de la puntuacin mayor, esto es: P(-0,31Z0,65)= P (Z 0,65)- P (Z -0,31)= 0,7422-0,3783=0,3639 De este modo la probabilidad de obtener valores entre -0,31 y 0,65 es de 0,3639, o dicho de otro modo, el 36,39% de los valores de la distribucin se encontrarn dentro de dicho intervalo.

0,3639

-0,31

0,65

Cules son los elementos necesarios para hacer un contraste de hiptesis y cmo se realiza un contraste de hiptesis?
A continuacin se muestran los elementos que hay que conocer para la realizacin de un contraste de hiptesis

Nivel de confianza
En el contraste de Hiptesis el nivel de confianza (1-) representa la probabilidad para no rechazar la H0 siendo cierta. El nivel de confianza a establecer es una decisin que ha de tomar el investigador (y, consiguientemente, lo mismo ocurre con su complementario: , el nivel de significacin). El nivel de confianza va ligado a la Regin de no rechazo, que es aquella zona de la distribucin muestral constituida por el conjunto de muestras para las cuales se acepta H0.

Nivel de significacin
El nivel de significacin se representa con la letra griega (alpha) y est asociado al contraste de una hiptesis estadstica, siendo su valor complementario al nivel de confianza (1- ), Se define como la probabilidad () de tomar la decisin de rechazar la hiptesis nula cuando sta es verdadera (error de tipo I). El establecimiento de un nivel de significacin (y consecuentemente, tambin el nivel de confianza) es una decisin que debe tomar el investigador, no obstante, son valores comnmente utilizados: 0,05 y 0,01.

El nivel de significacin define la zona de rechazo, aquella zona de la distribucin muestral constituida por el conjunto de muestras para las cuales se rechaza la H0 al considerarse que la probabilidad de obtener tales muestras, siendo H0 cierta, es demasiado baja.

Estadstico de contraste o medida de discrepancia


El estadstico de contraste se obtiene tras tener en cuenta las condiciones y supuestos formulados en el enunciado (caractersticas de la poblacin, datos sobre la muestra, hiptesis que se desean contrastar...). Teniendo en cuenta dichos elementos se optar por el estadstico que ha de calcularse. En todos los casos dicho estadstico ofrece un valor estandarizado, que se obtiene tras la aplicacin de una frmula, es una medida de discrepancia entre los datos observados y los datos tericos planteados en la hiptesis nula. Dicha medida es una variable aleatoria que sigue una determinada distribucin de probabilidad (normal, t, chi cuadrado)

Nivel crtico p, p-valor o valor p


Es la probabilidad asociada al estadstico de contraste dentro de la distribucin muestral del estadstico. Su clculo se obtiene buscando en la tabla respectiva cul es la probabilidad de encontrar un valor igual o ms extremo que el obtenido.

Su comparacin con el nivel de significacin ( ) permite saber si se acepta o rechaza H0, en estadstica paramtrica los criterios sern:
-

Se aceptar la Hiptesis nula cuando el nivel crtico p sea superior a . Se rechazar la Hiptesis nula cuando el nivel crtico p sea inferior a . Se aceptar por tanto la Hiptesis alternativa, siendo el resultado, pues, 'estadsticamente significativo'.

Valor crtico
Es el valor o valores dentro de la distribucin muestral que se asocian directamente al nivel de significacin , este valor marca la mxima diferencia que podemos admitir, por simple azar, entre el valor terico planteado en H0 y el valor obtenido en la muestra. Estos valores marcan los lmites entre la zona de rechazo y de aceptacin. Su valor se obtiene consultado las respectivas tablas de probabilidad.

La comparacin del valor crtico con el estadstico de contraste tambin permite tomar una decisin a la hora de aceptar o no la Hiptesis nula, en estadstica paramtrica los criterios sern:
-

Si el estadstico de contraste es menor (en valor absoluto) al valor crtico (en valor absoluto) no se podr rechazar la Hiptesis nula En la medida que el estadstico de contraste sea mayor (en valor absoluto) al valor crtico (en valor absoluto) se rechazar la Hiptesis nula aceptndose la Hiptesis alternativa.

10

Potrebbero piacerti anche