Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
A continuacin se presentan las preguntas ms frecuentes de la asignatura. Dicho listado se ir ampliando a lo largo del curso.
Qu diferencias existe entre una distribucin poblacional, una distribucin en la muestra y una distribucin muestral? ............................................................................... 2 Qu es el error tpico? ..................................................................................................... 2 Qu es la cuasivarianza de la muestra o varianza insesgada?......................................... 3 Qu es la cuasi-desviacin tpica de la muestra o desviacin tpica insesgada? ............ 4 Por qu a la hora de calcular intervalos de confianza o de realizar contraste de hiptesis se suele utilizar la cuasi-desviacin tpica de la muestra o desviacin tpica insesgada en vez de la desviacin tpica? .............................................................................................. 4 Por qu hay ejercicios en los que para el clculo de intervalos de confianza o para la realizacin de contrastes de hiptesis se utiliza la desviacin tpica de la muestra (que es un estimador sesgado de la desviacin tpica poblacional) en vez de la cuasi-desviacin tpica o desviacin tpica insesgada (que es el estimador insesgado de la desviacin tpica poblacional)?........................................................................................................... 5 Cmo se calculan probabilidades utilizando las tablas. Ejemplo de uso de la distribucin normal tipificada ............................................................................................................... 6 Cules son los elementos necesarios para hacer un contraste de hiptesis y cmo se realiza un contraste de hiptesis? ..................................................................................... 9
Qu diferencias existe entre una distribucin poblacional, una distribucin en la muestra y una distribucin muestral? La distribucin poblacional se refiere a cmo se distribuye una determinada caracterstica (por ejemplo nivel de ansiedad) en una poblacin de tamao N (estudiantes de la UNED). La distribucin en la muestra hace referencia a cmo se distribuye dicha caracterstica (nivel de ansiedad) en una muestra, esto es, en un subconjunto de n elementos tomados de una Poblacin de tamao N (por ejemplo, 1500 estudiantes de la UNED). La distribucin muestral hace referencia a la distribucin muestral de un determinado estadstico (media, proporcin, varianza, correlacin, etc) y es la base de la estadstica inferencial. Para entender qu es la distribucin muestral de un estadstico tenemos que situarnos en un escenario hipottico en el que pudiramos extraer todas las muestras posibles de tamao n (por ejemplo, 1.500) de una poblacin (por ejemplo estudiantes de la UNED); obteniendo para cada muestra su estadstico correspondiente (por ejemplo media del nivel de ansiedad). Como resultado de todo este proceso, el valor del estadstico obtenido en cada una de las muestras se comportar como una variable aleatoria, de tal modo que los diferentes valores tomados por la variable aleatoria (estadstico) les corresponder una determinada probabilidad. Pues bien, a dicha funcin de probabilidad se le denominar distribucin muestral.
Qu es el error tpico? El error tpico corresponde a la desviacin tpica de la distribucin muestral de un estadstico. Su clculo es imprescindible para la construccin de los intervalos de confianza y de los estadsticos de contraste. A lo largo de la presente asignatura estudiaremos cmo se calcula el error tpico de diferentes estadsticos, como por ejemplo, el error tpico de la media: y o el error tpico de la proporcin: p
Qu es la cuasivarianza de la muestra o varianza insesgada? La cuasivarianza de la muestra es el estimador insesgado de la varianza poblacional, por lo que tambin se le denomina varianza insesgada (recordemos que la varianza de la muestra no es un estimador insesgado de la varianza poblacional, mientras que la cuasivarianza s lo es). A continuacin se muestra cmo obtener el clculo de ambas: Varianza de la muestra
2 Sn =
( y y)
n
( y y)
n 1
Obsrvese, sin embargo que entre varianza y cuasivarianza de la muestra existe la siguiente relacin: S
2 n
( y y) =
n
( y y)
2
2 = n Sn
2 2 (n 1) S n 1 = n S n
2 n 1
( y y) =
n 1
( y y)
2 = (n 1) S n 1
Por lo que la cuasivarianza de la muestra se puede calcular a partir de la varianza de la muestra de acuerdo a la siguiente expresin:
2 Sn 1 =
n 2 Sn n 1
Sn =
( y y)
n
S n1 =
( y y)
n 1
Por qu a la hora de calcular intervalos de confianza o de realizar contraste de hiptesis se suele utilizar la cuasi-desviacin tpica de la muestra o desviacin tpica insesgada en vez de la desviacin tpica?
Esto es as porque la cuasi-desviacin tpica de la muestra es el estimador insesgado de la desviacin tpica poblacional, por lo que tambin se le denomina desviacin tpica insesgada (recordemos que la desviacin tpica de la muestra no es un estimador insesgado de la desviacin tpica poblacional, mientras que la cuasi-desviacin tpica s lo es). No obstante, tal y como se seala en la siguiente FAQ tambin se podr utilizar la desviacin tpica de la muestra si se realizan las correcciones oportunas.
Por qu hay ejercicios en los que para el clculo de intervalos de confianza o para la realizacin de contrastes de hiptesis se utiliza la desviacin tpica de la muestra (que es un estimador sesgado de la desviacin tpica poblacional) en vez de la cuasi-desviacin tpica o desviacin tpica insesgada (que es el estimador insesgado de la desviacin tpica poblacional)?
Aunque la desviacin tpica de la muestra es un estimador sesgado se podr utilizar para el clculo de intervalos y realizacin de intervalos siempre y cuando se realicen las correcciones oportunas en la frmula, pues, recurdese cmo la cuasivarianza de la muestra y la varianza se podan relacionar a travs de la siguiente equivalencia:
2 Sn 1 =
n 2 Sn n 1
Por ejemplo, para calcular el error tpico de la media: y cuando la varianza poblacional es desconocida, habr que estimarla a partir de su estimador: Puesto que el estimador insesgado de la varianza poblacional es la cuasivarianza de la muestra, se obtendr mediante la siguiente frmula:
y =
-
S n1 n
Sin embargo, y puesto que la desviacin tpica de la muestra puede equipararse a la cuasidesviacin tpica mediante las debidas correcciones, podremos obtener tambin el error tpico de la media haciendo para ello uso de su estimador sesgado (desviacin tpica de la muestra), teniendo en cuenta que ahora esta se divide por n 1 en vez de n
y =
Sn n 1
Cmo se calculan probabilidades utilizando las tablas. Ejemplo de uso de la distribucin normal tipificada
Aunque el alumno ya ha aprendido a utilizar las tablas para el clculo de probabilidades en la asignatura de Introduccin al Anlisis de Datos, a continuacin ofrecemos un breve repaso partiendo del texto del Tema 7 de dicha Asignatura- con el fin de garantizar un buen manejo de las mismas.
Clculo de la probabilidad para valores menores o iguales que una determinada puntuacin tpica.
Por ejemplo: si una variable se distribuye normalmente, cul es la probabilidad de obtener valores menores o iguales que z=-0,31? Se trata de un valor negativo, por lo que se encontrar en la parte izquierda de la grfica (recurdese que la media es 0). En la Tabla III buscaremos la interseccin entre el valor -0,3 de la primera columna y el valor 0,01 de la primera fila, obteniendo de este modo una probabilidad de 0,3783. De este modo, la probabilidad de obtener valores iguales o inferiores a -0,31 es de 0,3783; o dicho de otro modo, el 37,83% de los valores son iguales o inferiores a -0,31. P (Z -0,31)= 0,3783
0,3783
-0,31
0,2578
0,65
0,3639
-0,31
0,65
Cules son los elementos necesarios para hacer un contraste de hiptesis y cmo se realiza un contraste de hiptesis?
A continuacin se muestran los elementos que hay que conocer para la realizacin de un contraste de hiptesis
Nivel de confianza
En el contraste de Hiptesis el nivel de confianza (1-) representa la probabilidad para no rechazar la H0 siendo cierta. El nivel de confianza a establecer es una decisin que ha de tomar el investigador (y, consiguientemente, lo mismo ocurre con su complementario: , el nivel de significacin). El nivel de confianza va ligado a la Regin de no rechazo, que es aquella zona de la distribucin muestral constituida por el conjunto de muestras para las cuales se acepta H0.
Nivel de significacin
El nivel de significacin se representa con la letra griega (alpha) y est asociado al contraste de una hiptesis estadstica, siendo su valor complementario al nivel de confianza (1- ), Se define como la probabilidad () de tomar la decisin de rechazar la hiptesis nula cuando sta es verdadera (error de tipo I). El establecimiento de un nivel de significacin (y consecuentemente, tambin el nivel de confianza) es una decisin que debe tomar el investigador, no obstante, son valores comnmente utilizados: 0,05 y 0,01.
El nivel de significacin define la zona de rechazo, aquella zona de la distribucin muestral constituida por el conjunto de muestras para las cuales se rechaza la H0 al considerarse que la probabilidad de obtener tales muestras, siendo H0 cierta, es demasiado baja.
Su comparacin con el nivel de significacin ( ) permite saber si se acepta o rechaza H0, en estadstica paramtrica los criterios sern:
-
Se aceptar la Hiptesis nula cuando el nivel crtico p sea superior a . Se rechazar la Hiptesis nula cuando el nivel crtico p sea inferior a . Se aceptar por tanto la Hiptesis alternativa, siendo el resultado, pues, 'estadsticamente significativo'.
Valor crtico
Es el valor o valores dentro de la distribucin muestral que se asocian directamente al nivel de significacin , este valor marca la mxima diferencia que podemos admitir, por simple azar, entre el valor terico planteado en H0 y el valor obtenido en la muestra. Estos valores marcan los lmites entre la zona de rechazo y de aceptacin. Su valor se obtiene consultado las respectivas tablas de probabilidad.
La comparacin del valor crtico con el estadstico de contraste tambin permite tomar una decisin a la hora de aceptar o no la Hiptesis nula, en estadstica paramtrica los criterios sern:
-
Si el estadstico de contraste es menor (en valor absoluto) al valor crtico (en valor absoluto) no se podr rechazar la Hiptesis nula En la medida que el estadstico de contraste sea mayor (en valor absoluto) al valor crtico (en valor absoluto) se rechazar la Hiptesis nula aceptndose la Hiptesis alternativa.
10