Sei sulla pagina 1di 18

INFERENCIA ESTADÍSTICA

Lic. Hugo L. Saavedra Saavedra.

1. INTRODUCCIÓN

La Inferencia Estadística comprende un conjunto amplio de técnicas y


procedimientos que permiten obtener información acerca de una o más
poblaciones con base a una o más muestras aleatorias obtenidas de la población
o poblaciones objeto de estudio.

INFERENCIA
ESTADÍSTICA

PRUEBAS DE ESTIMACIÓN DE
HIPÓTESIS PARÁMETROS

MÉTODOS MÉTODOS NO ESTIMACIÓN ESTIMACIÓN DE


PARAMÉTRICOS PARAMÉTRICOS PUNTUAL INTERVALOS

Mediante la Inferencia Estadística, se resuelven dos clases de problemas:


 Problemas de Pruebas de hipótesis
 Problemas de Estimación de parámetros

2. CONCEPTOS BÁSICOS DE PRUEBAS DE HIPÓTESIS


Técnicas estadísticas que nos permiten probar o contrastar hipótesis dentro del
proceso de una investigación científica o tecnológica.
 Hipótesis estadística: cualquier afirmación respecto a la
distribución de una o más poblaciones, más específicamente,
afirmaciones o proposiciones respecto a los valores de los
parámetros de una o más poblaciones.
 Tipos de hipótesis estadística.
 Hipótesis Nula, se simboliza por H0.
Contiene el signo de relación =, < o >
Esta hipótesis se formula para su posible rechazo.
 Hipótesis Alternativa, simbolizada por H1.
Contiene el signo de relación ≠, > o <.
La hipótesis alternativa es aquella en la que se operativiza la
hipótesis de investigación.
En una prueba de hipótesis se formulan las dos hipótesis, la nula y la
alternativa.
La hipótesis que se somete a prueba es la hipótesis nula Ho.
 Tipos de prueba
Los tipos de prueba se distinguen de acuerdo al signo de relación
que se encuentra en la hipótesis alternativa. Véase el esquema
siguiente:

Tipos de
prueba

Prueba bilateral
Prueba unilateral
≠ (non equal)

Prueba de cola Prueba de cola derecha


izquierda < (Less than) > (greater than)
 Ejemplos de hipótesis estadísticas:
Hipótesis nula H0 : µ = 300
Hipótesis alternativa H1 : µ ≠ 300, prueba de dos colas

Hipótesis nula H0 : p ≤ 0.25


Hipótesis alternativa H1 : p> 0.25, prueba de cola derecha

Hipótesis nula H0 : µ1 ≥ µ2
Hipótesis alternativa H1 : µ1 < µ2 prueba de cola izquierda

Hipótesis nula H0 : p1 ≤ p2
Hipótesis alternativa H1 : p1 > p2

Hipótesis nula H0 : σ1 = σ2
Hipótesis alternativa H1 : σ1 ≠ σ2

 La Prueba de hipótesis es un procedimiento por el cual se llega a


tomar la decisión de rechazar o no rechazar la hipótesis nula.

 Tipos de error
Al probar una hipótesis nula con datos muestrales y usando las
técnicas apropiadas, se puede estar frente a una de cuatro
situaciones que se muestran en la siguiente tabla.
Decisión que toma Ho es
Ho es falsa
el investigador verdadera
Rechazar la Ho Decisión
Error Tipo I
correcta
No rechazar la Ho Decisión
Error Tipo II
correcta

 Error de Tipo I. Es el error que se comete al tomar la decisión de


rechazar, (darla por falsa), una hipótesis nula que en realidad es
verdadera.
 Error de Tipo II. Es el error que se comete al tomar decisión de
aceptar, (dar por verdadera), una hipótesis nula que en realidad es
falsa.

No se puede evitar el riesgo de cometer estos dos tipos de error, sin


embargo se los puede controlar en términos de probabilidades.
Esto es, podemos asignar probabilidades a para cada uno de los dos
tipos de error, sin embargo, el procedimiento de prueba de
hipótesis asigna una determinada probabilidad al error de tipo I,
que se considera el error más importante o grave que se puede
cometer al probar una hipótesis nula.
 Nivel de significancia. Es la probabilidad de rechazar una hipótesis
que en realidad es verdadera, se simboliza con α. Los valores más
usados son α, esto es,
α = P(Error Tipo I) = P(Rechazar Ho / Ho es cierta)
 Probabilidad de no rechazar (aceptar) una hipótesis nula que en
realidad es falsa
P(Error Tipo II) = P(Aceptar Ho / Ho es falsa) = Β
 Potencia de una prueba. Es la probabilidad de rechazar una
Hipótesis nula, que en realidad es falsa.

Potencia de una prueba = 1-Β = 1 - P(Aceptar Ho / Ho es falsa)

3. PASOS DE UNA PRUEBA DE HIPÓTESISCONCEPTOS BÁSICOS DE PRUEBAS


DE HIPÓTESIS
El número de pasos que se siguen en una prueba de hipótesis no es algo
estándar, difiere de un autor a otro, pues unos consideran pocos pasos y otros,
mayor número de pasos, en realidad esto es irrelevante.

Nosotros usaremos los siguientes pasos


Paso 0. Análisis del problema para identificar:
 La variable de análisis
 Población(es)
 Objetivo del estudio
 Parámetros implicados
 Datos. etc.
Paso 1. Formular las hipótesis nula y alternativa.
Ho:
H1:
Paso 2. Decidir sobre el valor del nivel de significancia (valor para α)
Los valores usuales son:
α = 0.10 o 10% de significancia
α = 0.05 o 5% de significancia, este es el nivel más usado
α = 0.01 o 1% de significancia
Paso 3. Seleccionar el estadístico de prueba adecuado para el caso. Selección
de una fórmula según sea el caso. Más adelante se proporcionarán dichos
estadísticos
Paso 4. Obtener muestra(s) y calcular el valor experimental del estadístico de
prueba, consiste en realizar ciertos cálculos
Paso 5. Calcular el p-valor asociado al valor del estadístico. Implica el cálculo
usando Excel o tablas especiales de probabilidades
Paso 6. Tomar la decisión de rechazar o no rechazar la Ho usando la regla
siguiente:

Si p-valor < α rechazar la Ho


Si p-valor > α no rechazar la Ho
Paso 7. Formular la conclusión teniendo en cuenta el objetivo.
Los cálculos involucrados en los pasos 4 y 5 los realizaremos con MegaStat.

4. CONCEPTOS BÁSICOS DE ESTIMACIÓN DE PARÁMETROS

Los parámetros son ciertos valores numéricos que corresponden a las


poblaciones, tales como la media de la población, la varianza de una
población, la proporción de una población.

Las técnicas de estimación permiten conocer, en forma aproximada, los


valores de parámetros, usando para ello datos de muestras aleatorias.

Un parámetro puede estimarse de dos maneras:

 En forma puntual. La estimación consta de un solo valor (un punto),


calculado como el valor numérico de un estadístico.

 Estimación de intervalos. Consiste en calcular con los datos muestrales los


límites de un intervalo (Límite inferior, Límite superior), de tal manera que
se tenga un determinado nivel de confianza de que el valor verdadero del
parámetro se encuentre dentro del intervalo.
5. DISTRIBUCIONES MUESTRALES

5.1. DISTRIBUCIÓN DE LA MEDIA MUESTRAL

Dada una población o variable X cuya media es µ y varianza es σ2, sea


ésta finita o infinita, existe un conjunto grande de muestras posibles de
tamaño n. Si para todas las muestras posibles se calculara la media
aritmética, se tiene que la media muestral toma diferentes valores con
diferentes muestras posibles. Con todos los valores posibles de la
media muestral se construye una distribución de frecuencias, que
viene a ser la distribución de la media muestral o la distribución de la
media en el muestreo.
Se demuestra que:
 El valor esperado de la media muestral es igual a la media de la
población, esto es,

𝐸 (𝑋̅) = 𝜇𝑋̅ = 𝜇
 La varianza de la media muestral es igual a la varianza
de la población dividida entre el tamaño de la muestra,
esto es:
𝜎2
𝑉𝑎𝑟(𝑋̅ ) = 𝜎𝑋2̅ =
𝑛

 Error estándar de la media muestral


Se denomina error estándar de la media muestral a su desviación
estándar de la media muestral, está dada por:

̅) = 𝜎̅ = 𝜎
𝐸𝐸(𝑋 𝑋
√𝑛
Obsérvese que cuando el tamaño de la muestra toma valores grandes, el error
estándar disminuye.
5.2. DISTRIBUCIÓN DE LA PROPORCIÓN MUESTRAL

Con un razonamiento análogo a lo expuesto para la distribución de la media


muestral, podemos hallar la distribución de la proporción muestral.
Dada una población donde p es la proporción de elementos que poseen una
característica de interés, se obtienen muestras aleatorias de tamaño n, el
valor de la proporción muestral también varía de una muestra a otra. Con
todas las proporciones se construye la distribución de la proporción muestral.
Se demuestra que:
 El valor esperado de la proporción muestral es igual a la
proporción poblacional, esto es,

𝐸 (𝑝̂ ) = 𝜇𝑝̂ = 𝑝
 La varianza de la proporción media muestral es igual a
la varianza de la proporción muestral es:
𝑝 ∗ (1 − 𝑝)
𝑉𝑎𝑟(𝑝̂ ) = 𝜎𝑝2̂ =
𝑛

 Error estándar de la proporción muestral


Se denomina error estándar de la media muestral a su desviación
estándar de la media muestral, está dada por:

𝑝 ∗ (1 − 𝑝)
𝐸𝐸(𝑝
̂ ) = 𝜎𝑝̂ =
√𝑛
Obsérvese que también en este caso, cuando el tamaño de la muestra toma
valores grandes, el error estándar disminuye.
5.3. INFERENCIAS RESPECTO LA MEDIA µ DE UNA POBLACIÓN

Sea una variable cuantitativa X (variable aleatoria) cuya media es µ,


desconocida, y varianza es σ2. Se tiene interés en probar hipótesis
respecto a la media µ y estimar este valor mediante intervalos de
confianza.

 Pruebas de hipótesis.
Se tiene interés en probar una de las siguientes hipótesis:

Ho: µ = µ0 Ho: µ ≥ µ0 Ho: µ ≤ µ0


Ho: µ ≠ µ0 Ho: µ < µ0 Ho: µ > µ0

Para probar estás hipótesis se hace uso de ciertas fórmulas


denominadas estadísticos de prueba, dependiendo del tamaño
de la muestra.
Caso 1. Con una muestra grande (n ≥ 30)
El estadístico de prueba es:
̅ − μ0
𝑋
𝑍=
𝑆/√𝑛
Si la hipótesis nula, es cierta, el estadístico Z tiene
distribución normal estándar.

Caso 2. Con una muestra pequeña (n < 30)


En este caso es necesario que la población (variable X) de donde
se ha tomado la muestra tenga una distribución normal con
media µ, desconocida, y varianza es σ2.
El estadístico de prueba es:

̅ − μ0
𝑋
𝑡=
𝑆/√𝑛
Si la hipótesis nula es cierta, el estadístico tiene
distribución t de Student con grados de libertad n-1 = df.
Caso 3. Cuando la varianza de la población es conocida

Este caso corresponde a la situación en la que se conoce la


varianza o desviación estándar de la población, σ2, situación que
rara vez puede presentarse en la realidad. El estadístico de
prueba es:
̅ − μ0
𝑋
𝑍=
𝜎/√𝑛

Ejemplos. Ejercicios del Capítulo 7 de Bioestadística de Daniel

 Intervalo de confianza para la media µ de una población


Un intervalo de confianza del (1-α)*100 para la media µ de una población se
calcula considerando los mismos casos de las pruebas de hipótesis.
Caso 1. Con una muestra grande (n ≥ 30)
La fórmula para calcular un intervalo de confianza está dada por:
𝑆 𝑆
𝑋̅ − 𝑍 ∗ ≤ μ ≤ 𝑋̅ + 𝑍 ∗
√𝑛 √𝑛
El valor de Z depende del nivel de confianza con que se calcula el intervalo. Los
valores más usados son 90%, 95% y 99%, los valores de Z son 1.645, 1.96 y 2.58,
respectivamente, recuerde los valores de Z considerados en el cálculo del
tamaño de muestra, son los mismos.
Caso 1. Con una muestra pequeña (n < 30)
La fórmula para calcular un intervalo de confianza está dada por:
𝑆 𝑆
𝑋̅ − 𝑡 ∗ ≤ μ ≤ 𝑋̅ + 𝑡 ∗
√𝑛 √𝑛
El valor de t también depende del nivel de confianza y además del
parámetro de la distribución t, que son los grados de libertad 0 n-1, el
valor de t que entra en la fórmula se obtiene de la tabla de la
distribución t de Student o usando una función de Excel.
5.4. INFERENCIAS RESPECTO LA DIFERENCIA DE LAS MEDIAS DE DOS
POBLACIONES CON MUESTRAS INDEPENDIENTES

Con frecuencia el objetivo de una investigación implica realizar la


comparación de las medias de dos poblaciones.

POBLACIÓN 1 POBLACIÓN 2
µ1 µ2
σ12 σ22

Se tiene interés en realizar inferencias respecto a las medias de estas


poblaciones, concretamente, se desea:
 Probar hipótesis respecto a µ1 - µ2
 Estimar µ1 - µ2
Para estos propósitos se obtienen muestras aleatorias independientes
de tamaños n1 y n2, respectivamente, de la población 1 y población 2.
PRUEBA DE HIPÓTESIS.
Las hipótesis posibles son:

Estadísticos de prueba
Para probar cualquiera de las hipótesis anteriores se usan estadísticos,
según sea el caso.
Caso 1. Con muestras pequeñas (n1 o n2 < 30) y las varianzas de las
poblaciones no son conocidas, pero son iguales:
 Se asume que las poblaciones tienen distribución normal
 Estadístico de prueba:

Si la Ho es cierta, el estadístico t tiene distribución t de Student con


grados de libertad = df = n1 + n2 – 2.
 Intervalo de confianza:

Caso 2. Con muestras pequeñas (n1 + n2 < 30) y las varianzas de las
poblaciones no son conocidas y no son iguales:

Si la Ho es cierta, el estadístico t’ tiene distribución t de Student con


grados de libertad = df = v, donde
 Intervalo de confianza:

Caso 3. Con muestras grandes (n1 y n2 ≥ 30) y las varianzas de las


poblaciones no son conocidas, pero son iguales:
 Las poblaciones pueden tener distribución normal o una
distribución deferente de la normal
 No se requiere igualdad de varianzas
 Estadístico de prueba (Z)

Por lo general las varianzas poblacionales que intervienen no son


conocidas, por lo que se usan las varianzas de las muestras, esto es,
(𝑋̅1 − 𝑋̅2 ) − (𝜇1 − 𝜇2 )
𝑍=
𝑆12 𝑆22
√ +
𝑛1 𝑛2

 Intervalo de confianza:
5.5. INFERENCIAS RESPECTO LA DIFERENCIA DE MEDIAS CON MUESTRAS
RELACIONADAS (DATOS PAREADOS)
El caso de datos pareados (emparejados) surgen cuando se usan
diseños con un solo grupo con mediciones Antes y Después (pre y
postest). Los datos provienen de hacer mediciones en dos
ocasiones, en los mismos sujetos.
 X valores de la variable “antes”
 Y valores de la variable “después”
 Se crea una variable D = X – Y
 µ1 - µ2 = µD
 Hipótesis posibles:
Ho: µD = δo Ho: µD ≥ δo Ho: µD ≤ δo
H1: µD ≠ δo H1: µD < δo H1: µD > δo
 Estadístico de prueba
𝑑̅ − δo
𝑡=
𝑆𝑑

√𝑛
Si la Ho es cierta este estadístico tiene distribución t
de Student con grados de libertad: df = n-1.
 Intervalo de confianza
5.6. PRUEBAS DE HIPÓTESIS RESPECTO A LA PROPORCIÓN P DE UNA
POBLACIÓN.
Sea p la proporción de elementos de una población que poseen
una característica de interés.
 Hipótesis posibles
Ho: p = po Ho: p ≥ po Ho: p ≤ po
H1: p ≠ po H1: p < po H1: p > po

 Estadístico de prueba

Si la Hipótesis nula es cierta el estadístico tiene una


distribución que se aproxima a una normal estándar.
 Intervalo de confianza para una proporción

5.7. PRUEBAS DE HIPÓTESIS RESPECTO A LA DIFERENCIA DE


PROPORCIONES DE DOS POBLACIONES.

POBLACIÓN 1 POBLACIÓN 2
P1 P2

Interesa hacer inferencias respecto a p1 – p2.


 Hipótesis posibles:
Ho: p1 - p2 = δ0 Ho: p1 - p2 ≥ δ0 Ho: p1 - p2 ≤ δ0
H1: p1 - p2 ≠ δ0 H1: p1 - p2 < δ0 H1: p1 - p2 > δ0
 Estadístico de prueba
(𝑝̂1 − 𝑝̂ 2 ) − δ0
𝑍=
𝑝̂1 (1 − 𝑝̂1 ) 𝑝̂ 2 (1 − 𝑝̂ 2 )
√ +
𝑛1 𝑛2
Si Ho es cierta, Z tiene distribución que se aproxima a una
normal estándar para muestras grandes.
 En caso de ser δ0=0, se usa el estadístico:
𝑝̂1 − 𝑝̂ 2
𝑍=
1 1
√𝑝̂ (1 − 𝑝̂ )( + )
𝑛1 𝑛2

𝑥 +𝑥 𝑛1 𝑝1 +𝑛2 𝑝2
Donde 𝑝̂ = 𝑛1+𝑛2 =
1 2 𝑛1 +𝑛2

Si Ho es cierta, Z tiene distribución que se aproxima a una


normal estándar para muestras grandes.

 Intervalo de confianza.
5.8.

Potrebbero piacerti anche