Sei sulla pagina 1di 44

La inferencia estadística

Conceptualización actual.
El hito de 1995

Concepción San Luis


LA INFERENCIA CLÁSICA.
CONCEPTOS BÁSICOS

Concepción San Luis


Distribución Normal

Concepción San Luis


Conceptos

• Estadístico
• Parámetro
• Muestra
• Distribución Muestral de un Estadístico

Concepción San Luis


DISTRIBUCIÓN MUESTRAL DE UN
ESTADÍSTICO

Supongamos que de una población


determinada extraemos, al azar, infinitas
muestras todas de tamaño n.
De cada muestra calculamos el valor de un
estadístico (proporción, media, etc.).
Se llama distribución muestral al conjunto
formado por los valores del estadístico
seleccionado, obtenido para cada una de las
muestras extraigas de la población.
Concepción San Luis
Inferencia: Distribución muestral

Parámetros
media: 
Varianza σ2θ

Concepción San Luis


Principales distribuciones
muestrales

• Proporciones • Medias:
Media:  p  Media x  
Error típico:
Error típico:
N desconocida
N desconocida
  1    
p 
n x 
n
N conocida N conocida
  1    N  n  N n
p   x  
n N 1 n N 1

Concepción San Luis


Parámetro y Estimador
• Parámetro: Característica descriptiva de la
población.
• Estadístico: Propiedad descriptiva de una
muestra que no es más que una combinación
determinada de los valores de la/s variables.
• Un Estadístico permite “estimar” el valor del
parámetro aunque nunca dará su valor exacto.

Concepción San Luis


Estimación Puntual
• Se toma como valor del Parámetro el calculado por el
estadístico o estimador muestral.
• Toda función de distribución de una variables viene
caracterizada por la variable a la que se refiere y uno o más
parámetros que la definen.
Si F (x; β) es una función de distribución que depende del
parámetro β que no conocemos, si para estimarlo
empelamos un estadístico, dicho estadístico es un
estimador de β, que representaremos por b.
Puesto que b es una función de los valores X de la muestra,
que son variables aleatorias, b será también una variable
aleatoria.

Concepción San Luis


¿Son todos los estadísticos buenos
estimadores de sus correspondientes
parámetros?.
¿Cómo se calculan los estimadores?

Concepción San Luis


Características de un buen
estimador
• Carencia de sesgo: 
E ˆ  
Valor esperado coincide con el parámetro

 
• Consistencia: a medida
Aumente n p ˆ    1

   
• Eficiencia:
Varianza máxima Var ˆ1  Var ˆ2
• Suficiencia
Utiliza toda la
información
Concepción San Luis
Métodos de obtención de Estimadores
Hay muchos, pero los de interés son
• Mínimos cuadrados: Selecciona como e timador
el que hace mínimo el error entre el valor real y el
que predicho.
• Máxima Verosimilitud: Selecciona como
estimador aquel que maximiza la probabilidad de
la muestra observada
Son los que se utilizan en los procedimientos de
análisis más habituales en Ciencias Sociales

Concepción San Luis


ESTIMACIÓN POR INTERVALOS

Concepción San Luis


Estimación por intervalos

Intervalo de probabilidad Intervalo de confianza


(único) (tantos como muestras)

Población  Muestra Muestra  Población

Parámetro  Estadístico Estadístico  Parámetro


  p p  
  x x  
Concepción San Luis
Intervalo de probabilidad:
proporciones
• Condición de aplicación
 ·n5
(1 - ) · n  5
• IP:
  z / 2   p
  1   
p 
n

  1    N n
p  
n N 1
Concepción San Luis
Ejemplo I. Probabilidad de
proporciones
• La proporción de personas mayores de 65 años que
padecen depresión en la población es de 0,15. ¿Entre
que valores estará esta proporción en un centre geriátrico
que té 40 residentes? (NC = 95%)
• Es un intervalo de probabilidad por qué tenemos la
información de la población y queremos conocer la
información para la muestra:  = 0,15 ¿ p?
• C.A.: 40 · 0,15 = 6 i 40 · (1 - 0,15) = 34  Sí

• IP:
0,15  0,85
0,15  1,96  0,039  0,261 NC  95%
40
Concepción San Luis
Intervalo de probabilidad: MEDIAS
Se asume normalidad de la
variable en la població.

• IP:   z / 2   x

x 
n

 N n
x  
n N 1

Concepción San Luis


Ejemplo Intervalo de Probabilidad de
MEDIAS
• ¿Entre qué valores se encontrará la media de edad
de un grupo de 30 persones mayores de 65 anys
que viven rn Madrid si en la població de origen de la
muestra la media es de 72 años con una varianza
de 5 años? (NC = 96%)
• De trata de un intervalo de probabilidad para la
media de la muestra siendo en la población ( = 72)
• Se asume distribución normal e la edad en la
población.

• IP: 5
72  2,0537   71,16  72,84 NC  96%
30
Concepción San Luis
Intervalo de confianza: proporciones

• IC: p  z / 2   p

p  1  p 
p 
n
p  1  p  N n
p  
n N 1

• Condición de aplicación
ˆ i  n  5 1  ˆ i   n  5
ˆ s  n  5 1  ˆ s   n  5

Concepción San Luis


CONTRASTE DE HIPÓTESIS

Concepción San Luis


1.- Se basa en las distribuciones muestrales.
(modelos probabilísticos por tanto es un resultado
probabilístico)
2.- Son un conjunto de técnicas que permiten
comprobar la información que produce una
muestra (observaciones) concuerda o no con una
determinada distribución (modelo) de
probabilidad conocido (distribución muestral). Lo
que se prueba es los que denominamos H0.

Concepción San Luis


Como se decide. Criterio
Sea x = (x1,x2,x3…xn) las observaciones (datos obtenidos).
Definimos un criterio (estadístico de contraste) que divide
la distribución muestral del estadístico en dos partes:
• región Crítica (rechazo): Área de la distribución muestral
que corresponde a los valores del estadístico de contraste
tan alejados que es poco probable que ocurra (H0 se
rechaza). Su probabilidad es α
• Región e Aceptación: Área de la distribución muestral
que corresponde a los valores del estadístico de contraste
no incluidos en la región crítica. Su probabiliad es 1-α
(aceptar H0)

Concepción San Luis


CONSECUENCIAS

• El tamaño de las regiones de rechazo y


aceptación quedan determinadas por α nivel
de significación.
• Se interpreta como un nivel de error, por
tanto su valor debe ser pequeño.

Concepción San Luis


Dado que hemos dividido la distribución en
dos regiones dependiendo y que H0 y
H1tienen que ser exhaustivas y excluyentes
(se trata de tomar una decisión entre dos
posibles), dependiendo de cómo
formulemos H1 podemos hablar de
contrastes bilaterales o unilaterales.

Concepción San Luis


Planteamiento de las hipótesis
estadísticas
• Contraste bilateral:
H 0: p =  H 0: x = 
H1: p   H1: x 
•Contraste Unilateral:
• Dcha:
H 0: p   H 0: x  
x
H1: p >  H 1: >
•Izda.:
x
H 0: p   H 0: 
x
H1: p <  H 1: <
Concepción San Luis
Procedimiento General para el
contraste
1. Plantear la hipótesis nula H0.
2. Seleccionar una muestra (mediante una regla de
muestreo).
3. Determinar la distribución muestral del estadístico de
interés.
4. Seleccionar y calcular el estadístico de contraste
(índice de discrepancia).
5.-Fijar el valor del riesgo .
6.- Comparar el estadístico el contraste con el valor de
estadístico para α.
Concepción San Luis
¿Ha funcionado este procedimiento?

Aunque podríamos pensar que sí, todos lo hemos


hecho de esta forma, hay varia críticas:
Se han mezclado dos procedimientos encontrados:
Se toma de Fisher la concepción y la sistemática
del contrastar la H0.
Se introduce la H1 de Neyman Pearson y el
proceso de toma de decisión entre DOS
CONTRARIOS inaceptable en la filosofía de
Fisher.
CONSECUANCIA

Concepción San Luis


Que ha ocurrido

Se han mezclado dos procedimientos:


Fisher: Contrastes de significación.
Sólo una de las dos posibles soluciones
Rechazo H0 a un nivel α o decir que ni hay
evidencia suficiente. No hay H1
Neyman Pearson: Plantean explícitamente la
H1 (contrapuesta a H0) y se centran en un
problema de toma de decisiones
Concepción San Luis
Errores asociados a la toma de
decisión en la prueba de hipótesis

Carácter de la Hipótesis nula H0

verdadera falsa

No se refuta la H0 Decisión correcta Error tipo II


NC: 1 -  
Decisión
Es refuta la H0 Error tipo I Decisión correcta
 Potencia: 1 - 

Concepción San Luis


Errores asociados a la toma de
decisión en la prueba de hipótesis

Concepción San Luis


Reducción del error 
Riesgo :
- Fijado por el investigador
Riesgo :
- Valor de 
-Tamaño de la Muestra
- Tamaño del efecto

Concepción San Luis


Relación entre  y 

A medida que aumenta  disminuye 

Concepción San Luis


Relación entre  y el tamaño de la
muestra
n1 < n2
n1 n2

A medida que aumenta el tamaño de la muestra


disminuye el error estandar y por lo tanto el
riesgo de 

Concepción San Luis


Relación entre el riego  y el valor
verdadero de H1

Hay tantos valores de  como H1 se hayan enunciado

Concepción San Luis


Todos los elementos contemplados en el
cuadro de decisión ha sido sistemáticamente
olvidados.
1995 La Taks Force propone como solución.
Añadir la potencia, el tamaño del efecto y
los intervalos de confianza.

Concepción San Luis


Para que

Solventar los problemas de integración de


resultados (El meta análisis).
Mejorar la comunicación
Facilitar los experimentos cruciales
Dar paso a un planteamiento más cercano a
la modelización.

Concepción San Luis


A donde habíamos llegado
La concentración de esfuerzos en las pruebas de
significación a llevado a que ne la enseñanza y en
la investigación sólo nos preocupe buscar cual es
la solución adecuada a nuestra situación de
investigación concreta con el único interés en
desechar la H0 sin preocuparnos de.
La implicación teórico practica y la búsqueda de
explicaciones acumulativas que mejoren la
comprensión de la realidad compleja.

Concepción San Luis


ASÍ TRABAJAMOS

Concepción San Luis


ÁRBOL DE DESISIÓN PARA LA
ELECCIÓN DEL ESTADÍSTICO DE
CONTRASTE APROPIADO EN
INVESTIGACIONES EN CIENCIAS
SOCIALES

 
¿En relación a cuántas muestras se pretende
realizar la inferencia?

1 2 más de 2

Concepción San Luis


Contraste sobre
NO
promedios

SI

NO Contraste para la
media

SI

SI Varianza NO
conocida
Z T

Contraste para
2 SI la varianza

NO

Z SI Contraste para la
proporción

NO
Escala de intervalo
y distribución NO Bondad de
simétrica ajuste

SI SI
WILCOXONConcepción San Luis SIGNOS 2
¿Muestras
NO SI
relacionadas?

¿Contraste ¿Contraste
SI paramétrico? paramétrico?
SI NO
NO
Contraste
de medias NO Contraste
medias SI
Contraste Contraste
SI promedios promedios
Varianza
conocida SI
Varianza NO SI NO
conocida SI
Función
SI NO distribución Z NO NO
Escala de
SI intervalo y
Z
D NO W distribuc.
T simétrica
T
Homo-
geneidad NO SI
Contraste Contraste
SI varianzas SI varianzas
SI
2 Contraste de
F
proporciones SIGNOS
NO

NO
Contraste de T SI
SI
proporciones
B WILCOXON
Z Contraste de
Z SI proporciones
Concepción San Luis
¿Cont. paramétrico? NO

¿Muest. depen.?
SI SI

1 Nº de 2 ó más NO
factores
¿ Orden predic.?
ANOVA ANOVA
unifact. NO SI
multiact.
K-W Jonckeere
¿Mues. depend.?

¿Mues. depen.?
SI
SI
NO Med. repe. en:
ANOVA ANOVA
NO multifact.Muest ind.
1Fact.Med.Rep.
Efect aleat.
¿ Efect. fijos? 2 Fac.
NO 1 Fact.
¿ Efect. fijos? ANOVA
NO ANOVA multifact. Med. Rep.
ANOVA SI multifact. Med. Rep.
1Fact. Mues.Ind. en 1 Factor
Efect aleat ¿Interacción? Cocran
ANOVA SI
NO
1Fact. Mues.Ind. SI SI
Efect fijos ANOVA ANOVA V. dicotómic.
multifact. Muest ind. multifact. Muest ind.
Efect fijos Con interac. Efect fijos Sin interac. NO
  Concepción San Luis   Friedman
Un nuevo planteamiento

LA MODELIZACIÓN

Concepción San Luis


Concepción San Luis

Potrebbero piacerti anche