Sei sulla pagina 1di 29

TEMA 1

CONCEPTOS BSICOS DE LA
INFERENCIA ESTADSTICA

INDICE
1.

2.
3.
4.
5.
6.

Marco general de la inferencia estadstica en


Psicologa
Variables y su clasificacin
Poblacin, muestra, parmetro y estadstico
Distribucin muestral
Estimacin de parmetros
Contraste de hiptesis

1. MARCO GENERAL DE LA
INFERENCIA ESTADSTICA

Estadstica:

Coleccin de datos numricos presentados de manera


ordenada y sistemtica
Ciencia que se ocupa

- Recogida de datos, organizacin y anlisis


- Realizar predicciones a partir de los datos

Estadstica descriptiva
Estadstica inferencial

POBLACIN
Parmetros

MUESTRA
Estadstico

1. MARCO GENERAL DE LA
INFERENCIA ESTADSTICA

La estadstica inferencial se centra en dos aspectos: la


estimacin de parmetros y las pruebas de hiptesis.

Estimacin de parmetros: generalizacin de los datos de la


muestra a la poblacin. Averiguar qu valores habran
correspondido en la poblacin de haber trabajado directamente
sobre ella.
La estimacin de parmetros puede ser:

Estimacin puntual: Se obtiene un valor nico aproximado.


Estimacin por intervalos: Proporciona, a partir de la informacin
recogida en la muestra, un intervalo que con cierta probabilidad
contiene al parmetro.

Si queremos decidir entre dos hiptesis que afectan a un cierto


parmetro de la poblacin, a partir de la informacin de la muestra
usaremos el contraste de hiptesis.

2. VARIABLES Y SU CLASIFICACIN

VARIABLE: Caracterstica que admite varios valores.


Podemos clasificar las variables haciendo referencia a dos
caractersticas:

Nivel de medida utilizado:

Cualitativa: expresan distintas cualidades o modalidades. Pueden


ser dicotmicas o politmicas; nominales u ordinales.
Cuantitativa discreta: tiene valores numricos enteros previamente
establecidos
Cuantitativa continua: puede asumir cualquier valor numrico

Nivel de manipulacin:

Independiente: factor que manipula el investigador y que causa los


efectos en la VD
Dependiente: conducta de estudio que se observa
Extraas: factores que distorsionan los efectos en VD

3. POBLACIN, MUESTRA, PARMETRO


Y ESTADSTICO

En el sistema democrtico los ciudadanos eligen individualmente


al candidato favorito.
El resultado de unas elecciones es siempre aleatorio, ya que el
nmero final de personas que acuden a votar es desconocido.
Por diversas razones se producen abstenciones y, adems,
algunas personas cambian su voto a ltima hora.

En unas votaciones dos candidatos A y B tienen que enfrentarse.


Qu candidato piensas que ganar?

Podramos preguntar a todos los espaoles qu piensan votar?


Sera este el resultado de la votacin?
A quienes tendramos que preguntar?

3. POBLACIN, MUESTRA, PARMETRO


Y ESTADSTICO

Poblacin: conjunto o coleccin de personas o cosas objeto de


estudio

Poblacin finita: n de elementos que la forman finito, ej. n de


alumnos de un centro de enseanza, o grupo clase.
Poblacin infinita: n de elementos que la forman es infinito, o tan
grande que pudiesen considerarse infinitos.

Muestra: subgrupo que analizamos

Estadstico:

Medidas que permiten describir la muestra

Parmetro:

ndices calculado en la poblacin;


Valores globales que determinan las caractersticas de la poblacin
concreta
Los ms utilizados: media, desviacin tpica, varianza, proporcin

4. DISTRIBUCIN MUESTRAL

Imagina que queremos evaluar la inteligencia en una poblacin de 1000 sujetos.


Cuntas muestras de 100 personas podemos extraer?

Variaciones de 1000 elementos tomados de 100 en 100: 1000100 muestras.


Si en la primera muestra el CI es 104, ser este el CI medio de los 1000 sujetos?

Muestreo:

Procedimiento estadstico para seleccionar la muestra de la poblacin

Ventajas: bajo costo, menor tiempo, a veces es la nica opcin

Caractersticas del muestreo:

Equiprobabilidad: todos los sujetos tienen la misma probabilidad

Independencia: el hecho que un elemento haya salido seleccionado, no


modifique la probabilidad de que se elijan los dems.

Representatividad: exhibe las mismas caractersticas de la poblacin.

Variabilidad muestral: Los elementos de distintas muestras pueden ser


diferentes, y los resultados pueden variar.

4. DISTRIBUCIN MUESTRAL

Supongamos que tenemos una caja con tres fichas


numeradas del 1 al 3.
Tomamos al azar dos fichas, con reemplazamiento, y
queremos deducir el valor de la media de las tres
fichas, mediante la media obtenida en la muestra.
2
1

Tomemos todas las muestras posibles, y calculemos


la media de cada una:

4. DISTRIBUCIN MUESTRAL

Supongamos que tenemos una caja con tres


fichas numeradas del 1 al 3.
Tomamos al azar dos fichas, con
reemplazamiento, y queremos deducir el
valor de la media de las tres fichas, mediante
la media obtenida en la muestra.
2
1

Tomemos todas las muestras posibles, y


calculemos la media de cada una:

fichas

media

1,1

2,1

1.5

3,1

1,2

1.5

2,2

3,2

2.5

1,3

2,3

2.5

3,3

4. DISTRIBUCIN MUESTRAL
- La media de las muestras una variable aleatoria.
- Su distribucin de probabilidad sera la siguiente
Esta es la DISTRIBUCIN MUESTRAL
de la media al lanzar un dado
Observamos:
El valor ms frecuente
Coincide tambin con el valor medio del
estadstico
Corresponde con la media poblacional.
La media se utiliza como estimador del parmetro
La desviacin tpica se denomina error tpico
Existen modelos tericos que modelizan la
distribucin muestral para cada parmetro

P(x)

x.P(x)

1/9

1/9

1.5

2/9

3/9

3/9

6/9

2.5

2/9

5/9

1/9

3/9
18/9

4. DISTRIBUCIN MUESTRAL

En una poblacin se puede extraer varias muestras diferentes.


Los estadsticos en una muestra, se consideran variables aleatorias: tenemos
diferentes valores para el estadstico, en funcin de la muestra seleccionada

DISTRIBUCIN MUESTRAL: Distribucin terica que asigna una probabilidad


concreta a cada uno de los valores que puede tomar un estadstico en cada
muestra

Es decir, seguimos los siguientes pasos:

- Recogemos los datos en una muestra.

- Calculamos el valor de un estadstico w (ej. media).

- Para saber cmo de esperable es el valor de w, extraemos todas las


posibles muestras. Pongamos que son k posibles muestras.

- En cada muestra, se calcula el mismo ndice w. Contamos con k medidas de


w.

- Habr valores de w que se repiten ms y otros que se repiten menos.

- El conjunto de las medidas de w se denomina distribucin muestral de w.

Teorema del Lmite Central: Ejemplo CI

n =1

Teorema del Lmite Central: Ejemplo CI

n =1

Teorema del Lmite Central: Ejemplo CI

n =2

Teorema del Lmite Central: Ejemplo CI

Teorema del Lmite Central: Ejemplo CI

Teorema del Lmite Central: Ejemplo CI

N=4

N=10

4. DISTRIBUCIN MUESTRAL DE LA MEDIA

Un conocimiento de la distribucin de los estadsticos en el muestreo es


imprescindible para estadstica inferencial.
No necesitamos hallar todas las posibles muestras y calcular los posibles
valores del estadstico, por suerte, existen modelos tericos que utilizamos
para simular la distribucin muestral que seguira el ndice en el cual nos
interesamos
Si aplicamos un test de inteligencia a una muestra de 500 universitarios
obtenida al azar, podemos calcular la media resultante.
Si obtenemos un nmero infinito de muestras de 500 universitarios, cada
una de esas muestras tendr una media. Entre esas infinitas medias
algunas sern iguales, otras diferentes. Si hacemos una distribucin de
esas medias, resultar una distribucin muestral de medias.

Distribucin muestral de un estadstico es la distribucin de frecuencias de


los valores que ese estadstico toma en un nmero infinito de muestras del
mismo tipo y tamao.

Una de las distribuciones muestrales ms utilizadas es la distribucin


muestral de la media

4. DISTRIBUCIN MUESTRAL DE LA MEDIA

Si tenemos una variable con distribucin normal N(,),


Tomamos muestras de valores de dicha variable,
La distribucin de las medias de estas muestras tambin parecen
que pueden ser descritas apropiadamente por una distribucin
normal.
La distribucin muestral de la media seguir la distribucin siguiente:

N ,

Recordad que usaremos la media de la distribucin para estimar el


valor del parmetro

4. DISTRIBUCIN MUESTRAL DE LA MEDIA

La desviacin tpica de esta distribucin recibe el nombre de ERROR


TPICO
El error tpico tiene una gran importancia.
A medida que aumenta el tamao de la muestra, el error tpico
disminuye. Esto es como decir que a mayor tamao de la muestra, la
dispersin de esta distribucin es menor.
Mide el grado hasta el que esperamos que varen las medias de las
diferentes muestras debido a este error fortuito cometido en el proceso
de muestreo
Tambin mide la precisin que obtendremos si utilizamos una
estadstico de la muestra para estimar un parmetro de poblacin.
Una distribucin muestral con error tipico pequeo es un mejor
estimador de la media de la poblacin

N ,

Error tpico

4. DISTRIBUCIN MUESTRAL DE LA MEDIA

http://onlinestatbook.com/stat_sim/sa
mpling_dist/index.html

5. ESTIMACIN DE PARMETROS

Cuando estimamos un parmetro podemos hacerlo de dos formas:

Estimacin puntual: cuando damos un valor puntual como estimador


del parmetro.
Estimacin por intervalo: cuando damos un intervalo de valores en el
que se espera que est el parmetro.

estimador puntual del


Nomenclatura:
parmetro
parmetro
Por lo general, un estimador no es idntico al parmetro que
estima,
La diferencia entre ellos se denomina error de muestreo

Estimadores puntuales de algunos parmetros:

Media: media muestral x


Varianza: cuasivarianza muestral

S n21

2
(
x

x
)
i

n 1

5. ESTIMACIN DE PARMETROS

Caractersticas de un buen estimador puntual:


Insesgado:

Cuando el tamao de la muestra crece arbitrariamente, el valor estimado se


aproxima al parmetro desconocido, el error de muestreo disminuye

Eficiencia:

Consistencia:

El valor medio que se obtiene de la estimacin para diferentes muestras debe ser
el valor del parmetro.
Media de la distribucin muestral del estadstico es igual al parmetro;

Su dispersin con respecto al valor central debe ser pequea


Un estimador 1 es ms eficiente que de 2 , si la varianza del primero es menor
que la del segundo

Suficiencia:

Si transmite tanta informacin de la muestra como sea posible acerca del


parmetro
No hay otro estimador en la muestra que proporcione mayor informacin sobre el
parmetro.

5. ESTIMACIN DE PARMETROS

Una estimacin puntual no proporciona suficiente informacin.


En varias muestras es posible obtener un estimador puntual
diferente.
Intervalo de confianza:

Intervalo de valores alrededor de un valor muestral en los que, con


una probabilidad (o nivel de confianza, 1-) determinado, se situar el
parmetro poblacional a estimar
Se expresa: [1, 2]

Para construir un intervalo de confianza se siguen los siguientes


pasos:

Determinar el nivel de riesgo que se quiere tomar:


Buscar la puntuacin tpica correspondiente a ese nivel: |Z /2|
Calcular el error tpico de la distribucin muestral del estimador:
Establecer el error mximo: Emax=|Z /2|
Obtener limite inferior y superior: LI= - Emax y LS= + Emax

5. ESTIMACIN DE PARMETROS

Interpretacin: Intervalo de confianza de 95%


Si extraemos 100 muestras y calculamos en cada una el intervalo,
95 de estos intervalos calculados contendrn el verdadero valor
del parmetro,
95% de las medias muestrales estarn dentro de 1.96
desviaciones estndar de la media poblacional hipottica (2.58
para un intervalo al 99%).

EJERCICIO

Una muestra aleatoria de 100 estudiantes de psicologa


responde a una prueba de inteligencia espacial,
obteniendo una media de 80 y una desviacin tpica
insesgada de 10
Entre qu lmites se hallar la verdadera inteligencia
espacial media de los estudiantes de psicologa, con un
nivel de confianza de 0,99?

1. = 0,01
2. |Z /2| = 2,57
3. = Sn-1/n= 1
4. Emax=|Z /2| = 2,57
5. [77,42 , 82,57]

EJERCICIO

El director de la escuela de administracin desea


estimar el nmero medio de horas por semana que
estudian los alumnos. Una muestra de 49
estudiantes dio una media de 24 h con desviacin
estndar de 4 h. Cul es el intervalo de confianza
de 95% para el nmero promedio de horas por
semana que estudian los alumnos?

1. = 0,05
2. |Z /2| = 1,96
3. = Sn-1/n= 4/7
4. Emax=|Z /2| = 1,12
5. [22,88 , 25,12]

EJERCICIO

En un experimento sobre percepcin, un psiclogo


presenta a un sujeto un nmero desconocido de bolas
del mismo tamao y color durante un segundo.
El sujeto debe estimar el nmero de bolas que le han
sido presentadas.
Repetido el experimento con 100 sujetos se elabora la
distribucin de frecuencias del nmero de bolas
estimadas y se obtiene una media de 16 y desviacin
tpica de 2,4.
Entre qu lmites estimaremos que se halla el
verdadero nmero de bolas presentadas, con un nivel
de confianza del 99%?

Potrebbero piacerti anche