Sei sulla pagina 1di 60

UNIVERSIDAD NACIONAL DE ASUNCION

FACULTAD DE FILOSOFIA
MAESTRIA EN PSICOLOGIA CLINICA

M d u l o d e I n v e s t i g a c i n C i e n t f i c a I

Introduccion al analisis estadistico


con soporte informatico con

Instructor: Enrique Morosini

Introduccin
El taller tiene carcter introductorio, concentrndonos en la
estructura general del software y de las operaciones bsicas.
Veremos operaciones especficas conforme diseos
especficos y abordaremos cuestiones tcnicas relacionadas
a las tcnicas especficas de anlisis vinculados a distintos
diseos experimentales (y no experimentales), que permitan
la extraccin de conocimiento a partir de los datos.
No se cuenta con el tiempo suficiente para profundizar
tcnicas ms complejas que seran tiles de abordar y que
son posibles mediante la utilizacin del SPSS pero se ofrece
una gama interesante de material de consulta.

Enrique Morosini - Pg. 2

ESTRUCTURA GENERAL
Existen dos elementos fundamentales en la estructura del
software que requieren de correcta comprensin para
familiarizarse con el entorno de trabajo:
1. La estructura de las bases de datos.
2. La estructura del funcionamiento del SPSS:
a. Las ventanas.
b. Los mens.
c. Los comandos y ventanas de tareas.

Enrique Morosini - Pg. 3

ESTRUCTURA GENERAL
Estructura de las bases de datos
Una base de datos es una coleccin de datos ORGANIZADOS y
RELACIONADOS entre s. Su estructura bsica es una matriz
y es la materia prima para la realizacin de anlisis
estadsticos.
MATRIZ: Es una tabla ordenada de datos compuesta de filas y
columnas.
Por lo tanto las bases de datos, que pueden poseer mltiples
dimensiones y variables en su estructura bsica se compone
de filas y columnas.

Enrique Morosini - Pg. 4

ESTRUCTURA GENERAL
Estructura de las bases de datos
Generalmente los programas informticos interpretan que
las filas son casos y las columnas son variables.
Consideremos el ejemplo utilizado para esta clase:

Base de datos

Enrique Morosini - Pg. 5

ESTRUCTURA GENERAL
Estructura de las bases de datos

Enrique Morosini - Pg. 6

ESTRUCTURA GENERAL
Estructura del SPSS
El SPSS se compone de tres tipos distintos de archivos:
1. Editor de Datos.
2. Visor de Resultados.
3. Editor de Sintaxis.

Enrique Morosini - Pg. 7

ESTRUCTURA GENERAL
Estructura del SPSS
1. Editor de Datos.
Es el espacio en el cual se pueden editar los datos, lo que
implica cargar informacin, modificarla, corregirla. Su
apariencia es la misma a cualquier planilla electrnica,
Excel o similar.
El Editor de Datos presenta a su vez dos pantallas:
- una referida a los datos
- otra referida a las propiedades de las variables.

Enrique Morosini - Pg. 8

ESTRUCTURA GENERAL
Estructura del SPSS
1. Editor de Datos - Vista de datos

Enrique Morosini - Pg. 9

ESTRUCTURA GENERAL
Estructura del SPSS
1. Editor de Datos - Vista de datos

Enrique Morosini - Pg. 10

ESTRUCTURA GENERAL
Estructura del SPSS
1. Editor de Datos - Vista de datos

Enrique Morosini - Pg. 11

ESTRUCTURA GENERAL
Estructura del SPSS
1. Editor de Datos - Vista de datos

Enrique Morosini - Pg. 12

ESTRUCTURA GENERAL
Estructura del SPSS
1. Editor de Datos - Vista de datos

Enrique Morosini - Pg. 13

ESTRUCTURA GENERAL
Estructura del SPSS
1. Editor de Datos - Vista de datos

Enrique Morosini - Pg. 14

ESTRUCTURA GENERAL
Estructura del SPSS
1. Editor de Datos - Vista de datos

Enrique Morosini - Pg. 15

ESTRUCTURA GENERAL
Estructura del SPSS
1. Editor de Datos - Vista de datos

Enrique Morosini - Pg. 16

ESTRUCTURA GENERAL
Estructura del SPSS
1. Editor de Datos - Vista de datos

Enrique Morosini - Pg. 17

ESTRUCTURA GENERAL
Estructura del SPSS
1. Editor de Datos - Vista de variables

Enrique Morosini - Pg. 18

ESTRUCTURA GENERAL
Estructura del SPSS
1. Editor de Datos - Vista de variables

Enrique Morosini - Pg. 19

ESTRUCTURA GENERAL
Estructura del SPSS
Ejercicio 1
1. Abrir el programa.
2. Cargar los datos siguientes

Enrique Morosini - Pg. 20

ESTRUCTURA GENERAL
Estructura del SPSS
Ejercicio 1
3. Examinar la Vista de Variables
4. Colocar nombres a las variables:
ID; se; It01; It02; It03
5. Modificar el tipo de variable:
ID = Cadena; se, It01, It02 y It03 = Numrico
6. Indicar las etiquetas siguientes:
ID = Identificacin; se = Sexo; tem 1; tem 2; tem 3.
7. Especificar la medida:
ID = nominal; se = nominal; It01, It02 y It03 = escala
Enrique Morosini - Pg. 21

ESTRUCTURA GENERAL
Estructura del SPSS
2. Visor de resultados.
Es una ventana que aparece automticamente cada vez que
se activa una orden:
- Abrir un archivo.
- Alguna funcin de datos.
- Alguna funcin de transformacin.
- Se ejecuta algn anlisis especfico.

Enrique Morosini - Pg. 22

ESTRUCTURA GENERAL
Estructura del SPSS
2. Visor de resultados.
Muestra tres tipos de informacin:
1. Comando de ejecucin.
2. Tablas.
3. Grficos.

Enrique Morosini - Pg. 23

ESTRUCTURA GENERAL
Estructura del SPSS
2. Visor de resultados.
Muestra tres tipos de informacin:
1. Comando de ejecucin.

FREQUENCIES VARIABLES=VAR00002
/BARCHART FREQ
/ORDER=ANALYSIS.

2. Tablas.
3. Grficos.

Enrique Morosini - Pg. 24

ESTRUCTURA GENERAL
Estructura del SPSS
Ejercicio 2
Con la misma planilla con la que se trabaj en el ejemplo
anterior realizar la siguiente operacin:
1. Ingresar al men Analizar / Estadstico descriptivo /
Frecuencias.
2. Seleccionar la variable se y con la flecha enviarla a la
ventana derecha.
3. Seleccionar la pestaa Grficos... y Grficos de barra.

Enrique Morosini - Pg. 25

Comando de
ejecucin.

Tablas.

Grficos.

Enrique Morosini - Pg. 26

ESTRUCTURA GENERAL
Estructura del SPSS
3. Editor de sintaxis.
En el SPSS es posible trabajar en modo comando,
introduciendo una secuencia ordenada / jerarquizada de
rdenes o instrucciones, a lo que se denomina sintaxis.
Estas rdenes escritas en formato de texto permiten
ejecutar las funciones que se realizan a partir de los mens.
La ventaja consiste en que se puede contar con un conjunto
de instrucciones para repetir una secuencia de comandos de
manera automtica.

Enrique Morosini - Pg. 27

ESTRUCTURA GENERAL
Estructura del SPSS
Ejercicio 3
1. Ingresar a la pantalla Visor.
2. Copiar la secuencia de comando que aparece al inicio de
la ventana; dar doble click, seleccionar el texto y copiar.
3. Seleccionar la funcin Archivo / Nuevo / Sintaxis.
4. Aparecer una pantalla en la cual pegaremos la
secuencia anteriormente copiada.
5. Clickear sobre el siguiente cono del men:

[ejecutar]

6. Comentar qu es lo que se observa.

Enrique Morosini - Pg. 28

ESTRUCTURA GENERAL
Estructura del SPSS
Los mens
Son las rutas o caminos visuales a travs de los cuales se
ejecutan los comandos. Se accede a ellos a travs de la
barra de men y ejecutan distintos grupos de comandos.

Enrique Morosini - Pg. 29

ESTRUCTURA GENERAL
Estructura del SPSS
Las ventanas
La mayora de las aplicaciones analticas del SPSS presentan la
misma estructura: un conjunto de ventanas, generalmente dos, en
las cuales de un lado se encuentra la lista completa de variables
y del otro lado un espacio vaco al que habr que trasladar
aquellas que sea de nuestro inters su anlisis.

Enrique Morosini - Pg. 30

ESTRUCTURA GENERAL
Estructura del SPSS
Las ventanas
La mayora de las aplicaciones analticas del SPSS presentan la
misma estructura: un conjunto de ventanas, generalmente dos, en
las cuales de un lado se encuentra la lista completa de variables
y del otro lado un espacio vaco al que habr que trasladar
aquellas que sea de nuestro inters su anlisis.

Enrique Morosini - Pg. 30

ESTRUCTURA GENERAL
Estructura del SPSS
Las ventanas
La mayora de las aplicaciones analticas del SPSS presentan la
misma estructura: un conjunto de ventanas, generalmente dos, en
las cuales de un lado se encuentra la lista completa de variables
y del otro lado un espacio vaco al que habr que trasladar
aquellas que sea de nuestro inters su anlisis.

Enrique Morosini - Pg. 30

EXPLORACIN
La primera fase del proceso de investigacin es la exploracin de
los datos.
La fase exploratoria tiene una importancia en s misma ya que
permite comprender la forma de distribucin de los datos, lo que
contiene la esencia del comportamiento colectivo de los atributos
que estamos analizando.
La exploracin consiste bsicamente en analizar los datos
descriptivos a fin de identificar la forma de la distribucin, la
existencia de datos atpicos, ausencia de respuestas, etc.
Ms extendidas en los ltimos 30 aos se han implementado
tcnicas especficas de exploracin de datos gracias al aporte de
John Wilder Tukey. una de ellas es el grfico Box-Plot.

Enrique Morosini - Pg. 31

EXPLORACIN
1. El anlisis descriptivo.
Se analizan la media, mediana, moda, varianza, desvo estndar,
media recortada, curtosis, asimetra, cuartiles.
Estos datos permiten tener una aproximacin respecto a la
distribucin de los datos y aproximacin a la distribucin normal.

2. El anlisis grfico.
Con el SPSS se obtienen dos grficos por defecto:
- El diagrama de tallos y hojas
- El grfico de cajas y bigotes (box-plot).

Enrique Morosini - Pg. 32

EXPLORACIN
- El Diagrama de tallos y hojas (Stem-and-Leaf Diagram) permite
obtener simultneamente una distribucin de frecuencias de la
variable y su representacin grfica. Para construirlo basta separar
en cada dato el ltimo dgito de la derecha (que constituye la
hoja) del bloque de cifras restantes (que formar el tallo). Esta
representacin de los datos es semejante a la de un histograma
pero adems de ser fciles de elaborar, presentan ms informacin
que estos.
2.12233333444
2.566666677788889999
3.01133
Tallos
Hojas
3.89
4.146
5.2
Enrique Morosini - Pg. 33

EXPLORACIN
- El grfico de cajas y bitotes (box plot) son una presentacin
visual que describe varias caractersticas importantes, al mismo
tiempo, tales como la dispersin y simetra. Para su realizacin se
representan los tres cuartiles y los valores mnimo y mximo de los
datos, sobre un rectngulo, alineado horizontal o verticalmente.

Mn

Q1

Med

Q3

Mx

Caja
Bigotes

Enrique Morosini - Pg. 33


34

EXPLORACIN
Ejercicio 4
1. Abrir la base de datos Ejercicio 01.xls".
2. Ejecutar la funcin del men analizar / estadsticos
descriptivos / explorar.
3. Seleccionar la variable edad.
4. Realizar un breve comentario al respecto.

Enrique Morosini - Pg. 35

LIMPIEZA DE DATOS
Antes de aplicar cualquier tipo de anlisis se debe realizar una
cuidadosa depuracin de la base de datos. Para ello se debe
limpiarla verificando que no se hayan colado errores de tipeado;
tambin se debe analizar la ausencia de datos y cualquier otra
anomala en el registro de los datos necesarios para el anlisis
correspondiente.
- Tratamiento de valores atpicos: existen valores atpicos porque
fueron mal ingresados a la base de datos, otros porque son
extraordinariamente raros u otros que son claramente explicable
por la interaccin de otra variable. En el primer caso lo aconsejable
es corregir los errores, en el segundo convendra eliminarlos de la
base de datos y en el ltimo caso conviene mantenerlos.

Enrique Morosini - Pg. 36

LIMPIEZA DE DATOS
- Tratamiento de valores atpicos: Los valores atpicos pueden
ser detectados mediante el examen de los grficos del proceso
Exploratorio.
Adems se pueden aplicar procesos especficos para identificar
los casos que presentan puntuaciones o datos fuera del rango
esperado, especficamente la funcin Control de calidad /
Grfico de control.
- Datos ausentes: Un problema importante es la presencia de
datos ausentes en la matriz base. Cuando stos datos ausentes
representan un nmero importante se aplican mtodos de
imputacin para estimar la posible respuesta ausente.

Enrique Morosini - Pg. 37

LIMPIEZA DE DATOS
Ejercicio 5
1. Con la misma base Ejercicio 01.xls abierta
2. Ejecutar el men Anlizar / Estadsticos Descriptivos /
Explorar y luego seleccionar las variables: edad, SAT04 y Hs03.
3. Comentar los resultados en trminos de datos atpicos y
variables con datos ausentes.

Enrique Morosini - Pg. 38

CONTRASTE DE HIPTESIS
Qu es un contraste de hiptesis?

Enrique Morosini - Pg. 39

CONTRASTE DE HIPTESIS
Qu es un contraste de hiptesis?
Es un procedimiento que se encuentra en el centro de las
decisiones estadsticas y los errores que suponen ese
procedimiento.
El razonamiento bsico del contraste de hiptesis es el siguiente:
qu probabilidad tenemos de que los datos observados sean
iguales al resultado hipotetizado?
La mayora de las pruebas estadsticas ofrecen resultados
acompaados del valor p (probabilidad) en funcin a la
comparacin del resultado con relacin a la hiptesis nula (de no
efecto o no diferencia).

Enrique Morosini - Pg. 39

CONTRASTE DE HIPTESIS
Los insumnos ms importantes en la toma de decisiones es la
estadstica inferencial basada en la estimacin de parmetros y la
idea de distribucin muestral.
Resumiendo se puede decir que el Contraste de Hiptesis es un
proceso de decisin en el que una hiptesis formulada en trminos
estadsticos es puesta en relacin con los datos empricos para
determinar si es o no compatible con ellos.
Los supuestos:
- Que una muestra dada pertenece a una distribucin poblacional conocida.
- Que existe un estadstico de contraste capaz de ofrecer informacin.
- Que existe un conjunto de reglas que guan la toma decisiones.

Enrique Morosini - Pg. 40

CONTRASTE DE HIPTESIS
Proceso para la estimacin de parmetros:
- Dada la distribucin muestral de determinado parmetro y la
formulacin de la hiptesis estadstica se establecen las reglas de
inferencia.
- Supongamos la distribucin normal, que responde a la ley de los
grandes nmeros y al teorema central del lmite, dada cierta
hiptesis, se conocen las probabilidades asociadas a ciertos valores
estandarizados, es decir, si conocemos la hiptesis nula y tenemos
un valor emprico se podra estimar el valor probabilstico de
obtener tal o cual valor en unidades estandarizadas.

Enrique Morosini - Pg. 41

CONTRASTE DE HIPTESIS
Probabilidad bajo la distribucin normal:

90%
95%
99%
Ho
Enrique Morosini - Pg. 42

CONTRASTE DE HIPTESIS
Consideraciones centrales
- La mayora de las pruebas estadsticas ponen a prueba la
hiptesis nula, por lo tanto el valor p asociado a dichas pruebas
representa la probabilidad de que el resultado obtenido sea una
desviacin aleatoria de la hiptesis nula. Entendindose por
hiptesis nula la ausencia de efecto de la variable independiente.
- Las hiptesis nulas, estricto sensu, no se aceptan, lo que se
puede afirmar es que no existe evidencia suficiente para rechazar
la hiptesis nula a qu se debe esta situacin?

Enrique Morosini - Pg. 43

CONTRASTE DE HIPOTESIS
Pruebas paramtricas y no paramtricas
Introduccin
Las pruebas de contraste de hiptesis se clasifican en
paramtricas y no paramtricas (tambin conocidas como
pruebas de distribucin libre o libre de distribucin). La
diferencia se basa en las suposiciones de los parmetros de la
poblacin existentes y el tipo de datos analizables.

Enrique Morosini Pg. 44

CONTRASTE DE HIPTESIS
Pruebas paramtricas
Las pruebas paramtricas tienen dos caractersticas:
1. Su clculo requiere la estimacin, a partir de los datos
muestreados, de los parmetros de la poblacin.
2. Realizan suposiciones acerca de la naturaleza de ciertos
parmetros de la poblacin.

Enrique Morosini Pg. 45

CONTRASTE DE HIPTESIS
Pruebas paramtricas
Parmetros y estadsticos
Cuando realizamos un estudio
tomando una muestra de una
poblacin N, suponemos que
sta tiene parmetros: media
(); desviacin (); varianza
(2); etc.
La muestra n nos proporciona
una informacin: media (X);
desviacin (S); varianza (S2)
Enrique Morosini Pg. 46

CONTRASTE DE HIPTESIS
Pruebas paramtricas
SUPUESTOS

(Clark-Carter, 2002, pp. 195-196)

Las pruebas paramtricas requieren que la poblacin de


puntuaciones de la cual proviene la muestra, est distribuida
normalmente [ver propiedades de la distribucin normal].
Cuando se comparan grupos, se exige que las mediciones sean
independientes y las respuestas de cada individuo tambin.
Que los datos estn en una escala de intervalo o razn.
Esta exigencia es discutida ya que existe otra posicin
considerada abierta que sostiene que los nmeros no
tienen conciencia de su origen (ver Lord, 1953).
Enrique Morosini Pg. 47

CONTRASTE DE HIPTESIS
Pruebas paramtricas
Estadsticos ms utilizados
Prueba t (dos grupos):
De diferencia de medias no relacionadas.
De diferencia de medias relacionadas.

Prueba f - ANOVA (ANalysis Of VAriance) (ms de dos grupos):

De una sola variable independiente.


Factorial o de ms de una variable independiente.
De medidas repetidas de una sola VI.
De medidas repetidas factorial de ms de una VI.

Correlaciones bivariadas y mltiples:


R de Pearson, coeficientes de regresin.
Enrique Morosini Pg. 48

CONTRASTE DE HIPTESIS
Pruebas no paramtricas
Cuando los datos se encuentran en una escala ordinal es posible
utilizar la prueba de una muestra de Kolmogorov-Smirnov. Sin
embargo es poco frecuente y se suele utilizar la 2 (ji o chi cuadrado).
Se suele recomendar su uso cuando no se cumplen los supuestos
para la aplicacin de las pruebas paramtricas, especialmente las
relacionadas con la normalidad (simetra, homocedasticidad y
curtosis).
Tambin se suelen recomendar su uso cuando los datos son de
tipo categrico u ordinal.

Enrique Morosini Pg. 49

CONTRASTE DE HIPTESIS
Pruebas paramtricas
Estadsticos ms utilizados
Para una sola muestra:
Prueba de Kolmogorov-Smirnov.
Prueba 2 (ji o chi cuadrado).
Prueba de Wilcoxon.
Prueba de los signos.
Para dos grupos:
Prueba de Mann-Whitney.
Prueba de Wilcoxon.

Enrique Morosini Pg. 50

CONTRASTE DE HIPTESIS
Pruebas paramtricas
Estadsticos ms utilizados

(cont.)

Para ms de dos grupos:


Prueba de Kruskal-Wallis.
Prueba de Friedman.

Correlacin de variables:
r de Spearman.
de Kendall.
de Goodman y Kruskal.
W de Kendall.

Correlacin y regresin mltiple:


Modelos loglineales jerrquicos.
Modelos Logit.
Enrique Morosini Pg. 51

CONTRASTE DE HIPOTESIS
Pruebas paramtricas y no paramtricas
Consideraciones especiales

(Morales, 2006, p. 41)

Existen lneas argumentales de distintos autores que justifican la


preferencia en el uso de pruebas PARAMTRICAS:
1.
2.

3.

Los nmeros son ciegos y la aplicabilidad de los mtodos estadsticos


depende de los supuestos del modelo y no del origen de los datos.
Las escalas de medicin que se utilizan en Psicologa pueden considerarse
escalas de intervalo imperfectas, ya que el rasgo latente observado
posiblemente sea continuo y no categrico.
Hay suficientes pruebas experimentales que avalan la aplicabilidad de los
mtodos paramtricos, su robustez a pesar de la violacin de sus
supuestos y la debilidad de los no paramtricos (errores de tipo II).
4. Los mtodos no paramtricos son con frecuencia inconsistentes.
Enrique Morosini Pg. 52

CONTRASTE DE HIPOTESIS
Pruebas paramtricas y no paramtricas
Ejemplo
Un ejemplo MONTECARLO referente a la independencia de la
distribucin poblacional para la distribucin normal de un
estadstico paramtrico (la media aritmtica).
[una aproximacin a la teora de los grandes nmeros].
1.
2.
3.
4.

Abrir una planilla Excel.


Generar nmeros aleatorios entre 1 y 5.
Calcular el promedio.
Generar rplicas de muestras y analizar los resultados.

Enrique Morosini Pg. 53

CONTRASTE DE HIPOTESIS
EJERCICIOS
Trabajo 1.
1. Lluvia de ideas sobre los posibles diseos que podran
estar vinculados con los datos de la base Ejercicios 1.
2. Comparacin de anlisis paramtricos y no
paramtricos.
3. Anlisis del caso: prueba t; r de person; ji-cuadrada.

Enrique Morosini Pg. 54

CONTRASTE DE HIPOTESIS
EJERCICIOS
Trabajo 2: en grupo
1. Formar espontneamente grupos de 3 o 4 personas.
2. Formular un breve y rpido plan de anlisis de los datos
contenidos en la planilla Ejercicio 1.
3. Definir: Problema, objetivos, hiptesis y forma de
contrastar la hiptesis (= diseo y anlisis).
4. Realizar el anlisis y presentar las conclusiones.
Enrique Morosini Pg. 55

CONTRASTE DE HIPTESIS
La comparacin 2 de medias
Uno de los contrastes ms habituales es el que se refiere a la
comparacin de dos grupos de datos. El primer elemento a
considerar es si stos fueron formados aleatoriamente y si
las variables que se van a comparar estn o relacionadas.
En caso de que se trate de grupos independientes y las

variables no estn relacionadas se utiliza la prueba t de


diferencia de medias no relacionadas.
En caso de que las medidas a compara s estn

relacionadas se utiliza la prueba t de diferencia de medias


correlacionadas.

Enrique Morosini - Pg. 58

CONTRASTE DE HIPTESIS
La comparacin 2 de medias
Ejercicio 6
1. Abrir la base de datos Ejercicio01.xls.
2. Seleccionar la funcin Analizar / Comparacin de medias /
Prueba t para muestras independientes.
3. En la ventana Variables para contrastar colocar la variable
edad.
4. En la ventana Variable agrupacin colocar la variable sexo.
5. Luego selecionar Definir grupo e indicar que el grupo 1
tendra valor 1 y el grupo 2 valor 2.

Enrique Morosini - Pg. 59