Sei sulla pagina 1di 117

Área de Estadística

Lima-Perú
2020
GUÍA DE LABORATORIO DE ESTADÍSTICA GENERAL

Derechos Reservados 2020

Área de Estadística

Primera Edición 2020

Diseño y Diagramación

Universidad Científica del Sur

Panamericana Sur km 19 - Lima 42

Lima-Perú 610-6400

2
Rector
Dr. Manuel Rossemberg

Presidente Ejecutivo
Luis Javier Cardó Soria

Vicerrectos Académico
José Agustín Ortiz Elías

Director de Cursos Básicos (e)


Sarita Bocanegra Gonzales

Coordinador de Matemática y Estadística


Sarita Bocanegra Gonzales

3
INDICE

5
Conociendo el SPSS
Ingreso de variables 6

9
Tablas y gráficos de frecuencias (variable cualitativa)

11
Edición de gráficos
Tablas de contingencia para variables cualitativas 20
Tipos de Gráficos (con 2 variables) 22
Tablas y gráficos de frecuencias (variable cuantitativa discreta) 34

Tablas y gráficos de frecuencias por intervalos 35

Tablas de frecuencias para variables agrupadas 42


Tablas de frecuencias con 3 variables 45
Medidas de Tendencia Central 47
Medidas de Posición 51
Medidas de Dispersión 52
Medidas de forma de una distribución 54
Diagrama de tallos y hojas. Gráfico de cajas y bigotes 58
Muestreo Aleatorio Simple 62
Regresión y Correlación lineal simple 78
Tablas de contingencia y Prueba Chi Cuadrado 97

4
CONOCIENDO EL SPSS
IBM SPSS 26

Para dar inicio al software estadístico primeramente hacemos clic en IBM SPSS
Statistics 26. Se muestra la presentación del programa.

Cuando se trabaja con IBM SPSS, existen dos ventanas principales: el Editor de datos
y el Visor de resultados

Editor de datos: Esta ventana presenta dos vistas: (1) Vista de datos, donde se muestran
o ingresan los datos (numérico o de cadena). Se observará una ventana que contiene tantas
filas como casos; y (2) Vista de variables, en esta ventana se podrá asignar el nombre de
la variable (No acepta palabras separadas) el tipo, ancho de columna (N° de caracteres),
decimales, etiqueta, valores (se asignan códigos a cada una de las categorías de la variable
cualitativa) y la medida (escala involucra a toda variable cuantitativa). Se observará una
ventana que contiene tantas filas como variables.

5
Visor de resultados: Esta ventana muestra los resultados obtenidos de un procedimiento
estadístico como son las tablas y gráficos que se van generando de acuerdo al
procedimiento utilizado. Es aquí donde se realiza la edición de los resultados obtenidos:
poner título, copiar las tabla y gráficos, guardar o imprimir los resultados.

Ingreso de Variables
ARCHIVO: PRESALUD

Este archivo contiene información acerca de 45 madres que acudieron a cierto hospital
para ser atendidas por parto.

Caso Edad Estado Civil Partos Peso Sexo

1 25 1 2 2,90 2
2 22 1 2 2,90 2
3 32 1 4 4,04 1
4 22 1 1 4,35 2
5 18 2 1 3,60 1
6 21 2 3 3,50 1
7 20 3 2 3,20 1
8 19 2 1 3,00 2
9 23 2 3 3,60 1
10 26 2 2 2,80 1
11 36 2 5 3,00 1
12 30 1 5 3,30 2
13 23 3 3 3,10 2
14 29 1 4 3,30 2
15 22 1 2 3,30 2
16 23 2 1 3,50 2
17 27 1 2 3,62 1
18 28 1 3 3,30 2
19 19 1 1 2,65 2
20 32 2 2 2,86 2
21 17 1 1 2,62 1
22 21 1 2 3,56 2
23 18 2 2 3,10 1
24 27 1 3 3,62 2
25 21 2 1 3,18 1
26 19 2 1 2,95 1
27 19 1 2 3,90 1
28 31 2 3 3,00 2
29 32 2 4 4,00 2
30 21 1 2 3,85 1
31 23 2 2 2,75 2

6
32 19 2 1 3,18 2
33 19 1 1 3,14 2
34 26 1 3 3,08 2
35 18 2 1 2,80 2
36 24 2 2 3,40 1
37 30 2 3 3,00 2
38 26 2 3 3,05 2
39 19 2 1 2,90 2
40 34 2 3 3,10 2
41 28 2 3 3,40 1
42 24 2 2 2,97 2
43 26 2 2 2,94 2
44 22 2 2 3,80 1
45 34 2 5 4,65 2
Las variables bajo estudio son:

Edad

Estado Civil:

1: Conviviente 2: Casada 3: Soltera

Partos: Número de partos de la madre

Peso: Peso del recién nacido

Sexo: Del recién nacido

1: Masculino 2. Femenino

Primeramente hacemos clic con el mouse en Vista de variables (Figura 1) y empezamos


a dar Nombre a cada una de las variables: Edad, Estado civil (EC), Partos y Sexo. Luego
definimos sus características: Tipo de variable: numérico, Anchura: 8, N° de Decimales,
Etiqueta (Acepta el nombre completo de la variable) Valores (aquí asignaremos los
códigos a cada una de las categorías de las variables estado civil y sexo) y Medida tal
como aparece en la siguiente figura.

7
Figura 1

Luego hacemos clic con el mouse en Vista de datos (Figura 2) y aparecerá en cada
columna las variables creadas. Luego se ingresa la información para cada una de las 45
madres (una en cada fila). En este caso todos los datos son de tipo numérico

Hay que tener en cuenta que si hubiera decimales como es el caso de la variable peso; el
SPSS no acepta el punto sino la coma.

8
Figura 2

Tablas Estadísticas con una sola variable cualitativa


Variable: Estado Civil
Analizar Estadísti cos descriptiv os. Frecuencias . Seleccionamos la variable
estado civil (Figura 3) luego pulsamos Aceptar y se obtienen los resultados de la tabla 1

9
Figura 3
Estado civil
Porcentaje Porcentaje
Tabla 1 Frecuencia Porcentaje válido acumulado
Válido Conviviente 17 37,8 37,8 37,8
Casada 26 57,8 57,8 95,6
Soltera 2 4,4 4,4 100,0
Total 45 100,0 100,0

Luego copiamos la tabla 1 y lo pegamos en el Word y haciendo algunas modificaciones


en dicha tabla obtenemos la tabla 2

Tabla 2. Distribución de las madres, según estado civil

Estado Civil Cantidad Porcentaje


Conviviente 17 37,8
Casada 26 57,8
Soltera 2 4,4
Total 45 100,0

En la tabla 2 podemos observar que el 57.8% de las madres son casadas, seguido de un
37.8% que son convivientes; mientras sólo el 4.4% son madres solteras

Representaciones Gráficas

10
Gráfico de Barras Simples
Gráfi cos Cuadros de diá log o antiguos Barras . Al hacer clic en Barras
aparece la figura 4; elegimos Simples y Resúmenes para grupos de casos

Figura 4

Luego pulsamos Definir y se obtiene la figura 5.


En esta figura elegimos: % de casos (lo más recomendable). En la opción Eje de
categorías insertamos la variable Estado civil.
Luego Aceptar y obtenemos el Gráfico 1

Figura 5

Gráfico 1: Gráfico de Barras Simples

11
Enseguida trataremos de mejorar el gráfico 1.
Para ello damos un doble clic sobre una de las barras del gráfico 1. Luego clic derecho y
elegimos Mostrar etiquetas de datos; obtenemos el gráfico 2

Gráfico 2

Nuevamente clic derecho sobre una de las barras del gráfico 2. Elegimos Ventana
Propiedades y obtenemos la figura 6.

12
Figura 6

Luego pulsamos Profundidad y ángulo y aparece la figura 7. Aquí elegimos 3D y en


Distancia insertamos el valor 20

Figura 7

Finalmente Aplicar y después Cerrar. Obtenemos el gráfico 3

Gráfico 3

13
Enseguida prodecemos a darle color a cada una de las barras, obteniendo el gráfico 4

Gráfico 4

Gráfico de Sectores Circulares


Gráfi cos Cuadros de diá log o antiguos Circular

14
Luego se sigue los mismos pasos que se hizo para obtener el Gráfico de Barras Simples
y se obtiene el gráfico 5. También este gráfico se puede mejorar en forma similar a lo que
se hizo en el gráfico de barras simples, obteniéndose de esta manera el gráfico 6

Gráfico 5

Gráfico 6

Como se puede apreciar este gráfico no tiene una buena presentación; por lo que se
recomienda hacer dicha gráfica en Excel.

Gráfico de Sectores Circulares en Excel


Para obtener los porcentajes, ubicamos el cursor en C2 y allí creamos la fórmula:

=(B2/45)*100 luego Enter y obtenemos el valor 37.8 tal como se observa en la figura 8

15
Figura 8

Después hacemos un arrastre hacia abajo y obtenemos los demás porcentajes, los cuales
se observan en la figura 9

Figura 9

Seguidamente ubicamos el cursor en la celda A2 y seleccionamos las celdas A3 y A4


luego manteniendo presionada la tecla Control, seleccionamos las celdas C2, C3 y C4
tal como se aprecia en la figura 10

16
Figura 10

Ahora pulsamos Insertar y en la opción gráfico circular o de anillos, elegimos Gráfico


circular 3D (Ver figura 11); y obtenemos el Gráfico 7.

Figura 11

Gráfico 7

17
Después damos un clic derecho sobre este gráfico y elegimos Agregar etiquetas de
datos, obteniéndose el gráfico 8

Gráfico 8

18
Similarmente podemos elegir después de pulsar Insertar la opción insertar gráfico de
columnas o de barras y a partir de allí elegir Columna en 3-D obteniendo luego de hacer
cambios en el color y algunos otros ajustes; el gráfico 9

Gráfico 9

Estado civil de las madres

57.8
60

50
37.8
40

30

20

10 4.4

0
Conviviente Casada Soltera

Tareas
Con la variable Sexo de los recién nacidos:

a) Obtener una tabla de frecuencias. Interprete


b) Utilizando los programas SPSS y Excel represente gráficamente a la variable sexo
a través de gráficos de barras simples y de sectores circulares.

19
Tablas de contingencia para variables cualitativas
Variables: Estado Civil y Número de hijos
Analizar Estadísti cos descriptiv os Tablas cruzadas Al hacer clic sobre Tablas
cruzadas aparece la figura 12

Figura 12

Luego en dicha figura colocamos en Filas a la variable Estado civil y en Columnas a la


variable N° de partos (Ver figura 13) Finalmente Aceptar y obtenemos la tabla 3

Figura 13

20
Tabla 3 Tabla cruzada Estado civil*Nº de partos
Recuento
Nº de partos
1 2 3 4 5 Total
Estado civil Conviviente 4 7 3 2 1 17
Casada 8 8 7 1 2 26
Soltera 0 1 1 0 0 2
Total 12 16 11 3 3 45

Enseguida presentaremos dicha tabla pero expresado en porcentajes (lo más recomendable)
A partir de la figura 13 pulsamos Casillas. En Porcentajes elegimos Total (Ver figura
14)
Finalmente Continuar Aceptar y obteniendo la Tabla 4

Figura 14

Tabla 4. Distribución de las madres, según estado civil y Número de


partos

Nº de partos
1 2 3 4 5 Total
Estado civil Conviviente 8,9% 15,6% 6,7% 4,4% 2,2% 37,8%
Casada 17,8% 17,8% 15,6% 2,2% 4,4% 57,8%
Soltera 2,2% 2,2% 4,4%
Total 26,7% 35,6% 24,4% 6,7% 6,7% 100,0%

21
En la Tabla 4 podemos observar que el 8.9% son madres convivientes que han tenido su
primer parto. Si elegimos en la figura 15 Porcentajes en Columna obtenemos la Tabla 5

Figura 15

Tabla 5 Tabla cruzada Estado civil*Nº de partos


% dentro de Nº de partos
Nº de partos
1 2 3 4 5 Total
Estado civil Conviviente 33,3% 43,8% 27,3% 66,7% 33,3% 37,8%
Casada 66,7% 50,0% 63,6% 33,3% 66,7% 57,8%
Soltera 6,3% 9,1% 4,4%
Total 100,0% 100,0% 100,0% 100,0% 100,0% 100,0%

La Tabla 5 nos muestra que 63.6% de las madres que han tenido su tercer parto son
casadas. Así mismo el 33.3% de las madres que han tenido su primer hijo son
convivientes.

Por otro lado; si elegimos Porcentajes en Fila obtenemos la Tabla 6


Tabla 6
Tabla cruzada Estado civil*Nº de partos
% dentro de Estado civil
Nº de partos
1 2 3 4 5 Total
Estado civil Conviviente 23,5% 41,2% 17,6% 11,8% 5,9% 100,0%
Casada 30,8% 30,8% 26,9% 3,8% 7,7% 100,0%
Soltera 50,0% 50,0% 100,0%
Total 26,7% 35,6% 24,4% 6,7% 6,7% 100,0%

22
En la tabla 6 podemos observar que el 41,2% de las madres convivientes han tenido su
segundo parto.

Representación Gráfica: Gráfico de barras múltiples


Analizar Estadísti cos descriptiv os Tablas cruzadas

Figura 16

Si en la figura 16 seleccionamos Mostrar los gráficos de barras agrupadas y pulsamos


Aceptar obtenemos un gráfico que luego de hacer algunos reajustes queda tal como se
observa en el gráfico 10

Gráfico 10

En el gráfico 10 podemos observar que entre las madres convivientes 7 de ellas han sido
atendidas por su segundo parto. Entre las madres casadas 8 han acudido al hospital por su
primer o segundo parto y 7 por su tercer parto. En lo que respecta a las madres solteras
son dos; una de ellas ha tenido su segundo parto y la otra su tercer parto.

23
OTROS EJERCICIOS
1.- Se realizó un estudio para determinar la cantidad de personas que obtienen un empleo.
La siguiente tabla incluye datos de 400 sujetos seleccionados al azar:

Fuentes de empleo Nº de
sujetos

Anuncios clasificados 56

Empresas de búsqueda de ejecutivos 44

Contactos profesionales 280

Correo masivo 20

Total 400

Estando en EXCEL primeramente obtenemos los porcentajes que se observan en la


columna C (Figura 17); para esto creamos la fórmula en la celda C3 de la siguiente
manera:

=(B3/400)*100 luego Enter; seguidamente hacemos un arrastre.

Luego seleccionamos las celdas desde A3 hasta A6 y manteniendo presionado la tecla


Control seleccionamos las celdas desde C3 hasta C6.

Figura 17

Luego pulsamos Insertar y elegimos Insertar gráfico de columnas o de barras y dentro


de esas opciones elegimos Barra en 3-D tal como se observa en la figura 18.

24
Figura 18

Después de hacer algunas modificaciones en el gráfico obtenido resulta finalmente el


gráfico 11

Gráfico 11

CORREO MASIVO 5

CONTACTOS PROFESIONALES 70

EMPRESAS DE BÚSQUEDA DE EJECUTIVOS 11

ANUNCIOS CLASIFICADOS 14

0 10 20 30 40 50 60 70

2.- En marzo de 1995 la inversión extranjera en el Perú y de acuerdo al país de origen


fue como sigue:

España 46% Países Bajos 6%

EE.UU. 16% Panamá 5%

Reino Unido 8% Chile 4%

Otros 15%

25
Representar gráficamente dicha información.

En primer lugar, pulsamos la pestaña Vista de variables e ingresamos las variables tal
como se observa en la figura 19

Figura 19

Luego pulsamos la pestaña Vista de datos e ingresamos los datos tal como se aprecia en
la figura 20

Figura 20

Luego Gráfi cos Cuadros de diá log o antiguos Barras y elegimos las opciones
que aparecen en la figura 21

Figura 21

26
Al pulsar Definir obtenemos el siguiente cuadro de diálogo y asignamos las variables en
su respectivo lugar tal como aparece en la figura 22

Figura 22

Finalmente hacemos clic sobre Aceptar y obtenemos el gráfico 12

Gráfico 12

Después de hacer algunos reajustes sobre el gráfico 12 obtenemos el gráfico 13


Gráfico 13

27
3.- La siguiente información se refiere al número de estudiantes matriculados en tres
especialidades de Administración de Empresas, durante los años 2,000 y 2,005.

Representar gráficamente la información contenida en el siguiente cuadro

Especialidad 2000 2005

Finanzas 160 250

Marketing 140 200

Contabilidad 100 150

Empezando por Vista de variables (Ver figura 23)

28
Figura 23

Luego seleccionamos Vista de datos e ingresamos los datos (Ver figura 24)

Figura 24

Gráfi cos Cuadros de diá log o antiguos Barras Nos mostrará la figura 25

Figura 25

29
Al pulsar Definir completamos los recuadros tal como se observa en la figura 26

Figura 26

luego pulsamos Aceptar y obtenemos el gráfico 14 (Gráfico de barras dobles)

Gráfico 14 Se observa un incremento en la cantidad de estudiantes en el año 2005 con


respecto al 2000 en las tres especialidades

Ahora determinaremos en qué especialidad el incremento porcentual fue mayor usando


EXCEL. Como se puede ver en la figura 27 en la especialidad de Finanzas el alumnado
creció en un 56.25% el año 2005 con respecto al año 2000 por otro lado en Contabilidad
el incremento en la matrícula fue de un 50%; un crecimiento menor se observó en
Marketing (42.86%).

30
Figura 27

Gráfico 15: Gráfico de Barras Bidireccionales


Este gráfico es apropiado cuando lo quiere mostrar son crecimiento y decrecimiento
porcentuales en la variable (en este caso se ha observado que ha habido crecimiento en
las tres especialidades)

Variación porcentual Matrícula 2005/2000

CONTABILIDAD 50

MARKETING 42.85714286

FINANZAS 56.25

0 10 20 30 40 50 60

31
4.- Se tiene la siguiente información

Pacientes atendidos por enfermedades: Cardiovasculares y Tuberculosis (1987-1992)

Año TIPO DE ENFERMEDAD


Cardiovascular Tuberculosis
1987 30 50
1988 20 80
1989 50 100
1990 60 100
1991 100 110
1992 120 110

Representar gráficamente dicha información.

Ingresamos los datos en EXCEL y seleccionamos las celdas respectivas, tal como aparece
en la figura 28

Figura 28

Pulsamos Insertar y elegimos Insertar gráfico de línea o de áreas (Ver figura 29)

32
Figura 29

Finalmente se muestra el gráfico 16 en donde se puede observar que la tuberculosis


mostró un incremento significativo durante el período 1987 – 1989 y a partir de 1989 su
incremento ya fue controlado. Por otro lado las enfermedades cardiovasculares muestran
un descenso durante el período 1987 -1988 sin embargo a partir de 1988 muestra un
crecimiento acelerado hasta el año 1992 llegando inclusive a superar a la TBC en este
último año.

Gráfico 16

140

120

100

80

60

40

20

0
1987 1988 1989 1990 1991 1992

Cardiovascular Tuberculosis

33
Tabla de frecuencias para variable cuantitativa discreta (para
datos no agrupados)
Variable: Número de partos

Analizar Estadísti cos descriptiv os. Frecuencias . Seleccionamos la variable


Número de partos; luego pulsamos Aceptar en la figura 30 y obtenemos los resultados
que se muestran en la tabla 7 (modificada)

Figura 30

Tabla 07
Nº de partos
Porcentaje
N° de partos Cantidad Porcentaje acumulado
1 12 26,7 26,7
2 16 35,6 62,2
3 11 24,4 86,7
4 3 6,7 93,3
5 3 6,7 100,0
Total 45 100,0

En la tabla 07 se puede apreciar que el 35.6% de las madres han acudido al hospital por
su segundo parto, seguido de un 26.7% de madres quienes han tenido su primer parto y
muy de cerca un 24.4% quienes han ido para ser atendidas por su tercer parto.

34
Gráfico 17

Tablas y gráficos de frecuencias por intervalos (para datos


agrupados)
Variable: Peso (recién nacidos)
En primer lugar debemos definir los intervalos de clase para la variable peso. En este
caso lo agruparemos en 5 intervalos de clase.

Considerando un rango R = 4,65 – 2.62 = 2,03 Agruparemos los datos de acuerdo a la


siguiente tabla

Peso (kg)
2,61 – 3,02
3,02 – 3,43
3,43 – 3,84
3,84 – 4,25
4,25 – 4,66

Luego ingresamos al menú Transformar Agrupaciónvisual. (Figura 31)

35
Figura 31

En la figura 31 hacemos clic sobre Agrupación visual y aparece la figura 32


seleccionamos la variable Peso y la trasladamos al recuadro Variables para agrupar en
intervalos (Ver figura 32)

Figura 32

Enseguida pulsamos Continuar y obtenemos la figura 33

36
Figura 33

Seguidamente colocaremos en Valor en la cuadrícula 1 el límite superior del primer


intervalo (3,02) y a su lado derecho en Etiqueta definimos el primer intervalo de clase
2,61 – 3,02. Luego seguimos con la cuadrícula 2; y así sucesivamente. Además en el
recuadro Variable agrupada especificamos un nombre distinto al de la variable peso por
ejemplo (Peso _) quedando finalmente tal como se observa en la figura 34

Figura 34

Luego se presiona el botón Aceptar, nuevamente Aceptar. Después nuevamente

ingresamos al menú Analizar Estadísti cos descriptiv os Frecuencias

En la primera ventana elegimos la variable Peso (Agrupada) y haciendo un clic sobre el


botón lo trasladamos a la ventana Variables (Figura 35)

37
|

Figura 35

Finalmente presionamos el botón Aceptar y obtenemos la tabla 08

Tabla 08 Peso (Agrupada)

Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
Válido 2,61 - 3,02 16 35,6 35,6 35,6
3,02 - 3,43 15 33,3 33,3 68,9
3,43 - 3,84 8 17,8 17,8 86,7
3,84 - 4,25 4 8,9 8,9 95,6
4,25 - 4,66 2 4,4 4,4 100,0
Total 45 100,0 100,0

38
Después de copiar, pegar en el Word y haciendo algunos reajustes en la tabla 08;
obtenemos la tabla 09

Se puede observar en la tabla 08 que el 35.6% de los bebés nacieron pesando entre 2.61
y 3.02 kg seguido de un 33.3% quienes nacieron pesando entre 3.02 y 3.43 kg haciendo
un total de 68.9% quienes nacieron con un peso máximo de 3.43 kg

Tabla 09

Porcentaje
Peso (kg) Cantidad Porcentaje acumulado
2,61 - 3,02 16 35,6 35,6
3,02 - 3,43 15 33,3 68,9
3,43 - 3,84 8 17,8 86,7
3,84 - 4,25 4 8,9 95,6
4,25 - 4,66 2 4,4 100,0
Total 45 100,0

Representación gráfica: Histrograma de frecuencias

Utilizamos el menú Gráfi cos Cuadros de diá log o antiguos Histograma


(Ver figura 36)

Figura 36

39
Hacemos clic sobre Histograma y aparece el cuadro de diálogo Histograma, trasladamos
a la variable Peso (Agrupada) (Peso) tal como se observa en la figura 37

Figura 37

Al presionar el botón Aceptar obtenemos el gráfico 18 denominado Histograma

Hacemos algunos reajustes, luego Archivo Cerrar luego copiar y


pegar en el Word

Gráfico 18: Histograma para la variable Peso

40
Gráfico 19: Histograma con MINITAB

Pesos de los recién nacidos


40
35.5556
33.3333

30
Porcentaje

20 17.7778

10 8.88889

4.44444

0
2.61 3.02 3.43 3.84 4.25 4.66
Peso

Ahora estudiaremos a la Variable: Edad de las madres atendidas en el hospital

Rango: R = 36 – 17 = 19

La diferencia entre la madre más joven y la de mayor edad es de 19 años

K = 1 + 3,32 log 45 = 6,49 k=6

En este caso usaremos K = 5 (dado que no son muchos los datos)

Amplitud de los intervalos de clase: C = R/K C =19/5 = 3,8

Por lo tanto utilizaremos intervalos cerrados con una amplitud C = 4 (por estar expresado
las edades en números enteros)

La tabla 10 nos está mostrando que el 31.1% de las madres tienen edades entre
21 y 24 años seguido de un 26.7% de madres bastante jóvenes cuyas edades fluctúan entre 17 a 20 años y
y 20 años de edad.

41
Tabla 10

Edad (años) Cantidad Porcentaje


17 - 20 12 26,7
21 - 24 14 31,1
25 - 28 9 20,0
29 - 32 7 15,6
33 - 36 3 6,7
Total 45 100,0

Tabla de Contingencia para variables agrupadas


Primeramente presentaremos a dichas variables en forma agrupada (categorizada) para
que no se disperse la información. Los pasos a seguir son similares a lo ya visto en tablas
para datos agrupados, con una ligera variación tal como se observa en la figura 38

Figura 38

A partir de la figura 38 obtenemos la tabla 11

Tabla 11

Peso (Agrupada)
Porcentaje Porcentaje
Frecuencia Porcentaje
válido acumulado
Menor o igual a 3,0 16 35,6 35,6 35,6
Válido 3,0 - 3,8 23 51,1 51,1 86,7
Más de 3,8 6 13,3 13,3 100,0

42
Total 45 100,0 100,0

Hacemos lo mismo para la variable edad, tal como se observa en la figura 39

Figura 39

Luego a partir de la figura 39 obtenemos la tabla 12

Tabla 12

Edad (Agrupada)
Frecuenci Porcentaje Porcentaje
a Porcentaje válido acumulado
Válido 17 - 20 12 26,7 26,7 26,7
21 - 30 26 57,8 57,8 84,4
Más de 30 7 15,6 15,6 100,0
Total 45 100,0 100,0

Cruzamos las tablas 11 y 12: Analizar Estadísti cos descriptiv os Tablas cruzadas
Hacemos clic en el botón Aceptar e insertamos las variables agrupadas creadas. Se
recomienda colocar a la variable dependiente Peso (Agrupada) como columna (Fig 40)

43
Figura 40

Presionamos el botón Aceptar y obtenemos la tabla 13.

Tabla 13 Tabla cruzada Edad (Agrupada)


*Peso (Agrupada)
Recuento
Peso (Agrupada)
Menor o igual a
3,0 3,0 - 3,8 Más de 3,8 Total
Edad (Agrupada) 17 - 20 6 5 1 12
21 - 30 7 17 2 26
Más de 30 3 1 3 7
Total 16 23 6 45

Para una mejor interpretación presentaremos la tabla 13 expresada en porcentajes por


columna (Ver tabla 14)

Tabla 14

Tabla cruzada Edad (Agrupada)

*Peso (Agrupada)
% dentro de Peso (Agrupada)
Peso (Agrupada)
Menor o igual a
3,0 3,0 - 3,8 Más de 3,8 Total
Edad (Agrupada) 17 - 20 37,5% 21,7% 16,7% 26,7%
21 - 30 43,8% 73,9% 33,3% 57,8%
Más de 30 18,8% 4,3% 50,0% 15,6%
Total 100,0% 100,0% 100,0% 100,0%

En la tabla 14 se observa que el 43.8% de los bebés que nacieron con un peso máximo de
3 kg provienen de madres cuyas edades están entre 21 y 30 años de edad; y el 37.5%
proceden de madres jóvenes que tienen a lo mucho 20 años. Por otro lado el 50% de los
bebés que nacieron con un peso mayor a 3.8 kg provienen de madres con más de 30 años
de edad.

44
Tabla 15

Tabla cruzada Edad (Agrupada)*Nº de partos


% del total
Nº de partos
1 2 3 4 5 Total
Edad (Agrupada) 17 - 20 20,0% 6,7% 26,7%
21 - 30 6,7% 26,7% 20,0% 2,2% 2,2% 57,8%
Más de 30 2,2% 4,4% 4,4% 4,4% 15,6%
Total 26,7% 35,6% 24,4% 6,7% 6,7% 100,0%
En la tabla 15 se puede observar a las variables Edad y Número de partos presentadas en
una tabla cruzada, expresada en porcentajes con respecto al total. En esta tabla
observamos que el 26.7% de las madres han tenido su segundo parto a la edad de 21 a 30
años. También nos muestra que el 20% de las madres han tenido su primer hijo a la edad
de 17 a 20 años; un porcentaje similar de madres han tenido su tercer hijo a la edad 21 a
30 años.

Nota: Si observamos los totales de las columnas vemos que el 35.6% de las madres han
acudido al hospital por su segundo parto.

Tablas de Contingencia con 3 variables


En las tablas cruzadas se pueden analizar tres variables, la primera en la fila, la segunda
en la columna y la tercera en capa, como se muestra en el cuadro de diálogo siguiente:
Figura 41

Figura 41

45
Si para Filas se elige Edad (Agrupada); para Columnas, la variable N° de partos y para
Capa 1 de 1, la variable Estado civil y se hace clic en Aceptar, se mostrará como
resultado la siguiente tabla:

Tabla 16

46
Medidas de Tendencia Central

A partir de la información proporcionada por variables cuantitativas nos proponemos


hallar la media aritmética, la mediana y la moda.

En este caso hemos elegido a la variable Peso de los recién nacidos

Primeramente debemos ir al menú Analizar Ver figura 42

Figura 42

Analizar Estadísti cos descriptiv os Frecuencias Al hacer clic sobre Frecuencias,


para la caja Variables elegimos la variable Peso, según la figura 43. Seguidamente
hacemos clic sobre el botón Estadísticos y seleccionamos las medidas de tendencia
central Media, Mediana y Moda (Ver figura 44)

Figura 43

47
Figura 44

Finalmente presionamos el botón Continuar y después Aceptar (Resultados tabla 17)

En la tabla 17 se observa que la media es de aproximadamente 3.3 kg es decir el peso


promedio por bebé es de 3.3 kg. Por otro lado la mediana es igual a 3.18 kg esto significa
que el 50% de los bebés han nacido con un peso máximo de 3.18 kg y el 50% restante
con un peso mayor a 3.18 kg. Así mismo se observa que existe más de una moda (3.00 y
3.30) que vendrían a ser los pesos más frecuentes que se ha registrado.

Tabla 17
Estadísticos
Peso
Válido 45
N
Perdidos 0
Media 3,2836
Mediana 3,1800
Moda 3,00a

a. Existen múltiples modos. Se muestra el valor más pequeño.

48
Cálculo de Promedios, según categorías.
Se trata de calcular algunos promedios con respecto a ciertas categorías de una
variable cualitativa. En este caso determinaremos el peso promedio de los bebés,
según su sexo. Ingresamos al menú Datos tal como se observa en la siguiente figura

Datos Segmentar archivo Al dar clic en la opción “Segmentar archivo” elegimos


Comparar los grupos y luego en el recuadro “Grupos basados en” consideraremos a
la variable cualitativa Sexo, tal como se observa en la figura 45.

Figura 45

Luego al hacer clic sobre el botón Aceptar aparecerá un cierto mensaje.

49
Luego vamos al menú Analizar Estadísti cos descriptiv os Descriptiv os (fig. 46)

Figura 46

Enseguida elegimos la variable cuantitativa en este caso Peso y después damos clic
sobre el botón Aceptar en la figura 47 y obtenemos los resultados que se muestran en
la tabla 18

Figura 47

En la tabla 18 se observa que el peso promedio de los varoncitos es de 3.4 kg mientras


que las mujercitas han nacido con un peso promedio de 3.2 kg

Tabla 18
Estadísticos descriptivos

50
Desv.
Sexo N Mínimo Máximo Media Desviación
Masculino Peso 17 2,62 4,04 3,3859 ,40823
N válido (por lista) 17
Femenino Peso 28 2,65 4,65 3,2214 ,46508
N válido (por lista) 28

Cálculo de Medidas de Posición.


Ahora nuestro propósito es determinar algunas medidas de posición como los Cuartiles,
deciles y Percentiles. En este caso consideraremos a la variable Peso

Estos estadísticos se obtienen desde el cuadro de diálogo del menú


Analizar Estadísti cos descriptiv os Frecuencias Luego aparece el cuadro de
diálogo Frecuencias. Aquí, el primer paso consiste en trasladar al recuadro de la derecha
aquella variable que se desea analizar (Ver figura 48)

Figura 48

Al hacer clic sobre el botón Estadísticos elegimos Valores percentiles (si queremos
obtener medidas de posición) en este caso marcamos Cuartiles, Percentiles tal como se
observa en la figura 49 (si queremos determinar el percentil 80) luego Añadir y podemos
seguir añadiendo otros percentiles.

51
Figura 49

luego Continuar y después Aceptar Los resultados se muestran en la tabla 19

Al marcar Cuartiles el programa calcula automáticamente los percentiles equivalente a


los tres cuartiles. El cuartil 1 ó P25 = 2.96 lo cual nos indica que el peso máximo del 25%
inferior es de 2.96 kg. También observamos el cuartil 2 ó P50 (mediana); así como también
el cuartil 3 ó P75 = 3.58 kg es decir el peso máximo del 75% de estos bebés fue de 3.58
kg; este peso a su vez viene a ser el peso mínimo del 25% superior (cuarto superior).

También observamos al Percentil 80: P80 = 3.616 kg lo cual nos indica que el 80% de
estos bebés pesan a lo mucho 3.62 kg aproximadamente y el 20% restante pesa más de
3.62 kg. Este valor 3.62 kg viene a ser el peso mínimo del 20% superior (quinto superior).

Tabla 19

Estadísticos
Peso
N Válido 45
Perdidos 0
Percentiles 25 2,9600
50 3,1800
75 3,5800
80 3,6160

Medidas de Dispersión.
Ahora calcularemos algunas medidas de dispersión como la varianza, desviación estándar
y el rango que nos permitan analizar la variabilidad de los datos.

Estos estadísticos se obtienen desde el cuadro de diálogo del menú


Analizar Estadísti cos descriptiv os Frecuencias Luego aparece el cuadro de

52
diálogo Frecuencias. Aquí, el primer paso consiste en trasladar al recuadro de la derecha
aquella variable que se desea analizar. Elegiremos Peso (Ver figura 50)

Figura 50

Al hacer clic sobre el botón Estadísticos en la opción Dispersión marcamos dichas


medidas, tal como se observa en la figura 51 luego Continuar y después Aceptar.

Figura 51

Los resultados se observan en la tabla 20

53
Tabla 20

Estadísticos
Peso
N Válido 45
Perdidos 0
Desv. Desviación ,44703
Varianza ,200
Rango 2,03
Mínimo 2,62
Máximo 4,65

En cuanto al rango de los pesos podemos decir que la diferencia entre el bebé que nació
con un mayor peso y el de menor peso ha sido de 2 kg aproximadamente.

La desviación del peso de los recién nacidos con respecto a su promedio es de 0.45 kg en
promedio.

NOTA.- Se debe tener en cuenta que la varianza que se está mostrando como resultado
viene a ser la varianza muestral S2; si se quisiera determinar la varianza poblacional σ2 se
tendría que aplicar la siguiente transformación:

2 (n 1) S 2
n

Medidas de Forma de una Distribución


Estudiar la forma de una distribución implica, básicamente, valorar dos características:
asimetría y curtosis

Cálculo de Medidas de Asimetría y Curtosis.


Analizar Estadísti cos descriptiv os Frecuencias Seguidamente elegimos la
variable Peso y la trasladamos al recuadro de la derecha. Luego hacemos clic sobre el
botón de Estadísticos y elegimos Asimetría y Curtosis tal como se ve en figura 52.

Finalmente Continuar y Aceptar. Los resultados aparecen en la tabla 21

54
Figura 52

Tabla 21

Estadísticos
Peso
N Válido 45
Perdidos 0
Asimetría 1,035
Error estándar de asimetría ,354
Curtosis ,997
Error estándar de curtosis ,695

Según la tabla 21 se puede observar que para la variable peso; el índice de asimetría
(Asimetría = 1.035> 0 ) lo cual significa que dicha variable tiene una asimetría positiva;
es decir, muchos bebés nacieron con pesos relativamente bajo (por debajo de la media) y
pocos con peso alto.

55
Gráfico 21

Comprobación del valor de la Asimetría: Índice de Asimetría de


Pearson
Aplicando momentos:

45
n M3
As en donde M3 ( xi x )3
(n 1) (n 2) S 3 i 1

luego para n = 45 y x 3.2836 M3 3.8866

45 (3.8866)
As 1.035
44 (43) (0.447) 3

En cuanto a la curtosis; existen varias maneras de medir la curtosis de la distribución de


los datos; pero su aplicación sólo es recomendable cuando la distribución es simétrica.
En la tabla 21 se observa que (Curtosis = 0.997 > 0). Sin embargo, no se puede decir que
es leptocúrtica, porque la distribución de los datos no es simétrica.

56
Comprobación del valor de la Curtosis
La curtosis utilizando momentos es definida por la expresión:

n (n 1) M 4 3 M 2 M 2 (n 1)
K
(n 1) ( n 2) (n 3) S 4

En donde
45 45
2
M2 ( xi x ) 8.79263 M4 ( xi x ) 4 6.45788
i 1 i 1

Luego reemplazando en K tenemos:

45( 46) 6.45788 3 (8.79263) (8.79263) (44) 3162.846414


K 0.997
( 44) (43) (42) (0.447) 4 3172.491849

Expresiones del tipo “un valor próximo a cero” o “un valor más alejado de cero” ayudan
poco a tomar una decisión sobre el grado de asimetría o curtosis de una distribución.
Para resolver este problema puede recurrirse a una sencilla estrategia.
La estrategia consiste en dividir el índice de asimetría (o el de curtosis) entre su error
típico o error estándar. Si el resultado se encuentra entre -2 y 2 puede asumirse que la
distribución es simétrica (o mesocúrtica); si es mayor que 2 puede afirmarse que la
distribución es asimétrica positiva (o leptocúrtica); y si es menor que -2 puede afirmarse
que la distribución es asimétrica negativa (o platicúrtica).

Según la tabla 21 se puede observar que para la variable peso el índice de asimetría
(Asimetría = 1.035) dividido por su error típico (error estándar de asimetría = 0.354) da
un valor igual a 2.924 > 2 lo cual significa que dicha variable tiene una asimetría positiva.
En cuanto a la Curtosis (Curtosis = 0.997) dividido entre su error típico (error estándar de
curtosis = 0.695) da como resultado 1.435

57
Diagrama de Tallo y Hojas. Gráfico de Caja y Bigotes.
Permiten examinar los datos, identificar valores atípicos; ayuda también a establecer la
distribución de un conjunto de datos.

Diagrama de Tallo y Hojas


El diagrama de tallo y de hojas ofrece la misma información que un histograma, pero más
detallada: permite comprobar si existen valores que se repiten mucho o valores que no
aparecen.
Las filas primera y última del diagrama muestran (si los hay) el número de casos con
valores extremos y los valores que toman esos casos (entre paréntesis).

Estos diagramas se obtienen desde el cuadro de diálogo del menú

Analizar Estadísti cos descriptiv os Explorar Trasladamos la variable peso al


recuadro Lista de dependientes tal como se observa en la figura 53

Figura 53

Luego hacemos clic sobre el botón Aceptar y obtenemos la figura 54, en dicha figura
aparece en la última fila un caso atípico (entre paréntesis) con un peso mayor o igual a
4.7 kg

Figura 54. Diagrama de tallo y hojas para la variable peso

Frecuencia Stem & Hoja

12,00 2 . 667888999999
19,00 3 . 0000001111112333344
10,00 3 . 5556666889
3,00 4 . 003
1,00 Extremos (>=4,7)

Ancho del tallo: 1,00

58
En la figura 54 (Diagrama de tallo y hojas) para la variable peso se puede observar:
Primera fila 12 bebés nacieron pesando entre 2.6 a 2.9 kg distribuidos
de la siguiente manera:
2 nacieron con un peso de 2.6 kg
1 con un peso de 2.7 kg
3 con un peso de 2.8 kg
6 con un peso de 2.9 kg

Segunda fila 19 bebés nacieron pesando entre 3.0 y 3.4 kg distribuidos


de la siguiente manera:
6 con un peso de 3.0 kg
6 con un peso de 3.1 kg
1 con un peso de 3.2 kg
4 con un peso de 3.3 kg
2 con un peso de 3.4 kg

Y así sucesivamente ………………….

Gráfico de Caja y Bigotes.

En el gráfico 21 se observa la presencia de un dato atípico (4,65 kg) que corresponde al


caso Nº 45 ya que 4,65 se encuentra a más de 1.5 amplitudes intercuartílicas del percentil
75; a saber

Q3 1,5 RI 3,58 1,5 (3,58 2,96) 3,58 0,93 4,51

Gráfico 21: Gráfico de caja para la variable peso

59
Enseguida compararemos la distribución de los pesos en los bebés según su sexo, a través
de los diagramas de cajas. Estos diagramas se obtienen desde el cuadro de diálogo del
menú
Analizar Estadísti cos descriptiv os Explorar Trasladamos las variables peso y sexo
a los recuadros de la derecha tal como se aprecia en la figura 55

|
Figura 55

Luego, pulsamos el botón Aceptar y obtenemos entre otros resultados el gráfico 22

Gráfico 22: Gráfico de caja para la variable peso, según sexo

60
En el gráfico 22 podemos observar que el peso de los bebés de sexo femenino presentan
una mayor dispersión que el de los varones; ya que se tiene la presencia de dos datos
atípicos (correspondientes a los casos 4 y 29) inclusive se puede notar la presencia de un
caso extremo (caso Nº 45) ya que 4,65 se encuentra a más de 3 amplitudes intercuartílicas
del percentil 75 del peso de los bebés de sexo femenino.

Comprobación

Para ello necesitamos la información acerca de los cuartiles del peso de los bebés según
su sexo. Estando en la figura 55 hacemos clic sobre Estadísticos y aparece el recuadro
de la derecha, allí elegimos Percentiles luego Continuar, Aceptar y aparecerá entre
otros resultados los percentiles 75 y 25 de los bebés de sexo femenino los cuales se
muestran en la tabla 22

Figura 56

Tabla 22
Percentiles
Percentiles
Sexo
5 10 25 50 75 90 95
Masculino 2,6200 2,7640 3,0500 3,4000 3,7100 3,9280 .
Peso
Femenino 2,6950 2,7950 2,9100 3,0900 3,3000 4,0350 4,5150

Bisagras de Masculino 3,1000 3,4000 3,6200


Peso
Tukey Femenino 2,9200 3,0900 3,3000

Por lo tanto:

Q3 3 RI 3,3 3 (3,3 2,91) 3,3 1,17 4,47


61
MUESTREO ALEATORIO SIMPLE

En este caso usaremos la base de datos Practsalud; la cual contiene información acerca de
un total de 200 pacientes, cuyas variables bajo estudio son:

Edad

Sexo: Masculino = 1 Femenino = 2

Residencia del paciente: Ate = 1 La Victoria = 2 …………………….Otros = 11

Diagnóstico: F33 = 1 F32 = 2 …………………………. Otro diagnóstico = 8

Tipo de paciente: Consulta externa = 1 ………………….Sala de operaciones = 3

Consideremos que se trata de una población de 200 pacientes. Nuestra variable objeto de
estudio será la Edad. Haciendo una exploración de las edades podemos observar la
presencia de un dato casi extremo; se trata de la edad de un paciente identificado con el
número 150, cuya edad correspondiente es de 80 años; según el gráfico 01

Gráfico 01

62
Cálculo de los parámetros: Media poblacional y varianza poblacional
Excluyendo esa edad obtenemos los siguientes resultados:
Tabla 01

Estadísticos
Edad
N Válido 199
Perdidos 0
Media 30,67
Varianza 152,049

Podemos observar que la media poblacional µ = 30.67 años

Como ya se dijo anteriormente que el programa por defecto procesa los datos como si se
tratara de una muestra, por lo tanto la varianza 152.049 no es otra cosa que la varianza
muestral. En consecuencia la varianza poblacional sería:

2 198 (152.049)
151.285
199

Selección de una muestra Aleatoria: Estimación de la Media


Nuestro principal objetivo será estimar la edad promedio a partir de una muestra
aleatoria. En primer lugar lo haremos a partir de una muestra piloto de tamaño 30
seleccionada de la población de tamaño N = 199

Primeramente vamos al menú Datos Selecciona r casos

Figura 01

63
Al hacer clic sobre Seleccionar casos en la figura 01, aparece la figura 02 y elegimos
Muestra aleatoria de casos tal como se observa en la figura 02

Figura 02

Al presionar el botón Ejemplo aparece un pequeño recuadro, en el cual elegimos


Exactamente y especificamos el tamaño de la muestra 30 casos de los primeros 199
luego damos clic en Continuar (Figura 03) y después Aceptar

Figura 03

En Editor de datos (Figura 04) aparecerá una columna filter_$ en donde se puede
apreciar una serie de valores: ceros y unos; los cuales identifican a las muestras
(pacientes) que han sido seleccionadas, siendo estas identificadas con el número 1 y los
no seleccionados con el 0.

En la figura 04 se observa solo una parte de las 30 muestras seleccionadas

64
Figura 04

Luego ingresamos al menú Analizar Estadísti cos descriptiv os Explorar


(Ver figura 05)

Figura 05

65
Al hacer clic sobre Explorar aparece el cuadro de diálogo siguiente, aquí se selecciona
Edad y lo trasladamos a Lista de dependientes (Ver Figura 06)

Figura 06

Al pulsar Estadísticos aparece el cuadro de diálogo siguiente (figura 07), en donde por
defecto vemos seleccionado Descriptivos y elegido 95 como el porcentaje de
confiabilidad del intervalo de confianza para la media poblacional.

Nota.- El 95% de confiabilidad que se observa puede ser cambiado, de tal manera que
dicho porcentaje de confiabilidad quede a criterio del investigador.

| Figura 07

Luego pulsaremos Continuar, Aceptar y aparece el resultado que se muestra en la


siguiente tabla

66
Tabla 02

Descriptivos
Estadístico Error estándar
Edad Media 33,00 1,801
95% de intervalo de Límite inferior 29,32
confianza para la media Límite superior 36,68
Media recortada al 5% 32,72
Mediana 32,00
Varianza 97,310
Desviación estándar 9,865
Mínimo 18
Máximo 55
Rango 37
Rango intercuartil 15
Asimetría ,404 ,427
Curtosis -,497 ,833

De acuerdo a los resultados obtenidos con la muestra piloto de tamaño 30 podemos


concluir con un 95% de confiabilidad que la edad promedio de dichas madres estaría
entre 29.32 y 36.68 años.

También podemos concluir con un 95% de confiabilidad que la edad promedio de los
pacientes es de 33 años con un margen de error (e = 36.68 – 33) de 3.68 años.

Dicho de otra manera “la probabilidad de que la media muestral difiera de la verdadera
media en a lo más 3.68; es de 0.95”. Simbólicamente se puede expresar así:

P X 3.68 0.95
Considerando que el margen de error obtenido (e = 3.68) es muy grande, estimaremos el
tamaño de muestra apropiado, para reducir dicho margen de error a 2 años; con un 95%
de confiabilidad.

67
Estimación del tamaño de muestra

Z 2/2 2
n
e2
(1.96) 2 151.285
n 2
145.3 aprox 146
2
Pero como ya hemos considerado que el tamaño de la población es conocida N = 199
entonces haremos un reajuste del tamaño de muestra obtenido; de la siguiente manera:

n0
n
n0
1
N
146
n 84.2 aprox 85
146
1
199
El siguiente paso será extraer nuevamente una muestra aleatoria de tamaño 85 de la base
de datos, tal como se observa en la figura 08, luego Continuar, Aceptar (Ver fig. 9)

Figura 08

68
Figura 09

Luego siguiendo los mismos pasos vistos anteriormente es decir:

Analizar Estadísti cos descriptiv os Explorar y después eligiendo la variable Edad


obtenemos los resultados que se muestran en la tabla 03

Tabla 03

Descriptivos
Estadístico Error estándar
Edad Media 31,26 1,318
95% de intervalo de Límite inferior 28,64
confianza para la media Límite superior 33,88
Media recortada al 5% 30,84
Mediana 30,00
Varianza 147,718
Desviación estándar 12,154
Mínimo 5
Máximo 73
Rango 68
Rango intercuartil 15

69
Asimetría ,678 ,261
Curtosis ,790 ,517

De acuerdo a los resultados obtenidos en la tabla 03 podemos concluir con un 95% de


confiabilidad que la edad promedio de dichos pacientes es de 31.26 años. Si comparamos
el valor verdadero de la media (µ = 30.67) nos damos cuenta que el error de estimación
es apenas de 31.26 – 30.67 = 0.59

Cálculo de la Proporción Poblacional


Trataremos de determinar el valor de la proporción poblacional, para lo cual elegiremos a
la variable sexo. Específicamente trataremos de estimar la proporción de pacientes
varones.

Según nuestra base de datos, la codificación ha sido:

1 = Masculino 2 = Femenino

Primeramente haremos una recodificación en la variable Sexo, de tal manera que el valor
0 = Femenino; para esto entramos al menú:

Transformar Re codificar en las mismas var iables (Ver figura 10)

Figura 10

Al elegir Recodificar en las mismas variables aparece la figura 11 en donde elegimos la


variable Sexo y la trasladamos el recuadro de Variables numéricas. Ver figura 11

70
Figura 11

Luego pulsamos Valores antiguos y nuevos y aparece la figura 12 aquí etiquetamos con
el valor 2 para Valor antiguo y el valor 0 para Valor nuevo

Figura 12

En la figura 12 presionamos el botón Añadir y se muestra la figura 13

Figura 13

71
Finalmente Continuar y Aceptar; luego en Editor de datos se observará la figura 14

Figura 14

Para obtener el porcentaje de hombres y de mujeres entramos al menú

Analizar Estadísti cos descriptiv os Frecuencias y obtenemos la figura 15

72
Figura 15

Luego presionamos el botón Aceptar y se obtiene la tabla 04; en la cual se puede


observar que la proporción poblacional de pacientes de sexo masculino es de 43%

Tabla 04

Sexo
Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
Válido Femenino 114 57,0 57,0 57,0
Masculino 86 43,0 43,0 100,0
Total 200 100,0 100,0

73
Estimación de la Proporción Poblacional
Nuestro principal objetivo será estimar la proporción de pacientes varones a partir de la
muestra aleatoria de tamaño 80 (muestra piloto), seleccionada de la población de tamaño
N = 200

Primeramente vamos al menú Datos Selecciona r casos Al dar clic sobre Seleccionar
casos aparece la figura 16 en la cual elegimos Muestra aleatoria de casos

Figura 16

Al presionar el botón Ejemplo aparece un pequeño recuadro, en el cual elegimos


Exactamente y especificamos el tamaño de la muestra 80 casos de los primeros 200
luego damos clic en Continuar (Figura 17) y después Aceptar

Figura 17

En Editor de datos (Figura 18) aparecerá una columna filter_$ en donde se puede
apreciar una serie de valores: ceros y unos; los cuales identifican a las muestras

74
(pacientes) que han sido seleccionadas, siendo estas identificadas con el número 1 y los
no seleccionados con el 0.

En la figura 18 se observa solo una parte de las 80 muestras seleccionadas

Figura 18

Luego ingresamos al menú Analizar Estadísti cos descriptiv os Explorar


y aparece la figura 19 elegimos la variable Sexo y la trasladamos a Lista de
dependientes

Figura 19

Finalmente Aceptar y se observan los resultados que aparecen en la tabla 05. De acuerdo
a esta tabla podemos concluir con un 95% de confiabilidad que la proporción de
pacientes varones se estima estaría comprendido entre 35% y 57%.

75
También podemos concluir con un 95% de confiabilidad que la proporción de pacientes
varones es de 46% con un margen de error de 11%.

Tabla 05
Descriptivos
Estadístico Error estándar
Sexo Media ,46 ,056
95% de intervalo de Límite inferior ,35
confianza para la media Límite superior ,57
Media recortada al 5% ,46
Mediana ,00
Varianza ,252
Desviación estándar ,502
Mínimo 0
Máximo 1
Rango 1
Rango intercuartil 1
Asimetría ,153 ,269
Curtosis -2,028 ,532

Considerando que este margen de error es demasiado grande (11%) nos proponemos
reducirlo a un 3%; entonces estimaremos el tamaño de muestra necesario para cumplir
este objetivo con un 95% de seguridad.

Z 2/2 p q (1.96) 2 0.43x0.57


n n 1046
e2 (0.03) 2
Pero como sabemos nuestra población es tan solo de 200 pacientes; entones haremos un
reajuste a través de la siguiente fórmula

n0 1046
n n 168
n0 1046
1 1
N 200
Enseguida seleccionaremos una muestra aleatoria de tamaño 168 de nuestra base de
datos. Para ello tenemos que ir al menú

76
Datos Selecciona r casos Luego elegir Muestra aleatoria de casos, pulsar el botón
Ejemplo y aparecerá el siguiente recuadro en donde registraremos el tamaño de la
muestra 168 y el total de la población 200 tal como se observa en la figura 20

Figura 20

Luego Continuar y Aceptar. Enseguida el Editor de datos mostrará los 168 pacientes
seleccionados para la muestra. Ver figura 21

Figura 21

Ahora ingresamos al menú Analizar Estadísti cos descriptiv os Explorar


Al hacer clic sobre Explorar aparece la figura 22 y trasladamos la variable Sexo a Lista
de dependientes

77
REGRESIÓN Y CORRELACIÓN LINEAL SIMPLE
Ejemplo 1.- La siguiente información corresponde a la Estatura (metros) y el Peso
(kilogramos) de 30 estudiantes.

Alumno Estatura Peso


1 1.25 32
2 1.28 33
3 1.27 34
4 1.21 30
5 1.22 32
6 1.29 35
7 1.30 34
8 1.24 32
9 1.27 32
10 1.29 35
11 1.25 33
12 1.28 35
13 1.27 34
14 1.21 30
15 1.22 33
16 1.29 34
17 1.30 35
18 1.24 32
19 1.27 33
20 1.29 33
21 1.25 33
22 1.28 34
23 1.27 34
24 1.21 31
25 1.22 32
26 1.29 34
27 1.30 34
28 1.24 31
29 1.27 35
30 1.29 34

Primeramente ingresamos a Editor de datos, en Vista de variables, creamos las variables


Estatura y Peso con sus respectivas características; seguidamente en Vista de datos, se
ingresan los datos de cada una de dichas variables; tal como, se observa en las figuras 01
y 02 respectivamente.

78
Figura 01

79
Figura 02

Diagrama de Dispersión

Este diagrama nos permitirá visualmente observar si existe una cierta relación entre el
peso y la estatura y si lo hubiera de qué forma estas variables estarían relacionadas.

Para obtener el Diagrama de dispersión se sigue la siguiente ruta:

Gráfi cos Cuadros de di´a log o antiguos Dispersión / Puntos tal como se observa en
la figura 03

80
Figura 03

Al hacer clic sobre Dispersión/Puntos obtenemos la figura (04) en donde elegimos


Dispersión simple y luego clic sobre Definir

Figura 04

Al pulsar el botón Definir aparece el cuadro de diálogo correspondiente al procedimiento


Diagrama de dispersión simple se realizan las siguientes acciones: en el cajón Eje Y se
ingresa la variable Peso y en el cajón Eje X se ingresa la variable Estatura. Véase figura
05

81
Figura 05

Al pulsar el botón Aceptar obtenemos el siguiente gráfico 01 en donde se puede observar


una posible relación lineal entre dichas variables (los puntos siguen una tendencia lineal).

Gráfico 01: Diagrama de dispersión para las variables Estatura y Peso

82
Análisis de Correlación

Una vez visualizado una probable relación lineal entre las variables bajo estudio; el
siguiente paso será medir (cuantificar) el grado de relación lineal, a través del coeficiente
de correlación lineal o de Pearson (ver figura 06)

Figura 06

Al elegir Bivariadas aparece el cuadro de diálogo correspondiente al procedimiento


Correlaciones bivariadas y realizamos las siguientes acciones: en el cajón Variables se
ingresan las variables Peso y Estatura (ver figura 07)

83
Figura 07

Al pulsar el botón Aceptar se obtiene el siguiente resultado (Ver tabla 01); en donde se
observa que el coeficiente de correlación lineal es de 0.828 y el nivel crítico es 0.000 lo
cual significa que si lleváramos a cabo una prueba de hipótesis para determinar si la
correlación es significativa, estaríamos concluyendo que efectivamente existe una
correlación lineal altamente significativa.; en este caso la correlación es positiva es decir;
a mayor estatura mayor peso.

Tabla 01

Correlaciones

Estatura Peso

Estatura Correlación de Pearson 1 ,828**

Sig. (bilateral) ,000

N 30 30

Peso Correlación de Pearson ,828** 1

Sig. (bilateral) ,000

N 30 30

**. La correlación es significativa en el nivel 0,01 (bilateral).

84
Análisis de Regresión Lineal Simple
Después de haber determinado que existe una correlación lineal significativa entre las
variables bajo estudio; el siguiente paso será determinar la ecuación de regresión lineal
que nos permita pronosticar (estimar) el valor de la variable dependiente (Y) a partir de
ciertos valores de la otra variable independiente (X).

Para ello, se selecciona el menú

Analizar Re gresión Lineales (Ver figura 08)

Figura 08

Al elegir la opción Lineales obtenemos el cuadro de diálogo correspondiente al


procedimiento Regresión lineal en donde en el cajón de Dependientes se ingresa la
variable Peso y en el cajón de Independientes se ingresa la variable estatura. Ver (figura
09)

85
Figura 09

Al pulsar el botón Aceptar obtenemos como resultado las tablas 02 y 03

En la tabla 02 se observa el coeficiente de correlación lineal (correlación de Pearson)


igual a 0.828 y también el coeficiente de determinación 68.6% lo cual nos indica que el
68.6% de las variaciones que se observa en el peso de los alumnos se debe o se explica
por las variaciones observadas en su estatura. El 31.4% restante de dichas variaciones se
debería a otros factores (edad, sexo) que estarían influyendo en la variación del peso.

Tabla 02

Resumen del modelo

R cuadrado Error estándar


Modelo R R cuadrado
ajustado de la estimación

1 ,828a ,686 ,675 ,825

a. Predictores: (Constante), Estatura

86
Tabla 03

Coeficientesa

Coeficientes
Coeficientes no estandarizados estandarizados

Modelo B Desv. Error Beta t Sig.

1 (Constante) -17,714 6,500 -2,725 ,011

Estatura 40,265 5,149 ,828 7,819 ,000

a. Variable dependiente: Peso

En primer lugar, en la tabla 03 observamos el valor de los coeficientes de regresión, con


los cuales construiremos la ecuación de regresión lineal:

Yˆ 17.714 40.265 X

El coeficiente de regresión 1 40.265 nos indica que al aumentar la estatura en una


unidad (1 metro) el peso se espera que aumente en 40 kg aproximadamente; para que sea
más entendible; podemos decir, que si la estatura aumenta en 1 cm, entonces se espera
que el peso aumente en 0.4 kg.

Comprobación

Estime el peso de un alumno que tiene una estatura de 1.25 m

Yˆ 17.714 40.265 (1.25) 32.6 kg

Estime el peso de un alumno que tiene una estatura de 1.26 m

Yˆ 17.714 40.265 (1.26) 33 kg


En tabla 03 también podemos observar que el valor T para el coeficiente de regresión es
de 7.819 y el nivel crítico es 0.000 lo cual significa que si lleváramos a cabo una prueba
de hipótesis para determinar si 1 0 estaríamos concluyendo que el aumento del peso
está influenciado en forma lineal por el incremento en las estaturas.

87
Nota.- Cabe destacar que nuestras estimaciones tienen cierto grado de precisión para
valores de X (estatura) comprendidos entre 1.21 y 1.30 metros; para valores de X fuera
de este rango nuestras estimaciones no tendrán validez.

Gráfica de la línea de regresión

Analizar Re gresión Estimación curvilínea (Ver figura 10)

Figura 10

88
Al elegir Estimación curvilínea obtenemos el cuadro de diálogo correspondiente al
procedimiento Estimación curvilínea; en el cajón de Dependientes se ingresa la variable
Peso y en el cajón de Variable Independiente se ingresa Estatura (figura 11)

Figura 11

Al pulsar el botón Aceptar obtenemos los resultados de la tabla 04 y el gráfico 02

Tabla 04

Resumen de modelo y estimaciones de parámetro

Variable dependiente: Peso

Resumen del modelo Estimaciones de parámetro


Ecuación
R cuadrado F gl1 gl2 Sig. Constante b1

Lineal ,686 61,142 1 28 ,000 -17,714 40,265

89
La variable independiente es Estatura.

Gráfico 02

Obtención de los valores estimados de Y

Estando en la figura 09 pulsamos el botón Guardar y obtenemos la figura 12 en donde


seleccionamos Ajustada (Ver figura 12)

90
Figura 12

Enseguida Continuar y Aceptar Luego en el Editor de datos se observarán los valores


estimados de Y para cada valor de X (Ver figura 13)

91
Figura 13

Ejemplo 2.- Se realizó un estudio para determinar la relación que existe entre el precio
(en soles) y la demanda (en miles de unidades) de cierto producto. En el presente estudio
se seleccionó una muestra aleatoria de 20 días y se obtuvieron los siguientes resultados.

Precio (X) Demanda (Y)


2.5 30
2.0 32
1.7 39
2.8 27
2.9 23
1.9 36
3.0 20
1.6 42
2.6 29
2.4 30
1.9 34
2.1 34
3.1 17
1.5 44
2.3 35

92
1.8 34
3.1 21
2.6 27
2.7 24
2.2 30

Diagrama de dispersión: Gráfico 03

Coeficiente de correlación lineal (Pearson)

La tabla 05 nos muestra que las variables precio y demanda están relacionadas
linealmente en forma negativa, ya que el coeficiente de correlación de Pearson es igual a
-0.954 lo cual significa que al aumentar el precio del artículo, la demanda disminuye, o
que al bajar el precio del artículo, hay una mayor demanda. Por otro lado, se
observa que el nivel crítico (Sig), asociado a la T, es 0,000 < 0,05 (α) lo cual permite
rechazar la hipótesis nula (Ho) de que no existe relación lineal entre las variables,
para un nivel de significancia de 5%.

93
Tabla 05

Correlaciones

Precio Demanda

Correlación de Pearson 1 -,954**

Precio Sig. (bilateral) ,000

N 20 20

Correlación de Pearson -,954** 1

Demanda Sig. (bilateral) ,000

N 20 20

**. La correlación es significativa en el nivel 0,01 (bilateral).

Coeficiente de determinación.- Según la tabla 06 el coeficiente de determinación


R2 = 0,91 lo cual nos significa que el 91% de la variación observada en la demanda del
producto, se explica por la variación del precio; y el 9% restante de la variación en la
demanda, se debería a la influencia de algunas otras variables (publicidad, calidad etc) no
tomadas en cuenta en el presente estudio.

Tabla 06

Resumen del modelo

R cuadrado
Modelo R R cuadrado ajustado Error estándar de la estimación

1 ,954a ,910 ,905 2,217

94
Ecuación de regresión lineal

De acuerdo a los resultados que se muestran en la tabla 07; la ecuación de regresión lineal
queda expresada de la siguiente manera:

Yˆ 61.836 13.463 X

Cuando el costo del producto se incrementa en un sol, la demanda disminuye en


promedio, en 13.463 miles de unidades.

Tabla 07

Coeficientesa

Coeficientes
Coeficientes no estandarizados
estandarizados
Modelo t Sig.

B Desv. Error Beta

(Constante) 61,836 2,380 25,984 ,000


1
Precio -13,463 ,997 -,954 -13,506 ,000

a. Variable dependiente: Demanda

Gráfica de la línea de regresión

95
96
TABLAS DE CONTINGENCIAS Y PRUEBA CHI
CUADRADO

Las tablas de contingencia contienen la distribución conjunta de dos o más variables y se


han estudiado en relación con los contrastes sobre independencia e igualdad de
proporciones.

Ejemplo 1.- En varios estudios realizados durante los últimos años se ha llegado a
conclusiones contradictorias acerca de la relación existente entre el estado civil y la actitud
hacia el aborto. Con intención de aportar nueva evidencia empírica sobre esta relación, se
ha encuestado a 500 sujetos y; tras clasificarlos según su estado civil y su actitud hacia el
aborto, se han obtenido los siguientes resultados.

ARCHIVO: INFORMACIÓN PARA TABLA DE CONTINGENCIA

El archivo contiene información acerca de la opinión de 500 sujetos respecto al aborto.

En este caso las variables bajo estudio son:

Estado civil: Soltero = 1 Casado = 2 Divorciado/separado = 3 Viudo = 4

Actitud hacia el aborto: A favor = 1 En contra = 2

Primeramente ingresamos a Editor de datos, en Vista de variables, creamos las variables:


Actitud hacia el aborto y Estado civil, con sus respectivas características; seguidamente en
Vista de datos, se ingresan los datos de cada una de dichas variables; tal como, se observa
en las figuras 01 y 02 respectivamente.

97
Figura 01

98
Figura 02

Para contrastar la hipótesis sobre independencia entre dos variables categóricas,


aplicaremos la prueba 2 de Pearson; por lo que plantearemos las hipótesis:

Ho: Las variables estado civil y actitud hacia el aborto son independientes.

99
H1: Las variables estado civil y actitud hacia el aborto no son independientes (están
relacionadas)

Ingresamos a la base de datos y se sigue la siguiente ruta:

Analizar Estadísti cos descriptiv os Tablas cruzadas tal como se observa en la figura
03

Figura 03

Al hacer clic sobre Tablas cruzadas, aparece el cuadro de diálogo correspondiente al


procedimiento Tablas cruzadas, se realizan las siguientes acciones: en el cajón Filas se
ingresa la variable Estado civil y en el cajón Columnas se ingresa la variable Actitud hacia
el aborto. Véase figura 04

100
Figura 04

Si lo que se desea obtener son los valores observados conjuntamente con los esperados se
deberá pulsar el botón Casillas del cuadro de diálogo Tablas cruzadas: Mostrar en las
casillas y en Recuentos elegimos Observado y Esperado (Ver figura 05)

Figura 05

101
Luego Continuar y Aceptar y aparecerá la tabla 01; en donde podemos observar en la
primera celda que el valor observado es 130 y su valor esperado es 72

Tabla 01

Tabla cruzada Estado civil*Actitud hacia el aborto

Actitud hacia el aborto


Total
A favor En contra

Recuento 130 20 150


Soltero
Recuento esperado 72,0 78,0 150,0

Recuento 50 150 200


Casado
Recuento esperado 96,0 104,0 200,0
Estado civil
Recuento 40 60 100
Divorciado/separado
Recuento esperado 48,0 52,0 100,0

Recuento 20 30 50
Viudo
Recuento esperado 24,0 26,0 50,0

Recuento 240 260 500


Total
Recuento esperado 240,0 260,0 500,0

Si en la figura 04 pulsamos el botón Estadísticos se observará la figura 06 en donde


elegiremos Chi-cuadrado.

102
Figura 06

luego pulsamos los botones Continuar y Aceptar observándose los resultados que
aparecen en la tabla 02 y 04

Tabla 02

Tabla cruzada Estado civil*Actitud hacia el aborto

Recuento

Actitud hacia el aborto

A favor En contra Total

Estado civil Soltero 130 20 150

Casado 50 150 200

Divorciado/separado 40 60 100

Viudo 20 30 50

Total 240 260 500

Para analizar mejor la tabla 02 lo expresaremos en porcentaje por columnas, quedando asi:

103
Tabla 03

Tabla cruzada Estado civil*Actitud hacia el aborto

% dentro de Actitud hacia el aborto

Actitud hacia el aborto

A favor En contra Total

Estado civil Soltero 54,2% 7,7% 30,0%

Casado 20,8% 57,7% 40,0%

Divorciado/separado 16,7% 23,1% 20,0%

Viudo 8,3% 11,5% 10,0%

Total 100,0% 100,0% 100,0%

Podemos observar que la mayoría (54.2%) de los que respondieron estar a favor del aborto
son solteros; mientras que el 57.7% de los que respondieron estar en contra son casados; es
decir los que más están a favor del aborto son los solteros y los que están más en contra
son los casados.

Tabla 04

Pruebas de chi-cuadrado

Significación
asintótica
Valor df (bilateral)

Chi-cuadrado de Pearson 136,084a 3 ,000

Razón de verosimilitud 147,707 3 ,000

Asociación lineal por lineal 49,203 1 ,000

N de casos válidos 500

a. 0 casillas (0,0%) han esperado un recuento menor que 5. El recuento


mínimo esperado es 24,00.

104
2
En la tabla 04 se puede observar que el valor Chi-cuadrado de Pearson 136.084

Con 3 grados de libertad y el nivel crítico o valor p (sig. bilateral) es 0.000. Y la regla de
decisión dice que si el nivel crítico es pequeño (generalmente menor que 0.05) la hipótesis
nula Ho deberá ser rechazada. Por lo que para un nivel de significancia (α) del 5%
rechazaremos Ho y podemos sostener que los datos muestran evidencia suficiente como
para concluir que existe relación entre la actitud hacia el aborto y el estado civil

Otro Método: Partiendo de la tabla ya obtenida

Se trata analizar una tabla de contingencia partiendo de una tabla que ya ha sido obtenida;
es decir asumiremos que desconocemos la base de datos y solo contamos con la siguiente
tabla.

Estado Actitud hacia el aborto


civil A favor En contra Total
Soltero 130 20 150
Casado 50 150 200
Divorciado/separado 40 60 100
Viudo 20 30 50
Total 240 260 500

En primer lugar, entramos al Editor de datos Vista de variables, para registrar el nombre
de las variables tal como se observa en la figura 07

105
Figura 07

Luego en Vista de datos se registran los siguientes valores, tal como se observa en la
figura 08

106
Figura 08

Datos Ponderar casos

Figura 09

Al hacer clic sobre Ponderar casos obtenemos la figura 10 en donde elegimos Ponderar
casos mediante. En el cajón de Variable de frecuencia se ingresa Frecuencias y luego
Aceptar

107
Figura 10

Luego se selecciona el menú Analizar Estadísti cos descriptiv os Tablas cruzadas

Tal como se muestra en la figura 11

Figura 11

Al hacer clic sobre Tablas cruzadas aparece la figura 12 y lo que sigue a continuación ya se
ha mencionado anteriormente

108
Figura 12

Luego pulsamos los botones Estadísticos después Continuar y Aceptar

Prueba de Homogeneidad de Muestras

Con esta prueba se busca determinar si dos o más muestras independientes provienen de una
misma población.

Las hipótesis nula y alternativa de la prueba de homogeneidad son respectivamente:

Ho: Las muestras aleatorias provienen de una misma población (o las muestras son
homogéneas).

H1: Las muestras aleatorias no provienen de una misma población ( o las muestras no son
homogéneas).

Ejemplo.- El departamento médico de cierta universidad estudia el nivel de efectividad de


tres remedios para la alergia: R1, R2 y R3. Cada remedio se suministró a 60 estudiantes.

Los resultados del experimento se dan en la tabla que sigue.

109
Efectividad
Remedios Sin alivio Cierto alivio Alivio total
Remedio 1 10 40 10
Remedio 2 20 30 10
Remedio 3 15 20 25

¿Podemos concluir al nivel de significación 0.01 que los tres remedios para la alergia son
igualmente efectivos?

En primer lugar, entramos a Editor de datos y pulsamos Vista de variables aquí se definen
las variables (Ver figura 13)

Figura 13

Enseguida pulsamos Vista de datos e introducimos la siguiente información que aparece


en la figura 14

110
Figura 14

Luego vamos al menú Datos Ponderar casos (Ver figura 15)

111
Figura 15

Al hacer clic sobre Ponderar casos obtenemos la figura 16 en donde elegimos Ponderar
casos mediante. En el cajón de Variable de frecuencia se ingresa Frecuencias y luego
Aceptar

112
Figura 16

Después de hacer clic sobre el botón Aceptar seleccionamos el menú


Analizar Estadísti cos descriptiv os Tablas cruzadas (Ver figura 17)

Figura 17

113
Al elegir la opción Tablas cruzadas obtenemos el cuadro de diálogo correspondiente al
procedimiento Tablas cruzadas en donde en el cajón de Filas se ingresa la variable
Remedios para la alergia y en el cajón de Columnas se ingresa la variable Efectividad. Ver
(figura 18)

Figura 18

En la figura 18 pulsamos Estadísticos y aparece la figura 19 allí elegimos Chi-cuadrado


luego Continuar y Aceptar

114
Figura 19

Enseguida se observa como resultado las tablas 04 y 05

Tabla 05

Tabla cruzada Remedios para la alergia*Efectividad

Recuento

Efectividad

Sin alivio Cierto alivio Alivio total Total

Remedios para la alergia Remedio 1 10 40 10 60

Remedio 2 20 30 10 60

Remedio 3 15 20 25 60

Total 45 90 45 180

115
Tabla 06

Pruebas de chi-cuadrado

Significación
asintótica
Valor df (bilateral)

Chi-cuadrado de Pearson 20,000a 4 ,000

Razón de verosimilitud 19,517 4 ,001

Asociación lineal por lineal 1,657 1 ,198

N de casos válidos 180

a. 0 casillas (0,0%) han esperado un recuento menor que 5. El recuento


mínimo esperado es 15,00.

2
En la tabla 06 se puede observar que el valor Chi-cuadrado de Pearson 20

Con 4 grados de libertad y el nivel crítico o valor p (sig. bilateral) es 0.000. Por lo que para
un nivel de significancia (α = 0.01) rechazaremos Ho y podemos concluir que la muestra
está evidenciando que los tres remedios para la alergia no tienen la misma efectividad.

116
117

Potrebbero piacerti anche