Sei sulla pagina 1di 65

UNIVERSIDAD NACIONAL DE INGENIERIA

Clase 2 : Recolección: y
Organización de datos

gpomachagua@hotmail.com

Material de Clases © G.P.P. 6-Abr.-19


OBJETIVOS

Al finalizar el tema 2, el participante será capaz de:


1. Distinguir la fuente de datos
2. Recopilar datos.
3. Diferenciar métodos y técnicas de recolección de
datos.
4. Elaborar una encuesta
5. Presentar datos en tablas

Material de Clases © G.P.P. 6-Abr.-19


RECOLECCION DE DATOS
• La recolección de datos es la fase en el cuál el
investigador se pone en contacto con los elementos
sometidos a estudio, con el fin de obtener datos o
respuestas de las variables consideradas y a partir de
aquí se prepara la información estadística.
• Antes de recolectar datos es importante determinar el
objetivo de estudio, precisar las variables, las fuentes de
datos, con la finalidad de definir que datos hay que
recolectar

Material de Clases © G.P.P. 6-Abr.-19


FUENTES DE DATOS

• Son aquellos lugares, persona o elementos de


los que se puede obtener datos o información
necesaria para realizare estudio de
investigación

Material de Clases © G.P.P. 6-Abr.-19


TIPOS DE FUENTES
a) Fuentes Secundarias:
 Datos ya recolectados para cumplir otros objetivos
 Contiene información, sintetizada y organizada
 Es la primera fuente que se debe analizar.
Ejemplo:
Datos publicados (en papel o en forma electrónica) en revistas especializadas,
tesis, censos y en las hojas de registro anteriores
Principales organismos que disponen de publicaciones son:
Instituto Nacional del Estadística e Informática www.inei.gob.pe
Banco Central de Reserva del Perú www.bcrp.gob.pe/
Ministerio de Salud del Perú www.minsa.gob.pe
Organización Mundial de la Salud www.who.int/es/
Ministerio de Educación www.minedu.org.pe
Ipsos Apoyo. Opinión y Mercado www.ipsos-apoyo.com.pe
Ministerio de Energía y Minas www.minem.gob.pe
Instituto Geológico Minero y Metalúrgico www.ingemmet.gob.pe

Material de Clases © G.P.P. 6-Abr.-19


TIPOS DE FUENTES

• FUENTES PRIMARIAS:
– Datos que hay que recolectar para el trabajo
– Personas que por su conocimiento proporciona
información especifica para el investigador
– Las técnica mas empleadas de recolección de datos son
La observación:
La experimentación
La entrevista.
La encuesta (Cuestionario)

Material de Clases © G.P.P. 6-Abr.-19


(a) La observación

Es el registro visual de lo


ocurre, es una situacional real,
clasificando y consignando los
acontecimientos pertinentes de
acuerdo con algún esquema
previsto y según el problema que
se estudia.
 Cuando se mide el desempeño,
la persona observada no debe
saber que es sujeta de
observación

Material de Clases © G.P.P. 6-Abr.-19


(b) La experimentación
Se registra un dato bajo condiciones provocadas
simulando el proceso lo más real posible.

Ejemplo:
Un mercado prueba para introducir un tipo jabón
de antiséptico con fragancia .

Material de Clases © G.P.P. 6-Abr.-19


(c) La entrevista
 Permite recolectar datos
o partir de un dialogo.
 Puede se estructurada o
no estructurada

Ejemplo:
Entrevista al Director de una
Clínica sobre la aplicación de
norma de calidad ISO 9000

Material de Clases © G.P.P. 6-Abr.-19


(a) La encuesta:
La encuesta es una de las técnicas de recolección mas usadas se fundamente
en un cuestionario que es un conjunto de preguntas

Diseño de cuestionario para la


encuesta
1. Cuestionario de preguntas abiertas o cerradas
2. Al diseñarla se debe:
• Decidir forma de aplicarlo: correo, teléfono, personal, web
• Plantear preguntas
• Realizar una prueba piloto y hacer revisiones finales
Ejemplo:
Encuesta para conocer el grado de satisfacción de los asegurados a una clínica.

Material de Clases © G.P.P. 6-Abr.-19


Material de Clases © G.P.P. 6-Abr.-19
RECOMENDACIONES EN LA ELABORACIÓN DE CUESTIONARIOS

Es una tarea difícil y que requiere tiempo


• Construir el instrumento de modo que refleje calidad
• Hacer el cuestionario lo más breve posible, de modo
que se requiera el mínimo de tiempo para llenarlo.
• Todos los reactivos (preguntas) deberán estar en
función del problema de investigación.
• Debe partirse de las hipótesis y específicamente de los
indicadores que expresan a las variables. Estos
indicadores deben traducirse en las preguntas del
cuestionario.

Material de Clases © G.P.P. 6-Abr.-19


• El lenguaje utilizado en la redacción debe ser
entendible por los encuestados

• Debe evitarse la ambigüedad


Ejemplo: En un estudio de sobre tabaquismo

¿Frecuentemente fuma? SI …. NO ……

• No formular preguntas dirigidas. Evitar adjetivos


Ejemplo: ¿Cree usted que precio de las tarifas
postales son altas?
SI …….. NO ………

Material de Clases © G.P.P. 6-Abr.-19


• Neutralidad de las preguntas. El investigador debe
intentar adoptar una postura neutral con respecto al
problema objeto de estudio.

Ejemplo 1: “La defensa del país exige contar


con un presupuesto adecuado. ¿Está usted de
acuerdo con que se destinen fondos del
presupuesto nacional a la actualización del
Armamento de las Fuerzas Armadas?
Forma tendenciosa grotesca

Material de Clases © G.P.P. 6-Abr.-19


• Ejemplo 2: ¿Considera usted que la empresa X
ofrece un buen servicio postventa?
Si ____
No ____
No sabe/ no contesta_____________

Forma más sutil de sesgar la pregunta

Material de Clases © G.P.P. 6-Abr.-19


Ejemplo 3:
• ¿Cómo encuentra usted el servicio post-venta de la empresa X?
Bueno _________
Regular ________
Malo ___________
No sabe/ no contesta __________
• ¿Aprueba o desaprueba la labor que viene desarrollando Ollanta
Humala como Presidente de la República? (%)
Aprueba 1

Desaprueba 2
• ¿Esta a favor o en contra de otorgar indulto a Alberto Fujimori? (%)

A favor 1

En Contra 2

Forma objetiva
Material de Clases © G.P.P. 6-Abr.-19
Tipos de preguntas
I. Según su formulación en el cuestionario:
1) Preguntas cerradas
Las posibles respuestas se presentan como alternativas.
Facilita la codificación y operatividad de los datos.
Ejemplo : ¿Posee Ud. un seguro médico?
Si 1 No 2 Cerradas Dicotómicas (Si /No)

Ejemplo: Categoría docente


Principal ( ) 1
Cerradas múltiple
Asociado ( ) 2
Auxiliar ( ) 3
Ejemplo: ¿Cómo se entero de nuestra de nuestra institución?
Internet ( ) 1
Periódico ( ) 2
Cerradas de elección
Radio ( ) 3
multiple
Tv ( ) 4
Amigos ( ) 5
Material de Clases © G.P.P. 6-Abr.-19
2) Preguntas abiertas

 Los encuestados tienen libertad para emitir su


opinión.
 Se utilizan cuando no se tiene precisión sobre las
posibles respuestas.
 Dificulta la recolección de datos (incomoda al
encuestado).
 Es necesario codificar las respuestas para ser
procesadas
Ejemplo:
¿Qué opinión tiene sobre la política de salud del
actual Gobierno ?
………………………………………………………………………

Material de Clases © G.P.P. 6-Abr.-19


3) Preguntas Literales

Sonpreguntas
Son preguntas abiertas
abiertas cuyasserespuestas
cuyas respuestas se palabra
expresan con una expresan con
o cantidad
Ejemplo:
una palabra o cantidad
cantidad
 ¿Cuál es su edad? ……………………………
Ejemplo:
 ¿Cuántos hijos tiene? …………………………..
 ¿Cuál
 ¿Cuáles es su edad?
edad?
su ocupación ……………………………
actual? …………………….……………………………
 Preguntas
4) ¿Cuántoscon
hijos tiene? de grados
respuestas …………………………..
de intensidad
 ¿Cuál es su ocupación actual? …………………….
Sus respuestas indican un grado de intensidad en sus respuestas
Ejemplo : ¿Esta usted de acuerdo con la política económica del actual gobierno?

1. Totalmente en desacuerdo ( )
2. En desacuerdo ( )
3. Ni en acuerdo ni desacuerdo ( ) Escala de Likert
4. De acuerdo ( )
5. Totalmente de acuerdo ( )

Material de Clases © G.P.P. 6-Abr.-19


SUGERENCIAS PARA LA CODIFICACION
• Es buena idea codificar las variables como números para poder
procesarlas con facilidad en un programa estadístico.
• Es conveniente asignar “etiquetas” a los valores de las
variables para recordar qué significan los códigos numéricos.
– Sexo (Cualitativa: Códigos arbitrarios)
• 1 = Hombre
• 2 = Mujer
• Se pueden asignar códigos a respuestas especiales como
• 0 = No sabe
• 99 = No contesta...

Material de Clases © G.P.P. 6-Abr.-19


El orden de las preguntas
1. Empezar con una presentación
2. Filtros al principio de los bloques
3. Primeras preguntas sencillas
4. Agrupar temas afines
5. Ir de lo general a lo específico y de lo sencillo a lo
complicado
6. Preguntas delicadas en medio
7. Acabar con preguntas “de relax”
8. Preguntas de clasificación al final
9. Dar las gracias al acabar

Material de Clases © G.P.P. 6-Abr.-19


CUESTIONARIO

http://www.enferpro.com/documentos/validacion_cuestionarios.pdf
Material de Clases © G.P.P. 6-Abr.-19
Material de Clases © G.P.P. 6-Abr.-19
VALIDEZ Y CONFIABILIDAD DE LOS INSTRUMENTOS DE RECOLECCIÓN DE DATOS

Material de Clases © G.P.P. 6-Abr.-19


PRESENTACION DE DATOS

• Después de la recopilación de los datos es


necesario resumirlos y presentarlos en forma tal
que faciliten su comprensión y su posterior
análisis.
• Para ello se presenta en tablas y gráficos.

Material de Clases © G.P.P. 6-Abr.-19


Material de Clases © G.P.P. 6-Abr.-19
Nota: Manual para la presentación de cuadros estadísticos D.L. 604

Material de Clases © G.P.P. 6-Abr.-19


Material de Clases © G.P.P. 6-Abr.-19
Material de Clases © G.P.P. 6-Abr.-19
Material de Clases © G.P.P. 6-Abr.-19
Material de Clases © G.P.P. 6-Abr.-19
Tipos de Presentación de datos

1. Tablas de Contingencia:
2. Tabla de Frecuencia.
3. Tallos y hojas
4. Gráficos

Material de Clases © G.P.P. 6-Abr.-19


Tipos de Presentación de datos

1) Tablas de Contingencia: Es un arreglo ordenado


de filas y columnas de datos estadísticos
Tabla 01: LIMA: POBLACION DE ALUMNOS QUE FUMA SEGÚN
SEXO, 2014
Tabla de contingencia SEXO * FUMAR

Recuento
FUMAR
FUMA NO FUMA Total
SEXO HOMBRE 55 25 80
MUJER 16 4 20
Total 71 29 100

Fuente:
Apoyo 2014

Material de Clases © G.P.P. 6-Abr.-19


En SPSS ir a Analizar / Estadísticos Descriptivos/ Tablas de Contingencia …

Luego clic en Casillas

Después Continuar / Aceptar

Tabla de contingencia SEXO * FUMAR

Recuento
FUMAR
FUMA NO FUMA Total
SEXO HOMBRE 55 25 80
MUJER 16 4 20
Total 71 29 100

Material de Clases © G.P.P. 6-Abr.-19


Tipos de Presentación de datos
2. Tabla de Frecuencia: Es una tabla que divide a un conjunto de datos
en un numero adecuado de intervalos o categorías.
Elementos de una Tabla de Frecuencia:
• Frecuencia Absoluta (fi): Es el número de veces que se repite cada
valor de una variable.
Donde: m = número de intervalos o categorías
n = número total de observaciones
m
Además
 fi  n
i 1
y 0  fi  n

• Frecuencia Relativa (hi): Se expresa en términos de porcentajes.


Donde fi
hi 
n m

Además h
i 1
i 1 y 0  h1  1

Material de Clases © G.P.P. 6-Abr.-19


• Frecuencia Absoluta Acumulada (Fi): Es la acumulación
sucesivamente de las frecuencias absolutas, donde:
F1 = f 1
F2 = f1 + f2 = F1 + f2
… = …………………………………

Fm = f1 + f2 + ………+ fm = Fm-1 + fm = n

• Frecuencia Relativa Acumulada (Hi): Resulta de sumar


sucesivamente las frecuencias relativas, donde:
H1 = h1
H2 = h1 + h2 = H1 + h2
…= ……………………………………………
Hm = h1 + h2 + ………+ hm = Hm-1 + hm = 1

Material de Clases © G.P.P. 6-Abr.-19


Material de Clases © G.P.P. 6-Abr.-19
Tabla de frecuencia con intervalos: Se sigue el
procedimiento siguiente:
1) Determinar el rango R= Xmax - Xmin
2) Determinar el número m de intervalos. Se
recomienda generalmente entre (5  m  15).
m = 1 + 3.3 x log (n) (Redondear al entero más
cercano).
3) Se determina el tamaño del intervalo de clase.
En lo preferible se debe encontrar un número entero
R
C tal que Cm  R
m
(Redondear por exceso, a la cantidad de
decimales que tienen los datos).
En caso de no cumplir, cambiar m o C

Material de Clases © G.P.P. 6-Abr.-19


4º) Calcular el rango ampliado R´= Cm
(5º) Hallar la diferencia a= R´- R

(6º) Distribuir la diferencia


 -(Límite inferior del primer intervalo)
 +(Límite superior del último intervalo)

(7º) Construcción de los intervalos [ >, < ]

(8º) Hallar la marca de clase que es el promedio del


intervalo
( Li  Ls )
Mi 
2

(9º) Se elabora la tabla: titulo, cuerpo y fuente

. Material de Clases © G.P.P. 6-Abr.-19


Histograma de Frecuencias: Un histograma divide los valores de la muestra
en muchos intervalos y representa la frecuencia de los valores de datos en cada
intervalo con una barra.

Polígono de Frecuencias: Se construye tomando en cuenta la


marca de clase
Material de Clases © G.P.P. 6-Abr.-19
• Ejemplo 1: La siguiente tabla muestra las edades de los 21
trabajadores que laboran en Siderúrgica Aceros Arequipa:

Construir a partir de estos datos


• Una tabla de frecuencia
• Un histograma
• Un polígono de frecuencia

Material de Clases © G.P.P. 6-Abr.-19


Solución
1. El rango R =72 – 39 =33
2. Determinar el intervalo
m =1 + 3.3log(21)
m =1 + 3.3x1.322 = 1 + 4.36 = 5.36
m=5
3. Hallar la amplitud
C =R/m=33/5= 6.6 (la cantidad de decimales que tienen los
datos).C=7
4. Luego el rango ampliado R´=C*m= 7x5=35
5. La diferencia a=R´-R =35-33=2
6. Distribuyendo la diferencia

Min Max +a
V. Corregido 39 72+2=74

Material de Clases © G.P.P. 6-Abr.-19


Interpretar

1) f1, F2, h3, H4


2) ¿Calcular el número y porcentaje de trabajadores entre 47 años y 68 años?

3) ¿Calcular el porcentaje de trabajadores que tienen por lo menos 55 años?

Material de Clases © G.P.P. 6-Abr.-19


• .
Histograma de Frecuencias fi

8 7
7 6
6

Frecuencia
5
4 3 3
3 2
2
1
0
[39 - 46] <46 - 53] <53 - 60] <60 - 67] <67 - 74]

Poligono de Frecuencias fi
8
7
6
Frecuencia

5
4
3
2
1
0
35.5 42.5 49.5 56.5 63.5 70.5 77.5

Material de Clases © G.P.P. 6-Abr.-19


Reporte del SPSS

Material de Clases © G.P.P. 6-Abr.-19


En SPSS después de poner los datos
Ir a Transformar / Recodificar en distintas variables ..

Luego clic en
Valores antiguos y nuevos

Y así hasta completar


todos los intervalos

Material de Clases © G.P.P. 6-Abr.-19


Luego clic en
Continuar/ Cambiar Aceptar

Luego hallar la tabla de frecuencia de la


variable EDADRECO

Material de Clases © G.P.P. 6-Abr.-19


Material de Clases © G.P.P. 6-Abr.-19
En Minitab Polígono de Frecuencia
Polígono de Frecuencia
7
7

6
6

Frecuencia Absoluta fi
5

3 3
3

2
2

0 0
0
35.5 42.5 49.5 56.5 63.5 70.5 77.5
Marca de Clase

Material de Clases © G.P.P. 6-Abr.-19


Variables Cuantitativas (Discretas y Continuas)
Distribuciones de frecuencias para datos discretos con muchos valores y
datos continuos (Varios valores se agrupan en una clase)

ELABORACION DE HISTOGRAMAS
EN MINITAB
a) Luego de elegir
Graficas/Histograma
aparece la ventana
Histograma.

b) Elegir Simple y dar


Aceptar; luego ingresar en
la ventana Variables de
grafica el nombre de la
columna (variable) que se
desea analizar. La ventana
resultante es:

06/04/2019 . 50
Material de Clases © G.P.P. 6-Abr.-19
Variables Cuantitativas (Discretas y Continuas)
Distribuciones de frecuencias para datos discretos con muchos valores
y datos continuos (Varios valores se agrupan en una clase)

c) Dar click en
Etiquetas) y luego
seleccionar Etiqueta
de datos / Usar
etiquetas de valor y a
fin de que se muestre
la altura de la barra
(frecuencia).
d) Aceptar La grafica
resultante es:

06/04/2019 51
Material de Clases © G.P.P. 6-Abr.-19
Variables Cuantitativas (Discretas y Continuas)
Distribuciones de frecuencias para datos discretos con muchos valores
y datos continuos (Varios valores se agrupan en una clase)

e) Este gráfico no es
el que se desea
obtener. Vea que
C=7 y m=5, como
lo habíamos
planteado.
f) Dar click en una
barra cualquiera y
se obtiene la
ventana Edit
Barras:

Material de Clases © G.P.P. 6-Abr.-19


Variables Cuantitativas (Discretas y Continuas)
Distribuciones de frecuencias para datos discretos con muchos valores
y datos continuos (Varios valores se agrupan en una clase)

g) A continuación, se elige
la opción
Seccionamiento y se
abre el cuadro de datos
Punto medio y Punto de
corte , tal como se
muestra a continuación:

Material de Clases © G.P.P. 6-Abr.-19


Variables Cuantitativas (Discretas y Continuas)

h) Nótese que en Tipo


de intervalo, se ha
elegido la opción
Punto de corte. En
Definición de
intervalo se ha
elegido Posiciones
de punto medio de
corte
Xmín:Xmáx/C

i) A continuación se da
click en Aceptar y se
obtiene la ventana
Histograma:

Material de Clases © G.P.P. 6-Abr.-19


Variables Cuantitativas (Discretas y Continuas)
Distribuciones de frecuencias para datos discretos con muchos valores
y datos continuos (Varios valores se agrupan en una clase)

j) El grafico obtenido es
denominado: Histograma de
Frecuencias Absolutas.
Note que ahora m=5 y los
valores de los límites superior é
inferior de cada clase, se
muestran en el eje horizontal
del gráfico.

k) Esto nos facilita elaborar la


correspondiente Tabla de
Distribución de Frecuencias

Material de Clases © G.P.P. 6-Abr.-19


STATA

Clic en Graphics/ Histogram

8
7

6
Frequency

3 3

2
2
0

39 46 53 60 67 74
EDAD1

Material de Clases © G.P.P. 6-Abr.-19


Material de Clases © G.P.P. 6-Abr.-19
GRAFICO DE TALLOS Y HOJAS

EDAD Stem-and-Leaf Plot


3*10+9 tallo=3, hoja= 9, anchura =10
Frequency Stem & Leaf

1,00 3. 9
3,00 4. 029
8,00 5. 14678889
5,00 6. 34689
4,00 7. 0012

Stem width: 10
Each leaf: 1 case(s)

Material de Clases © G.P.P. 6-Abr.-19


GRAFICO DE CAJAS Y BIGOTES
(BOX PLOT)

25

24 46

23 52

22 41
71
47
62

21 43
93
65
28
94

20

19
EDAD

18

17
N= 80 20

HOMBRE MUJ ER

SEXO

Material de Clases © G.P.P. 6-Abr.-19


Grafico de la Pirámide Poblacional Pictogramnas

Material de Clases © G.P.P. 6-Abr.-19


• Ejemplo 1: Completa la siguiente tabla correspondiente a las edades de
32 estudiantes

Edad fi hi Fi Hi
21 0.5
22 16
23 0.75
24 2
25 4
26
TOTAL
a) Cuantos estudiantes menores de 24 años hay
b) Que porcentaje de jóvenes son mayores de 23 años

Material de Clases © G.P.P. 6-Abr.-19


• Ejemplo 3: La siguiente tabla muestra el
número de horas de tardanza anuales de de
40 empleados de una empresa textil

Construir a partir de estos datos


a) Una tabla de frecuencia
b) Un histograma
c) Un polígono de frecuencia

Material de Clases © G.P.P. 6-Abr.-19


Ejemplo2: Las notas de la primera práctica calificada que obtuvieron 120
alumnos que llevan el curso de Análisis Matemático son presentados en la
siguiente tabla:
a) Si se desea analizar el rendimiento que han tenido los alumnos en dicha
práctica, determine:
La población:
La unidad de análisis:
La variable y su tipo:

a) Complete la tabla de distribución de frecuencias

Material de Clases © G.P.P. 6-Abr.-19


Material de Clases © G.P.P. 6-Abr.-19
muestras y análisis geoquímico, si se extrajo 29 muestras en una zona minera de la
sierra y se obtuvo el % de Alúmina (Al2O3). Los resultados obtenidos son los siguientes.

a) Realizar una tabla de frecuencia


b) Hacer un análisis estadístico

Material de Clases © G.P.P. 6-Abr.-19

Potrebbero piacerti anche