Sei sulla pagina 1di 27

PROCESAMIENTO DE DATOS Y

ANLISIS UNIVARIADO.
Iniciado con el planteamiento de un problema de investigacin que implica
responder a interrogantes situados en la frontera de los conocimientos
existentes.
Dos niveles diferentes: el terico y el emprico.
Nivel terico: Construccin del marco terico, el que operacionalizado, nos
indicar en definitiva que datos es preciso obtener para satisfacer las
interrogantes iniciales.
Nivel emprico: Concretada en un tipo de diseo, implementado a travs de
las tcnicas de recoleccin, que nos permitir obtener los datos requeridos
El instrumento de recoleccin de datos sintetizar ambos planos y ser la
herramienta concreta que nos proporcione la informacin que necesitamos.
RECOLECCIN DE DATOS
Mayor o menor complejidad y duracin.
En ella se aplicarn los instrumentos a los objetos de estudio, lo que nos proporcionar
las informaciones que necesitamos.
Se completarn las lecturas.
Se proceder a realizar efectivamente los experimentos, encuestas o estudios que sea
menester
Finalizadas las tareas de recoleccin el investigador quedar en posesin de un cierto
nmero de datos.
A partir de los DATOS ser posible sacar las conclusiones generales que apunten a
esclarecer el problema formulado en los inicios del trabajo.
Pero los DATOS obtenidos debern ser organizados.
Estas acciones son las que integran el llamado procesamiento de los datos.

1. El conjunto de los datos obtenidos debemos dividirlos de acuerdo a un
criterio bien elemental: de un lado la informacin que es de tipo
numrica, de la informacin que se expresa verbalmente o mediante
palabras.
2. Los datos numricos quedarn como tales, cualquiera sea su naturaleza,
y se procesarn luego para exponerlos en forma clara y fcilmente
asimilable.
3. El objetivo final: construir cuadros estadsticos, promedios generales y
grficos ilustrativos, sintetizar sus valores y extraer, a partir de su anlisis,
enunciados tericos de alcance ms general.
4. Los datos verbales podrn sufrir dos destinos diferentes: se convertirn
en datos numricos o quedarn como informacin no cuantificada,
cualitativa.
5. Si se ha realizado una serie de entrevistas profundizadas, de tipo no
estructurado, pueden cuantificarse algunos de los datos obtenidos del
nmero de entrevistados por sexo y edad, la respuesta a alguna
pregunta especfica en tanto que otras informaciones se mantendrn en
su forma verbal, como paradigmas o ejemplos de las opiniones de la
muestra frente a ciertos problemas de inters.
6. El criterio a adoptar depender de circunstancias concretas: de los
objetivos del trabajo, de la posibilidad de cuantificar cada variable, del
tamao del universo o muestra considerados y de varios otros criterios
TAREAS BSICAS DEL PROCESAMIENTO
En primer lugar ser preciso hacer una revisin detallada de todos los
datos obtenidos, atendiendo en especial a su coherencia.
Si se trata de cuestionarios o de pautas de observacin, de registros de
tests, sociogramas, o de cualquier otro instrumento de recoleccin, habr
que examinar cada uno de ellos para analizarlos internamente, buscando
sus posibles incongruencias, omisiones o errores, y enmendndolos si
cabe hacerlo.
Es decir, se revisar sistemticamente toda la informacin disponible,
juzgando su calidad y el grado de confianza que merece, para determinar
qu parte puede incluirse en el informe de investigacin, cual debe
corregirse o modificarse en algo (acudiendo, llegado el caso, a una nueva
recoleccin de datos) y cual, por sus graves deficiencias, deber ser
excluidas sin ms.
Por cada tipo de datos se proceder entonces como
Los datos numricos se procesarn agrupndolos en intervalos y se
tabularn.
Luego se construirn con ellos cuadros estadsticos, calculndose adems
las medidas de tendencia central, de dispersin o de correlacin que
resulten necesarias.
Los datos verbales que se desea presentar como numricos sufrirn una
primera operacin que se denomina codificacin.
De all en adelante se trabajarn al igual que los otros datos numricos,
mediante la tabulacin y el procesamiento en cuadros estadsticos.
Los datos verbales que habrn de manejarse en forma puramente
conceptual y no matemtica seguirn el proceso que indicaremos cuando
tratemos el pargrafo relativo a datos secundarios (ver 10.5).
LA CODIFICACIN
Es un procedimiento que tiene por objeto agrupar numricamente los datos
que se expresen en forma verbal para poder luego operar con ellos como si
se tratara de datos cuantitativos.
Para lograrlo se habr de partir de un cmulo de informaciones que tengan
una mnima homogeneidad, condicin necesaria para poder integrarlas.
Pueden tratarse de cientos de respuestas a una misma pregunta o de una
variedad de posibles situaciones observadas mediante un mismo tem de
una pauta de observacin: en ambos casos existir una determinada
variedad de declaraciones o de observaciones que presenten las respuestas
o los comportamientos de los objetos de estudio.

El primer paso a dar frente a todos estos datos es realizar una revisin
atenta de un subgrupo reducido de ellos con el objeto de encontrar una
tipologa de respuestas posibles, en concordancia, por otra parte, con las
formulaciones tericas que guan la investigacin y con los criterios
adoptados en la etapa de operacionalizacin.
A cada categora de respuestas habremos de darle un cdigo particular, un
nmero o letra diferente, que servir para agrupar tras de s a todas las
respuestas u observaciones que sean idnticas o que, al menos, aparezcan
como equivalentes.

LA TABULACIN
La palabra tabulacin deriva etimolgicamente del latn tabula, y significa
hacer tablas, listados de datos que los muestren agrupados y
contabilizados.
Para ello es preciso contar cada una de las respuestas que aparecen,
distribuyndolas de acuerdo a las categoras o cdigos previamente
definidos.
Cada una de las preguntas de un cuestionario o de una hoja de
observacin tendr que ser tabulada independientemente, por lo que es
preciso hacer previamente un plan de tabulacin que prepare
adecuadamente la tarea a realizar.
Las tablas que resultan de la tabulacin deben considerarse, por lo tanto,
como un material de trabajo, como un producto preliminar todava no
completamente terminado.
TABULACIN DE DOS VARIABLES
Casi siempre resulta necesario presentar simultneamente las mediciones
correspondientes a dos o ms variables, en especial para tratar de percibir
si se presenta algn tipo de correlacin o asociacin entre ellas.
Para alcanzar este objetivo se emplea una tabulacin llamada cruzada, o
de doble entrada, que consiste en la contabilizacin de las respuestas a
una pregunta discriminndolas de acuerdo a las de otras variable diferente
CUADROS ESTADSTICOS
Luego de terminar con la tabulacin de toda la informacin contenida en
nuestros instrumentos de recoleccin es preciso presentar los resultados
de modo tal que estos se hiciesen fcilmente inteligibles aun para los
lectores no especializados.
Este criterio se manifiesta, en primer lugar, en el correcto titulado de cada
cuadro.
Ello significa que el ttulo debe contener todas las caractersticas de la
informacin que se presenta, en forma concreta, especfica y no difusa.
Cuando en un cuadro aparecen dos variables deber mencionarse primero
aquella que suponemos dependiente y luego la independiente
La tarea siguiente es convertir en porcentajes las cifras reales (llamadas
absolutas) que hemos obtenido de la tabulacin.
Ello permite, por una parte, tener una mejor idea de lo que puede
representar una parte frente al todo.
La prctica de la porcentuacin permite, percibir diferencias y similitudes,
apreciar variaciones y tendencias y hacer comparaciones con otras
investigaciones.
El valor en funcin del cual se hace el clculo de los porcentajes, se llama
base del porcentaje
GRAFICACIN
La graficacin es una actividad derivada de la anterior que consiste en
expresar visualmente los valores numricos que aparecen en los cuadros.
Su objeto es permitir una comprensin global, rpida y directa, de la
informacin que aparece en cifras.
Es sumamente til, especialmente cuando nos dirigimos a lectores con
poca preparacin matemtica, aunque siempre es recomendable por el
valor de sntesis que posee.
Raramente se grafica toda la informacin que se presenta en una
investigacin pues ello ocupara un espacio desmesurado en el informe de
investigacin, lo que podra ms bien a confundir al lector.
Lo corriente y ms aconsejable es graficar las informaciones ms
importantes y generales que se presten a una expresin grfica

PROCEDIMIENTO
UNIVARIADO
CUAL ES EL
NIVEL DE LA
ESCALA DE LA
VARIABLE
NOMINAL
DE INTERVALO
ORDINAL
a. MEDIA
b. DESVIACIN STANDART
a. MEDIANA
b. RANGO INTERCUART
a. MODA
b. FREQ RELATIVAS FREQ
ABSOLUTAS
1. DESCRIPTIVA
a. TENDENCIA
CENTRAL
b. DISPERSIN
2. INFERENCIAL
PRUEBA Z
PRUEBA T
PRUEBA DE
KOLMOGOROV-
SMINOV
PRUEBA DE CHI
CUADRADO
ES EL ANALISIS BASICO PRIMARIO
SE PRESENTA LAS CARACTERISTICAS DE LAS PERSONAS O COSAS MEDIDAS
UNA A UNA, DE MODO UNIVARIADO.
LOS ESTADISTICOS COMO LA MEDIANA, LA MODA, LA MEDIA, LA
VARIANZA, LOS PORCENTAJES, MIDEN UNA VARIABLE.
CUANDO EL ANALISIS SE PRESENTA CARACTERISTICA POR CARACTERISTICA
ESTAMOS ANTE UN ANALISI UNIVARIADO
EJ EL PESO DE UNA PERSONA 65K, EL 23% SON DE SEXO MASCULINO.
EN UN ESTUDIO UNIVARIADO SE EXAMINAN LOS EFECTOS DE LA VARIABLE
INDEPENDIENTE, SOBRE UNA VARIABLE DEPENDIENTE UNICA.
Ej: ESTUDIO EXPERIMENTAL: UN GRUPO CONTROL Y UN GRUPO EXPERIMENTAL
MIDE LA MISMA VARIABLE DEPENDIENTE PARA CADA SUJETO EN CADA GRUPO.
CON LA ESTAD.UNIVARIANTE, SE PRETENDE ESTABLECER UNA RELACIN CAUSAL
ENTRE LA VAR. INDEPENDIENTE Y LA VAR. DEPENDIENTE (PUEDE HABER MAS DE UNA VAR
INDEPENDIENTE, PERO SOLO HABRA UNA VAR.DEPENDIENTE)
ANALISIS PARA VARIABLES
CLASIFICACIN DE LAS VARIABLES: POR SU NATURALEZA
VARIABLES CUALITATIVAS
O CATEGRICAS


VARIABLES
CUANTITATIVAS
NMERICAS
NOMINAL
ORDINAL
INTERVALO
DE RAZN
DICOTOMICAS
POLITOMICAS
DISCRETAS
CONTINUAS
ESTADISTICA DESCRIPTIVA SEGN VARIABLES
VARIABLES
CUALITATIVAS








VARIABLES
CUANTITATIVAS
MEDIDAS DE RESUMEN
1. FRECUENCIAS
2. PORCENTAJES PROPORCIONES
3. PORCENTAJES ACUMULADOS
TABLAS CUADROS
GRAFICOS
TABLAS DE DISTRIBUCIN
DE FREQ
1. GRAFICOS DE BARRAS
2. GRAFICOS DE
SECTORES
1. MEDIDAS DE TENDENCIA
CENTRAL
2. MEDIDAS DE DISPERSIN
3. MEDIDAS DE FORMA
TABLAS DE MEDIDAS DE
TENDENCIA CENTRAL Y
DISPERSIN
1. HISTOGRAMA
2. GRAFICOS DE TALLO Y
HOJAS
3. DIAGRAMA DE CAJAS
ANALISIS PARA VARIABLES CUALITATIVAS
MEDIDAS DE RESUMEN
Son procedimientos de clculos numricos que producen cifras que
resumen una cantidad de informacin
Frecuencias
Frecuencias acumuladas
Porcentajes
Porcentajes acumulados
FRECUENCIA (FREQ)
Es el nmero de veces que se repite un determinado valor categora de
la variable
FRECUENCIAS ACUMULADAS
Es la suma de las frecuencias de las categoras menores iguales a una
cierta categora de la variable
PORCENTAJE
Es el cociente entre la frecuencia y el total de la muestra por cada
categora que toma la variable.
PORCENTAJES ACUMULADOS
Es el cociente entre las frecuencias acumuladas de un determinado valor
categora y el nmero total de la muestra
ANALISIS PARA VARIABLES CUALITATIVAS
DISTRIBUCIN DE FRECUENCIAS
Tabla construida en orden por categoras indicando para cada una de ellas
la: frecuencia, frecuencia acumulada, porcentaje y porcentaje acumulado.
Lo ms comn es que se presenten las frecuencias y los porcentajes
ANALISIS PARA VARIABLES CUANTITATIVAS
MEDIDAS DE TENENCIA CENTRAL
Medidas empleadas para describir el valor medio de un conjunto de datos
Las ms usadas son : La media, la mediana y la moda

MEDIDAS DE DISPERSIN
Mide la dispersin de los datos con respecto al promedio
Medidas de dispersin: Rango, percentiles, rango intercuartilico, varianza,
desviacin estndar.
ESTADISTICA INFERENCIAL
PRUEBA DE HIPOTESIS
Enunciado acerca de una poblacin para ponerlo a prueba
PASOS PARA UNA PRUEBA DE HIPOTESIS
1. FORMULAR UNA HIPOTESIS NULA A SER PROBADA (Ho) Y UNA ALTERNA
(H1)
2. SELECCIONAR EL TIPO DE PRUEBA ESTADISTICA APROPIADA PARA AL TIPO DE
DATOS REQUERIDOS
3. ELEGIR EL NIVEL DE SIGNIFICANCIA (Probabilidad de rechazar Ho cuando es
verdadera: ( 0,01 a 0,05)
4. BUSCAR EL ESTADISTICO DE PRUEBA PARA EL (Tabla)
5. CALCULAR EL VALOR ESTADISTICO (Z= (X-/ /n)
6. COMPROBAR ESTE VALOR CON EL DE LA TABLA. SI ES MAYOR SE RECHAZA Ho
7. OBTENER LA CONCLUSIN SOBRE LA POBLACIN.
PRUEBA Z
Compara la media de la muestra con una media hipotticamente existe en
una poblacin y tomar as una decisin.
Se aplica
Donde el tamao de muestra es de cualquier orden y se conoce la
desviacin estndar de la poblacin.
El tamao de la muestra es mayor de 30 y no se conoceDS
PRUEBA t
Utilizada en la prueba de hiptesis de las medias cuando se desconoce DS
y n es menor de 30
Se utiliza s como una desviacin de DS
PRUEBA DE KOLMOGOROV-SMIRNOV
Usa una comparacin de frecuencias observadas y esperadas para
determinar si los resultados observados guardan correspondencia con una
hiptesis nula especifica para datos ordinales
JI CUADRADO
Se compara una distribucin hipottica de la poblacin con una
distribucin generada por una muestra con
X
2
= (Oi Ei)
2
/ Ei

Oi > # observado de encuestados en categora i

Ei > # hipottico de encuestados en categora i