Sei sulla pagina 1di 32

Módulo II

Diseño y aplicaciones de la visualización de datos

Codificación gráfica de datos


[6.1] ¿Cómo estudiar este tema?

[6.2] Definición de la codificación y la tabulación gráfica

[6.3] Etapas de trabajo para la codificación

[6.4] Geocodificación. La codificación de datos en el


análisis geográfico

[6.5] Aplicaciones empresariales de la geocodificación.


El caso de Uber

[6.6] Referencias bibliográficas

6
TEMA
Esquema

TEMA 6 – Esquema
CODIFICACIÓN GRÁFICA DE DATOS

Definición de la Geocodificación. Aplicaciones


Etapas de

2
codificación y la La codificación de empresariales de
Presentación trabajo para la
tabulación datos en el análisis la geocodificación.
codificación
gráfica geográfico El caso de Uber

Proceso de
codificación de
preguntas
abiertas
Presentación y Visualización de Datos

© Universidad Internacional de La Rioja (UNIR)


Presentación y Visualización de Datos

Ideas clave

6.1. ¿Cómo estudiar este tema?

Para estudiar este tema deberás leer y comprender las Ideas clave que se presentan a
continuación.

En este tema se comienza con la definición de codificación y tabulación. Posteriormente,


se define el proceso de codificación, para concluir con la geocodificación y un ejemplo
real de geocodificación.

El contenido de este tema es de elaboración propia a partir del libro: Introducción a la


metodología de la investigación empírica, del experto Klaus Heineman.

TEMA 6 – Ideas clave 3 © Universidad Internacional de La Rioja (UNIR)


Presentación y Visualización de Datos

6.2. Definición de la codificación y la tabulación gráfica

Para el experto en codificación Heineman, K. (2003), un plan para analizar e interpretar


datos debe constar de las siguientes etapas que podemos identificar en la siguiente
figura:

Fuente: Heineman, K., 2003, p. 229.

Codificación

Marketingbrianda (2017) indica que «la codificación se puede definir como un proceso
consistente en asignar a todos y cada uno de los tipos de respuesta del cuestionario o del
documento de observación con un dígito o número que represente a cada una de las
respuestas. Es decir, que en la codificación se asigna a cada variable o a cada valor de una
variable un código que identifica la respuesta.

La codificación supone una reducción del contenido de las respuestas a un código


correspondiente a una clasificación que agrupe las expresiones y escalas de medición.
Por tanto, se puede afirmar que el objetivo de la codificación es representar todas y cada

TEMA 6 – Ideas clave 4 © Universidad Internacional de La Rioja (UNIR)


Presentación y Visualización de Datos

una de las respuestas de los cuestionarios y de las anotaciones de los documentos


de observación por códigos numéricos que faciliten su agrupación.

Cuando se realiza el análisis de los datos obtenidos, la información debe agruparse


según las categorías previstas a partir de observaciones o encuestas estandarizadas, de
modo que se puedan seguir analizando.

La codificación supone tanto una interpretación de los datos obtenidos (qué


comentario/observación se asigna a un código), como un proceso en el que se codifica
la información obtenida con arreglo a un plan establecido de codificación para poder
seguir analizando los resultados de este procedimiento.

» Las preguntas cerradas se codifican asignando un número a cada una de las


respuestas predeterminadas.

» Para codificar las preguntas abiertas o semiabiertas se procede del siguiente


modo:

o Se leen todas las respuestas dadas a la pregunta.


o Se establecen grupos (o intervalos) de respuestas que agrupen todas las respuestas.
o Se asigna un código a cada uno de los grupos (o intervalos) de respuestas
establecidas.

La clasificación de las preguntas abiertas es laboriosa y está sujeta a errores y


subjetividades por lo que, sin negar la riqueza de matices que puede aportar, es
aconsejable reducirlas al mínimo en los cuestionarios.

Tabulación de los datos

La tabulación de los datos se puede definir como el recuento del número de respuestas
que ha tenido una pregunta y su presentación en tablas. Consiste en resumir los datos en
una tabla que sustituya la masa de datos difícilmente manejable por una representación
ordenada de los mismos para facilitar su uso.

La tabulación no tiene un fin en sí misma, sino que es el medio que permite al


investigador tener una visión de conjunto de la información de todos los

TEMA 6 – Ideas clave 5 © Universidad Internacional de La Rioja (UNIR)


Presentación y Visualización de Datos

cuestionarios al convertir estos en datos homogéneos que posteriormente serán objeto


de análisis.

La depuración de los datos consiste en detectar los datos erróneos. Estos datos
erróneos pueden deberse: bien por errores en la cumplimentación del cuestionario, o
bien por errores de inconsistencia de las respuestas. Ante estas situaciones se pueden dar
dos opciones: corregir los datos erróneos, observando de nuevo el elemento o recogiendo
otra vez el dato. O bien desechar los datos erróneos.
En las tablas se dispone de manera conjunta y ordenada de las sumas o totales, de las
respuestas de una pregunta o de varias relacionadas entre sí obtenidas de la tabulación
de los datos.

Por tanto, se puede concluir que el proceso sería el siguiente:

» ¿Cómo se realiza la tabulación de los datos?

La tabulación puede realizarse pregunta por pregunta, lo que se denomina


tabulación simple: tipo I, tipo II y tipo III. La tabulación puede realizarse de dos
en dos preguntas o más preguntas a la vez, lo que se denomina tabulación cruzada.

En la tabulación simple se calculan: la frecuencia absoluta, la frecuencia relativa, las


frecuencias acumuladas (ascendente o descendente) y los porcentajes con que se
presentaron dichas respuestas en la muestra.

En la tabulación cruzada se trata de poner en relación las respuestas a dos o más


preguntas diferentes para ver en qué medida las respuestas están ligadas entre sí. Se
calculan las frecuencias absolutas y relativas y las frecuencias conjuntas.

o Tablas de tipo I

Este tipo de tablas corresponde a situaciones en la que la variable x toma pocos


valores y, además, se dispone de pocas observaciones. En este caso, basta con
presentar la información de manera ordenada.

TEMA 6 – Ideas clave 6 © Universidad Internacional de La Rioja (UNIR)


Presentación y Visualización de Datos

Por ejemplo, x = número de hijos de los cinco trabajadores de mi empresa.


Las respuestas han sido: 0,3,0,1,3.
Bastaría presentar ordenados los datos: 0,0,1,3,3.

o Tablas de tipo II

Se utiliza en el caso en el que la variable x toma pocos valores y, sin embargo, toma
muchos datos.
Ejemplo: hemos preguntado a nuestros cincuenta empleados los días que faltaron
al trabajo durante el mes pasado, las respuestas han sido:

• 1,0,0,3,4,1,2,9,1,0
• 1,2,3,3,4,0,0,1,1,1
• 1,1,2,3,3,4,0,1,0,2
• 1,0,0,2,3,3,2.1,0,0
• 0,2,3,4,4,2,1,0,2,0

X= días ausentes Repeticiones

o Tablas de tipo III

Se utiliza este tipo de tabla cuando los valores que toma la variable objeto de
estudio es muy grande.

Por ejemplo: estudiamos el peso de una determinada población y obtenemos


cuarenta datos, pero muy diferentes:

• 60- 66-67-70-59-55-78-80-55,50-63
• 61-58-64,5-56-71-83-62-60,40-49-55-52
• 70-74,32-80-58-48-52-53-57-67-66
• 77-74-67-63-58,9-54-65-66-60-50

TEMA 6 – Ideas clave 7 © Universidad Internacional de La Rioja (UNIR)


Presentación y Visualización de Datos

En estos casos se agrupan las respuestas en intervalos, con lo que se consigue una
mayor comodidad en el tratamiento de los datos. Siempre teniendo en cuenta que
en esta agrupación se pierde información.

Los intervalos pueden tener la misma amplitud o no, dependiendo de la estructura


de los datos y el estudio que se está llevando a cabo. Además, pueden contener sus
valores extremos (intervalos cerrados, [2,10]) o no (intervalos abiertos [2,10]) o
incluir uno y no otro (intervalos semiabiertos [2,10])».

Conceptos importantes

Marketingbrianda (2017) manifiesta que es relevante tener claros algunos conceptos que
se utilizan tanto para codificar, como para tabular, depurar y analizar las respuestas de
las encuestas:

» «Población: conjunto de personas, animales o cosas sobre las que se va a realizar la


investigación.
» Elementos de una población: cada una de las unidades o entes componentes de
la población.
» Tamaño de la población: el número total de elementos que integra la población.
» Caracteres de la población: la serie de cualidades, propiedades o rasgos comunes
que poseen los elementos de una población (rasgos de un individuo: edad, sexo, nivel
de estudios...)

Los caracteres de la población pueden ser:

o Caracteres cualitativos o atributos: son aquellos que por su propia naturaleza


no se pueden cuantificar.
o Caracteres cuantitativos o variables: son aquellos que se pueden describir
mediante números.

Una vez tabulados los datos, serán sometidos a diversas técnicas de análisis. Este análisis
consiste en: obtener, de los datos numéricos contenidos en las tablas, medidas
estadísticas representativas de las mismas; y en determinar la validez de estas medidas
para el conjunto de la población objeto de estudio».

TEMA 6 – Ideas clave 8 © Universidad Internacional de La Rioja (UNIR)


Presentación y Visualización de Datos

6.3. Etapas de trabajo para la codificación

En la elaboración de un plan de codificación, el primer paso que se debe realizar es la


preparación de los datos para la elaboración de un plan de codificación. Según
Heineman, K. (2003), un plan de codificación debe contener:

» «Un número de identificación para cada hoja de recopilación (por ejemplo: para
cada cuestionario, cada protocolo de observación, cada texto, etc.). Este número de
identificación es el que hace posible, cuando sea necesario, corregir (volviendo a la
hoja de recopilación correspondiente) los errores de codificación en los que se haya
incurrido.

» Números variables, es decir, cada variable contiene un número de casa, que hace
posible identificar cada una de las variables o volver a encontrarlas; por ejemplo, en
el ordenador, con el fin de utilizarlas posteriormente en procedimientos de recuento
y cálculo.

» Los códigos para cada valor de una variable, es decir, asignación de un número a
cada valor» (pp. 220-221).

Según Heineman, K. (2003) no debe suponer un problema «la elaboración de un plan de


codificación para preguntas cerradas o para aquellas preguntas cuyas posibles respuestas
se encuentran ya distribuidas en categorías en el propio cuestionario o, en el caso de las
observaciones estandarizadas, en aquellas en las que los hechos observados deben
asignarse a categorías predeterminadas.

En estos casos, la clasificación de las respuestas sobre expresiones de variables la realiza


ya el propio encuestado, el entrevistador o, si se trata de una observación, las personas
que han observado un hecho (codificación de campo). La propia pregunta contiene ya la
escala de determinación de los valores de las variables. Al elaborar el plan de codificación
hay que fijar, pues, los números de identificación y los números de variable» (p. 221).

Por otro lado, Heineman, K. (2003) establece como un proceso más complejo «cuando
la codificación de las respuestas se realiza sobre preguntas abiertas o de textos; por
ejemplo: de entrevistas cualitativas o de protocolos de observaciones cualitativas» (p.
221).

TEMA 6 – Ideas clave 9 © Universidad Internacional de La Rioja (UNIR)


Presentación y Visualización de Datos

En estos casos, primero debe establecerse una escala basada en las respuestas que se
anotaron en el cuestionario, el protocolo de observación, etc. Se plantean aquí los
problemas que ya se comentaron en relación con el análisis de contenido.

Fases de la codificación

El proceso de codificación de preguntas abiertas definido por Heineman, K. (2003)


tiene las siguientes siete fases:

» «Escrutinio de las respuestas: el primer paso es examinar y anotar las respuestas


correspondientes a las preguntas abiertas. Se consigue así una perspectiva del
espectro de posibles respuestas y de la frecuencia con que éstas se obtienen. No tiene
mucho sentido crear códigos para respuestas muy poco frecuentes.

» Creación de variables: cuando ya se ha realizado el escrutinio se clasifican las


respuestas, es decir, se crean variables y se asignan cifras (códigos) a sus valores. Esta
clasificación supone el desarrollo de una escala de medición para variables mediante
las cuales se pueden determinar sus valores. De esta forma, las respuestas se
estructuran de acuerdo con estas escalas de medición. Por este motivo, los códigos
deben cumplir los mismos requisitos que se exigen a cualquier escala de medición.
Esto significa que los códigos de una variable deben ser claros y unívocos, adecuados
al problema y han de excluirse unos a otros» (pp. 221-222).

Heineman, K. (2003) propone que en estas dos primeras fases de la codificación de


preguntas abiertas, se debe realizar una tarea de comprensión y agrupación de las
respuestas para poder tabular estas cuestiones. Para facilitar la comprensión de estas
dos primeras etapas de la codificación de preguntas abiertas se expondrá un
ejemplo:

o «En una encuesta cara a cara se estudia qué tipo de gente utiliza unas instalaciones
deportivas comerciales. No interesa tanto si las utiliza o no (hecho objetivo), sino
la percepción del hecho desde el punto de vista del propio sujeto. Por eso, el
entrevistador plantea la pregunta abierta y se anotan las respuestas.

¿Con qué gente se encuentra uno en este gimnasio?


Anotación:...............

TEMA 6 – Ideas clave 10 © Universidad Internacional de La Rioja (UNIR)


Presentación y Visualización de Datos

En la revisión de prueba se encontraron respuestas del tipo: «gente maja con la que
da gusto estar»; «muchos hombres atléticos», «en realidad no tengo contacto
alguno», «suelen ser españoles, aunque hay algún extranjero»; «gente insociable,
solo quieren hacer músculo»; «muchas más mujeres», «la mayoría de las veces
gente rica»; «directivos, empleados, autónomos»; «provienen de todas las clases
sociales»; «sobre todo turcos y marroquíes», «muchos que solo vienen a ligar»; «la
mayoría hombres, aunque también alguna mujer», «una gente muy aburrida»,
«todos muy elegantes, muy intelectuales», «por lo menos tres catedráticos, uno
incluso es sociólogo», «no quiero tener ya nada que ver con esa gente, se lo toman
demasiado en serio», «lo más bonito: jóvenes y viejos pedaleando juntos al mismo
tiempo», «yo ya no voy a ir, hay demasiada gente barriobajera», «no quiero hacer
daño a nadie, pero seguro que algunos son homosexuales, tal como se miran el
cuerpo...», «no sé, hace nada incluso vinieron dos negros» (pp. 222-223).

Y ahora hay que ponerse a estructurar este compendio de respuestas heterogéneas.


Pueden formarse una gran cantidad de variables:

Características
de Características Sexo Grupos
personalidad sociales Nacionales.
Gente sociable Nivel de ingresos Sólo hombres Españoles
Gente maja Nivel profesional Sólo mujeres Extranjeros

Nivel de Hombres y
Gente aburrida formación mujeres Nacionalidad
……. ….. ….. ……

Este ejemplo deja claro que:

• Del conjunto de las respuestas pueden deducirse una gran cantidad de


variables. En este ejemplo, se propusieron cuatro variables distintas, pero a la
vista de las respuestas cabría pensar en muchas más. La decisión de cuáles crear
depende del tema que estudia el proyecto y de las suposiciones teóricas. Se
demuestra una vez más con toda claridad que una pregunta planteada de forma
poco precisa, sin contexto teórico sobre la relevancia de las variables, puede
convertir la interpretación de los datos en un caos.

• La codificación de preguntas abiertas supone al mismo tiempo la


interpretación de las respuestas, en un primer momento, por parte de los

TEMA 6 – Ideas clave 11 © Universidad Internacional de La Rioja (UNIR)


Presentación y Visualización de Datos

investigadores que elaboran el plan de códigos, más tarde por parte de los
codificadores que codifican las distintas encuestas según el plan de codificación,
es decir, que asignan un código a las respuestas (dudas que pueden surgir: ¿se
refiere con barriobajeras a un tema de profesión?; elegante e intelectual
¿pueden considerarse características de la personalidad?, etc.).

• Al llevar a cabo la codificación se pierde información. Si en el ejemplo


anterior consideramos que únicamente van a tenerse en cuenta características
objetivas como pueden ser la edad, el sexo y el nivel social, desaparece todo el
resto de la información como carente de relevancia».

El anterior ejemplo de Heineman, K. (2003) pone de relieve la importancia de una


correcta interpretación de las respuestas, al igual que el riesgo latente e inherente
a la agrupación y, por tanto, por la pérdida de información que se produce al
reducir las respuestas a unas pocas variables.

La siguiente etapa de la codificación de las respuestas para Heineman, K. (2003) es la


de continuos añadidos:

» «Continuos añadidos: el plan de codificación no suele ser definitivo cuando se


comienza el proceso de codificación. Todavía habrá que modificarlo repetidamente
según vayan apareciendo durante la codificación las respuestas frecuentes que no se
pueden asignar claramente a uno de los códigos o que no se tuvieron en cuenta en el
momento de elaborar el plan de codificación. Esto hace precisa una constante
información del investigador y una supervisión de su trabajo para evitar, por ejemplo,
que se incluya una gran parte de las respuestas en el apartado otros» (p. 223).

o Heineman, K. (2003) propone un proceso de realimentación de las


variables que mejore la codificación de las preguntas abiertas. Para mejorar la
comprensión, el autor plantea el siguiente ejemplo:

«I. Preguntas de un cuestionario:

• Dígame, por favor, cuántos socios tiene en este momento su club.

Menos de 100 socios ()


De 100 a 300 socios ()

TEMA 6 – Ideas clave 12 © Universidad Internacional de La Rioja (UNIR)


Presentación y Visualización de Datos

De 301 a 500 socios ()


De 501 a 1.000 socios ()
Más de 1.000 socios ()
No contesta ()
No sabe ()

• ¿Cuándo se fundó su club?

Año de fundación ❏❏❏❏


Año de fundación desconocido ()
Sin respuesta ()

• ¿Qué instalaciones deportivas ofrece su club en este momento?

Indicaciones al entrevistador:

Marcar la respuesta correspondiente:

Gimnasio, pabellón cubierto ()


Estadio ()
Canchas de tenis ()
Piscina ()
Otros ()

• Según su opinión ¿cómo podría conseguirse que su club dispusiera de mejores


instalaciones deportivas? ¿Puede comentarnos el motivo más importante?
Anotación:.......................................................

...........................................................................

...........................................................................

TEMA 6 – Ideas clave 13 © Universidad Internacional de La Rioja (UNIR)


Presentación y Visualización de Datos

II. Plan de codificación para esta parte de una encuesta:

Variable Nombre de las Códigos Columnas


variables
Número de cuestionario 1-4
V1 Tamaño del club
Hasta 100 socios (1) 5
De 100 a 300 (2)
De 301 a 500 (3)
De 501 a 1000 (4)
Más de 1000 (5)
No contesta (9)
No sabe (0)
V2 Año de fundación (XXX) 6-8
No sabe (998)
No contesta (999)
V3 Instalación 9
deportiva/pabellón

No
V4 Instalación 10
deportiva/estadio
Sí (1)
No (2)
V5 Instalación 11
deportiva/tenis
Sí (1)
No (2)
V6 Instalación 12
deportiva/piscina
Sí (1)
No (2)
V7 Instalación 13
deportiva/otros
Sí (1)
No (2)
V8 Mejora de las 14
instalaciones
deportivas

TEMA 6 – Ideas clave 14 © Universidad Internacional de La Rioja (UNIR)


Presentación y Visualización de Datos

Argumentos (1)
económicos
Argumentos políticos (2)
Argumentos. (3)
referentes al club
Argumentos referentes (4)
a la colaboración
Otros argumentos (5)
No sabe (8)
No contesta (9)

Tabla 1. Plan de codificación para encuesta.

• A cada variable se le asigna un número de casa, es decir, una o más columnas;


de esta forma pueden identificarse y comentarse las variables durante la
evaluación (el concepto columna procede de un tiempo en el que los datos se
almacenaban todavía en tarjetas perforadas, divididas en columnas)» (pp. 223-
225).

Para Heineman, K. (2003), la cuarta etapa de la codificación de preguntas abiertas es:

» «Codificación de los datos recopilados: las respuestas a los cuestionarios y los


datos de los protocolos de observación se codifican, pues, con arreglo a este plan de
codificación. Esto hace que en el transcurso de la investigación entre en acción un
nuevo grupo de personas, los codificadores.

El codificador se encarga de la labor técnica de codificar: debe traspasar los datos


básicos que se encuentran en las hojas de recopilación de acuerdo con el plan de
codificación al soporte informático correspondiente. El codificador debe ser
informado con exactitud de su tarea; es decir, es necesario que se familiarice con la
técnica de la codificación y el plan de codificación.

De nuevo, se plantean problemas con la codificación de las respuestas a preguntas


abiertas. La tarea más difícil del codificador es interpretar adecuadamente las
respuestas anotadas en el cuestionario o en el protocolo de observación y codificarlas
de acuerdo con las indicaciones recibidas. Por este motivo, es necesario explicar
cuidadosamente sobre todo la codificación de las preguntas abiertas y la
interpretación de las distintas categorías. Primero, conviene que el codificador realice

TEMA 6 – Ideas clave 15 © Universidad Internacional de La Rioja (UNIR)


Presentación y Visualización de Datos

codificaciones de prueba para practicar su trabajo. Además, en todo momento debe


supervisarse mediante pruebas al azar que realiza su labor correctamente.

La codificación es costosa, sobre todo si se trata de preguntas abiertas, y al mismo


tiempo arriesgada. Se plantean todas las tareas y los problemas comentados en
relación con la interpretación de textos en el análisis de contenidos. Esta
interpretación y clasificación de las preguntas es tarea, en último término, del
codificador. Esto supone una fuente importante de errores; se ha demostrado que dos
codificadores distintos han llegado a codificar hasta en un 20% de los casos de forma
distinta las respuestas a la misma pregunta.

Aunque las preguntas abiertas de un cuestionario son más fáciles de formular porque
no hace falta pensar indicaciones para la respuesta, son después mucho más
complejas de interpretar. Por este motivo, siempre hay que analizar detenidamente
en el momento de esbozar el cuestionario, si no sería más adecuado plantear una
pregunta cerrada, evitando así la complejidad y los riesgos de la interpretación de las
respuestas a preguntas abiertas» (p. 226).

Como propone el autor, siempre que se vaya a crear una encuesta se debe valorar e
intentar hacer todas las preguntas cerradas que se pueda para evitar pérdidas de
información en la codificación. Para Heineman, K. (2003), la siguiente etapa es:

» «Depuración de los datos: cuando el ordenador termina de elaborar una primera


distribución de frecuencias de las variables, suelen aparecer una serie de puntos
inciertos. Se codificaron expresiones de variables que, según el plan de codificación,
no deberían aparecer porque: se han confundido las variables, se han introducido sin
atención, las indicaciones de la hoja de recuento eran ilegibles, etc. En estos casos, es
necesario encontrar la hoja de recopilación mediante el número de identificación para
corregir el error.

Puede pensarse que algunos valores se dan muy pocas veces, de forma que no es
posible realizar la interpretación; o sea, que la distribución de valores es
extremadamente desigual. En estos casos, hay que realizar un cambio en los códigos»
(pp. 227-228).

Para Heineman, K. (2003), debido a la etapa de la depuración de los datos, se produce la


siguiente etapa nueva codificación

TEMA 6 – Ideas clave 16 © Universidad Internacional de La Rioja (UNIR)


Presentación y Visualización de Datos

» «Nueva codificación: a veces, la codificación se ha realizado de manera que no es


posible continuar con el análisis. Hay que unir varios códigos o, a veces, agregarlos a
un nueva variable; en algunos casos, la combinación de distintas variables puede
llevar a una nueva variable» (p. 228).

Para mejorar la comprensión, el autor propone un ejemplo:

«Las cifras de años del ejemplo anterior se codificaron de la manera en la que se


anotaron en el cuestionario. Esto hace difícil seguir con el trabajo porque en cada año
solo se fundaron unos pocos clubes. Pueden combinarse los datos creando grandes
periodos de tiempo, en grupos de diez o veinte años, por ejemplo; o se pueden
distribuir según las grandes fases de la historia, puesto que se supone que estas
también tuvieron su influencia sobre el desarrollo de los clubes: por ejemplo,
fundaciones anteriores a la guerra civil, durante la dictadura, fundaciones en la fase
de transición hasta 1983; nuevas fundaciones.

Al añadir estas categorías debe tenerse en cuenta que en los valores haya suficientes
casos para su inclusión. Parece razonable prestar especial atención a los clubes de
reciente creación, pero, si en la muestra hay solo quince nuevas fundaciones, no sería
nada útil una clasificación de este tipo» (p. 228)

Cuando ya se ha realizado la etapa de nueva codificación, para Heineman, K. (2003) ya


solo queda la fase final del proceso de codificación de preguntas abiertas:

» «Creación de múltiples indicadores/índices: cuando se utilizan múltiples


indicadores para medir una sola variable pueden reunirse estos en un nuevo indicador
múltiple. Un indicador múltiple de este tipo se denomina también índice» (p. 228).

Para mejorar la comprensión de esta etapa Heineman, K. (2003) propone un


ejemplo.

TEMA 6 – Ideas clave 17 © Universidad Internacional de La Rioja (UNIR)


Presentación y Visualización de Datos

Para analizar de forma empírica la participación deportiva pueden utilizarse tres


indicadores: % proporción de presupuesto que se gasta en deporte; % proporción de
tiempo libre que se usa para el deporte; % valor de la relación con el deporte, medido
en una escala de Guttman. De aquí, se forma un indicador participación deportiva, de
la siguiente forma:

Proporción de Hasta 5% 6 hasta 10% 11 hasta 15% Más de 15%


presupuesto
Puntos 1 2 3 4
presupuesto
Proporción Hasta 10% 10 hasta 20% 21 hasta 30% Más de 30 %
tiempo libre
Puntos 1 2 3 4
tiempo libre
Valor relación Hasta 0,2 0,21 hasta 0,4 0,41 hasta 0,7 Más de 0,7
con el deporte
Puntos unión 1 2 3 4

Al distribuir así los porcentajes, naturalmente hay que estar bien seguro de que
existen datos suficientes para rellenar todas las celdas. Al realizar la prueba hay que
obtener un valor de entre 3 (poca relación con el deporte) y 12 (mucha relación con el
deporte).

Es posible realizar modificaciones cuando estén descompensados los indicadores,


añadiendo otros. Este ejemplo muestra de nuevo la arbitrariedad de la formación de
los indicadores y hace comprensible que los resultados de este tipo de estudios
únicamente expresen algo cuando se conoce la forma en que se determinaron los
índices» (pp. 228-229).

El proceso de codificación de preguntas abiertas de Heineman, K. (2003) es muy


ilustrativo y sus ejemplos explican de una manera clara y sencilla cómo elaborar este
procedimiento.

TEMA 6 – Ideas clave 18 © Universidad Internacional de La Rioja (UNIR)


Presentación y Visualización de Datos

6.4. Geocodificación. La codificación de datos en el análisis


geográfico

Se puede definir la geocodificación como «el proceso consistente en asignar unas


coordenadas cartográficas a una entidad» (Calero, 2004, p. 237).

Pérez, R. P. (2008) ha definido la geocodificación como «la acción de atribuir


coordenadas geográficas a uno, o varios eventos» (p. 1). Pérez, R. P. (2008) indica que:
«es evidente que, aunque este proceso puede realizarse manualmente, su utilización
intensiva en la geografía contemporánea se debe al auge de los Sistemas de
Información Geográfica (como Flowmap, que también es un SIG) y al creciente
aumento de la capacidad de almacenamiento de grandes bases de datos, así como el
de la velocidad de procesamiento de los ordenadores» (p. 1).

Fuente: http://www.terranalisis.cl/imagenes/userfiles/geocodificacion.jpg

Según Pérez, R. P. (2008): «desde hace unos diez años, los recursos y métodos de
geocodificación han sido cada vez más utilizados. En combinación con otras tecnologías
de análisis espacial se han constituido en especialidades de los Sistemas de Información
Geográfica. Se hace referencia a los estudios de Geomarketing y al LBA (sigla
proveniente del inglés: Location Based Analisys); así como a la cartografía automatizada
de POI (Points of Interest ).

Más recientemente (en los últimos cinco años), el empleo de POI se ha hecho
prácticamente indispensable en los mapas digitales de Internet, sobre todo su

TEMA 6 – Ideas clave 19 © Universidad Internacional de La Rioja (UNIR)


Presentación y Visualización de Datos

combinación con la capacidad de geocodificación y el establecimiento de rutas y caminos


mínimos para la cartografía digital que se utiliza corrientemente hoy en día con los GPS,
sea para uso comercial (en taxis y autobuses), como institucional o privado» (p. 1).

Pasos a seguir en el proceso de geocodificación

El proceso de geocodificación no reviste gran dificultad, pero los pasos a seguir suponen
una cierta laboriosidad. Pondré como ejemplo el proceso de geocodificación que se llevó
a cabo en el artículo: ¿Qué distancia recorre el consumidor para comprar un coche?

» Se partió de una base de datos en donde se encontraba la relación completa de


códigos postales de Andalucía, sin ningún otro dato.

» Se identificó cartográficamente cada uno de los centroides de los códigos


portales de Andalucía. Para localizar cartográficamente los centroides de cada código
postal se buscan los códigos postales internacionales en Internet. Si no aparecía el
centroide del código postal o aparecían los datos erróneos, se acudía a la página web
http://www.geopostcodes.com/ para confirmar o cambiar este dato.

» Posteriormente, se identificaban los centroides de todos los códigos postales de


Andalucía. Por otro lado, se creó otra tabla en donde se extrajeron del total de códigos
postales de Andalucía, los códigos postales en los que se ubicaban geográficamente
los concesionarios de Citroën. Esta red de concesionarios de Citroën es la que se eligió
como red base para optimizarla.

TEMA 6 – Ideas clave 20 © Universidad Internacional de La Rioja (UNIR)


Presentación y Visualización de Datos

Como ejemplo se mostrará el resultado de esta última geocodificiación, es decir, la


ubicación cartográfica de los centroides de los códigos postales de Andalucía en los
que había concesionarios de Citroën en 2011:

CÓDIGO POSTAL NOMBRE


LONGITUD LATITUD
CONCESIONARIO MUNICIPIO
11011 Cádiz -625.054 36.479.678
11205 Algeciras -545.781 36.160.762
Jerez de la
11407 -613.679 36.704.790
Frontera
14013 Córdoba -481.052 37.759.901
14014 Córdoba -468.526 37.967.292
14400 Pozoblanco -475.872 38.278.041
14900 Lucena -453.285 37.368.212
18015 Granada -366.193 37.193.625
18600 Motril -349.061 36.748.674
21007 Huelva -690.005 37.298.018
23009 Jaén -370.429 37.856.368
23400 Úbeda -335.994 38.014.374
23650 Torredonjimeno -395.926 37.765.430
29004 Málaga -448.319 36.681.661
29006 Málaga -449.800 36.710.680
29200 Antequera -457.907 36.998.432
29603 Marbella -488.635 36.509.940
29640 Fuengirola -461.738 36.558.552
29700 Vélez-Málaga -412.054 36.757.442
41007 Sevilla -595.645 37.396.389
41015 Sevilla -597.338 37.435.396
41410 Carmona -557.559 37.457.564
41560 Estepa -489.833 37.300.084
Huércal de
94230 -246.901 36.886.223
Almería
94710 El Ejido -277.546 36.783.396
Tabla 2. Resultado de la última geocodificación. Fuente: elaboración propia a partir de Automóviles
Citroën España y las páginas web geopostcodes y códigos postales internacionales.

TEMA 6 – Ideas clave 21 © Universidad Internacional de La Rioja (UNIR)


Presentación y Visualización de Datos

6.5. Aplicaciones empresariales de la geocodificación. El caso de


Uber

En este tema ya hemos visto cómo codificar encuestas y cómo geocodificar para explotar
datos geográficos. Como continuación, presentaremos un caso de éxito empresarial
fundamentado en la geocodificación: el caso de Uber.

Modelo de negocio

La empresa Uber tiene un modelo de negocio sencillo: mediante la geolocalización de


usuarios y de vehículos ha logrado crear una red que puede proveer de un servicio de
transporte ejecutivo en menos de diez minutos en las ciudades donde opera a un precio
razonable. Para ello, aprovecha la conectividad de los consumidores actuales para
enlazarlos con el servicio que requieren de forma eficiente, abonando el servicio a través
de plataformas de pagos electrónicos para cerrar la transacción.

Uber es un sistema donde el usuario descarga una aplicación y posteriormente se


registra para permitir a esta empresa poder encontrar la ubicación del usuario de Uber a
través del GPS. Uber detecta automáticamente la posición gracias a la geolocalización. El
cliente elige entre diferentes modelos de vehículo y luego presiona en el botón que activa
el pedido. En ese momento, se le asigna el vehículo que ha elegido más próximo a su
ubicación. Todos los pagos de esta plataforma se hacen online. Cuando el usuario llega
al destino, Uber carga el precio del recorrido en la tarjeta de crédito del usuario sin
necesidad de pago en efectivo.

Fuente: http://pulsosocial.com/2015/11/03/uber-hace-entrada-en-republica-dominicana-con-tarifa-base-
de-dop-70/

TEMA 6 – Ideas clave 22 © Universidad Internacional de La Rioja (UNIR)


Presentación y Visualización de Datos

Historia de la empresa

La historia de Uber comenzó en el año 2008, cuando Garret Camp vendió StumbleUpon
a EBay y comenzó, junto a Travis Kalanick, a buscar otra empresa que crear. La primera
idea de empresa fue un negocio que compaginase tres factores: el coste del taxi, el del
conductor y el del estacionamiento. Después de afinar algunas ideas, en 2009 tenían el
primer prototipo de una aplicación para iPhone llamada UberCab.

En enero del 2010 Camp, Kalanick y Salazar fueron a Nueva York a probar la aplicación
utilizando tres vehículos alquilados. En julio del mismo año empezaron sus operaciones
en la ciudad de San Francisco, posteriormente en octubre del 2010 cambiaron su nombre
a Uber y, finalmente, en noviembre sacaron su versión para Android. Desde el
lanzamiento de su versión para Android, la empresa ha conocido un crecimiento sin fin
hasta nuestros días.

Travis Kalanick, creador de Uber.


Fuente:
https://3www.ecestaticos.com/imagestatic/clipping/eb3/888/eb388800647a82001a040536fa6bc86e/im
agen-sin-titulo.jpg?mtime=1498026194

Ventajas

La ventaja competitiva de Uber sobre los servicios de transporte tradicionales, como los
taxis, es que el usuario puede acceder al servicio en cualquier momento con
solamente acceder a una aplicación y con un par de clics puede tener un vehículo
disponible.

Del lado del conductor, la ventaja que ofrece Uber es la posibilidad de tener siempre un
viaje disponible cerca de su ubicación, además de que el sistema de calificación y
reputación que los usuarios hacen del servicio garantiza que a mejor calificación
obtendrán más viajes, lo que redunda en una mejor experiencia del cliente.

TEMA 6 – Ideas clave 23 © Universidad Internacional de La Rioja (UNIR)


Presentación y Visualización de Datos

Un modelo de negocio disruptivo es aquel que es distinto porque cambia las reglas de
juego. Uber no es simplemente un modelo de negocio disruptivo, Uber es el símbolo de
la disrupción. Uber no fue la mejor flota de taxis, con el mejor servicio o la mejor tarifa.
Uber no mejoró el producto, sino que ha sido capaz de mutar totalmente el modelo de
negocio del transporte terrestre de pasajeros.

Comparado con el servicio tradicional de taxi, en donde es difícil saber cuánto tiempo
tardará en pasar uno desocupado, o en los tiempos de espera en la línea telefónica para
solicitar un servicio, así como desconocer si el taxista sabe o no la mejor ruta a nuestro
destino, ha hecho que miles de usuarios prefieran el servicio de Uber. El servicio de taxis
siempre ha estado organizado en empresas formales, gremios y reglamentos para el
ingreso o salida de nuevas unidades. La propuesta de Uber fue distinta: poner en
contacto a conductores profesionales con usuarios que necesitan transporte. Conecta
de forma directa la necesidad con la oferta.

La base del éxito de Uber radica en la geolocalización, desde Londres hasta Ciudad de
México, esta aplicación permite a los usuarios una localización de un Uber que se
encuentre cerca de ellos, disponible y de manera inmediata. Mientras que para los
conductores, les ofrece una conectividad a aplicaciones de mapas y localización GPS más
precisas y con mayor cantidad de datos como cierres viales o incidentes en la ruta.

6.6. Referencias bibliográficas

Calero, R. (2004). Diseño de un sistema de Geomarketing para la localización de


establecimientos comerciales. Tesis Doctoral. Universidad Rey Juan Carlos.

Heineman, K. (2003). Introducción a la metodología de la investigación empírica. En


las ciencias del deporte. Barcelona: Paidotribo.

Marketingbrianda (2017). Codificación y tabulación. Recuperado de:


https://marketingbrianda.wikispaces.com/

Pérez, R. P. (2008). Proceso de geocodificación urbana: ejemplos de su aplicación en la


ciudad de Barcelona. Segon Congrés catalá de Geografía, pp. 626-640 DOI:
10.13140/2.1.1858.5280. Recuperado de:
http://dialnet.unirioja.es/servlet/articulo?codigo=4049337&orden=364450&info=link

TEMA 6 – Ideas clave 24 © Universidad Internacional de La Rioja (UNIR)


Presentación y Visualización de Datos

Lo + recomendado

Lecciones magistrales

Codificación gráfica de datos

En esta lección se va a tratar el proceso de codificación gráfica de datos, definiendo dicho


proceso, así como los tipos de codificaciones y sus características.

Accede a la lección magistral a través del aula virtual

No dejes de leer…

Tu discurso me aburre

Largo, A. (2011). Tu discurso me aburre. Recuperado de:


http://www.rrhhmagazine.com/articulos.asp?id=962

En este artículo se hace un alegato a realizar presentaciones diferentes que motiven y


entretengan a la audiencia.

Accede al artículo a través del aula virtual o desde la siguiente dirección web:
http://www.rrhhmagazine.com/articulos.asp?id=962

TEMA 6 – Lo + recomendado 25 © Universidad Internacional de La Rioja (UNIR)


Presentación y Visualización de Datos

No dejes de ver…

Los nuevos retos de la educación. César Bona

César Bona ha sido elegido como uno de los cincuenta mejores maestros del mundo,
según el Global Teacher Prize, el llamado Premio Nobel de los Profesores. En este
discurso hace un alegato sobre la educación y es un ejemplo de cómo la motivación en
las presentaciones es fundamental para llegar a la audiencia, en el caso de César sus
alumnos.

Accede al vídeo a través del aula virtual o desde la siguiente dirección web:
https://www.youtube.com/watch?v=LcNWYNp2MSw

TEMA 6 – Lo + recomendado 26 © Universidad Internacional de La Rioja (UNIR)


Presentación y Visualización de Datos

+ Información

Webgrafía

Ignasi Alcalde

Es una web creada por este experto en comunicación donde publica artículos y recursos
sobre la presentación y la visualización de datos.

Accede a la página web a través del aula virtual o desde la siguiente dirección:
http://www.ignasialcalde.es/

Bibliografía

Heineman, K. (2003). Introducción a la metodología de la investigación empírica. En


las ciencias del deporte. Barcelona: Paidotribo.

TEMA 6 – + Información 27 © Universidad Internacional de La Rioja (UNIR)


Presentación y Visualización de Datos

Actividades

Trabajo: Análisis de un trabajo de visualización en detalle

Descripción de la actividad:

OECD Better Life Index (http://www.oecdbetterlifeindex.org/es/ ) es una herramienta


que permite comparar el bienestar de los 34 países de la OCDE a través de diferentes
indicadores (seguridad, educación, vivienda). Se trata de un proyecto basado
fundamentalmente en visualización interactiva de información, que combina tanto
gráficos estándar como algunos más originales.

Metodología:

» Tu objetivo es escribir un artículo de análisis sobre el proyecto


http://www.oecdbetterlifeindex.org/es/ . Tienes que escribir como si hubiera de ser
publicado en una revista especializada en visualización de datos. Por ello, debe tener
un cierto tono académico, lo que no excluye que utilices un estilo creativo y claro. El
tono debe ser constructivo.

» El primer paso será visualizar y explorar todos los contenidos con atención. Toma
abundantes notas sobre ellos.

» En tu artículo deberías destacar tanto aquellas partes del proyecto que te parecen
especialmente relevantes y acertadas (gráfica e interactivamente), como aquellas
cuestiones que creas son susceptibles de mejora (usabilidad, elección de tipos de
gráfico no acertados, etc.)

» La estructura del artículo es libre. Se debe especificar la descripción de la actividad,


las pautas de elaboración, los objetivos, los criterios de evaluación y la extensión
máxima.

Objetivos:

El objetivo de esta práctica es analizar este trabajo de visualización en detalle.

TEMA 6 – Actividades © Universidad Internacional de La Rioja (UNIR)


28
Presentación y Visualización de Datos

Criterios de evaluación:

Se tendrá en cuenta la capacidad de síntesis, estructura del trabajo (introducción,


desarrollo, conclusiones y bibliografía aplicando las normas APA).

Extensión máxima: 3 páginas, Georgia 11, interlineado 1,5.

TEMA 6 – Actividades © Universidad Internacional de La Rioja (UNIR)


29
Presentación y Visualización de Datos

Test

1. ¿Qué es la codificación?:
A. Es la conversión datos en gráficos.
B. Es el proceso consistente en asignar a cada respuesta del cuestionario un
número que represente la respuesta.
C. Es el proceso consistente en asignar un código a cada representación gráfica de
los resultados del estudio.
D. Es cuando se asigna a cada encuesta un código para diferenciarla de las demás
encuestas.

2. ¿Cómo se codifican las preguntas abiertas?:


A. Se le da un código a cada respuesta.
B. Solo se asigna código a las respuestas más repetidas, desechando las respuestas
menos acontecidas.
C. Se leen todas las respuestas, se agrupan las respuestas en grupos y se da a cada
grupo de respuestas se le asigna un código.
D. Ninguna de las anteriores.

3. ¿Qué es la tabulación de los datos?:


A. La tabulación de los datos es el recuento del número de respuestas que ha tenido
una pregunta y su presentación en una tabla.
B. La tabulación supone leer todas las respuestas, agrupar las respuestas en grupos
y dar a cada grupo un código.
C. La tabulación es el establecimiento de una escala en las representaciones
gráficas de un estudio.
D. Tabulación y codificación son lo mismo.

4. ¿Qué es la depuración de los datos?:


A. Es la reducción de las respuestas a códigos.
B. Es la representación en una tabla de las respuestas.
C. Tabulación, codificación y depuración son lo mismo.
D. Supone detectar los datos erróneos y gestionar dichos datos erróneos.

TEMA 6 – Test 30 © Universidad Internacional de La Rioja (UNIR)


Presentación y Visualización de Datos

5. Todo plan de codificación debe contener:


A. Un número de identificación para cada hoja.
B. Número de variables.
C. Los códigos para cada valor de una variable.
D. Todos los anteriores.

6. ¿Cuáles son las fases del proceso de codificación de preguntas abiertas?:


A. Escrutinio, creación de las variables, continuos añadidos, codificación de los
datos recopilados, depuración de los datos, nueva codificación y creación de
indicadores.
B. Escrutinio, creación de las variables, continuos añadidos, codificación de los
datos recopilados, depuración de los datos, nueva codificación, creación de
indicadores y desarrollo de tablas.
C. Escrutinio, continuos añadidos, codificación de los datos recopilados,
depuración de los datos, nueva codificación y creación de indicadores.
D. Escrutinio, creación de las variables, continuos añadidos, codificación de los
datos recopilados, nueva codificación y creación de indicadores.

7. ¿Cuál de las siguientes afirmaciones sobre la codificación de datos es falsa?:


A. En la codificación de preguntas cerradas la propia pregunta contiene ya la escala
de determinación de las variables.
B. La codificación de preguntas abiertas requiere de un proceso de codificación.
C. El escrutinio es una de las fases del proceso de codificación de preguntas
abiertas.
D. La codificación de preguntas cerradas tiene la misma complejidad que la
codificación de preguntas abiertas.

8. ¿Cuál de las siguientes afirmaciones es falsa en relación a la codificación de los datos


recopilados?:
A. Se codifican tanto los cuestionarios como los datos de los protocolos de
observación.
B. El codificador se encarga de la labor técnica de codificar.
C. No es necesario que el codificador conozca el plan de codificación.
D. Debe ser supervisada la labor del codificador.

TEMA 6 – Test 31 © Universidad Internacional de La Rioja (UNIR)


Presentación y Visualización de Datos

9. ¿Cuál de las siguientes afirmaciones es falsa para la depuración de datos?:


A. La depuración no revela errores en la codificación.
B. La depuración muestra distintos tipos de errores en la codificación.
C. La recuperación de la hoja de recopilación es necesaria para corregir el error.
D. El número de identificación sirve para encontrar la hoja de recopilación.

10. ¿Cuál de las siguientes definiciones corresponde con geocodificación?:


A. El proceso consistente en asignar unas coordenadas cartográficas a una entidad.
B. La acción de atribuir coordenadas geográficas a uno o varios eventos.
C. Es el proceso de asignar, indicar qué código postal se encuentra en cada evento.
D. A y B son correctas.

TEMA 6 – Test 32 © Universidad Internacional de La Rioja (UNIR)

Potrebbero piacerti anche