Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
EJE 1
Conceptualicemos
Fuente: Shutterstock/625561898
Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
Fuentes de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Tipo de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
Sistemas de información . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
Bibliografía . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
ÍNDICE
Introducción
Los datos no son más que la forma o manera como las empresas conocen lo que
hacen, dicen o hacen sus clientes. Para hacer un registro de estos datos, regular-
mente se usan encuestas o reportes de facturas que llevan a identificar un dato.
INTRODUCCIÓN
Sistematizados
Organizado en un archivo de siste-
mas, tal como las bases de datos.
Los datos en las
organizaciones
Dentro de toda organización, sin importar su tipo, siempre encontraremos datos de
interés para cada área funcional, y es por ello que se hace necesaria su clasificación,
administración, gestión y análisis. Observemos en el ejemplo algunos datos que nos
permitirán el desarrollo de bases de datos.
Ejemplo:
- Número de factura.
Cliente Empresa - Compra.
- Método de pago.
Figura 1.
Fuente: propia
Negocio Andina S.A.
Rut:
Tomando como referencia la figura 2, se plantea una de las formas que podría tener
una base de datos:
Transv 28 Bombillas
21245866 Cali 150 $4.500
78K-F 150Kw
Instrucción
Los invito a desarrollar la primera actividad
práctica para mejor comprensión del tema
que estamos desarrollando.
Ejemplo
Geográficos
Ciencias
Culturales naturales
Tipos
de datos
Ambientales
Financieros
Estadísticos Transporte
Los datos regularmente provienen o son bolsa, la tasa de interés efectiva y nominal
obtenidos por sectores que en cualquier del mercado, etc.
momento obtienen información de un
ciudadano común. Aquellos que provienen
del sector transporte pueden ser como, por
ejemplo: el número de accidentes, la can-
tidad de vehículos que hay en el parque
automotor, número de vías pavimentadas. ¿Qué tipo de datos considera-
En otro sector como el financiero se puede ría el estudiante que proveería
tener: el precio de las acciones y/o deri- el sector ambiental?
vados financieros, el índice general de la
• Numérico.
Es de saber que en muchos
programas la clasificación
• Carácter o texto. puede variar, pero en esen-
cia la funcionalidad y des-
cripción suele ser la misma.
• Lógicos.
• Nulos.
Los datos de tipo numérico suelen representarse tal como su nombre de clasificación
así lo identifica.
Ejemplo
Enteros: 34560 o -34560. Puede ser también continuos o de forma deci-
mal, es decir, 2.36; 4.78, etc. Los primeros lenguajes de programación lo
toman como “int (integer)” y los segundos como “float”.
Debe tenerse en cuenta que los datos numéricos regularmente se usan para descrip-
ciones como precios, ingresos, gastos, numero de contacto, edad, etc.
Ejemplo
7 > 5, True.
3 = 4, False.
Analicemos un caso en Excel de Microsoft: tenemos un par de variables que son de tipo
numérico, para este caso se usan números enteros y a partir de estos queremos obtener
una respuesta lógica:
¡Recordemos !
Video
Videorelato
Así los ubicaríamos en Excel, para tener una aproximación columna de respuesta.
Para la fila 1, donde se encuentran los = SI (E9 < G9; “Verdadero”; “Falso”)
valores de 10, si es mayor estrictamente a 5
la celda respuesta debe ser condicionada a: Si en algún aspecto el estudiante se ve
confundido con la programación puede
= SI (E7 > G7; “Verdadero”; “Falso”) hacerlo de forma manual cambiando las
letras de la ubicación de la celda con los
Donde E7 corresponde a la celda que respectivos valores.
contiene el valor de 10, se usa el operador
“>” mayor estrictamente, G7 hace referen- = SI (13 < 16; “Verdadero”; “Falso”)
cia a la celda donde está el valor de 5 y
La respuesta será “Verdadero”.
Ejemplo
Precio
Cliente Dirección Ciudad Producto Cantidad
unitario
12366457 Cra 32 #F40 Bogotá Termos 2Cms NULL $5.320.000
Transv 28
21245866 Cali NULL 150 $4.500
78K-F
Lectura recomendada
Ejemplo
Recursos
Los elementos proveídos por los indivi-
duos generan información y con esta se
establecen recursos de operación. Figura 5. Sistema.
Fuente: propia
Los sistemas pueden ser más complejos en la medida que se adhieran más fases o
áreas dentro de las organizaciones, como se observa en la figura 6.
Sistema de información
Lenguaje. Localización.
Negocio.
Procesos de
Obtención información
de
información Estadística
Medios descriptiva.
informativos. Base
de datos
Análisis de
datos Estadística
Medios de Difusión inferencial.
difusión (diarios,
revistas,
Soluciones
internet).
técnicas
Modelos
de datos.
Presentación
a las Toma de
directivas. Acciones. decisiones.
Figura 6. Sistema de información
Fuente: propia
Al usar información que puede ser recopilada de forma diaria, semanal, quincenal,
mensual, semestral o anual, se puede establecer una jerarquía de perfiles de los clientes
o proveedores que participan en el entorno de la empresa. El buen uso de la información
genera una disciplina más precisa en la compañía en lo que tiene que ver con una mejor
oferta de servicios.
El estado de pensamiento de las empresas no solo reposa en la parte más alta que
asume la jerarquía de la compañía, al contrario, parte de las bases que le brinda el área de
analítica, regularmente compuesta con personal con talento en lectura e interpretación
de datos, a pesar de la necesidad de poseer conocimientos de las matemáticas, algebra
y estadística, la analítica intenta hacer una lectura correcta de la información y usarla a
favor de los desafíos del mercado.
Una definición muy formal podría darse más informadas, también suelen ser usa-
como el proceso de inspeccionar conjun- das por científicos e investigadores para
tos de datos e información que brindan verificar o refutar modelos científicos,
los agentes del mercado con el único fin teorías e hipótesis sobre condiciones que
de sacar conclusiones que lleven a mejo- establecen los mercados.
rar la calidad de la oferta de servicios, hoy
en día se hace con la ayuda de sistemas El simple análisis de datos parte desde
especializados y de software (muchos de el conocimiento de las métricas, saber en
estos con licencia de pago y otros muy qué forma o manera se
pocos de licencia abierta o gratuita). Las mide la información es
Conjeturas
tecnologías y técnicas de análisis de datos el punto de partida para Juicio que se forma de
se utilizan ampliamente en las industrias y establecer conjeturas con algo por indicios u ob-
empresas para permitir tomar decisiones la información disponible. servaciones.
Regularmente en las bases de datos las manual de etiquetas para cuando la base
variables se escriben con pocas letras, sim- de datos es gigante o usa demasiados datos
plemente se forman como una sola pala- como lo es la Gran encuesta manufactu-
bra, incluso a veces solo con iniciales, esto rera. Todo lo anterior puede ser denominado
depende -claro está- del administrador de la como la caracterización de la base de datos
base de datos que se familiariza con la infor- y se considera la primera etapa de la ana-
mación que entra para la digitación de esta. lítica. Muchas veces habrá que crear, codi-
Hay un establecimiento de etiquetas, que es ficar y sistematizar la información que es
donde regularmente se hace la descripción obtenida a diario y a partir de esto armar el
de todo tipo que puede tener la variable. En montaje en el software específico de utiliza-
los organismos estatales incluso se crea un ción, las bases de datos.
Hay muchos softwares más como R, Python, Tableau, SAS, que cada uno maneja a
disposición de su interfaz un gran grupo de variables e información. Cada uno tiene sus
ventajas y desventajas con respecto a otro, pero la analítica es la misma.
Otra de las fases del análisis de datos viene de los conceptos aplicados de la estadística,
los primeros son de orden descriptivo y los segundos ya de manera más formal como lo
son los inferenciales.
Para este caso será específicamente de 2.188.047, lo que nos indica que habrá ingre-
sos por encima de la media con valor de 2188 y por debajo del promedio en la misma
proporción. La desviación nos dice que tanto se desvían las observaciones con respecto
al promedio. Si la desviación fuera baja, sabríamos que los datos u observaciones serán
muy comunes entre personas, lo que quiere decir que casi todos tienen un mismo nivel
de ingreso promedio, pero si esta es demasiado alta, podríamos encontrarnos con dife-
rentes ingresos de las personas de la base de datos y hablaríamos de mucha variabilidad
o varianza.
El valor máximo y mínimo nos indica qué nivel de ingreso en esta ocasión fue el más
alto y el más bajo dentro de las 5 personas que nos emitieron información. Simplemente
se organizan los datos, primero de mayor a menor y después sí de menor a mayor. Se
toma el primer dato de cada uno de estos.
El ingreso más alto es el de $ 21.200, por tanto, el individuo número 4 es el que más
gana de todas las observaciones.
Por último, si queremos conocer la suma de todos los ingresos de las personas, eso
es simplemente sumando todos los datos proporcionados en la columna que para este
caso el valor es de $ 91.929.
En muchas ocasiones los softwares nos evitan los cálculos manuales, que pueden llegar
a convertirse en dispendiosos si la base ya contiene más del millón de observaciones, en
este caso hay que recurrir a la programación y salida de órdenes que se les da, para el
cálculo y resumen de métricas.
Ingresos
Media $ 18.385,80
Mediana $ 18.455,00
Moda NULL
Desviación estándar 2188,046777
Varianza de la muestra 4787548,7
Curtosis 0,084275904
Coeficiente de asimetría -0,192748948
Mínimo 15365
Máximo 21200
Suma 91929
N 5
1
Alfa hace referencia al nivel de confianza de la prueba, regularmente en estadística los parámetros se rigen al 95 %
y para la construcción de la zona como es (1 - alfa) el valor de probabilidad es de 5 % o 0.05.
Los datos cualitativos como no son usados de forma numérica, deben ser analizados
de forma distinta con el uso de las métricas descriptivas. Tal como son muchas veces
caracteres o cadena de textos se suelen codificar de forma binaria para poder ser toma-
dos como números.
Ejemplo
Videorelato
Lectura recomendada
Render, B., Stair, R, y Hanna, M. (2009). Métodos cuantitativos para los negocios.
México: Pearson Prentice Hall.