Sei sulla pagina 1di 2

___¿Cuál es la finalidad del

preprocesamiento de datos?
 La finalidad es la preparación de datos que seran utilizados para aplicar el modelo
deseado.
 Es que se deben preprocesar los datos para eliminar o transformar datos incompletos
o datos inconsistentes y así poder trabajar los datos de una manera más eficaz.
 Es procesar(eliminar , transformar ) grandes cantidades de datos y transformarlos en
información valiosa para la toma de decisiones.
 Es convertir los datos recopilados que están una forma no organizada y transformarlos
en un formato mas legible para que los ordenadores interpreten y se pueda usar la
información.

___Defina y escriba un ejemplo de


atributo numérico
 Atributo Numérico, trabaja únicamente con atributos que toman valores discretos.
 Un atributo numérico es una cantidad la cual puede representada con valores enteros o
reales, un ejemplo es la edad la cual puede ser representada como atributo numérico.
 Los atributos numéricos contienen valores enteros o reales. Por ejemplo, atributos
como el salario o la edad son numéricos.
 Cuantitativo,representado por valores reales

___Defina y escriba un ejemplo de


atributos categóricos
 Atributo Categórico, se ocupa del estudio de variables que son
mediables (color, nacionalidad, sexo), y que se puede establecer un
rango entre las observaciones

___Defina y escriba un ejemplo de


atributos binarios
 Atributo Binario se basa en una evaluación de parámetros de manera Binaria(0,1),
permite de manera fácil y rápida de obtener un resultado.

___Defina y escriba un ejemplo de


atributos de relación
Las relaciones entre atributos son asociaciones entre atributos que especifican
el modo en que se conectan los atributos.
Las relaciones entre atributos definen el modo en que las tablas y columnas se
unen y se usan, y qué tablas están relacionadas con otras tablas.

Herramientas que puedan realizar data


cleansing
Las herramientas que encontré son las siguientes: *

Drake *

OpenRefine: flujo de trabajo de datos basada en texto, extensible y fácil de


usar. DataCleaner: es una poderosa herramienta para trabajar con datos
desordenados: limpiarlo; transformándolo de un formato a otro; y ampliarlo con
servicios web y datos externos.

Jupyter

En qué consiste el proceso de Data


transformation
La transformacion de datos es el proceso de conversion de datos de un formato a otro,se
pueden realizar transformaciones como seleccionar ciertas columnas de tablas cargadas

___Herramientas para data


transformation
-Talen : Proporcionan Software para integrar, limpiar, enmascarar y perfilar datos, cuenta
con interfaz gráfica de usuario que permite administrar un gran numero de sistemas.

-SSIS de Microsoft SQL Server: Permite a los usuarios implementar soluciones


integradas de almacenamiento de datos, sin tener que involucrar código. La interfaz
permite arrastrar y colocar fácilmente ETL para varios tipos de datos y destinos de
almacén.

-Atom: es una solución de gestión de canalización de datos que permite la transmisión


de datos, en tiempo real, en un almacén de datos. Atom permite la personalización del
flujo de datos de la forma mas eficiente.

Potrebbero piacerti anche