Sei sulla pagina 1di 8

Conceptualización sobre técnicas de migración y herramientas ETL

Especialización en gestión y seguridad de base de datos

Ingrid Caterine Ramírez Aldana

Docente

Yuri Katherine Ibáñez Navarro

Adriana del Pilar González Ríos

Paula Bibiana Lara Sánchez

Servicio Nacional de Aprendizaje SENA

Bogotá D.C

2019
CONTENIDO

INTRODUCCIÓN ................................................................................................................................... 3
MIGRACIÓN DE DATOS........................................................................................................................ 4
TRANSFORMACIÓN ............................................................................................................................. 4
PASOS PARA MINIMIZAR EL RIESGO INHERENTE AL MOVIMIENTOS DE DATOS ................................ 4
HERRAMIENTAS ETL ............................................................................................................................ 5
COMPARATIVA DE SOFTWARE ETL ..................................................................................................... 5
CONCLUSIONES ................................................................................................................................... 7
REFERENCIAS ....................................................................................................................................... 8
INTRODUCCIÓN

En el siguiente informe se presentará las diferentes técnicas de migración de datos y un cuadro


comparativo de un software como herramienta ETL donde se compara su versión gratuita y la
versión de pago y sus principales características.
MIGRACIÓN DE DATOS

Migración de datos: Llamamos migración de datos al proceso que necesitamos hacer para transferir
los datos de un sistema a otro mientras cambiamos el sistema de almacenamiento donde se
encuentran los datos, o bien mientras se practican las modificaciones necesarias en la base de datos
o la aplicación que los gestiona.

La migración de datos es el proceso mediante el cual realizamos una transferencia de datos de unos
sistemas de almacenamiento de datos a otros, de unos formatos de datos a otros o entre diferentes
sistemas informáticos.

TRANSFORMACIÓN

Conjunto de pasos interconectados por medio de saltos que procesan registros a partir de un origen
de datos y cuya salida son uno o más registros.

Tiene una entrada de datos ya sea de un archivo plano, de una base de datos, de una hoja de cálculo,
de Access, un csv, un xml cualquier extracción de datos esto se procesa con unas transformaciones
para mejorar la información para limpiarla y optimizarla y posteriormente se genera una carga o
salida de datos también en cualquier tipo de almacenamiento de información, un archivo plano, una
base de datos relacional o no relacional, en un insert etc.

PASOS PARA MINIMIZAR EL RIESGO INHERENTE AL MOVIMIENTOS


DE DATOS

1. Entender que datas se está migrando, de qué tipo son, cuál es su origen y qué formato
adquirirán en destino, una vez completado el traslado.
2. Aplicar los procesos ETL (extracción, transformación y carga) preferiblemente antes de
proceder a la migración.
3. Definir e implementar políticas de migración de datos para garantizar el orden necesario a
lo largo de todo el proceso.
4. Apostar por las pruebas y validación de los datos migrados, por ser la única manera efectiva
de asegurarse de que reúnen todos los atributos de calidad necesarios.
HERRAMIENTAS ETL

Se llaman herramientas ETL porque permiten extraer, transformar y cargar; estas herramientas
permiten a las organizaciones mover datos desde múltiples fuentes, reformatearlos, limpiarlos y
cargarlos en otra base de datos, data warehouse, para analizar o en otro sistema operacional o para
apoyar un proceso de negocio.

COMPARATIVA DE SOFTWARE ETL

Producto Pentaho community (Data Pentaho Enterprise Edition


Integration)
Fabricante Pentaho-Estados unidos
Versión v. 8.3 NA (Son varios productos con
diferentes versiones)
Licencia NA Suscripcion anual
Lenguaje de Java
desarrollo
Entorno gráfico Herramienta de diseño (spoon) basada en SWT.
Entorno de ejecución Desde la herramienta de diseño, o desde línea de comandos con las
utilidades PAN y kitchen.
Plataforma Windows, unix y Linux.
Informes Si es posible crear algunos Es posible crear informes que
informes interactivos pero no puedan ser compartidos con otras
dashboard, ni hacer uso de personas, dashboard y hacer uso
herramientas de análisis. de herramientas analíticas.
Data integration, big La limpieza, transformación y carga Ofrece herramientas más
data de datos se puede hacer en la avanzadas de integración de datos
versión community pero no tiene y la posibilidad de mantener varios
herramientas avanzadas como Jobs.
programación de tiempos y de big Cuenta con herramientas más
data. avanzadas como Visual Map
reduce. Pentaho Enterprise Edition
toma las mejores ideas de la
comunidad, las somete
rigurosamente a pruebas en
múltiples entornos y brinda
soporte a largo plazo para el éxito
del big data
Mobile NA Tienen versión móvil
Soporte NA Por teléfono 24/7 y por email
Comunidad Los usuarios de Pentaho Enterprise Edition y Community Edition pueden
interactuar con su creciente comunidad de usuarios en reuniones.
Participe en la comunidad para intercambiar historias, adoptar las
mejores prácticas y compartir complementos integrados en la
plataforma de código abierto de Pentaho.
Riesgo El incumplimiento de las licencias Enterprise Edition garantiza que su
de código abierto podría resultar IP construida sobre Pentaho esté
en una infracción de IP y una protegida contra litigios, mientras
orden judicial para liberar su se beneficia de la comunidad
código fuente. innovadora, fácil integración y
conjunto de herramientas de
flexibilidad que van de la mano
con el código abierto
Actualizaciones NA Envía automáticamente
actualizaciones mensuales y
parches y rastrea vulnerabilidades,
correcciones y actualizaciones.
Data science tools NA Obtenga acceso a Sci-Kit,
TensorFlow, Keras, marcos de
aprendizaje profundo y otras
capacidades de ciencia de datos
que son independientes de la CPU
y la GPU en su cartera
Capa de ejecución NA Cambia sin problemas entre el
adaptativa motor Kettle nativo de Pentaho y
Spark. Hitachi garantizará el
soporte continuo de Pentaho de
los últimos motores para que los
desarrolladores no necesiten
reescribir sus aplicaciones
Costo 0 Pentaho ofrece modelos de
precios flexibles basados en
suscripción que se alinean con las
necesidades de una empresa. Para
conocer el costo se debe contactar
con ellos.
CONCLUSIONES

 Pentaho es una buena herramienta ETL y su versión gratuita es ideal para procesos de
transformación y carga de datos.
 Un plan de migración de datos debe contar con el análisis de los datos, secuencia de paso a
paso de los primeros datos a migrar, transformación de los datos si es necesario y
finalmente la carga de estos datos en otro sistema.
 Las herramientas ETL permiten automatizar y estandarizar procesos de migración de datos
y así evitar que se comentan errores manuales cuando se intenta hacer lo mismo sin ayuda
de ninguna herramienta.
 Existen diferentes tipos de migración una de ellas es migración de base de datos si es de un
motor de base de datos a otro igualmente se debe hacer un análisis de datos en este análisis
se debe conocer tablas, campos, procedimientos almacenados y triggers que deben
migrarse al nuevo sistema manejador de base de datos, lo ideal es que esta migración se
realice en un entorno de pruebas y una vez estemos seguros de que la migración se ha
realizado con éxito, sin problemas de interpretación de datos ni pérdida de ellos, podemos
pasar a un entorno de producción, teniendo en cuenta que una migración mal realizada
podría dar por terminada una estructura de información completa.
REFERENCIAS

https://www.powerdata.es/migracion-de-datos

https://www.hitachivantara.com/en-us/pdf/brochure/why-organizations-choose-pentaho-
enterprise-edition-ebook.pdf

Potrebbero piacerti anche