Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Presentado por
FRANCISCO JAVIER RAMÍREZ FAJARDO
Instructora
ALEXANDRA MARCELA VILLAMIL LOPEZ
Cuando la migración de datos se lleva a cabo con éxito la empresa se beneficia de:
- Mayor agilidad.
- Actualización máxima.
1.5.5 Qué se debe tener en cuenta para la elección del software de ETL .......... 20
CONCLUSIONES
1 MIGRACIÓN DE DATOS
1.4.1.1 CronSQL
CronSQL es una herramienta para la sincronización de
bases de datos. Permite definir múltiples sincronizaciones
entre diferentes bases de datos de una empresa
facilitando la sincronización de ciertos datos entre varios
programas e incluso entre una páginas web.
El caso más habitual y para el cual CronSQL fue inicialmente desarrollado, es para
sincronizar el software de gestión de una empresa con la base de datos de la página
web, de modo que los productos dados de alta en el programa de gestión sean
automáticamente llevados a la tienda virtual de la web.
1.4.1.2 SharePlex
Migre y actualice
Aumente la escalabilidad.
Mejore el rendimiento
Soporte análisis
Optimice su entorno de informes y mejore el rendimiento de OLTP.
1.4.1.3 SymmetricDS
El software se instala o bien de modo autónomo, como una aplicación web dentro de
servidor de aplicaciones Java, o puede ser incorporado a otra aplicación Java.
SQL Data Sync es un servicio que permite poder sincronizar datos a través de las
múltiples bases de datos SQL de Azure y bases de datos de SQL Server locales.
El concepto básico de sincronización de datos con SQL Data Sync se puede ver en la
siguiente imagen:
SQL Data Sync usa una topología de radios de hub para sincronizar los datos. En el
grupo de sincronización (por ejemplo, Grupo de sincronización 1), una base de datos se
define como la base de datos del concentrador (debe ser una base de datos SQL de
Azure) y el resto de las bases de datos del grupo de sincronización son las bases de
datos de los miembros. La sincronización de datos se muestra solo entre el
concentrador y la base de datos miembro individual.
Las bases de datos de miembros pueden ser bases de datos SQL de Azure, bases de
datos de SQL Server local o instancia de SQL Server en máquinas virtuales de Azure.
La dirección de sincronización de datos (Sync) puede ir en ambas direcciones
(bidireccional) o en una, desde la base de datos central a una base de datos miembro
(Hub to Member) y viceversa, desde una base de datos miembro a la base de datos
hub (Member to Hub)
Para poder sincronizar los datos entre SQL Server local y la base de datos de Azure
(Hub), el agente de sincronización local tiene que instalarse en la máquina local. Este
agente se comunica entre el concentrador y la base de datos de SQL Server local. Para
más información sobre cómo instalar y configurar el Agente de sincronización de datos
de SQL Azure se explica en el artículo Cómo sincronizar la base de datos de Azure y la
base de datos local con SQL Data Sync.
1.5 PROCEDIMIENTOS ETCL (EXTRACCIÓN, TRANSFORMACIÓN, LIMPIEZA Y
CARGA)
Consiste en evaluar y comprender los datos existentes y, en particular, los que son
requeridos por el nuevo sistema. Para determinar la calidad de los datos orígenes hay
que detectar si existen datos erróneos, si un mismo concepto se encuentra definido
con distintos términos o si faltan datos, ya que todo ello evidenciaría una falta de
calidad. Para poder extraer conclusiones se debe realizar un perfilado de los datos,
analizando cada uno en particular, así como sus interrelaciones. En esta fase es
fundamental:
1.5.2.2 Conversión
Esta etapa supone transformar los datos orígenes, adecuándolos al modo en que se
necesitarán en el destino. Es necesario preparar los datos para que sean cargados en
la nueva estructura y para ello habrá que realizar las conversiones necesarias en base
a las reglas de negocio y a la configuración de los sistemas actual y futuro.
1.5.2.3 Mapeo y carga de datos hacia la fuente destino
En esta fase se cargan los datos ya limpios y transformados al nuevo sistema. Este
proceso se puede hacer directamente o empleando áreas intermedias (repositorios)
donde validar y someter a los datos a ciclos de pruebas y simulaciones de carga,
aumentando las garantías de éxito en el momento de ejecutar la carga al destino final.
De esta manera no se pierde productividad pero se gana en agilidad. En cualquier caso,
es fundamental conocer y analizar la infraestructura a utilizar para lograr la migración de
datos, si quiere minimizarse el riesgo en la operación.
Hay distintas herramientas ETL en el mercado, cada una con sus características
concretas. Sin embargo, a la hora de elegir la herramienta adecuada para nuestra
empresa o proyecto, nos encontramos frente a cuatro distintas categorías principales:
Si se quiere saber cuáles son las mejores herramientas ETL, una referencia importante
es el Cuadrante Mágico de Gartner, que cada año indica cuáles son los proveedores
leader del mercado, entre los cuales se encuentran:
Otras herramientas también extremadamente potentes son: AWS Glue, Microsoft Azure
Data Factory y Astera Centerprise Data Integrator.
Según una investigación de EY y Nimbus Ninety, el 81% de los directivos toman sus
decisiones más estratégicas con base en la analítica de datos. De allí que los
proveedores de soluciones tecnológicas diseñen herramientas ETL cada vez más
potentes.
1.5.5 Qué se debe tener en cuenta para la elección del software de ETL
Existen muchas herramientas de ETL diferentes, como también hay infinidad de bases
de datos, sistemas y organizaciones distintas. En el momento de seleccionar la que
liderará la migración e integración de datos pueden tomarse en consideración las
recomendaciones de Gartner en cuanto a las cualidades que la herramienta ha de
presentar:
Un estudio de Bain & Company indica que los negocios con procesos de analítica
optimizados pueden tomar decisiones cinco veces más rápido que la competencia.
Contar, o no, con las herramientas de gestión de datos que mejor se adapten a la
organización puede marcar la diferencia entre su éxito o su fracaso.
En este sentido, elegir las mejores herramientas ETL trae los siguientes beneficios:
Como se ha visto, todas las categorías de herramientas ETL tienen sus ventajas y
desventajas. Por lo cual es importante tener en cuenta nuestros objetivos y
necesidades, así como los costes y recursos que tenemos a disposición para elegir si
adquirir una solución comercial, adaptar una herramienta open source, o desarrollar
nuestra propia herramienta.
Benetl: Es una herramienta ETL de uso libre, desarrollada entre los años 2007 – 2014,
hecha en java y trabaja con base a lenguajes de base de datos PostgreSQL o MySQL.
Esta herramienta se creó para facilitar el trabajo con archivos TXT, CSV o archivos de
fuente de datos XML. Para recuperar los datos que tendrán que definir un dato de
tiempo y una entidad, que está representado por datos a calcular o para mostrar.
Todos los objetos útiles serán creados por Benetl dentro de una base de datos MySQL
o PostgreSQL. La aplicación también es capaz de recuperar automáticamente los datos
mediante el uso de diversas tareas planificadas de su sistema.
Caracteristicas Benetl
Tecnologias:
Java 7 update 80
PostgreSQL 9.5.0 (con el apoyo plpgsql)
MySQL 5.6 con función de OLD_PASSWORD de inicio de sesión de
usuario (para controlador suministrado)
Con Windows (se utiliza "tareas programadas")
Benetl 4.7 funciona en Linux.
Requerimientos Tecnicos:
ejecución de Java (JRE) 1.7
base de datos PostgreSQL 9.5 con soporte plpgsql
base de datos de MySQL 5.6 con OLD_PASSWORD la función de inicio
de sesión de usuario o el controlador oficial de MySQL (no incluido)
Probado en sistemas de 64 bits
Ejemplo: Nombre EtlTool… Definir Nombre, Este nombre es también el nombre
de la tabla de PostgreSQL o tabla de MySQL donde se almacenan las líneas de
datos.
Un archivo llamado "EtlTool.bat" se creará en la carpeta de origen de datos.
Debe presionar enter para validar su nombre EtlTool, y luego se pueden guardar
los parámetros.
El SSIS Import/Export Wizard permite mover datos de origen a destino sin modificar los
datos del origen y permitiendo hacer iteraciones y cambios de información antes de
llegar al destino dentro de tablas de ETL. Se pueden importar datos de fuentes
diferentes a SQL Server.
Los paquetes, que son las unidades de almacenamiento de estas tareas de migración
se pueden guardar en archivos dtsx o en la base de datos en formato XML.
Caracteristicas SSIS
La opción empresarial ETL (Enterprise ETL Option) para Warehouse Builder es una
opción que puede ser adquirida con Oracle Warehouse Builder como parte de la
edición empresarial del motor de base de datos (Oracle DB Enterprise Edition).
2.2.3 Opciones Avanzadas para Carga de Datos
Como parte de la Enterprise ETL Option, Warehouse Builder permite ejecutar cargas
de datos usando métodos rápidos y eficientes tales como el Oracle Data Pump y
transportable tablespaces. Esta es una aproximación completamente diferente al
movimiento de datos que se realiza por medio de conjuntos de datos controlados por el
motor de base de datos. Los incrementos en velocidad de carga se deben entonces a
la omisión de las capas SQL tradicionales.
Técnica Descripción
Es una técnica muy utilizada en procesos de migración de datos,
consiste en hacer que dos bases de datos sean equivalentes en el
mismo tiempo.
Se logra mediante la copia de datos y metadatos de una base de
datos origen a una base de datos destino mediante una herramienta
Sincronización
tecnológica. Los asistentes de sincronización de los SMBD son
de base de
configurados con las bases de datos origen y la base de datos
datos
destino, parametrizando la ubicación de particiones y métodos de
seguridad.
Ediciones Precio de
Modelo de Disponibilidad de
de SQL Ideal para... Open NL
licencia canal
Server 2014 (USD)
Enterprise Rendimiento confiable y Por núcleo** Licencias por $14,256***
completo para satisfacer volumen, hosting
los requisitos de base de
datos y de Business
Intelligence más exigentes.
La edición Enterprise
proporciona los niveles de
servicio y rendimiento más
altos para las cargas de
trabajo de nivel 1.*
Business Una plataforma amplia que Servidor + Licencias por $8,908***
Intelligence permite a las CAL**** volumen, hosting
organizaciones compilar e
implementar soluciones de
BI seguras, escalables y
administrables.
Standard Funcionalidad de Business Por núcleo** Licencias por $3,717***
Intelligence y volumen, hosting
administración de datos
básica para cargas de
trabajo que no son críticas,
con recursos de TI
mínimos.
Servidor
+ Licencias por $931***
CAL****volumen, hosting,
minorista (FPP)
Developer Versión completamente Por usuario Licencias por $38***
funcional de SQL Server volumen,
que permite a los minorista (FPP)
desarrolladores compilar,
probar y demostrar
aplicaciones con software
de SQL Server de una
manera rentable.
PRECIO LICENCIA ORACLE
http://www.oracle.com/us/corporate/pricing/price-lists/business-intelligence-price-list-
071347.pdf
CONCLUSIONES
ETL; consiste en extraer los datos desde los sistemas de origen, no relacionales
u otras estructuras diferentes; para convertirlos los datos a un formato
predefinido para iniciar el proceso de transformación para su migración.
Control de la extracción de los datos y su automatización, disminuyendo el
tiempo empleado en el develamiento de procesos no documentados,
minimizando el margen de error y permitiendo mayor flexibilidad.
Acceso a diferentes tecnologías, haciendo un uso efectivo del hardware,
software, datos y recursos humanos existentes.
Se analizan los datos extraídos, de lo que resulta un chequeo que verifica si los
datos cumplen la pauta o estructura que se esperaba. De no ser así los datos
son rechazados.
Se utilizan para consolidar, migrar y sincronizar bases de datos operativas entre
diferentes sistemas operativos o similares.
Las ETL, son muy importantes para el manejo de grandes volúmenes de datos
Dependiendo del tipo, sistema operativo, clase de red y motor de BD; se debe
escoger la herramienta ETL apropiada.
BIBLIOGRAFIA
https://www.spuch.com/productos/cronsql/cronsql.htm
https://www.quest.com/mx-es/products/shareplex/
https://www.sqlshack.com/es/que-es-la-sincronizacion-de-los-datos-sql/
https://blog.mdcloud.es/herramientas-etl-comparativa-y-principales-categorias/