Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
CALI-VALLE
Agosto 2019
Introduccion
La migracion de los datos de una base de datos es una tarea la cual debemos aplicar, La
razón más común para la migración es la necesidad de mover los datos a un nuevo sistema
para ampliar y acomodar el crecimiento del volumen. Conocer las diferentes formas de
migracion de datos es de mucha importancia para asi saber cual se adapta a las
necesidades de la compañia.
Tecnicas existentes de migracion de base de datos
Sincronizacion
Esto se logrará con la copia de datos y metadatos destino mediante una herramienta
tecnológica, en la cual se configuran los sistemas de gestión de bases de datos con bases
de datos origen y destino parametrizando la ubicación de particiones y método de
seguridad.
DML
Estas sentencias son utilizadas para gestionar datos dentro de schemas. Una posibilidad
de los sistemas gestores de datos es la utilización de esta sentencia para generar los
respectivos scripts SQL que permiten realizar las migraciones existentes.
Ventajas
• Permiten realizar copias de seguridad, pruebas y creación o actualización de datos.
Desventajas
• Lentitud para las escrituras.
• Los índices afectan el rendimiento de algunos comandos.
ETCL
Es el proceso que permite a las organizaciones mover datos desde múltiples fuentes,
reformatearlos y limpiarlos, y cargarlos en otra base de datos, data mart, o data
warehouse para analizar, o en otro sistema operacional para apoyar un proceso de negocio.
Las funciones de este sistema son la carga inicial de mantenimiento o refresco periódico
que puede ser diario semanal, trimestral o mensual. El almacenamiento interno permite
realizar transformaciones sin la necesidad de paralizar la base de datos operacionales y el
almacén de datos, también se permite almacenar metadatos y sobretodo la facilidad de
integración de fuentes externas.
Pasos para la migracion ETCL.
Herramientas ETCL
Las herramientas ECTL son los instrumentos principales que nos permiten construir un data
warehouse o data mart. Sin embargo, no siempre es sencillo saber como elegir la
herramienta correcta y que mejor se adapte a nuestros objetivos. En este post se explicarán
las distintas categorías de herramientas ETCL y se hará una comparativa de las principales
herramientas en el mercado.
Hay distintas herramientas ETCL en el mercado, cada una con sus características
concretas. Sin embargo, a la hora de elegir la herramienta adecuada para nuestra empresa
o proyecto, nos encontramos frente a cuatro distintas categorías principales:
Herramientas ETCL Enterprise. Se trata de productos propietarios, con muchas
funcionalidades incluidas y soporte para conexión con una gran cantidad de fuentes y
suelen ser elegidas por grandes empresas ya que el coste de adquisición es elevado.
Herramientas ETCL open source. Se trata de herramientas de código libre y de uso gratuito,
lo que permite una mayor accesibilidad para empresas de tamaño reducido. Al ser
productos con un enfoque general, es necesaria a menudo una personalización para que
se adapten a objetivos concretos, lo que requiere consultoría especializada.
Herramientas ETCL personalizadas. Se trata de herramientas desarrolladas a medida y de
forma específica para una empresa o proyecto en concreto. Requieren un grande esfuerzo
inicial de desarrollo, pero el resultado se ajusta mejor a los requerimientos.
Herramientas ETCL Cloud. La nube nos puede proporcionar todas sus ventajas como una
alta flexibilidad y el pago por uso a la hora de elegir herramientas ETCL que se ofrecen
como servicio.
Informatica PowerCenter
Es una de las plataformas de integración de datos líderes en el mercado, que es capaz de
impulsar y acelerar las iniciativas de integración de datos en proyectos de Business
Intelligence, data warehousing, migración e integración de aplicaciones en la nube y data
governance.
Características de PowerCenter ETCL
• Metadatos: Las visualizaciones son la diferencia más importante entre la
solución PowerCenter ETCL y otras de su clase. Para llevar a cabo una gestión
más efectiva y en base a metadatos la herramienta proporciona completas gráficas.
No sólo eso, sino que sus características analíticas, orientadas a conocer mejor el
linaje y el impacto,optimizan la función de gobierno.
• Reutilización: Reutilizar es sinónimo de economía y de efectividad. Si además le
sumas la automatización y lo entregas a través de un software user friendly tendrás
como resultado usuarios de negocio que mejoran su rendimiento y resultados al
aprovechar las opciones de transformación pre-integradas que esta herramienta
pone a su alcance.
• Autonomía: La independencia de los usuarios de negocio de IT les hace ganar en
agilidad a ambos, permitiendo que, mientras los primeros pueden consumir datos
fiables y precisos, sin latencias; los últimos ganan tiempo extra para ocuparse de
asuntos más relevantes y de mayor importancia estratégica para el negocio.
• Escalabilidad: Éste es uno de los criterios más frecuentemente empleados para
seleccionar herramientas tecnológicas y, en el caso de PowerCenter ETCL, además
de su cualidad de escalable, no hay que perder detalle de atributos tan importantes
como su alta disponibilidad, optimización de pushdown, balanceo de carga
adaptable, procesamiento distribuido y particionado dinámico.
• Gobierno: Quien tiene el control tiene el poder y eso es lo que entrega este software,
que permite alcanzar nuevas cotas de supervisión operacional mejoradas por un
eficaz sistema de alertas.
• Prototipos: La innovación es uno de los requisitos de la revolución digital pero, ya
no basta con exprimir la creatividad sino que además hay que hacerlo más rápido
que la competencia. La herramienta de Informatica destaca por sus funcionalidades
de colaboración en este sentido, permitiendo ganar en agilidad a la hora de proceder
a la validación de resultados.
• Real time: La eficiencia operativa es una cuestión de tiempo. Poder trabajar en
tiempo real, incluso en trabajos analíticos es una experiencia de la que no se puede
privar a los usuarios de negocio.
• Automatización, integración y conectividad: Pruebas de validación automatizadas
en cualquier entorno, facilidad de acceso a la información e integración de datos
desde cualquier tipo de fuente es sinónimo de rendimiento.
Informatica PowerCenter es una potente herramienta ETL que, basada en una estructura
de plataforma unificada de integración de datos empresariales, permite acceder, descubrir
e integrar datos de prácticamente cualquier sistema empresarial.
En un entorno de pruebas ETL la cobertura de Informatica podría concretarse en:
• Mantenimiento del flujo de trabajo de Informatica y sus componentes; asegurando
la marcha de todas las transformaciones utilizadas en las asignaciones
subyacentes.
• Prevención de la pérdida de datos. La integridad de los datos no queda
comprometida en ningún momento al cargarse en destino los datos proyectados sin
ningún truncamiento ni menoscabo.
• Puntualidad del proceso. Los datos consiguen cargarse en destino dentro de los
límites de tiempo estimados, asegurando el rendimiento de trabajo óptimo en todo
momento.
• Calidad de la información. Se trata de un aspecto prioritario para mantener la
confianza de los usuarios en el sistema de información empresarial y, por eso,
supone una prioridad para Informatica que, con PowerCenter, asegura que el flujo
de trabajo no permita que se carguen datos no válidos o no deseados en el destino.
• El Servicio SSIS
• El Motor de ejecucion de SSIS y otros ejecutables
• El Motor de Flujo de Datos de SSIS y los componentes de flujo de Datos
• Los Clientes SSIS
El motor de ejecución y sus programas auxiliares son los que realmente se encargan de
correr los paquetes. Este motor es el que salva la distribución de los elementos dentro de
BIDS, administra las bitácoras, depuración, configuración, conexiones y transacciones.
Adicionalmente maneja los eventos de envió de correos o almacenamiento de bitácoras en
la base de datos cuando un evento se dispara en el paquete. Lo ejecutables auxiliares
proveen otras funciones tales como: Contenedores, Tareas, Manejadores de Eventos y
restricciones de precedencia.
• Bulk Insert (Inserción de volúmenes altos de datos): Carga datos en una tabla
usando el comando BULK INSERT.
• Data Flow (Flujo de datos): Es una de las mas utilizadas, se usa para cargar y
transformar datos dentro de un destino OLE DB.
• Send Mail (Envio de Correo): Envía correo a través de un servidor SMTP (Send Mail
Transfer Protocol)
• WMI Data Reader (Lectores de Datos WMI): Con esta tarea se pueden ejecutar
consultas WQL contra WMI (Windows Management Instrumentation). De esta forma
se puede leer información de las bitácoras de eventos que guarda Windows o
obtener información del hardware instalado por ejemplo.
• WMI Event Watcher (Captura de Eventos WMI): Con esta tarea SSIS es capaz de
esperar y responder por ciertos eventos que ocurren en el sistema operativo.
En síntesis SSIS es una de las herramientas mas innovadoras de migración de datos que
han aparecido en el mercado, si ya se tiene una licencia de SQL Server no tiene costo pues
se incluye como parte del paquete. Con un poco de imaginación y conocimiento, SSIS
puede utilizarse en un sin fin de tareas interesantes.