Sei sulla pagina 1di 11

Captulo 21.

Gestin de Metadatos
Adems de la gestin de datos, administradores de bases tienen que ser capaces de gestionar y
controlar la definicin de los elementos de datos utilizados en las bases de datos. Sin una
comprensin de la estructura, las limitaciones, la definicin y descripcin de los datos, es probable
que los datos van a ser mal interpretadas o mal utilizados. Adems, los datos que no est bien
definida puede causar problemas de integridad de la base de datos.

Qu son los metadatos?


Alguna vez has visto el programa de "Antiques Roadshow" en la televisin? En este espectculo, la
gente trae artculos a anticuarios profesionales tenerlos examinadas y evaluadas. Los participantes
esperan aprender que sus artculos son tesoros perdidos hace mucho tiempo de un valor inmenso. Los
anticuarios siempre pasan mucho tiempo hablando con los propietarios sobre sus artculos. Ellos
siempre hacen preguntas como "De dnde sacaste este material?" y "Qu me puede decir sobre su
historia?" Por qu? Debido a que estos detalles proporcionan conocimiento sobre la autenticidad y
la naturaleza de la partida. El distribuidor tambin examina cuidadosamente el artculo, en busca de
marcas y las fechas que brindan pistas sobre el origen del artculo.
Los usuarios de los datos deben ser capaces de ponerlo en contexto antes de los datos se vuelve til
como informacin. Informacin sobre los datos se conoce como metadatos. La definicin ms simple
de los metadatos son "datos sobre datos". Para ser un poco ms precisos, los metadatos describen
datos, proporcionando informacin como el tipo, duracin, descripcin textual, y otras
caractersticas. Por ejemplo, los metadatos permite al usuario saber que el nmero de cliente es un
campo numrico de cinco dgitos, mientras que los datos en s podra ser 56.789.

Los metadatos son "datos sobre datos".


Por lo tanto, el uso de nuestro ejemplo "Antiques Roadshow", el elemento que se est evaluando es el
"datos". Las respuestas a las preguntas de los anticuarios y las marcas en el tema son los "metadatos".
El valor se asigna a un elemento slo despus de los metadatos sobre ese tema se descubre y se
evala.
Metadatos caracteriza datos. Se utiliza para proporcionar la documentacin que los datos puedan ser
comprendidas y ms fcilmente consumidos por su organizacin. Metadatos contesta el quin, qu,
cundo, dnde, por qu y cmo las preguntas de los usuarios de los datos.

A partir de datos de conocimiento y ms all


El bloque bsico de construccin del conocimiento es de datos. Data es un hecho representado como
un elemento o evento fuera de contexto y sin relacin con otros hechos. Ejemplos de datos son 27,
JAN, y 010110. Sin ms detalles, no sabemos nada acerca de cualquiera de estos tres datos.
Considere lo siguiente:

Es 27 un nmero en base diez, o es en octal (que se traducira a 23 en base diez)?


Si 27 es un nmero en base diez, qu representa? Es una edad, una cantidad de dinero, un
coeficiente intelectual, una talla de zapatos, o algo completamente distinto?

Qu representa ENE? Es el nombre de una mujer (o el nombre de un hombre)? O


representa el primer mes del ao? O tal vez es algo completamente distinto?

Por ltimo, Qu pasa con 010.110? Es un nmero binario? O es una representacin de


una fecha, tal vez 01 de enero 1910? 01 de enero 2010? O algo completamente distinto?

Datos es un hecho representado como un elemento o evento fuera de contexto.


Debido a la falta de contexto, todos estos son ejemplos de datos. Informacin, por otro lado, aade
contexto mediante la especificacin de relaciones entre los datos, y posiblemente otra informacin.
Los datos en el contexto de metadatos hace que la informacin. Las relaciones pueden representar
informacin, sin embargo, las relaciones no constituyen en realidad la informacin hasta que se
entienden. Adems, las relaciones que representan los datos tienen una tendencia a ser limitado en su
contexto, en su mayora en el pasado o presente, con poca o ninguna incidencia en el futuro.
Nuevo Diccionario Colegiado de Webster define el conocimiento como "el hecho o condicin de
saber algo con familiaridad adquirida a travs de la experiencia o de la asociacin." Conocimiento
aade la comprensin y la retencin a la informacin. Es el siguiente paso natural despus de la
informacin. Para tener "conocimiento" requiere informacin junto con los patrones entre los datos,
la informacin y otros conocimientos. Por lo tanto, las parejas de conocimiento de informacin con
la comprensin y la cognicin.
El paso final sera pasar del conocimiento a la sabidura. La sabidura puede ser pensado como
conocimiento aplicado. Usted puede tener la certeza de que los alimentos grasos son malas para ti,
pero si se comen todos modos, no es sabio.

Sabidura se puede pensar en el conocimiento como aplicada.

Para que los datos sean algo ms que simples datos, se requiere metadatos. Sin metadatos, los datos
no identificable significado no es ms que una coleccin de dgitos, caracteres o bits. Metadatos da
datos de su forma y permite su uso por profesionales de la informacin.

Estrategia de Metadatos
Una organizacin sabio desarrollar una estrategia de metadatos para recoger, gestionar y
proporcionar un vehculo para acceder a los metadatos. Una estrategia de metadatos de sonido debe
tratar los siguientes puntos:

Una directiva de cmo metadatos se utiliza en la organizacin


Procedimientos para la identificacin y definicin de propiedad de los datos y la
administracin
Identificacin de los tipos de metadatos que deben recogerse
Una descripcin de la finalidad para cada tipo de metadatos que se identifica-una razn clara
y concisa por qu cada pieza de metadatos es requerido por la organizacin

Los mtodos para la recogida y almacenamiento de metadatos (normalmente utilizando un


repositorio)

Mtodos de acceso a los metadatos

Las polticas destinadas a hacer cumplir los procedimientos de custodia de datos y la


seguridad de acceso a los metadatos
Identificacin de fuentes de metadatos, tanto internos como externos
Medidas para medir la calidad y facilidad de uso de los metadatos

Metadatos difunde y apoya a los datos de su organizacin produce y mantiene. Por el montaje y
gestin de metadatos, su organizacin tendr acceso a los datos pertinentes acerca de sus datos, por
lo que sus sistemas sean ms utilizables y las bases de datos ms tiles.
DBAs deben participar en el equipo que desarrolla la estrategia de metadatos, pero la organizacin de
administracin de datos, si existe, debe ser el lder de los esfuerzos de los metadatos.

Datos Administracin
Un mayordomo de datos es responsable de las acciones
tomadas utilizando un conjunto definido de datos. Una poltica
de la administracin de datos ser identificar a los individuos
dentro de la organizacin cuya responsabilidad es crear,
mantener y borrar datos. Un mayordomo de datos no es
necesariamente el titular de los datos. Una poltica integral de
gestin de datos tambin definir los consumidores de los
datos, es decir, aquellos que usan directamente los datos en el
transcurso de su trabajo.

Data Warehousing y metadatos


Las empresas que utilizan sistemas de almacenamiento de datos son ms propensas que otras
empresas para que se han embarcado en una estrategia de gestin de metadatos. Los usuarios
requieren informacin precisa acerca de los datos contenidos en un depsito antes de que los datos
pueden ser utilizados adecuadamente para los negocios. Por lo tanto, este tipo de empresas tienen una
necesidad crtica de fcil acceso metadatos de alta calidad. Con frecuencia, sin embargo, poco o nada
de metadatos es capturado y administrado antes de la aparicin de un esfuerzo de almacenamiento de
datos.

Un esfuerzo de almacenamiento de datos tiene una necesidad crtica de fcil acceso metadatos de alta
calidad.

Tipos de Metadatos
A pesar de que todos los metadatos describen datos, hay muchos tipos y fuentes de metadatos
diferentes. En un nivel fundamental, sin embargo, todos los metadatos es uno de dos tipos: de
metadatos tecnologa o metadatos negocio. Metadatos Tecnologa describe los aspectos tcnicos de
los datos en relacin con el almacenamiento y la gestin de los datos en los sistemas informticos.
Los metadatos de negocio, por su parte, describe los aspectos de cmo los datos es utilizado por la
empresa, y es necesario para que los datos tienen un valor a la organizacin. Sabiendo, por ejemplo,
que la columna de la lino es un nmero entero positivo entre 1 y 9999999 es un ejemplo de
metadatos de la tecnologa. Por supuesto, el usuario de negocios tambin requiere esta informacin.
Sabiendo que un nmero referido como un lino es el nmero de licencia profesional de los
instructores del curso certificado, que debe debe ser nico, y que cada profesor puede tener uno y
slo un nmero de licencia es un ejemplo de metadatos comerciales. (Aunque, estos detalles tambin
son tambin tiles para el DBA para crear la base de datos adecuada y eficaz.)
Para los administradores de bases, el propio DBMS es una buena fuente de metadatos. El catlogo
del sistema utilizado para almacenar informacin acerca de los objetos de base de datos es una tienda
vital de metadatos DBA metadatos-tecnologa. DBAs y desarrolladores hacen uso regular de los
metadatos en el catlogo del sistema DBMS para ayudarles a entender los objetos de bases de datos y
los datos que figuran en l mejor. Dependiendo de las DBMS, el usuario puede escribir consultas en
las tablas de catlogo del sistema o puntos de vista, o puede ejecutar procedimientos almacenados
proporcionados por el sistema para devolver los metadatos de las tablas de catlogo del sistema. Casi
cualquier tipo de informacin descriptiva sobre la composicin de los datos se pueden encontrar en el
catlogo del sistema. Por ejemplo, la mayora de los DBMS almacenan todos los siguientes
metadatos en el catlogo del sistema:

Los nombres de cada base de datos, tablas, columnas, ndices, vistas, relacin, procedimiento
almacenado, disparador, etc.

La clave principal para cada tabla y claves externas que hacen referencia de nuevo a esa
clave primaria
Qu tablas estn en qu puntos de vista
Tipo de datos, la longitud y las limitaciones de cada columna de cada tabla
Los nombres de los archivos fsicos utilizan para almacenar datos de bases de datos, as
como informacin sobre el almacenamiento de archivos, extensiones, y los volmenes de
disco

Autorizacin y seguridad de la informacin que detalla qu usuarios tienen qu tipo de


autoridad en la que los objetos de base de datos

Fecha y hora del ltimo cambio de definicin de base de datos, as como el ID del usuario
que implementa el DDL para el cambio

Informacin de la organizacin de base de datos

El catlogo del sistema DBMS es una fuente particularmente efectiva de metadatos.


El catlogo del sistema DBMS es una fuente particularmente efectiva de metadatos porque es activa,
integrada y nonsubvertible. El catlogo del sistema est activo porque los metadatos se construye y
se mantiene en forma automtica a medida que se crean y modifican los objetos de base de datos. A
medida que el DBA crea las bases de datos, el DBMS recopila automticamente y rellena los
metadatos en el catlogo del sistema. La integracin del catlogo del sistema y el DBMS, junto con
el carcter activo del catlogo del sistema, mantiene los metadatos de la tecnologa en el catlogo del
sistema de informacin precisa y actualizada. Adems, el catlogo del sistema DBMS es
nonsubvertible, lo que significa que las operaciones normales de DBMS son el nico mecanismo
para poblar el catlogo del sistema. Por supuesto, el subvertibility del catlogo del sistema ser
diferente de DBMS DBMS. Algunos DBMS proporcionan opciones para activar actualizaciones
directas en el catlogo del sistema, pero esta opcin es para ser utilizado slo en casos de emergencia
y, en general bajo la direccin del personal de soporte tcnico del proveedor de DBMS.
Aunque una gran cantidad de metadatos se puede encontrar en el catlogo del sistema, estos
metadatos DBMS suele ser insuficiente para describir completamente los datos. Por ejemplo, las
descripciones de los objetos de base de datos no se encuentran comnmente en el catlogo del
sistema DBMS. Algunos DBMS proporcionan sistema de descripcin catlogo columnas que se
pueden poblaron a discrecin del DBA. Sin embargo, muchos administradores de bases evitar esto
por temor a desorganizar el catlogo del sistema. Tambin es posible que las descripciones de los
objetos de base de datos no estaban disponibles cuando se crearon los objetos. Metadatos adicional
que es til, pero no se encuentra en el catlogo del sistema, incluye

Los metadatos para archivos nondatabase (plano o archivos secuenciales)


Modificacin informacin sobre cundo y por quin datos en la base de datos fue modificado
ultimamente

Informacin cuaderno para la tabla de base de datos (o un archivo nondatabase), as como


los programas que usan esa informacin

Informacin sobre el empleo y las transacciones que acceden a los datos del lote
Metadatos Operativa sobre componentes de la infraestructura de TI
Modelo de datos de metadatos que describe el diseo de base de datos lgica y cmo se
correlaciona con la aplicacin de base de datos fsica

El almacenamiento de datos y la fuente de datos que definen los metadatos ETL (s), el
sistema de registro, y otra informacin analtica

Propiedad de los datos y metadatos de la mayordoma

Por supuesto, esto es una lista incompleta. Existe una gran variedad de diferentes tipos de metadatos
y propsitos que pueden ser catalogados y administrado. La captura y el mantenimiento de
documentos de metadatos mejor las bases de datos y sistemas, lo que las hace ms fciles de usar.
Los ms metadatos que poner a disposicin de los usuarios de negocio, ms valor que ser capaz de
extraer de sus sistemas de informacin.

La captura y el mantenimiento de bases de datos y metadatos hace que los sistemas sean ms fciles
de usar.

Repositorios y diccionarios de datos


Un repositorio almacena informacin sobre los activos de datos de una organizacin. En otras
palabras, los repositorios se utilizan para almacenar metadatos. Una correctamente implementados
repositorio almacena todos los metadatos pertinentes para la corporacin. Puede actuar como un
nico mecanismo, centralizada para ayudar en la migracin de los datos procedentes de mltiples
fuentes a un almacn de datos.

Un repositorio almacena toda metadatos pertinentes para la corporacin.


En la eleccin de un repositorio, basar su decisin en el almacenamiento de metadatos y las
necesidades de recuperacin de toda la organizacin, no slo las bases de datos que desea apoyar.
Tpicamente, un repositorio puede

Almacenar informacin acerca de sus datos, procesos, y el medio ambiente.

Soporte de mltiples formas de ver los mismos datos. Un ejemplo de este concepto es el
enfoque threeschema, en el que los datos se ve en los planos conceptuales, lgicos y fsicos.

Tienda documentacin en profundidad, y producir de detalle y gestin de informes de esa


documentacin.

Datos de apoyo a la creacin y administracin de modelo. Integracin con ETL popular, el


modelado de datos y herramientas CASE es tambin un importante criterio de evaluacin.

Soporte para el control de versiones y cambio. Versiones ayuda a sincronizar el desarrollo de


aplicaciones, eliminando la reanudacin y el aumento de la flexibilidad.

Hacer cumplir las convenciones de nomenclatura.


Analizar y extraer los metadatos de mltiples fuentes. Por ejemplo, si su sitio es una gran
tienda COBOL, el vendedor repositorio debe ofrecer herramientas que analizan
automticamente el cdigo fuente COBOL para extraer metadatos.

Generar cuadernos de definiciones de elementos de datos.


Estas son algunas de las funciones ms comunes de un repositorio. Al elegir un repositorio para el
desarrollo de bases de datos, las siguientes caractersticas generalmente son deseables.

Los almacenes de datos utilizados por el repositorio se pueden almacenar utilizando tablas de
bases de datos en su DBMS. Esto permite que las aplicaciones para leer directamente las
tablas del diccionario de datos. Por ejemplo, si usted es principalmente una tienda de Oracle,
debe favorecer el uso de un repositorio que almacena su informacin de metadatos en las
tablas de Oracle. Algunos productos de repositorios utilizan mltiples DBMS y permiten al
usuario elegir el DBMS a utilizar.

El repositorio debe ser capaz de leer directamente el catlogo del sistema o puntos de vista
sobre el catlogo del sistema para cada DBMS que utiliza. Esto asegura que el repositorio
tendr informacin actualizada sobre los objetos de la base.

Si el repositorio no lee directamente el catlogo del sistema, una interfaz debe proporcionar
para simplificar la tarea de poblar el repositorio utilizando la informacin de catlogo del
sistema.

El repositorio proporciona una interfaz para cualquier herramienta de modelado y diseo


utilizados para la generacin de objetos de la base.

La mayora de los productos populares son repositorios basados en mainframe y se basan en una
metadata centralizada "base de datos", o repositorio. Este enfoque es generalmente ms adecuado
para la documentacin de los sistemas basados en OLTP. Un depsito de este tipo puede ser ms
difcil de usar en un entorno de almacenamiento de datos, ya que un foco de mainframe puede
presentar retos en la gestin de metadatos en una implementacin de almacenamiento de datos
distribuida, estado-of-the-art. Muchas herramientas ETL utilizados en los proyectos de

almacenamiento de datos tambin contienen un repositorio que se orienta hacia las necesidades del
almacn de datos. Organizaciones que necesitan para administrar metadatos, tanto para OLTP y
almacenes de datos deben asegurarse de que los datos en sus repositorios ETL se pueden migrar con
xito al repositorio OLTP.
Otros productos del repositorio son centrado en las aplicaciones. Tal tecnologa repositorio se centra
en el desarrollo de aplicaciones de metadatos que es til, pero no completa. Por ejemplo, el
repositorio de Microsoft se centra en Visual Studio y se centra en los activos informticos de
Microsoft. Microsoft se ha asociado con Computer Associates, fabricantes del PLATINUM
Repositorio, para proporcionar capacidades adicionales para toda la empresa la tecnologa de
repositorio de Microsoft lder en el mercado.

Algunos productos de depsito son centrado en las aplicaciones.

Beneficios del repositorio


Repositorio tecnologa ofrece muchos beneficios a las organizaciones que explotan adecuadamente
sus capacidades. Los metadatos en el repositorio puede ser utilizado para integrar puntos de vista de
varios sistemas que ayudan a los desarrolladores a entender cmo los datos es utilizado por dichos
sistemas. Los patrones de uso pueden ser analizados para determinar cmo los datos se relaciona en
formas que no pueden ser entendidos formalmente dentro de la organizacin. El descubrimiento de
estos patrones puede conducir a la innovacin de procesos de negocio.
En general, el principal beneficio de un repositorio es la consistencia que proporciona en la
documentacin de elementos de datos y reglas de negocio. El repositorio ayuda a unificar las "islas
de datos independientes" inherentes a muchos sistemas heredados. El repositorio permite a la
organizacin de reconocer el valor de sus sistemas heredados por programa y metadatos
operacionales que se puede utilizar para integrar los sistemas de legado con desarrollo de nuevas
aplicaciones documentar.

Un repositorio proporciona consistencia en la documentacin de los elementos de datos y reglas de


negocio.
Por otra parte, un repositorio puede soportar un entorno rpidamente cambiante como las impuestas
por los esfuerzos de desarrollo de Internet en las organizaciones. Los metadatos en el repositorio
puede ser examinado para producir informes de anlisis de impacto para determinar rpidamente
cmo los cambios en un rea impactarn otros.

Reutilizacin es un gran ahorro de tiempo. Si algo se puede reutilizar en lugar de ser desarrollado
desde cero, no slo el tiempo de ser salvos, sino tambin valiosos recursos se pueden implementar en
los proyectos ms importantes. Repositorios facilitan la reutilizacin documentar componentes de la
aplicacin y hacer estos metadatos a disposicin de la organizacin.
Por ltimo, los repositorios son una ayuda inestimable a las iniciativas de almacenamiento de datos.

Desafos del repositorio


Uno de los mayores desafos en la implementacin y el uso de la tecnologa de repositorio es
mantener el repositorio hasta a la fecha. El repositorio debe llenarse con datos de mltiples fuentes,
todos los cuales pueden cambiar en cualquier momento. Cuando la composicin o estructura de los
cambios de datos de origen, sus metadatos ms probable es que tenga que cambiar, tambin.
El proceso para poblar el repositorio es complicado y debe ser lo ms automatizado posible. Referirse
aFigura 21-1. Fuentes de metadatos provienen de mltiples reas y ubicaciones dentro de una
organizacin y pueden incluir

Metadatos del componente de aplicacin de las herramientas de desarrollo de programas,


programas de aplicacin y bibliotecas de cdigo

Metadatos de Empresas de la entrada del usuario de negocios, documentos y notas


Datos de modelado de metadatos de las herramientas de modelado de datos
Metadatos de base de datos del catlogo del sistema DBMS
ETL metadatos de herramientas de almacenamiento de datos
Metadatos Operacional de operaciones automatizadas y herramientas de planificacin de
trabajos
Otros tipos de metadatos, tales como el uso de datos de metadatos de herramientas de
consulta
Figura 21-1. Rellenar el repositorio

Rellenar el repositorio es complicado.


Para tener xito, esta informacin debe ser recopilada, analizada, y registrado en el repositorio de
metadatos corporativa. El proceso de integracin debe tener en cuenta la frecuencia de cambio para
cada origen de metadatos. Cada vez que cambia los metadatos en la fuente, los metadatos en el
repositorio estar fuera de sincronizacin hasta que se escanee el metadatos de origen, capturado, y
se integra en el repositorio de nuevo.
Muchas de las tiendas no son dueos de un repositorio. Ms exactamente, muy pocas tiendas poseen
un repositorio centralizado de metadatos. Adems, muchas organizaciones que poseen un repositorio
no siempre aplicar los procedimientos de integracin y uso adecuados, haciendo que el repositorio
para ser descuidado. Tan pronto como los metadatos en el repositorio se vence, inexacta, o
inexistente, el repositorio dejar de tener valor. Por supuesto, la culpa no es necesariamente con el
depsito de la tecnologa ms probable es que la culpa es de la organizacin que no implementa
procedimientos para mantener los metadatos en el repositorio hasta a la fecha. Por supuesto, este
esfuerzo requiere un presupuesto importante, el compromiso y el esfuerzo de los profesionales de la
gestin de datos profesionales, con el DAS y DBAs.

Muy pocas tiendas poseen un repositorio centralizado de metadatos.

Datos Diccionarios
Los diccionarios de datos fueron los precursores de la tecnologa repositorio. Los diccionarios de
datos eran populares en la dcada de 1980. El propsito de un diccionario de datos era para gestionar
las definiciones de datos. En general, se ofrecieron automatizacin la pequea usuario tena que
introducir manualmente las definiciones. En algunos casos, el diccionario de datos se integr en los

DBMS y bases de datos podra definirse usando los metadatos en el diccionario de datos, pero esto
era productos DBMS-prerelational antes tenan catlogos del sistema.

El propsito de un diccionario de datos es gestionar las definiciones de datos.


A medida que se identifican ms y ms tipos de metadatos y organizaciones desean acumular y
administrar dichos metadatos, el diccionario de datos se transform en el repositorio. El uso de
herramientas CASE, como Excelerator y Advantage Gen, para la aplicacin y desarrollo de bases de
datos habilitadas ms metadatos para ser capturado y mantenido durante el proceso de desarrollo.
Como desarrolladores hicieron ms sofisticados con el tiempo, los diccionarios de datos se
desarrollaron para proporcionar algo ms que datos atribuyen descripciones. Los productos se
volvieron capaces de rastrear las aplicaciones acceder a lo que las bases de datos. Los desarrolladores
que utilizan el diccionario de datos correctamente fueron capaces de mantener sus sistemas y
aplicaciones con ms facilidad.
A decir verdad, AD / Cycle y Repository Manager iniciativas de IBM causaron gran parte de esta
transformacin. A pesar de que ambas iniciativas fracasaron en ltima instancia, en el mercado, la
tecnologa repositorio cambi para siempre por empresas de IBM en este campo. Para obtener ms
informacin sobre las iniciativas de IBM en esta rea, consulte Repository Manager de IBM / MVS
por Henry C. Lefkovits, el libro definitivo sobre el tema.

Resumen
Este captulo sobre la gestin de metadatos ha sido necesariamente breve. Como DBA, usted tendr
que entender el papel de los metadatos como impacta a los DBMS, bases de datos y usuarios de
bases de datos. Las organizaciones que pasan mucho tiempo en la gestin y el mantenimiento de
metadatos probablemente tendrn un administrador de datos sobre el personal. Como alternativa, el
administrador de almacenamiento de datos o arquitecto podran centrarse en la gestin de metadatos.
DBA puede involucrarse en ciertos aspectos de la gestin de metadatos, como la seleccin de
repositorio, instalacin y mantenimiento. Sin embargo, la mayora de los administradores de bases
utilizarn metadatos mucho ms de lo que sern llamados a almacenar, administrar y mantener los
metadatos.

Potrebbero piacerti anche