Sei sulla pagina 1di 35

TALLER DE ANALISIS DE SISTEMAS Y BASES DE DATOS

GERALDINE DIAZ MOLINA


MARIA FERNANDA VINASCO LEON

UNIVERSIDAD DEL VALLE SEDE ZARZAL


FACULTAD DE CIENCIAS DE LA ADMINISTRACION
ADMINISTRACION DE EMPRESAS
ZARZAL
2014

TALLER DE ANALISIS DE SISTEMAS Y BASES DE DATOS

GERALDINE DIAZ MOLINA


MARIA FERNANDA VINASCO LEON

MINERIA DE DATOS Y CONCEPTOS DE BASES DE DATOS

ING. JUAN CARLOS GALEANO G.

UNIVERSIDAD DEL VALLE SEDE ZARZAL


FACULTAD DE CIENCIAS DE LA ADMINISTRACION
ADMINISTRACION DE EMPRESAS
ZARZAL
2014

INTRODUCCION

En la actualidad es necesario conocer todas aquellas herramientas tecnolgicas


que de alguna manera estn haciendo que la recopilacin, reconocimiento y
organizacin de los datos sea mucho ms fcil tanto para las organizaciones como
para las personas. Por medio del siguiente trabajo, se desarrollara un cuestionario,
donde se darn a conocer los conceptos de aquellas herramientas tecnolgicas
que est enfrentando la globalizacin, y hace que el reconocimiento y el manejo
de procesar datos sea un formato nuevo de utilizacin de herramientas de
cmputo que permita obtener conocimiento de los datos superando problemas de
complejidad, volumen, relaciones propias y externas entre los mismos datos. Una
de las reas de investigacin que obtiene informacin de grandes volmenes de
datos es la Minera de Datos y esto ha permitido el desarrollo de esta rea de
investigacin respecto de la capacidad de prediccin en base al procesamiento de
cantidades masivas de datos. Por otro lado, se tratara de retroalimentar y adquirir
conocimiento en conceptos que se relacionan con cada una de las actividades
diarias de las personas en el mundo, que de alguna manera generan una visin
ms grande de lo que en realidad estas herramientas implantan en los procesos
que grandes industrias manejan con magnitud y que les ha proporcionado
posicionamiento y valor agregado a estas.

TALLER

1. Explique en qu consiste la Minera de Datos, sus ventajas, desventajas,


manejo, caractersticas y otros conceptos que usted considere importante.
R/: La minera de datos es el proceso de detectar la informacin procesable de los
conjuntos grandes de datos. Utiliza el anlisis matemtico para deducir los
patrones y tendencias que existen en los datos. Normalmente, estos patrones no
se pueden detectar mediante la exploracin tradicional de los datos porque las
relaciones son demasiado complejas o porque hay demasiado datos.
Estos patrones y tendencias se pueden recopilar y definir como un modelo de
minera de datos. Los modelos de minera de datos se pueden aplicar en
escenarios como los siguientes:
Pronstico: clculo de las ventas y prediccin de las cargas del servidor o del
tiempo de inactividad del servidor.
Riesgo y probabilidad: eleccin de los mejores clientes para la distribucin de
correo directo, determinacin del punto de equilibrio probable para los escenarios
de riesgo, y asignacin de probabilidades a diagnsticos y otros resultados.
Recomendaciones: determinacin de los productos que se pueden vender juntos
y generacin de recomendaciones.
Bsqueda de secuencias: anlisis de los artculos que los clientes han
introducido en el carrito de la compra y prediccin de posibles eventos.
Agrupacin: distribucin de clientes o eventos en grupos de elementos
relacionados, y anlisis y prediccin de afinidades.
VENTAJAS:
Si bien la data mining se presenta como una tecnologa emergente, posee ciertas
ventajas, como estas:
Resulta un buen punto de encuentro entre los investigadores y las
personas de negocios.
Este punto hace referencia a que aparece nueva tecnologa la cual muchas veces
es adquirida por empresas grandes las cuales financian estos proyectos.

Ahorra grandes cantidades de dinero a una empresa y abre nuevas


oportunidades de negocios.

Prcticamente esto apoya al punto anterior ya que cuando un proyecto es bueno


este es financiado por una empresa la cual adquiere ms dinero del que invirti y
gracias a esta tecnologa una empresa puede abrir otras oportunidades en el
mercado.

Trabajar con esta tecnologa implica cuidar un sin nmero de detalles


debido a que el producto final involucra "toma de decisiones".

Tienes la tecnologa y esta te abri paso en el mercado, tambin esta crea un


producto el cual tu estas ofreciendo, pero hay que ver que tan efectiva fue la
implementacin la empresa va creciendo o decreciendo? , ha eso hace
referencia el punto 3.

Contribuye a la toma de decisiones tcticas y estratgicas


proporcionando un sentido automatizado para identificar informacin
clave desde volmenes de datos generados por procesos
tradicionales y de e-Business.
Permite a los usuarios dar prioridad a decisiones y acciones,
mostrando factores que tienen un mayor en un objetivo, tambin
muestra qu segmentos de clientes son desechables y qu unidades
de negocio son sobrepasados y el por qu?

Hace referencia a que gracias a Data Mining solo hay que preocuparse de las
tomas de decisiones ya que gracias a esta tecnologa va mostrando las diversas
ventajas y desventajas como son algunas sealadas en este punto. (Punto 5)

Proporciona poderes de decisin a los usuarios del negocio que


mejor entienden el problema y el entorno y es capaz de medir las
acciones y los resultados de la mejor forma.

Gracias a Data Mining se pueden dividir los problemas en distintos sectores y esto
provocara que en diversos sectores deba haber distintos grupos de trabajo
especializados en el mbito de ese problema para as optimizar el tiempo y
recursos.

Genera Modelos descriptivos: en un contexto de objetivos definidos


en los negocios permite a empresas, sin tener en cuenta la industria o

el tamao, explorar automticamente, visualizar y comprender los


datos e identificar patrones, relaciones y dependencias que impactan
en los resultados finales de la cuenta de resultados (tales como el
aumento de los ingresos, incremento de los beneficios, contencin de
costes y gestin de riesgos).

Genera Modelos predictivos: permite que relaciones no descubiertas e


identificadas a travs del proceso del Data Mining sean expresadas
como reglas de negocio o modelos predictivos. Estos outputs pueden
comunicarse en formatos tradicionales (presentaciones, informes,
informacin electrnica compartida, embebidos en aplicaciones, etc.)
para guiar la estrategia y planificacin de la empresa.

DESVENTAJAS:

Requiere una gran inversin debido a que su correcta construccin no es


tarea sencilla y consume muchos recursos, adems, su misma
implementacin, implica desde la adquisicin de herramientas de consulta y
anlisis, hasta la capacitacin de los usuarios.
Existe resistencia al cambio por parte de los usuarios
Los beneficios del almacn de datos son apreciados en el mediano y largo
plazo. Este punto deriva del anterior, y bsicamente se refiere a que no
todos nos usuarios confiaran en el DW en una primera instancia, pero si lo
harn una vez que comprueben su efectividad y ventajas. Adems, su
correcta utilizacin surge de la propia experiencia.
Si se incluyen datos propios y confidenciales del cliente, proveedores, etc.,
el depsito de datos atentara contra la privacidad de los mismos, ya que
cualquier usuario podr tener acceso a ellos.
Infravaloracin de los recursos necesarios para la captura, carga y
almacenamiento de los datos
Infravaloracin del esfuerzo necesario para su diseo y creacin
Incremento continuo de los requerimientos de los usuarios
Subestimacin de las capacidades que puede brindar la correcta utilizacin
del DWH y de las herramientas del BI en general.

MANEJO:
Seleccin del conjunto de datos, tanto en lo que se refiere a las variables
objetivo (aquellas que se quiere predecir, calcular o inferir), como a las variables
independientes (las que sirven para hacer el clculo o proceso), como
posiblemente al muestreo de los registros disponibles.
Anlisis de las propiedades de los datos, en especial los histogramas,
diagramas de dispersin, presencia de valores atpicos y ausencia de datos
(valores nulos).
Transformacin del conjunto de datos de entrada, se realizar de diversas
formas en funcin del anlisis previo, con el objetivo de prepararlo para aplicar la
tcnica de minera de datos que mejor se adapte a los datos y al problema, a este
paso tambin se le conoce como preprocesamiento de los datos.
Seleccionar y aplicar la tcnica de minera de datos, se construye el modelo
predictivo, de clasificacin o segmentacin.
Extraccin de conocimiento, mediante una tcnica de minera de datos, se
obtiene un modelo de conocimiento, que representa patrones de comportamiento
observados en los valores de las variables del problema o relaciones de
asociacin entre dichas variables. Tambin pueden usarse varias tcnicas a la vez
para generar distintos modelos, aunque generalmente cada tcnica obliga a un
preprocesado diferente de los datos.
Interpretacin y evaluacin de datos, una vez obtenido el modelo, se debe
proceder a su validacin comprobando que las conclusiones que arroja son
vlidas y suficientemente satisfactorias. En el caso de haber obtenido varios
modelos mediante el uso de distintas tcnicas, se deben comparar los modelos en
busca de aquel que se ajuste mejor al problema. Si ninguno de los modelos
alcanza los resultados esperados, debe alterarse alguno de los pasos anteriores
para generar nuevos modelos.
Si el modelo final no superara esta evaluacin el proceso se podra repetir desde
el principio o, si el experto lo considera oportuno, a partir de cualquiera de los
pasos anteriores. Esta retroalimentacin se podr repetir cuantas veces se
considere necesario hasta obtener un modelo vlido.
Una vez validado el modelo, si resulta ser aceptable (proporciona salidas
adecuadas y/o con mrgenes de error admisibles) ste ya est listo para su
explotacin. Los modelos obtenidos por tcnicas de minera de datos se aplican

incorporndolos en los sistemas de anlisis de informacin de las organizaciones,


e incluso, en los sistemas transaccionales. En este sentido cabe destacar los
esfuerzos
del Data
Mining
Group,
que
est
estandarizando
el
lenguaje PMML (Predictive Model Markup Language), de manera que los modelos
de minera de datos sean interoperables en distintas plataformas, con
independencia del sistema con el que han sido construidos. Los principales
fabricantes de sistemas de bases de datos y programas de anlisis de la
informacin hacen uso de este estndar.
Tradicionalmente, las tcnicas de minera de datos se aplicaban sobre informacin
contenida en almacenes de datos. De hecho, muchas grandes empresas e
instituciones han creado y alimentan bases de datos especialmente diseadas
para proyectos de minera de datos en las que centralizan informacin
potencialmente til de todas sus reas de negocio. No obstante, actualmente est
cobrando una importancia cada vez mayor la minera de datos desestructurados
como informacin contenida en ficheros de texto, en Internet, etc.
2. Explique en qu consisten las bodegas de datos, sus ventajas, desventajas,
manejo, caractersticas y otros conceptos que usted considere importantes.
En el contexto de la informtica, un almacn de datos es una coleccin de datos
orientada a un determinado mbito (empresa, organizacin, etc.), integrado, no
voltil y variable en el tiempo, que ayuda a la toma de decisiones en la entidad en
la que se utiliza. Se trata, sobre todo, de un expediente completo de una
organizacin, ms all de la informacin transaccional y operacional, almacenado
en una base de datos diseada para favorecer el anlisis y la divulgacin eficiente
de datos (especialmente OLAP, procesamiento analtico en lnea). El
almacenamiento de los datos no debe usarse con datos de uso actual. Los
almacenes de datos contienen a menudo grandes cantidades de informacin que
se subdividen a veces en unidades lgicas ms pequeas dependiendo del
subsistema de la entidad del que procedan o para el que sea necesario.
En un almacn de datos lo que se quiere es contener datos que son necesarios o
tiles para una organizacin, es decir, que se utiliza como un repositorio de
datos para posteriormente transformarlos en informacin til para el usuario. Un
almacn de datos debe entregar la informacin correcta a la gente indicada en el
momento ptimo y en el formato adecuado. El almacn de datos da respuesta a
las necesidades de usuarios expertos, utilizando Sistemas de Soporte a
Decisiones (DSS), Sistemas de informacin ejecutiva (EIS) o herramientas para

hacer consultas o informes. Los usuarios finales pueden hacer fcilmente


consultas sobre sus almacenes de datos sin tocar o afectar la operacin del
sistema.
En el funcionamiento de un almacn de datos son muy importantes las siguientes
ideas:

Integracin de los datos provenientes de bases de datos distribuidas por


las diferentes unidades de la organizacin y que con frecuencia tendrn
diferentes estructuras (fuentes heterogneas). Se debe facilitar una
descripcin global y un anlisis comprensivo de toda la organizacin en el
almacn de datos.

Separacin de los datos usados en operaciones diarias de los datos


usados en el almacn de datos para los propsitos de divulgacin, de ayuda
en la toma de decisiones, para el anlisis y para operaciones de control.
Ambos tipos de datos no deben coincidir en la misma base de datos, ya que
obedecen a objetivos muy distintos y podran entorpecerse entre s.

Peridicamente, se importan datos al almacn de datos de los distintos sistemas


de planeamiento de recursos de la entidad (ERP) y de otros sistemas de software
relacionados con el negocio para la transformacin posterior. Es prctica comn
normalizar los datos antes de combinarlos en el almacn de datos mediante
herramientas de extraccin, transformacin y carga (ETL). Estas herramientas
leen los datos primarios (a menudo bases de datos OLTP de un negocio), realizan
el proceso de transformacin al almacn de datos (filtracin, adaptacin, cambios
de formato, etc.) y escriben en el almacn.

Ventajas:
Proporciona informacin clave para la toma de decisiones empresariales.
Mejora la calidad de las decisiones tomadas.
Especialmente til para el medio y largo plazo.

Son sistemas relativamente sencillos de instalar si las fuentes de datos y los


objetivos estn claros.
Muy tiles para el almacenamiento de anlisis y consultas de histricos.
Proporciona un gran poder de procesamiento de informacin.
Permite una mayor flexibilidad y rapidez en el acceso a la informacin.
Facilita la toma de decisiones en los negocios.
Las empresas obtienen un aumento de la productividad.
Proporciona una comunicacin fiable entre todos los departamentos de la
empresa.
Mejora las relaciones con los proveedores y los clientes.
Permite conocer qu est pasando en el negocio, es decir, estar siempre enterado
de los buenos y malos resultados.
Transforma los datos en informacin y la informacin en conocimiento
Permite hacer planes de forma ms efectiva.
Reduce los tiempos de respuesta y los costes de operacin.
Datawarehouse proporciona una informacin de gestin
accesible, correcta, uniforme y actualizada. Proporciona un menor coste en la
toma de decisiones, una mayor flexibilidad ante el entorno, un mejor servicio al
cliente y permite el rediseo de los procesos.
Desventajas:
No es muy til para la toma de decisiones en tiempo real debido al largo tiempo de
procesamiento que puede requerir. En cualquier caso la tendencia de los
productos actuales (junto con los avances del hardware) es la de solventar este
problema convirtiendo la desventaja en una ventaja.
Requiere de continua limpieza, transformacin e integracin de datos.
Mantenimiento.

En un proceso de implantacin puede encontrarse dificultades ante los diferentes


objetivos que pretende una organizacin.
Una vez implementado puede ser complicado aadir nuevas fuentes de datos.
Requieren una revisin del modelo de datos, objetos, transacciones y adems del
almacenamiento.
Tienen un diseo complejo y multidisciplinar.
Requieren una reestructuracin de los sistemas operacionales.
Tienen un alto coste.
Requieren sistemas, aplicaciones y almacenamiento especfico.
Las empresas que utilizan data warehouse son fundamentalmente aquellas que
manejan grandes volmenes de datos relativos a clientes, compras, marketing,
transacciones, operaciones como lo son las empresas de telecomunicaciones,
transporte, Turismo, fabricacin de bienes de consumo masivo etc.
CARACTERISTICAS DE UN DATA WAREHOUSE
Entre las principales se tiene:

Orientado al tema

Integrado

De tiempo variante

No voltil

Orientado a Temas
Una primera caracterstica del data warehouse es que la informacin se clasifica
con base a los aspectos que son de inters para la empresa. Siendo as, los datos
tomados estn en contraste con los clsicos procesos orientados a las
aplicaciones.
El ambiente operacional se disea alrededor de las aplicaciones y funciones tales
como prstamos, ahorros, tarjeta bancaria y depsitos para una institucin
financiera. Por ejemplo, una aplicacin de ingreso de rdenes puede acceder a los

datos sobre clientes, productos y cuentas. La base de datos combina estos


elementos en una estructura que acomoda las necesidades de la aplicacin.
En el ambiente data warehousing se organiza alrededor de sujetos tales como
cliente, vendedor, producto y actividad. Por ejemplo, para un fabricante, stos
pueden ser clientes, productos, proveedores y vendedores. Para una universidad
pueden ser estudiantes, clases y profesores. Para un hospital pueden ser
pacientes, personal mdico, medicamentos, etc.
Integracin
El aspecto ms importante del ambiente data warehousing es que la informacin
encontrada al interior est siempre integrada.
La integracin de datos se muestra de muchas maneras: en convenciones de
nombres consistentes, en la medida uniforme de variables, en la codificacin de
estructuras consistentes, en atributos fsicos de los datos consistentes, fuentes
mltiples y otros. .
A travs de los aos, los diseadores de las diferentes aplicaciones han tomado
sus propias decisiones sobre cmo se debera construir una aplicacin. Los estilos
y diseos personalizados se muestran de muchas maneras.
Se diferencian en la codificacin, en las estructuras claves, en sus caractersticas
fsicas, en las convenciones de nombramiento y otros.
La capacidad colectiva de muchos de los diseadores de aplicaciones, para crear
aplicaciones inconsistentes, es fabulosa.
Codificacin. Los diseadores de aplicaciones codifican el campo GENERO en
varias formas. Un diseador representa GENERO como una "M" y una "F", otros
como un "1" y un "0", otros como una "X" y una "Y" e inclusive, como "masculino" y
"femenino".
No importa mucho cmo el GENERO llega al data warehouse. Probablemente "M"
y "F" sean tan buenas como cualquier otra representacin. Lo importante es que
sea de cualquier fuente de donde venga, el GENERO debe llegar al data
warehouse en un estado integrado uniforme.
Por lo tanto, cuando el GENERO se carga en el data warehouse desde una
aplicacin, donde ha sido representado en formato "M" y "F", los datos deben
convertirse al formato del data warehouse.

Medida de atributos. Los diseadores de aplicaciones miden las unidades de


medida de las tuberas en una variedad de formas. Un diseador almacena los
datos de tuberas en centmetros, otros en pulgadas, otros en millones de pies
cbicos por segundo y otros en yardas.
Al dar medidas a los atributos, la transformacin traduce las diversas unidades de
medida usadas en las diferentes bases de datos para transformarlas en una
medida estndar comn.
Cualquiera que sea la fuente, cuando la informacin de la tubera llegue al data
warehouse necesitar ser medida de la misma manera.
Convenciones de Nombramiento.- El mismo elemento es frecuentemente referido
por nombres diferentes en las diversas aplicaciones. El proceso de transformacin
asegura que se use preferentemente el nombre de usuario.
Fuentes Mltiples.- El mismo elemento puede derivarse desde fuentes mltiples.
En este caso, el proceso de transformacin debe asegurar que la fuente apropiada
sea usada, documentada y movida al depsito.
Cualquiera que sea la forma del diseo, el resultado es el mismo - la informacin
necesita ser almacenada en el data warehouse en un modelo globalmente
aceptable y singular, aun cuando los sistemas operacionales subyacentes
almacenen los datos de manera diferente.
Cuando el analista de sistema de soporte de decisiones observe el data
warehouse, su enfoque deber estar en el uso de los datos que se encuentre en el
depsito, antes que preguntarse sobre la confiabilidad o consistencia de los datos.
De Tiempo Variante
Toda la informacin del data warehouse es requerida en algn momento. Esta
caracterstica bsica de los datos en un depsito, es muy diferente de la
informacin encontrada en el ambiente operacional. En stos, la informacin se
requiere al momento de acceder. En otras palabras, en el ambiente operacional,
cuando usted acceda a una unidad de informacin, usted espera que los valores
requeridos se obtengan a partir del momento de acceso.

Como la informacin en el data warehouse es solicitada en cualquier momento (es


decir, no "ahora mismo"), los datos encontrados en el depsito se llaman de
"tiempo variante".
Los datos histricos son de poco uso en el procesamiento operacional. La
informacin del depsito por el contraste, debe incluir los datos histricos para
usarse en la identificacin y evaluacin de tendencias.

1 La ms simple es que la informacin representa los datos sobre un horizonte


largo de tiempo - desde cinco a diez aos. El horizonte de tiempo representado
para el ambiente operacional es mucho ms corto - desde valores actuales hasta
sesenta a noventa das.
Las aplicaciones que tienen un buen rendimiento y estn disponibles para el
procesamiento de transacciones, deben llevar una cantidad mnima de datos si
tienen cualquier grado de flexibilidad. Por ello, las aplicaciones operacionales
tienen un corto horizonte de tiempo, debido al diseo de aplicaciones rgidas.
2 La segunda manera en la que se muestra el tiempo variante en el data
warehouse est en la estructura clave. Cada estructura clave en el data
warehouse contiene, implcita o explcitamente, un elemento de tiempo como da,
semana, mes, etc.
El elemento de tiempo est casi siempre al pie de la clave concatenada,
encontrada en el data warehouse. En ocasiones, el elemento de tiempo existir
implcitamente, como el caso en que un archivo completo se duplica al final del
mes, o al cuarto.
3 La tercera manera en que aparece el tiempo variante es cuando la informacin
del data warehouse, una vez registrada correctamente, no puede ser actualizada.
La informacin del data warehouse es, para todos los propsitos prcticos, una
serie larga de "snapshots" (vistas instantneas).
Por supuesto, si los snapshots de los datos se han tomado incorrectamente,
entonces pueden ser cambiados. Asumiendo que los snapshots se han tomado
adecuadamente, ellos no son alterados una vez hechos. En algunos casos puede
ser no tico, e incluso ilegal, alterar los snapshots en el data warehouse. Los datos
operacionales, siendo requeridos a partir del momento de acceso, pueden
actualizarse de acuerdo a la necesidad.

No Voltil
La informacin es til slo cuando es estable. Los datos operacionales cambian
sobre una base momento a momento. La perspectiva ms grande, esencial la
manipulacin bsica de los datos que ocurre en el data warehouse es mucho ms
simple. Hay dos nicos tipos de operaciones: la carga inicial de datos y el acceso
a los mismos. No hay actualizacin de datos (en el sentido general de
actualizacin) en el depsito, como una parte normal de procesamiento.
Hay algunas consecuencias muy importantes de esta diferencia bsica, entre el
procesamiento operacional y del data warehouse. En el nivel de diseo, la
necesidad de ser precavido para actualizar las anomalas no es un factor en el
data warehouse, ya que no se hace la actualizacin de datos. Esto significa que
en el nivel fsico de diseo, se pueden tomar libertades para optimizar el acceso a
los datos, particularmente al usar la normalizacin y de normalizacin fsica.
Otra consecuencia de la simplicidad de la operacin del data warehouse est en la
tecnologa subyacente, utilizada para correr los datos en el depsito. Teniendo que
soportar la actualizacin de registro por registro en modo on-line (como es
frecuente en el caso del procesamiento operacional) requiere que la tecnologa
tenga un fundamento muy complejo debajo de una fachada de simplicidad.
La tecnologa permite realizar backup y recuperacin, transacciones e integridad
de los datos y la deteccin y solucin al estancamiento que es ms complejo. En
el data warehouse no es necesario el procesamiento.
La fuente de casi toda la informacin del data warehouse es el ambiente
operacional. A simple vista, se puede pensar que hay redundancia masiva de
datos entre los dos ambientes. Desde luego, la primera impresin de muchas
personas se centra en la gran redundancia de datos, entre el ambiente
operacional y el ambiente de data warehouse. Dicho razonamiento es superficial y
demuestra una carencia de entendimiento con respecto a qu ocurre en el data
warehouse. De hecho, hay una mnima redundancia de datos entre ambos
ambientes.
Se debe considerar lo siguiente:
Los datos se filtran cuando pasan desde el ambiente operacional al de depsito.
Existe mucha data que nunca sale del ambiente operacional. Slo los datos que
realmente se necesitan ingresarn al ambiente de data warehouse.

El horizonte de tiempo de los datos es muy diferente de un ambiente al otro. La


informacin en el ambiente operacional es ms reciente con respecto a la del data
warehouse. Desde la perspectiva de los horizontes de tiempo nicos, hay poca
superposicin entre los ambientes operacional y de data warehouse.
El data warehouse contiene un resumen de la informacin que no se encuentra en
el ambiente operacional.
Los datos experimentan una transformacin fundamental cuando pasa al data
warehouse. La mayor parte de los datos se alteran significativamente al ser
seleccionados y movidos al data warehouse. Dicho de otra manera, la mayora de
los datos se alteran fsica y radicalmente cuando se mueven al depsito. No es la
misma data que reside en el ambiente operacional desde el punto de vista de
integracin.
En vista de estos factores, la redundancia de datos entre los dos ambientes es
una ocurrencia rara, que resulta en menos de 1%.
USOS DEL DATA WAREHOUSE
Los datos operacionales y los datos del data warehouse son accesados por
usuarios que usan los datos de maneras diferentes.
Uso de Base de Datos
Operacionales

Uso de

Muchos usuarios concurrentes

Pocos usuarios concurrentes

Consultas predefinidas y
actualizables

Data Warehouse

Consultas complejas,
frecuentemente
no anticipadas.

Cantidades pequeas de datos


detallados

Cantidades grandes de datos


detallados

Requerimientos de respuesta
inmediata

Requerimientos de respuesta no
crticos

Maneras diferentes de uso de datos


Los usuarios de un data warehouse necesitan acceder a los datos complejos,
frecuentemente desde fuentes mltiples y de formas no predecibles.

Los usuarios que accedan a los datos operacionales, comnmente efectan tareas
predefinidas que, generalmente requieren acceso a una sola base de datos de una
aplicacin. Por el contrario, los usuarios que accedan al data warehouse, efectan
tareas que requieren acceso a un conjunto de datos desde fuentes mltiples y
frecuentemente no son predecibles. Lo nico que se conoce (si es modelada
correctamente) es el conjunto inicial de datos que se han establecido en el
depsito.
Por ejemplo, un especialista en el cuidado de la salud podra necesitar acceder a
los datos actuales e histricos para analizar las tendencias de costos, usando un
conjunto de consultas predefinidas. Por el contrario, un representante de ventas
podra necesitar acceder a los datos de cliente y producto para evaluar la eficacia
de una campaa de marketing, creando consultas base o ad-hoc para encontrar
nuevamente necesidades definidas.
Slo pocos usuarios acceden a los datos concurrentemente
En contraste a la produccin de sistemas que pueden manejar cientos o miles de
usuarios concurrentes, al data warehouse acceda un limitado conjunto de usuarios
en cualquier tiempo determinado.
Los usuarios generan un procesamiento no predecible complejo
Los usuarios del data warehouse generan consultas complejas. A veces la
respuesta a una consulta conduce a la formulacin de otras preguntas ms
detalladas, en un proceso llamado drilling down. El data warehouse puede incluir
niveles de resmenes mltiples, derivado de un conjunto principal, nico, de datos
detallados, para soportar este tipo de uso.
En efecto, los usuarios frecuentemente comienzan buscando en los datos
resumidos y como identifican reas de inters, comienzan a acceder al conjunto
de datos detallado. Los conjuntos de datos resumidos representan el "Qu" de una
situacin y los conjuntos de datos detallados permiten a los usuarios construir un
cuadro sobre "Cmo" se ha derivado esa situacin.
Las consultas de los usuarios accedan a cantidades grandes de datos
Debido a la necesidad de investigar tendencias y evaluar las relaciones entre
muchas clases de datos, las consultas al data warehouse permiten acceder a
volmenes muy grandes tanto de data detallada como resumida. Debido a los
requerimientos de datos histricos, los data warehouses evolucionan para llegar a

un tamao ms grande que sus orgenes operacionales (de 10 a 100 veces ms


grande).
Las consultas de los usuarios no tienen tiempos de respuesta crticos
Las transacciones operacionales necesitan una respuesta inmediata porque un
cliente puede estar esperando una respuesta. En el data warehouse, por el
contrario, tiene un requerimiento de respuesta no-crtico porque el resultado
frecuentemente se usa en un proceso de anlisis y toma de decisiones. Aunque
los tiempos de respuesta no son crticos, los usuarios esperan una respuesta
dentro del mismo da en que es hecha la consulta.
Por lo general, los diferentes niveles de datos dentro del data warehouse reciben
diferentes usos. A ms alto nivel de esquematizacin, se tiene mayor uso de los
datos.
La data ms resumida, permite capturar los datos en forma ms rpida y eficiente.
Si en una tarea se encuentra que se hace mucho procesamiento a niveles de
detalle del data warehouse, entonces se consumir muchos recursos de mquina.
Es mejor hacer el procesamiento a niveles ms altos de esquematizacin como
sea posible.
Para muchas tareas, el analista de sistemas de soporte de decisiones usa la
informacin a nivel de detalle en un pre data warehouse. La seguridad de la
informacin de detalle se consigue de muchas maneras, aun cuando estn
disponibles otros niveles de esquematizacin. Una de las actividades del
diseador de datos es el de desconectar al usuario del sistema de soporte de
decisiones del uso constante de datos a nivel de detalle ms bajo.
El diseador de datos tiene dos predisposiciones:
Instalar un sistema chargeback, donde el usuario final pague por los recursos
consumidos
Sealar el mejor tiempo de respuesta que puede obtenerse cuando se trabaja con
la data a un nivel alto de esquematizacin, a diferencia de un pobre tiempo de
respuesta que resulta de trabajar con los datos a un nivel bajo de detalle.
3. Qu es una base de datos centralizada?. Ejemplos y como se puede
aplicar en conceptos de minera de datos o bodegas de datos?.
BASE DE DATOS CENTRALIZADA (BDC).

Es una base de datos almacenada en su totalidad en un solo lugar fsico, es decir,


es una base de datos almacenada en una sola mquina y una sola CPU, en donde
los usuarios trabajan en terminales que slo muestran resultados. Son aquellos
que se ejecutan en un nico sistema informtico sin interaccionar con ninguna otra
computadora.

CARACTERSTICAS DE LAS BASES DE DATOS


CENTRALIZADAS.
Se almacena completamente en una localidad central, es decir, todos los
componentes del sistema residen en un solo computador o sitio.
No posee mltiples elementos de procesamiento
intercomunicacin como las Bases de Datos Distribuidas.

ni

mecanismos

de

Los componentes de la Bases de Datos Centralizadas son los datos, el software


del SGBD (Sistema de Gestin de Base de Datos) y los dispositivos de
almacenamiento secundario asociados, como disco de almacenamiento en lnea
de la base de datos y cintas para las copias de seguridad.
El problema de seguridad es inherentemente fcil en estos sistemas de bases de
datos.
VENTAJAS E INCONVENIENTES
VENTAJAS DE LAS BASES DE DATOS CENTRALIZADAS.
Se evita la redundancia. En sistemas que no usan Bases de Datos
Centralizadas, cada aplicacin tiene sus propios archivos privados o se
encuentran en diferentes localidades.Esto a menudo origina enorme redundancia
en los datos almacenados, as como desperdicio resultante del espacio de
almacenamiento.
Se evita la inconsistencia. Ya que si un hecho especfico se representa por una
sola entrada, la no-concordancia de datos no puede ocurrir.
Pueden hacerse cumplir las normas establecidas. Con un control central de la
base de datos, el Administrador de Base de Datos (DBA) puede garantizar que se
cumplan todas las formas aplicables a la representacin de los datos.

Pueden aplicarse restricciones de seguridad. El Administrador de Base de Datos


(DBA) puede:
Asegurar que el nico medio de acceder la base de datos sea a travs de los
canales establecidos. Definir controles de autorizacin para que se apliquen cada
vez que se intente el acceso a datos sensibles
Puede conservarse la integridad. Que los datos se encuentren en una sola
mquina ayuda a evitar la inconsistencia de los datos, por el mismo hecho de
encontrarse en una sola mquina.El procesamiento de los datos ofrece un mejor
rendimiento y resulta ms confiable que en los sistemas distribuidos.

DESVENTAJAS DE LAS BASES DE DATOS CENTRALIZADAS.


Los mainframes (computadora central) no ofrecen mejor proporcin
precio/rendimiento que los microprocesadores de los sistemas distribuidos.
Cuando un sistema de Base de Datos Centralizada falla, se pierde toda la
disponibilidad de procesamiento y sobre todo de la informacin confiada al
sistema.
En caso de un desastre o catstrofe, la recuperacin es difcil de sincronizar.
Las cargas de trabajo no se pueden difundir entre diferentes computadoras, ya
que los trabajos siempre se ejecutarn en la misma mquina.
No se puede aadir poder de cmputo en pequeos incrementos, debido a lo
complicado de esta operacin.
Ejemplo:
Nombre de Evento: Puerta se Cerr
Detalle: Ninguno.
Foto: En todos los proyectos de seguridades expuestos en la materia de
graduacin se ha definido el uso de captura de imgenes por medio de cmaras,
para ciertos eventos se incluye la imagen asociada.

4. Que es una base de datos distribuida?


Son un grupo de datos que pertenecen a un sistema pero a su vez esta repartido
entre ordenadores de una misma red, ya sea a nivel local o cada uno en una
diferente localizacin geogrfica, cada sitio en la red es autnomo en sus
capacidades de procesamiento y es capaz de realizar operaciones locales y en
cada uno de estos ordenadores debe estar ejecutndose una aplicacin a nivel
global que permita la consulta de todos los datos como si se tratase de uno solo.
CENTRALIZADO
Control Centralizado: un solo DBA
Independencia de datos: organizacin
de los datos es transparente para el
programador.
Reduccin de redundancia: Una sola
copia de datos que se comparta
Estructuras fsicas
accesos eficientes
Seguridad

completas

para

DISTRIBUIDO
Control Jerrquico: DBA global y DBA
local
Transparencia en la distribucin:
Localizacin de los datos es un aspecto
adicional de independencia de datos.
Replicacin de datos: Copias mltiples
de datos que incrementa la localidad y
la disponibilidad de datos.
No hay estructuras intersitios: Uso de
optimizacin
global
para
reducir
transparencia de datos.
Problemas de seguridad intrnsecos.

5. Que es clustering, grid computing?


El trmino clster (del ingls cluster, "grupo" o "racimo") se aplica a los conjuntos
o conglomerados de computadoras construidos mediante la utilizacin de
hardwares comunes y que se comportan como si fuesen una nica computadora.
La tecnologa de clsteres ha evolucionado en apoyo de actividades que van
desde aplicaciones de supercmputo y software de misiones crticas, servidores
web y comercio electrnico, hasta bases de datos de alto rendimiento, entre otros
usos.
El cmputo con clsteres surge como resultado de la convergencia de varias
tendencias actuales que incluyen la disponibilidad de microprocesadores
econmicos de alto rendimiento y redes de alta velocidad, el desarrollo de
herramientas de software para cmputo distribuido de alto rendimiento, as como
la creciente necesidad de potencia computacional para aplicaciones que la
requieran.
Simplemente, un clster es un grupo de mltiples ordenadores unidos mediante
una red de alta velocidad, de tal forma que el conjunto es visto como un nico
ordenador, ms potente que los comunes de escritorio.
Los clsteres son usualmente empleados para mejorar el rendimiento y/o la
disponibilidad por encima de la que es provista por un solo computador
tpicamente siendo ms econmico que computadores individuales de rapidez y
disponibilidad comparables.
De un clster se espera que presente combinaciones de los siguientes servicios:
Alto rendimiento
Alta disponibilidad
Balanceo de carga
Escalabilidad
La construccin de los ordenadores del clster es ms fcil y econmica debido a
su flexibilidad: pueden tener todos la misma configuracin de hardware y sistema
operativo (clster homogneo), diferente rendimiento pero con arquitecturas y
sistemas operativos similares (clster semihomogneo), o tener diferente

hardware y sistema operativo (clster heterogneo), lo que hace ms fcil y


econmica su construccin.
La computacin grid es una tecnologa innovadora que permite utilizar de forma
coordinada todo tipo de recursos (entre ellos cmputo, almacenamiento y
aplicaciones especficas) que no estn sujetos a un control centralizado. En este
sentido es una nueva forma de computacin distribuida, en la cual los recursos
pueden ser heterogneos (diferentes arquitecturas, supercomputadores,
clusters...) y se encuentran conectados mediante redes de rea extensa (por
ejemplo Internet). Desarrollado en mbitos cientficos a principios de los aos
1990, su entrada al mercado comercial siguiendo la idea de la llamada Utility
computing supone una importante revolucin.
El trmino grid se refiere a una infraestructura que permite la integracin y el uso
colectivo de ordenadores de alto rendimiento, redes y bases de datos que son
propiedad y estn administrados por diferentes instituciones. Puesto que la
colaboracin entre instituciones envuelve un intercambio de datos, o de tiempo de
computacin, el propsito del grid es facilitar la integracin de recursos
computacionales. Universidades, laboratorios de investigacin o empresas se
asocian para formar grid para lo cual utilizan algn tipo de software que
implemente este concepto.
En la computacin grid, las redes pueden ser vistas como una forma de
computacin distribuida donde un supercomputador virtual est compuesto por
una serie de computadores agrupados para realizar grandes tareas.
La computacin grid ofrece muchas ventajas frente a otras tecnologas
alternativas. La potencia que ofrece multitud de computadores conectados en red
usando grid es prcticamente ilimitada, adems de que ofrece una perfecta
integracin de sistemas y dispositivos heterogneos, por lo que las conexiones
entre diferentes mquinas no generarn ningn problema. Se trata de una
solucin altamente escalable, potente y flexible, ya que evitarn problemas de falta
de recursos (cuellos de botella) y nunca queda obsoleta, debido a la posibilidad de
modificar el nmero y caractersticas de sus componentes.
Estos recursos se distribuyen en la red de forma transparente pero guardando
unas pautas de seguridad y polticas de gestin de carcter tanto tcnico como
econmico. As pues, su objetivo ser el de compartir una serie de recursos en la
red de manera uniforme, segura, transparente, eficiente y fiable, ofreciendo un
nico punto de acceso a un conjunto de recursos distribuidos geogrficamente en
diferentes dominios de administracin. Esto nos puede llevar a pensar que la

computacin Grid permite la creacin de empresas virtuales. Es importante saber


que una grid es un conjunto de mquinas distribuidas que ayudan a mejorar el
trabajo sobre software pesados.
6. Cul es la importancia de las bases de datos para los sistemas de
informacin?
Una base de datos proporciona a los usuarios el acceso a datos, que pueden
visualizar, ingresar o actualizar, en concordancia con los derechos de acceso que
se les hayan otorgado. Se convierte ms til a medida que la cantidad de datos
almacenados crece.
Una base de datos puede ser local, es decir que puede utilizarla slo un usuario
en un equipo, o puede ser distribuida, es decir que la informacin se almacena en
equipos remotos y se puede acceder a ella a travs de una red.
La principal ventaja de utilizar bases de datos es que mltiples usuarios pueden
acceder a ellas al mismo tiempo. Las bases de datos son una coleccin de
informacin de cualquier tipo perteneciente a un mismo contexto y almacenado
sistemticamente para su posterior uso. En este sentido un tarjetero de recetas,
un catlogo de fichas bibliogrficas, un archivo de inventario en el archivero de
una oficina, los registros de calificaciones escolares de un estudiante, etc. Casi
toda coleccin de informacin puede convertirse en una base de datos. Una base
de datos computarizada: es una coleccin de informacin almacenada de forma
organizada en un computador. Las bases de datos son necesarias para
Facilitar: - El almacenamiento de grandes cantidades de informacin. - La
recuperacin rpida y flexible de informacin. - La organizacin y reorganizacin
de la informacin. - La impresin y distribucin de informacin en varias formas.
Programa de base de datos: Es una herramienta de software para organizar el
almacenamiento y la recuperacin de esa informacin. Las bases de datos se
aplican en las industrias, bancos locales y nacionales, compaas manufactureras,
empresas e instituciones, redes de bancos, etc. Desde computadoras personales
y en situaciones ms complejas donde se requiere que muchos usuarios
compartan la informacin, utilizan computadoras multiusuario ya sea, mainframes,
minis o redes.
7. Explique en qu consiste SQL, sus ventajas, desventajas, manejo,
caractersticas y otros conceptos que usted considere importante

El lenguaje de consulta estructurado o SQL (por sus siglas en ingls Structured


Query Language) es un lenguaje declarativo de acceso a bases de
datos relacionales que permite especificar diversos tipos de operaciones en ellas.
Una de sus caractersticas es el manejo del lgebra y el clculo relacional que
permiten
efectuar consultas con
el
fin
de
recuperar
de
forma
sencilla informacin de inters de bases de datos, as como hacer cambios en
ellas.
CARACTERISTICAS GENERALES DEL SQL
El SQL es un lenguaje de acceso a bases de datos que explota la flexibilidad y
potencia de los sistemas relacionales y permite as gran variedad de operaciones.
Es un lenguaje declarativo de "alto nivel" o "de no procedimiento" que, gracias a
su fuerte base terica y su orientacin al manejo de conjuntos de registros y no
a registros individuales permite una alta productividad en codificacin y la
orientacin a objetos. De esta forma, una sola sentencia puede equivaler a uno o
ms programas que se utilizaran en un lenguaje de bajo nivel orientado a
registros. SQL tambin tiene las siguientes caractersticas:
Lenguaje de definicin de datos: El LDD de SQL proporciona comandos para la
definicin de esquemas de relacin, borrado de relaciones y modificaciones de los
esquemas de relacin.
Lenguaje interactivo de manipulacin de datos: El LMD de SQL incluye lenguajes
de consultas basado tanto en lgebra relacional como en clculo relacional de
tuplas.
Integridad: El LDD de SQL incluye comandos para especificar las restricciones de
integridad que deben cumplir los datos almacenados en la base de datos.
Definicin de vistas: El LDD incluye comandos para definir las vistas.
Control de transacciones: SQL tiene comandos para especificar el comienzo y el
final de una transaccin.
SQL incorporado y dinmico: Esto quiere decir que se pueden incorporar
instrucciones de SQL en lenguajes de programacin como: C++, C, Java, PHP,
Cobol, Pascal y Fortran.
Autorizacin: El LDD incluye comandos para especificar los derechos de acceso a
las relaciones y a las vistas.

Tipos de Datos
Algunos de los tipos de datos bsicos de SQL son:
Date: una fecha de calendario que contiene el ao (de cuatro cifras), el mes y el
da.
Time: La hora del da en horas minutos segundos (el valor predeterminado es 0).
Timestamp: la combinacin de Date y Time.
Optimizacin
Como ya se dijo antes, y suele ser comn en los lenguajes de acceso a bases de
datos de alto nivel, el SQL es un lenguaje declarativo. O sea, que especifica qu
es lo que se quiere y no cmo conseguirlo, por lo que una sentencia no establece
explcitamente un orden de ejecucin.
El orden de ejecucin interno de una sentencia puede afectar seriamente a la
eficiencia del SGBD, por lo que se hace necesario que ste lleve a cabo una
optimizacin antes de su ejecucin. Muchas veces, el uso de ndices acelera una
instruccin de consulta, pero ralentiza la actualizacin de los datos. Dependiendo
del uso de la aplicacin, se priorizar el acceso indexado o una rpida
actualizacin de la informacin. La optimizacin difiere sensiblemente en cada
motor de base de datos y depende de muchos factores.
Existe una ampliacin de SQL conocida como FSQL (Fuzzy SQL, SQL difuso) que
permite el acceso a bases de datos difusas, usando la lgica difusa. Este lenguaje
ha sido implementado a nivel experimental y est evolucionando rpidamente
FUNCIONES DE SQL:
Propiedad SELECT: hace la seleccin en una tabla de la BD.
SELECT *FROM datos
Esta sentencia seleccionara todos, absolutamente todos los registros dentro de la
tabla datos.
SELECT * FROM datos WHERE usuario= 'juan'
Seleccionaramos todos los registros dentro de la tabla datos que tengan como
usuarios a juan.

Propiedad INSERT INTO: Agrega un nuevo registro a la tabla elegida


INSERT INTO datos (usuario) VALUES ('corsa')
Insertaremos en la tabla datos en la columna usuario, un registro nuevo.
INSERT INTO datos (usuario, edad) VALUES ('corsa',20)
Aqu insertamos 2 registros al mismo tiempo.
Propiedad DELETE: Borrar registros de nuestra tabla
DELETE FROM datos WHERE usuario= 'pedrito'
Borramos los registros donde el usuario sea pedrito.
DELETE FROM datos WHERE usuario= 'Mario' AND edad=16
Borramos solo los usuarios de nombre Mario que tenian 16 aos.
Propiedad UPDATE: actualiza registros, modificando datos ya exixtentes.
UPDATE datos SET usuario= 'pedrito'
Esta modificacin renombrara todos los usuarios a pedrito.
UPDATE datos SET usuarios= 'Mario' WHERE edad=16
Modificamos solo los registros que tenan 16 aos. Ahora todos los usuarios de 16
aos se llaman Mario.

VENTAJAS DE SQL

Es un estndar para el manejo de datos en un manejador de base de datos


relacional
Es no sensitivo, esto quiere decir que no importa si pones en maysculas o
minsculas el comando o instruccin te lo reconocer.
Es imperativo, no necesariamente secuencial aunque tenga un
ordenamiento.
Es de fcil comprensin.
Es un lenguaje de alto nivel para datos, esto es con una sola instruccin
afecta a varios registros en tiempo real.

DESVENTAJAS DEL SQL

Es un lenguaje simple que si se requiere mayores implementaciones esta


limitado a la explotacin de datos.
Se dice que es estndar pero cuando se combina con tipos de datos
estndares hay pequeas diferencias que debilitan esta opcin.
Depende para ser seguro de que tan seguro sea el manejador de base de
datos relacional que lo este implementando.

8. Explique cmo aplica y en que influye la inteligencia artificial en los nuevos


Sistemas de bases de datos.
La Inteligencia Artificial trata de conseguir que los ordenadores simulen en cierta
manera la inteligencia humana. Se acude a sus tcnicas cuando es necesario
incorporar en un sistema informtico, conocimiento o caractersticas propias del
ser humano.
Las definiciones de Inteligencia Artificial han evolucionado tal es as que los
autores como Rich & Knight (1994), Stuart (1996), quienes definen en forma
general la IA como la capacidad que tienen las mquinas para realizar tareas que
en el momento son realizadas por seres humanos; otros autores como Nebendah
(1988), Delgado (1998), arrojan definiciones ms completas y las definen cmo el
campo de estudio que se enfoca en la explicacin y emulacin de la conducta
inteligente en funcin de procesos computacionales basadas en la experiencia y el
conocimiento continuo del ambiente.
Caractersticas de la IA
Una de sus caractersticas es que incluye varios campos de desarrollo, como la
robtica, la comprensin y traduccin de lenguajes, el reconocimiento y
aprendizaje de palabras de mquinas o los variados sistemas computacionales
expertos, que son los encargados de reproducir el comportamiento humano en
una seccin del conocimiento.
Tales tareas reducen costos y riesgos en la manipulacin humana en reas
peligrosas, mejoran el desempeo del personal inexperto y el control de calidad en
el rea comercial

Las reas de investigacin de la IA


Son muchas las reas de la A I que se investigan hoy da. Entre ellas, tenemos las
siguientes:
La representacin del conocimiento, que busca en el descubrimiento de mtodos
expresivos y eficientes describir informacin sobre aspectos del mundo real.
Los mtodos de aprendizaje automtico, que extienden las tcnicas estadsticas
con el fin de posibilitar la identificacin de un amplio rango de tendencias
generales a partir de un conjunto de datos de entrenamiento.
El campo de la planificacin, que enfrenta el desarrollo de algoritmos que
construyen y ejecutan automticamente secuencias de comandos primitivos con el
fin de alcanzar ciertas metas de alto nivel.
Los trabajos en el rea de razonamiento posible, que hacen uso de principios
estadsticos para desarrollar codificaciones de informacin incierta.
El estudio de las arquitecturas de agentes, que busca la integracin de otras
reas de la I A con el objeto de crear agentes inteligentes, entidades robustas
capaces de comportamiento autnomo y en tiempo real.
La coordinacin y colaboracin multiagentes, que ha permitido el desarrollo de
tcnicas para la representacin de las capacidades de otros agentes y la
especificacin del conocimiento necesario para la colaboracin entre ellos.
El desarrollo de ontologas, que persigue la creacin de catlogos de
conocimiento explcito, formal y multipropsito, que puedan ser utilizados por
sistemas inteligentes.
Los campos de procesamiento de voz y lenguaje, que buscan la creacin de
sistemas que se comunican con la gente en su lenguaje.
La sntesis y comprensin de imgenes, que conduce a la produccin de
algoritmos para el anlisis de fotografas, diagramas y videos, as como tambin
de tcnicas para el despliegue visual de informacin cuantitativa y estructurada.

reas de aplicacin de la IA
Pero tambin hay reas de aplicacin. En efecto, estos procesos de la AI se
aplican en los sistemas reales en una gran variedad de ramas y problemas:
Gestin y control: anlisis inteligente, fijacin de objetivos.
Fabricacin: diseo, planificacin, programacin, monitorizacin, control, gestin
de proyectos, robtica simplificada y visin computarizada.
Educacin: adiestramiento prctico, exmenes y diagnstico.
Ingeniera: diseo, control y anlisis.
Equipamiento: diseo, diagnstico, adiestramiento, mantenimiento, configuracin,
monitorizacin y ventas.
Cartografa: interpretacin de fotografas, diseo, resolucin de problemas
cartogrficos.
Profesiones: abogaca, medicina, contabilidad, geologa, qumica.
Software: enseanza, especificacin, diseo, verificacin, mantenimiento.
Sistemas de armamento: guerra electrnica, identificacin de objetivos, control
adaptativo, proceso de imgenes, proceso de seales.
Proceso de datos: educacin, interface en lenguaje natural, acceso inteligente a
datos y gestores de bases de datos, anlisis inteligente de datos.
Finanzas: planificacin, anlisis, consultora.
9. Explique cul es la importancia de la integracin de las bases de datos a los
Nuevos modelos de inteligencia de negocio.
La Inteligencia de Negocios es el trmino y procura caracterizar una amplia
variedad de tecnologas, plataformas de software, especificaciones de
aplicaciones y procesos. El objetivo primario de la a Inteligencia de Negocios es
contribuir a tomar decisiones que mejoren el desempeo de la empresa y
promover su ventaja competitiva en el mercado. En resumen, la Inteligencia de

Negocios faculta a la organizacin a tomar mejores decisiones ms rpidas. Este


concepto se requiere analizar desde tres perspectivas: Hacer mejores decisiones
ms rpido, convertir datos en informacin, y usar una aplicacin relacional para la
administracin.
Con respecto a la primera perspectiva, el objetivo primario de la Inteligencia de
Negocios es contribuir a tomar decisiones que mejoren el desempeo de la
empresa y promover su ventaja competitiva en el mercado. La Inteligencia de
Negocios faculta a la organizacin a tomar mejores decisiones ms rpidas. En
relacin con la conversin de datos en informacin la Inteligencia de Negocios se
orienta a establecer el "puente" que una las grandes cantidades de datos y la
informacin que los tomadores de decisiones requieren cotidianamente. Para ello
se emplean "indicadores de desempeo clave" destinados a colectar informacin
de las mtricas que afectan unidades particulares de la empresa as como al todo
de la misma
La Inteligencia de Negocios puede describirse como una aplicacin relacional para
la administracin, como un estado organizacional o una filosofa de administracin.
En resumen la Inteligencia de Negocios se caracterizada por: Buscar hechos
cuantitativos medibles y objetivos acerca de la empresa, usar mtodos y
tecnologas para el anlisis de hechos, desarrollar modelos que expliquen la
causa-efecto de las relaciones entre las acciones operacionales y los efectos que
estas han alcanzado las metas, y experimentar con aplicaciones alternativas y
supervisar los resultados que sirven de retroalimentacin.
10. Explique que son los Big Date.
Big data es el trmino ingls que designa los conjuntos de datos de gran tamao y
generalmente desestructurados que resultan difciles de manejar usando las
aplicaciones de bases de datos convencionales.
Algunos ejemplos de big data son los siguientes: las consultas y resultados de los
motores de bsqueda, los datos de las redes sociales (como los tuits), los datos
meteorolgicos, los datos astronmicos, la vigilancia militar, los datos econmicos
y burstiles, los historiales mdicos, los experimentos fsicos (Gran Colisionador
de Hadrones), los archivos fotogrficos, la radio y la televisin, los vdeos (CCTV y
YouTube) y los datos sobre transacciones.
Se espera que el fenmeno big dataimpulse las rentabilidades de toda una
generacin de nuevas empresas informticas con capitalizaciones de varios miles
de millones de dlares. Es el segmento del mercado de los sistemas de

informacin que ms crece en todo el mundo. Los analistas creen que el mercado
potencial total est valorado en 100.000 millones de dlares
Empresas como General Electric,IBM, Oracle, Microsoft, SAP y Symantechan
invertido mucho en centros de procesamiento de datos diseados para interpretar
big data. Estas empresas estn dispuestas a pagar una prima para contratar a los
profesionales ms brillantes. Oracle, Microsoft, IBM y SAP han gastado
conjuntamente ms de 15.000 millones de dlares en adquisiciones de empresas
tecnolgicas especializadas en herramientas de inteligencia de negocio. Hay
puestos para programadores, estadsticos, analistas cuantitativos, econometristas
y analistas de extraccin de datos. El mercado de los grandes conjuntos de datos
tiene su propia cadena de suministro y permite beneficiarse a las empresas, tanto
si estn especializadas en hardware o infraestructuras como en software o
servicios.
La capacidad tecnolgica con que cuentan estas compaas es impresionante y ya
son capaces de generar resultados beneficiosos para las empresas clientes que
contratan sus servicios. Los datos de los sensores colocados en los motores
aeronuticos podran estudiarse, por ejemplo, para mejorar el consumo de
combustible de un avin de pasajeros. El anlisis de datos tambin puede ser
ventajoso para el sector del petrleo y el gas, ya que puede contribuir a encontrar
formas de prolongar la vida til de los campos petrolferos y gasistas y la
recuperacin de los recursos naturales. Cara al futuro, estas grandes empresas
tecnolgicas estn en una buena posicin para desarrollar lucrativos negocios de
consultora basados en su capacidad para analizar grandes conjuntos de datos.
11. Qu implica no tener una base de datos o sistemas de informacin para
una empresa (reflexin)?.
Al paso de aos la humanidad ha encontrado la manera de almacenar
informacin, ya sea por considerarla como una simple actividad o por tener en
cuenta la importancia que tiene. Por todas las partes del mundo podemos
encontrar informacin que pasa de generacin en generacin hasta que se pierde,
pero no toda la informacin se considera como un simple recuerdo, podemos
encontrar informacin de nuestros pasados que nos dice como eran aquellos
tiempos o hasta informacin de gran impacto para todo aquel que viva en este
planeta. Sin duda alguna la informacin nos a hecho crecer como personas a toda
la humanidad entera, gracias a ella sabemos de donde venimos y como hemos
estado evolucionando siempre apoyndonos de informacin que nos dice lo que
podemos o no podemos hacer para lograr el xito que buscamos, de igual forma,

toda organizacin por mas pequea que sea, necesita saber su pasado y su
presente, la situacin actual en la que se encuentra y con que cuenta para afrontar
el futuro.
La informacin es un recurso vital para toda organizacin, y el buen manejo de
esta puede significar la diferencia entre el xito o el fracaso para todos los
proyectos que se emprendan dentro de un organismo que busca el crecimiento y
el xito.
Dentro de cualquier organizacin la informacin fluye da con da, y cada actividad
genera mas informacin que puede apoyar las distintas tareas que se llevan a
cabo para su buen funcionamiento. En todos los departamento de todas las
organizaciones se genera informacin, como lo son el los departamento de
recursos humano, finanzas, contabilidad, limpieza, produccin y todos los
departamentos mas que se imaginen. La informacin se genera debido a las
actividades que se llevan a cabo en cada departamento y el xito de estos mismos
depende de la visin que se tenga y en que se apoyen para lograr las metas
establecidas, sin duda alguna, el apoyo en la informacin que se genera dentro de
ese departamento es una base sumamente sustentable y creble para tomarse en
cuanta para posibles tareas.
Los datos histricos de una empresa pueden marcar el camino a seguir para las
tareas que se lleven a cabo dentro de la organizacin, estos datos no son sino
informacin almacenada y procesada para su interpretacin y para ser tomada en
cuenta como una gua a seguir de lo que se debe de hacer y lo que no se debe de
hacer segn experiencias de la misma empresa. Cualquier empresa que no
registe sus actividades, constantemente se ver en los mismo errores una y otra
vez hasta que se percate de cul es el error y lo documente para su utilizacin en
un futuro.
El manejo de la informacin es fundamental para cualquier empresa, con ello
puede lograr un alto nivel competitivo dentro del mercado y obtener mayores
niveles de capacidad de desarrollo. El manejo de informacin nos permite
identificar cules son nuestras fortalezas con las que contamos y cules son
nuestras debilidades y sectores vulnerables como organizacin. Teniendo en
cuenta que se sabe con certeza cuales son nuestras debilidades y fortalezas se
puede tener una planeacin ms alcanzable y factible, podemos identificar donde
se tiene que trabajar ms y que parte de nuestra empresa necesita mayor
atencin. Esto nos ayudara a tener un control ms amplio sobre el funcionamiento
de todas las actividades de la organizacin.

CONCLUSIONES
Con los avances tecnolgicos y los nuevos mecanismos que se usan, es preciso
decir que cada uno de estos es de vital importancia a la hora de relacionar y
organizacin informacin desde altos niveles hasta los ms bajos, dicho proceso
le proporciona a las empresas y a las personas mejorar sus estilos de anlisis a la
hora de tomar decisiones y generar estrategias dentro de un proceso requerido.
La organizacin de los datos se reconoce hoy da como un factor importante a la
hora de conocer todos los aspectos de planeacin y estudio de los entornos de
una empresa, con herramientas como la minera de datos que basa sus
principales funciones en la recopilacin de grandes cantidades de datos, donde de
alguna manera genera ventajas en las empresas o personas que recurran a dicha
herramienta, pues de esta se desprenden grandes actividades de mercadotecnia,
matemticas o financieras, estratgicas, entre otras que facilitan el manejo de la
informacin dentro de un proceso de reconocimiento como tal de lo requerido por
la persona o la entidad.
El objetivo final del adecuado uso de las herramientas antes conceptualizadas,
como la bodega de datos, el big data, y todos los sistemas de bases de datos, le
proporcionan a quien requiera de ellos optimizar costos y de algn mondo
maximizar sus utilidades; cabe tambin resaltar que en todo proceso de uso
frecuente se arriesgaran a perdidas, pero todo depende de la finalidad de la
herramienta a usar.

BIBLIOGRAFIA

Wikipedia.org
Documentos PDF de la web
msdn.microsoft.com

Potrebbero piacerti anche