Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
INTRODUCCION
TALLER
Hace referencia a que gracias a Data Mining solo hay que preocuparse de las
tomas de decisiones ya que gracias a esta tecnologa va mostrando las diversas
ventajas y desventajas como son algunas sealadas en este punto. (Punto 5)
Gracias a Data Mining se pueden dividir los problemas en distintos sectores y esto
provocara que en diversos sectores deba haber distintos grupos de trabajo
especializados en el mbito de ese problema para as optimizar el tiempo y
recursos.
DESVENTAJAS:
MANEJO:
Seleccin del conjunto de datos, tanto en lo que se refiere a las variables
objetivo (aquellas que se quiere predecir, calcular o inferir), como a las variables
independientes (las que sirven para hacer el clculo o proceso), como
posiblemente al muestreo de los registros disponibles.
Anlisis de las propiedades de los datos, en especial los histogramas,
diagramas de dispersin, presencia de valores atpicos y ausencia de datos
(valores nulos).
Transformacin del conjunto de datos de entrada, se realizar de diversas
formas en funcin del anlisis previo, con el objetivo de prepararlo para aplicar la
tcnica de minera de datos que mejor se adapte a los datos y al problema, a este
paso tambin se le conoce como preprocesamiento de los datos.
Seleccionar y aplicar la tcnica de minera de datos, se construye el modelo
predictivo, de clasificacin o segmentacin.
Extraccin de conocimiento, mediante una tcnica de minera de datos, se
obtiene un modelo de conocimiento, que representa patrones de comportamiento
observados en los valores de las variables del problema o relaciones de
asociacin entre dichas variables. Tambin pueden usarse varias tcnicas a la vez
para generar distintos modelos, aunque generalmente cada tcnica obliga a un
preprocesado diferente de los datos.
Interpretacin y evaluacin de datos, una vez obtenido el modelo, se debe
proceder a su validacin comprobando que las conclusiones que arroja son
vlidas y suficientemente satisfactorias. En el caso de haber obtenido varios
modelos mediante el uso de distintas tcnicas, se deben comparar los modelos en
busca de aquel que se ajuste mejor al problema. Si ninguno de los modelos
alcanza los resultados esperados, debe alterarse alguno de los pasos anteriores
para generar nuevos modelos.
Si el modelo final no superara esta evaluacin el proceso se podra repetir desde
el principio o, si el experto lo considera oportuno, a partir de cualquiera de los
pasos anteriores. Esta retroalimentacin se podr repetir cuantas veces se
considere necesario hasta obtener un modelo vlido.
Una vez validado el modelo, si resulta ser aceptable (proporciona salidas
adecuadas y/o con mrgenes de error admisibles) ste ya est listo para su
explotacin. Los modelos obtenidos por tcnicas de minera de datos se aplican
Ventajas:
Proporciona informacin clave para la toma de decisiones empresariales.
Mejora la calidad de las decisiones tomadas.
Especialmente til para el medio y largo plazo.
Orientado al tema
Integrado
De tiempo variante
No voltil
Orientado a Temas
Una primera caracterstica del data warehouse es que la informacin se clasifica
con base a los aspectos que son de inters para la empresa. Siendo as, los datos
tomados estn en contraste con los clsicos procesos orientados a las
aplicaciones.
El ambiente operacional se disea alrededor de las aplicaciones y funciones tales
como prstamos, ahorros, tarjeta bancaria y depsitos para una institucin
financiera. Por ejemplo, una aplicacin de ingreso de rdenes puede acceder a los
No Voltil
La informacin es til slo cuando es estable. Los datos operacionales cambian
sobre una base momento a momento. La perspectiva ms grande, esencial la
manipulacin bsica de los datos que ocurre en el data warehouse es mucho ms
simple. Hay dos nicos tipos de operaciones: la carga inicial de datos y el acceso
a los mismos. No hay actualizacin de datos (en el sentido general de
actualizacin) en el depsito, como una parte normal de procesamiento.
Hay algunas consecuencias muy importantes de esta diferencia bsica, entre el
procesamiento operacional y del data warehouse. En el nivel de diseo, la
necesidad de ser precavido para actualizar las anomalas no es un factor en el
data warehouse, ya que no se hace la actualizacin de datos. Esto significa que
en el nivel fsico de diseo, se pueden tomar libertades para optimizar el acceso a
los datos, particularmente al usar la normalizacin y de normalizacin fsica.
Otra consecuencia de la simplicidad de la operacin del data warehouse est en la
tecnologa subyacente, utilizada para correr los datos en el depsito. Teniendo que
soportar la actualizacin de registro por registro en modo on-line (como es
frecuente en el caso del procesamiento operacional) requiere que la tecnologa
tenga un fundamento muy complejo debajo de una fachada de simplicidad.
La tecnologa permite realizar backup y recuperacin, transacciones e integridad
de los datos y la deteccin y solucin al estancamiento que es ms complejo. En
el data warehouse no es necesario el procesamiento.
La fuente de casi toda la informacin del data warehouse es el ambiente
operacional. A simple vista, se puede pensar que hay redundancia masiva de
datos entre los dos ambientes. Desde luego, la primera impresin de muchas
personas se centra en la gran redundancia de datos, entre el ambiente
operacional y el ambiente de data warehouse. Dicho razonamiento es superficial y
demuestra una carencia de entendimiento con respecto a qu ocurre en el data
warehouse. De hecho, hay una mnima redundancia de datos entre ambos
ambientes.
Se debe considerar lo siguiente:
Los datos se filtran cuando pasan desde el ambiente operacional al de depsito.
Existe mucha data que nunca sale del ambiente operacional. Slo los datos que
realmente se necesitan ingresarn al ambiente de data warehouse.
Uso de
Consultas predefinidas y
actualizables
Data Warehouse
Consultas complejas,
frecuentemente
no anticipadas.
Requerimientos de respuesta
inmediata
Requerimientos de respuesta no
crticos
Los usuarios que accedan a los datos operacionales, comnmente efectan tareas
predefinidas que, generalmente requieren acceso a una sola base de datos de una
aplicacin. Por el contrario, los usuarios que accedan al data warehouse, efectan
tareas que requieren acceso a un conjunto de datos desde fuentes mltiples y
frecuentemente no son predecibles. Lo nico que se conoce (si es modelada
correctamente) es el conjunto inicial de datos que se han establecido en el
depsito.
Por ejemplo, un especialista en el cuidado de la salud podra necesitar acceder a
los datos actuales e histricos para analizar las tendencias de costos, usando un
conjunto de consultas predefinidas. Por el contrario, un representante de ventas
podra necesitar acceder a los datos de cliente y producto para evaluar la eficacia
de una campaa de marketing, creando consultas base o ad-hoc para encontrar
nuevamente necesidades definidas.
Slo pocos usuarios acceden a los datos concurrentemente
En contraste a la produccin de sistemas que pueden manejar cientos o miles de
usuarios concurrentes, al data warehouse acceda un limitado conjunto de usuarios
en cualquier tiempo determinado.
Los usuarios generan un procesamiento no predecible complejo
Los usuarios del data warehouse generan consultas complejas. A veces la
respuesta a una consulta conduce a la formulacin de otras preguntas ms
detalladas, en un proceso llamado drilling down. El data warehouse puede incluir
niveles de resmenes mltiples, derivado de un conjunto principal, nico, de datos
detallados, para soportar este tipo de uso.
En efecto, los usuarios frecuentemente comienzan buscando en los datos
resumidos y como identifican reas de inters, comienzan a acceder al conjunto
de datos detallado. Los conjuntos de datos resumidos representan el "Qu" de una
situacin y los conjuntos de datos detallados permiten a los usuarios construir un
cuadro sobre "Cmo" se ha derivado esa situacin.
Las consultas de los usuarios accedan a cantidades grandes de datos
Debido a la necesidad de investigar tendencias y evaluar las relaciones entre
muchas clases de datos, las consultas al data warehouse permiten acceder a
volmenes muy grandes tanto de data detallada como resumida. Debido a los
requerimientos de datos histricos, los data warehouses evolucionan para llegar a
ni
mecanismos
de
completas
para
DISTRIBUIDO
Control Jerrquico: DBA global y DBA
local
Transparencia en la distribucin:
Localizacin de los datos es un aspecto
adicional de independencia de datos.
Replicacin de datos: Copias mltiples
de datos que incrementa la localidad y
la disponibilidad de datos.
No hay estructuras intersitios: Uso de
optimizacin
global
para
reducir
transparencia de datos.
Problemas de seguridad intrnsecos.
Tipos de Datos
Algunos de los tipos de datos bsicos de SQL son:
Date: una fecha de calendario que contiene el ao (de cuatro cifras), el mes y el
da.
Time: La hora del da en horas minutos segundos (el valor predeterminado es 0).
Timestamp: la combinacin de Date y Time.
Optimizacin
Como ya se dijo antes, y suele ser comn en los lenguajes de acceso a bases de
datos de alto nivel, el SQL es un lenguaje declarativo. O sea, que especifica qu
es lo que se quiere y no cmo conseguirlo, por lo que una sentencia no establece
explcitamente un orden de ejecucin.
El orden de ejecucin interno de una sentencia puede afectar seriamente a la
eficiencia del SGBD, por lo que se hace necesario que ste lleve a cabo una
optimizacin antes de su ejecucin. Muchas veces, el uso de ndices acelera una
instruccin de consulta, pero ralentiza la actualizacin de los datos. Dependiendo
del uso de la aplicacin, se priorizar el acceso indexado o una rpida
actualizacin de la informacin. La optimizacin difiere sensiblemente en cada
motor de base de datos y depende de muchos factores.
Existe una ampliacin de SQL conocida como FSQL (Fuzzy SQL, SQL difuso) que
permite el acceso a bases de datos difusas, usando la lgica difusa. Este lenguaje
ha sido implementado a nivel experimental y est evolucionando rpidamente
FUNCIONES DE SQL:
Propiedad SELECT: hace la seleccin en una tabla de la BD.
SELECT *FROM datos
Esta sentencia seleccionara todos, absolutamente todos los registros dentro de la
tabla datos.
SELECT * FROM datos WHERE usuario= 'juan'
Seleccionaramos todos los registros dentro de la tabla datos que tengan como
usuarios a juan.
VENTAJAS DE SQL
reas de aplicacin de la IA
Pero tambin hay reas de aplicacin. En efecto, estos procesos de la AI se
aplican en los sistemas reales en una gran variedad de ramas y problemas:
Gestin y control: anlisis inteligente, fijacin de objetivos.
Fabricacin: diseo, planificacin, programacin, monitorizacin, control, gestin
de proyectos, robtica simplificada y visin computarizada.
Educacin: adiestramiento prctico, exmenes y diagnstico.
Ingeniera: diseo, control y anlisis.
Equipamiento: diseo, diagnstico, adiestramiento, mantenimiento, configuracin,
monitorizacin y ventas.
Cartografa: interpretacin de fotografas, diseo, resolucin de problemas
cartogrficos.
Profesiones: abogaca, medicina, contabilidad, geologa, qumica.
Software: enseanza, especificacin, diseo, verificacin, mantenimiento.
Sistemas de armamento: guerra electrnica, identificacin de objetivos, control
adaptativo, proceso de imgenes, proceso de seales.
Proceso de datos: educacin, interface en lenguaje natural, acceso inteligente a
datos y gestores de bases de datos, anlisis inteligente de datos.
Finanzas: planificacin, anlisis, consultora.
9. Explique cul es la importancia de la integracin de las bases de datos a los
Nuevos modelos de inteligencia de negocio.
La Inteligencia de Negocios es el trmino y procura caracterizar una amplia
variedad de tecnologas, plataformas de software, especificaciones de
aplicaciones y procesos. El objetivo primario de la a Inteligencia de Negocios es
contribuir a tomar decisiones que mejoren el desempeo de la empresa y
promover su ventaja competitiva en el mercado. En resumen, la Inteligencia de
informacin que ms crece en todo el mundo. Los analistas creen que el mercado
potencial total est valorado en 100.000 millones de dlares
Empresas como General Electric,IBM, Oracle, Microsoft, SAP y Symantechan
invertido mucho en centros de procesamiento de datos diseados para interpretar
big data. Estas empresas estn dispuestas a pagar una prima para contratar a los
profesionales ms brillantes. Oracle, Microsoft, IBM y SAP han gastado
conjuntamente ms de 15.000 millones de dlares en adquisiciones de empresas
tecnolgicas especializadas en herramientas de inteligencia de negocio. Hay
puestos para programadores, estadsticos, analistas cuantitativos, econometristas
y analistas de extraccin de datos. El mercado de los grandes conjuntos de datos
tiene su propia cadena de suministro y permite beneficiarse a las empresas, tanto
si estn especializadas en hardware o infraestructuras como en software o
servicios.
La capacidad tecnolgica con que cuentan estas compaas es impresionante y ya
son capaces de generar resultados beneficiosos para las empresas clientes que
contratan sus servicios. Los datos de los sensores colocados en los motores
aeronuticos podran estudiarse, por ejemplo, para mejorar el consumo de
combustible de un avin de pasajeros. El anlisis de datos tambin puede ser
ventajoso para el sector del petrleo y el gas, ya que puede contribuir a encontrar
formas de prolongar la vida til de los campos petrolferos y gasistas y la
recuperacin de los recursos naturales. Cara al futuro, estas grandes empresas
tecnolgicas estn en una buena posicin para desarrollar lucrativos negocios de
consultora basados en su capacidad para analizar grandes conjuntos de datos.
11. Qu implica no tener una base de datos o sistemas de informacin para
una empresa (reflexin)?.
Al paso de aos la humanidad ha encontrado la manera de almacenar
informacin, ya sea por considerarla como una simple actividad o por tener en
cuenta la importancia que tiene. Por todas las partes del mundo podemos
encontrar informacin que pasa de generacin en generacin hasta que se pierde,
pero no toda la informacin se considera como un simple recuerdo, podemos
encontrar informacin de nuestros pasados que nos dice como eran aquellos
tiempos o hasta informacin de gran impacto para todo aquel que viva en este
planeta. Sin duda alguna la informacin nos a hecho crecer como personas a toda
la humanidad entera, gracias a ella sabemos de donde venimos y como hemos
estado evolucionando siempre apoyndonos de informacin que nos dice lo que
podemos o no podemos hacer para lograr el xito que buscamos, de igual forma,
toda organizacin por mas pequea que sea, necesita saber su pasado y su
presente, la situacin actual en la que se encuentra y con que cuenta para afrontar
el futuro.
La informacin es un recurso vital para toda organizacin, y el buen manejo de
esta puede significar la diferencia entre el xito o el fracaso para todos los
proyectos que se emprendan dentro de un organismo que busca el crecimiento y
el xito.
Dentro de cualquier organizacin la informacin fluye da con da, y cada actividad
genera mas informacin que puede apoyar las distintas tareas que se llevan a
cabo para su buen funcionamiento. En todos los departamento de todas las
organizaciones se genera informacin, como lo son el los departamento de
recursos humano, finanzas, contabilidad, limpieza, produccin y todos los
departamentos mas que se imaginen. La informacin se genera debido a las
actividades que se llevan a cabo en cada departamento y el xito de estos mismos
depende de la visin que se tenga y en que se apoyen para lograr las metas
establecidas, sin duda alguna, el apoyo en la informacin que se genera dentro de
ese departamento es una base sumamente sustentable y creble para tomarse en
cuanta para posibles tareas.
Los datos histricos de una empresa pueden marcar el camino a seguir para las
tareas que se lleven a cabo dentro de la organizacin, estos datos no son sino
informacin almacenada y procesada para su interpretacin y para ser tomada en
cuenta como una gua a seguir de lo que se debe de hacer y lo que no se debe de
hacer segn experiencias de la misma empresa. Cualquier empresa que no
registe sus actividades, constantemente se ver en los mismo errores una y otra
vez hasta que se percate de cul es el error y lo documente para su utilizacin en
un futuro.
El manejo de la informacin es fundamental para cualquier empresa, con ello
puede lograr un alto nivel competitivo dentro del mercado y obtener mayores
niveles de capacidad de desarrollo. El manejo de informacin nos permite
identificar cules son nuestras fortalezas con las que contamos y cules son
nuestras debilidades y sectores vulnerables como organizacin. Teniendo en
cuenta que se sabe con certeza cuales son nuestras debilidades y fortalezas se
puede tener una planeacin ms alcanzable y factible, podemos identificar donde
se tiene que trabajar ms y que parte de nuestra empresa necesita mayor
atencin. Esto nos ayudara a tener un control ms amplio sobre el funcionamiento
de todas las actividades de la organizacin.
CONCLUSIONES
Con los avances tecnolgicos y los nuevos mecanismos que se usan, es preciso
decir que cada uno de estos es de vital importancia a la hora de relacionar y
organizacin informacin desde altos niveles hasta los ms bajos, dicho proceso
le proporciona a las empresas y a las personas mejorar sus estilos de anlisis a la
hora de tomar decisiones y generar estrategias dentro de un proceso requerido.
La organizacin de los datos se reconoce hoy da como un factor importante a la
hora de conocer todos los aspectos de planeacin y estudio de los entornos de
una empresa, con herramientas como la minera de datos que basa sus
principales funciones en la recopilacin de grandes cantidades de datos, donde de
alguna manera genera ventajas en las empresas o personas que recurran a dicha
herramienta, pues de esta se desprenden grandes actividades de mercadotecnia,
matemticas o financieras, estratgicas, entre otras que facilitan el manejo de la
informacin dentro de un proceso de reconocimiento como tal de lo requerido por
la persona o la entidad.
El objetivo final del adecuado uso de las herramientas antes conceptualizadas,
como la bodega de datos, el big data, y todos los sistemas de bases de datos, le
proporcionan a quien requiera de ellos optimizar costos y de algn mondo
maximizar sus utilidades; cabe tambin resaltar que en todo proceso de uso
frecuente se arriesgaran a perdidas, pero todo depende de la finalidad de la
herramienta a usar.
BIBLIOGRAFIA
Wikipedia.org
Documentos PDF de la web
msdn.microsoft.com