LA EDUCACIN UNIVERSITARIA INSTITUTO UNIVERSITARIO POLITCNICO SANTIAGO MARIO EXTENSIN CARACAS CTEDRA: PLANIFICACIN DE SISTEMAS
MODELOS EN EL ANLISIS ESTRUCTURADO
Autor: Veramendi, Patricia C.I: 19.671.769
Caracas, Julio de 2.014
2
NDICE Pg. INTRODUCCIN ............................................................................................ 3 MODELOS EN EL ANLISIS ESTRUCTURADO ........................................... 4 MODELOS DE DATOS ................................................................................... 4 MODELO DE PROCESOS ............................................................................. 8 Usos para los modelos de procesos ............................................................... 9 Estructura Conceptual .................................................................................. 10 Perspectivas en la representacin de procesos............................................ 11 Paradigmas del modelado de procesos ........................................................ 12 Formalidad del modelado de procesos ......................................................... 13 DIAGRAMA DE FLUJO DE DATOS ............................................................. 14 Componentes de un DFD ............................................................................. 14 Cmo construir un DFD? ............................................................................ 16 Niveles de un DFD ........................................................................................ 17 TABLA DE DECISIN .................................................................................. 17 Partes de la Tabla de Decisin ..................................................................... 18 Utilidad .......................................................................................................... 18 Cmo se construye la Tabla de Decisin? ................................................. 19 Tipos de Tabla de Decisin .......................................................................... 20 RBOLES DE DECISIN ............................................................................. 21 Ventajas ........................................................................................................ 23 Desventajas .................................................................................................. 23 Tipos de rboles de Decisin ....................................................................... 24 ANEXOS ....................................................................................................... 27 CONCLUSIN .............................................................................................. 34 REFERENCIAS BIBLIOGRFICAS .............................................................. 35
3
INTRODUCCIN
Los modelos en el anlisis de datos permiten definir la apariencia y el diseo del producto final, adems de permitir representar y evaluar conceptos esenciales de un sistema y de presentar la realidad compleja en trminos muy simples. Algunos de los modelos en el anlisis de datos, pueden ser los modelos de datos que permiten describir los elementos de la realidad que intervienen en un problema dado y la forma en que se relacionan esos elementos entre s. Y los modelos de procesos que son aquellos que estn enfocados hacia el anlisis del flujo y transformacin de datos y son usados para facilitar el entendimiento y comunicacin entre los humanos, de soporte para la mejora de los procesos, requiere de un proceso definido, de herramientas automatizadas y de bases computacionales para comparar, manipular y controlar el comportamiento automatizado.
Por otra parte, estn los diagramas flujos de datos (DFD) que es una tcnica grfica usada para representar el flujo de la informacin y las transformaciones que se aplican a los datos al moverse desde la entrada hasta la salida. Los DFD estn compuestos por procesos, flujos, almacenes y terminadores. Luego se tienen las tablas y los rboles de decisin que son implementados para formular de una manera ms eficiente las decisiones que se deben tomar dependiendo de la problemtica que se presenta. Sin embargo, existen diferencias entre stos dos, en las tablas de decisiones se representa mediante una tabla, que contiene las condiciones, acciones, la ejecucin y las reglas, stas pueden ser segn su condicin en: binarias, mixtas, etc., y segn como se encadenen en: abiertas o cerradas. En cambio los rboles de decisin se representan por un nodo de decisin, de probabilidad y las ramas, ofrecen ventajas y desventajas al momento de su implementacin.
4
MODELOS EN EL ANLISIS ESTRUCTURADO
El anlisis estructurado, como otros mtodos, permite construir modelos de sistemas a partir del anlisis de sus procesos y/o actividades que se ejecutan asociados al sistema. Permite al equipo encargado del estudio del desarrollo o la organizacin conocer de forma lgica un sistema o proceso.
El objetivo que persigue el anlisis estructurado es organizar las tareas asociadas con la determinacin de requerimientos para obtener la comprensin completa y exacta de una situacin dada.
El modelo de anlisis debe lograr los objetivos primarios: Describir las necesidades del cliente. Establecer una base para la creacin de un diseo de software, es decir, establecer las especificaciones internas. Definir un conjunto de requisitos que se puedan validar una vez que se ha construido el software. Obtener la aprobacin del cliente.
MODELOS DE DATOS
Aportan la base de datos conceptual para disear aplicaciones que hacen usos intensivos de datos, as como la base formal para las herramientas y tcnicas empleadas en el desarrollo y uso de sistemas de informacin. Con respecto al diseo de base de datos, el modelado de datos puede ser descrito de la siguiente manera segn Brodie (1984), como:
Dados los requerimientos de informacin y proceso de una aplicacin de uso intensivo de datos, por ejemplo un sistema de informacin, construir una representacin de la aplicacin que capture las propiedades estticas y dinmicas requeridas para dar soporte a los procesos deseados, por ejemplo 5
transacciones y consultas. Adems de capturar las necesidades dadas en el momento de etapa de diseo, la representacin debe ser capaz de dar cabida a eventuales futuros requerimientos.
En palabras ms concretas, se entiende por modelo de datos a la coleccin de conceptos definidos matemticamente que ayudan a expresar las propiedades estticas y dinmicas de una aplicacin con un uso intensivo de datos. Y conceptualmente, es una aplicacin que se caracteriza por:
- Propiedades estticas, que se refiere a las entidades (objetos), atributos de dichas entidades y las relaciones que existen entre esas entidades. - Propiedades dinmicas, que seran las operaciones que se realizan sobre las entidades, atributos o en las relaciones entre los atributos. - Reglas de integridad sobre las entidades y los atributos (por ejemplo, transacciones).
Otro enfoque es pensar que un modelo de datos permite describir los elementos de la realidad que intervienen en un problema dado y la forma en que se relacionan esos elementos entre s. El modelado de datos es una representacin que tiene dos componentes: las propiedades estticas se definen en un esquema y las propiedades dinmicas se definen como especificaciones de transacciones, consultas e informes. Un esquema consiste en una definicin de todos los tipos de objetos de la aplicacin, incluyendo sus atributos, relaciones y restricciones estticas. Correspondientemente, existir un repositorio de informacin, la base de datos, que es una instancia del esquema. Un determinado tipo de procesos slo necesita acceder a un subconjunto predeterminado de entidades definidas en un esquema, por lo que este tipo de procesos puede requerir slo un subconjunto de las propiedades estticas del esquema general. A este subconjunto de propiedades estticas se le denomina sub-esquema. 6
Una transaccin consiste en diversas operaciones o acciones sobre las entidades de esquema o sub-esquema. Una consulta se puede expresar como una expresin lgica sobre los objetos y relaciones definidos en el esquema; una consulta identifica un subconjunto de la base de datos. Las herramientas que se usan para realizar las operaciones de definicin de las propiedades estticas y dinmicas de la base de datos son los lenguajes de definicin (DDL) y manipulacin de datos (DML), junto con los lenguajes de consulta (QL).
Los modelos de datos se han centrado en los aspectos lgicos de las bases de datos y sobre los conceptos, herramientas y tcnicas para el diseo de las mismas. Aspectos relativos a la implementacin de los modelos, tales como velocidad de ejecucin, concurrencia, integridad fsica y arquitecturas no son factores relevantes en el estadio de anlisis de modelos de datos. La investigacin ms temprana sobre modelos de datos s estaba ms centrada en los aspectos de representacin fsica. Es por ello que se distinguen cuatro generaciones (aunque se implementan los modelos de datos clsicos):
- Modelos de datos primitivos (orientados al fichero). - Modelos de datos clsicos. - Modelos de datos semnticos (modelo entidad-relacin). - Modelos de datos de propsito especfico (orientados a la aplicacin).
En cuanto a los modelos de datos primitivos estaban absolutamente orientados al fichero: las entidades se representan en registros (divididos en campos, que representan sus propiedades), que se agrupan en ficheros. Las relaciones entre entidades son nicamente aquellas que pueden ser representadas usando directorios, por ejemplo ndices y listas invertidas. Un ejemplo de DBMS comercial de fichero, concretamente del tipo "lista invertida", es el CA-DATACOMB de Computer Associates International. 7
Por otra parte, estn los modelos de datos clsicos son tres: 1. Modelo Jerrquico Es similar al modelo de red en cuanto a las relaciones y datos, ya que estos se representan por medio de registros y sus ligas. La diferencia radica en que estn organizados por conjuntos de rboles en lugar de grficas arbitrarias.
Este tipo de diagrama est formado por dos componentes bsicos: - Rectngulos: que representan a los de registros. - Lneas: que representan a los enlaces o ligas entre los registros.
Un diagrama de rbol tiene el propsito de especificar la estructura global de la base de datos.
2. Modelo de Red Este modelo se basa en representaciones entre registros por medio de ligas, existen relaciones en las que participan solo dos entidades (binarias) y relaciones en las que participan ms de dos entidades (generales) ya sea con o sin atributo descriptivo en la relacin.
La forma de diagramado consta de dos componentes bsicos: - Celdas: representan a los campos del registro. - Lneas: representan a los enlaces entre los registros.
Un diagrama de estructura de datos de red, especifica la estructura lgica global de la base de datos; su representacin grfica se basa en el acomodo de los campos de un registro en un conjunto de celdas que se ligan con otro(s) registro(s).
8
3. Modelo Relacional En este modelo se representan los datos y las relaciones entre estos, a travs de una coleccin de tablas, en las cuales los renglones (tuplas) equivalen a los cada uno de los registros que contendr la base de datos y las columnas corresponden a las caractersticas (atributos) de cada registro localizado en la tupla.
MODELO DE PROCESOS
Tradicionalmente el modelado de procesos ha estado enfocado en el anlisis del flujo y transformacin de datos. La utilizacin de las computadoras en tecnologa de informacin no haba sido usada ms all del procesamiento de transacciones, como en la comunicacin y control. Para hacer una integracin satisfactoria de estos sistemas dentro de la empresa, se requiere de modelar desde los procesos organizacionales manuales en los que intervienen estos sistemas. Algunos ejemplos de esto, son:
- La reingeniera de procesos de negocios, la cual se encarga del rediseo de los procesos de negocios de las organizaciones con el fin de hacerlos ms eficientes. - Tecnologa de coordinacin, que ayuda en el manejo de las dependencias entre los agentes de un proceso de negocios, y provee soporte automatizado para los componentes ms rutinarios del proceso. - Ambientes de desarrollo de software dirigidos por el proceso, que es un sistema automatizado que integra el trabajo de toda la administracin y personal relacionado con el software.
El modelado de procesos se distingue de otros tipos de modelado en las reas de la computacin, porque los fenmenos modelados son realizados 9
ms por humanos que por mquinas. Tambin porque se centra en las interacciones entre los agentes, independientemente de si una computadora est envuelta en las transacciones.
Usos para los modelos de procesos Frecuentemente la gran cantidad de descripciones del ciclo de vida del software que almacenan las organizaciones, no corresponde con el proceso actualmente llevado a cabo en el desarrollo o mantenimiento del software. Esta falta de fidelidad es causada por factores como:
- Prescripciones del proceso de alto nivel que no estn relacionadas con las actividades actuales del proyecto. - Descripciones no utilizadas, imprecisas, ambiguas, incomprensibles, del proceso a ser representado en el proyecto, y - Fallas en la actualizacin de la documentacin cuando ocurren cambios en el proceso.
Tradicionalmente las descripciones del ciclo de vida son vistas como modelos del proceso, pero estas normalmente se centran en una abstraccin de la ingeniera del producto, y fallan al mostrar muchos bloques de construccin de los procesos elementales necesarios para manejar y coordinar el proyecto.
Existen cinco usos bsicos de los modelos de procesos, los cuales son: 1. Facilitar el entendimiento y comunicacin humanos, requiere que un grupo pueda compartir representaciones de formatos comunes. 2. El soporte para la mejora de procesos requiere una base para definir y analizar los procesos. 10
3. El soporte para la administracin de procesos requiere un proceso definido, contra el cual el comportamiento del proyecto pueda ser comparado. 4. La conduccin automtica del proceso requiere herramientas automatizadas para manipular descripciones de procesos. 5. El soporte para ejecucin automtica requiere bases computacionales para controlar el comportamiento de un ambiente automatizado.
Estructura Conceptual - Proceso es una secuencia de pasos o actividades ordenadas necesarias para el logro de un objetivo. - Elemento del proceso es cualquier componente del proceso. - Paso o actividad es una accin atmica de un proceso, que no tiene una estructura externamente visible. - Agente es un actor que desempea algn elemento del proceso. - Rol es un conjunto coherente de elementos del proceso que son asignados a un agente como una unidad de responsabilidad funcional. - Artefacto es un producto creado o modificado por la ejecucin de un elemento del proceso. - Script del proceso, es un modelo del proceso que ser desempeado por un humano. - Programa del proceso, es un modelo del proceso que ser ejecutado por una mquina.
11
Perspectivas en la representacin de procesos Cuatro de las ms comunes perspectivas representadas son las siguientes:
1. Funcional: Representa qu elementos del proceso estn siendo ejecutados y que entidades de informacin son relevantes a estos elementos del proceso.
2. De conducta: Representa cundo los elementos del proceso son ejecutados, as como aspectos de cmo son ejecutados a travs ciclos, iteraciones, toma de decisiones complejas, criterios de entrada y salida, etc.
3. Organizacional: Representa dnde y por quin en la organizacin, se ejecutarn los elementos del proceso, los mecanismos fsicos de comunicacin usados en las transferencias de entidades, y el medio y localizacin fsico, usado para el almacenamiento de entidades.
4. De Informacin: Representa las entidades de informacin producidas o manipuladas por un proceso. Esta representacin incluye la estructura de las entidades de informacin y sus relaciones entre ellas.
Estas representaciones presentan distintas ventajas desde el punto en que cada una puede ver y observar el proceso. Se puede asumir que combinando estas perspectivas se producir un modelo integrado, consistente y completo del proceso analizado.
12
Paradigmas del modelado de procesos Los lenguajes y representaciones para modelado de procesos pueden ser evaluadas en la medida de que tantas construcciones tiles proveen para representar y razonar acerca de varios aspectos de un proceso.
Osterweil present el siguiente problema: para encontrar las caractersticas de un lenguaje, se necesita escribir programas de procesos y para escribir programas de procesos, se necesitan caractersticas adecuadas de algn lenguaje. Para representar los procesos existen cinco aproximaciones las cuales son:
1. Modelos de programacin: Esta aproximacin parte de la observacin de que la especificacin de un proceso es una forma de programacin, por lo tanto un proceso puede ser modelado con todas las tcnicas y herramientas de los programadores.
2. Modelos funcionales: Un proceso es representado como una coleccin de elementos con atributos de entrada y de salida. Especficamente, un proceso se define como un conjunto de funciones matemticas que representan relaciones entre entradas y salidas. Adems, cada una de estas funciones puede ser descompuesta jerrquicamente en sub-elementos del proceso donde los atributos de entrada y salida de un elemento padre deben ser satisfechos por los atributos de sus hijos.
3. Modelos basados en plan: Este paradigma provee mecanismos donde los operadores representan posibles acciones que son seleccionadas con base en sus precondiciones. Estos operadores son aplicados al estado actual del domino en el que el proceso opera, con el fin de acercar ms ese estado al objetivo deseado. 13
4. Modelos redes de Petri: Esta tcnica modela la estructura de interaccin de roles de un proyecto usando un lenguaje y una representacin basados en redes de Petri. Las redes de interaccin de roles ayudan a la representacin y ejecucin de tareas estructuradas, que son aquellas que pueden ser planeadas por dependencias conocidas.
5. Modelos cuantitativos: Son sistemas dinmicos y es una de las pocas tcnicas de modelado que involucra representaciones cuantitativas, aplica retroalimentacin y tcnicas de sistemas de control a fenmenos sociales e industriales. Los modelos construidos de esta manera intentan definir un conjunto de relaciones cuantitativas entre variables de inters que simulan el comportamiento observado del sistema social.
Formalidad del modelado de procesos El nivel de matemtica formal requerida en un lenguaje de modelado de procesos, puede depender del propsito para el cual sirve el modelo del proceso y el agente responsable de la ejecucin del proceso especificado. Un lenguaje formal es ms fcil de manejar para una mquina que para un humano. Desafortunadamente, el inters en el entendimiento y la comunicacin humana, ha recibido menos atencin que las mquinas, y las definiciones y modelos de procesos no pueden ser de utilidad si no son entendibles. La formalidad en los modelos de procesos involucra ciertos criterios que deben ser aplicados para que sean de utilidad y entendibles, por lo tanto deben tener lo siguiente:
Granularidad y precisin: envuelve el tamao de los elementos del proceso representados en el modelo. La necesidad de una mayor granularidad, es conducida por la necesidad de asegurar la precisin en el proceso. 14
Adaptabilidad y Scriptiveness: Los modeladores de procesos difieren en como las prescripciones que ellos pretenden que sus modelos sean del actual comportamiento a ser desempeado. Un modelo prescriptivo implica que el proceso se debe llevar a cabo de una manera particular. El modelado descriptivo intenta determinar el proceso actualmente utilizado en una organizacin para realizar el trabajo, es decir un proceso de la organizacin que sirva de lnea base. Una tercera perspectiva es ofrecida por los modelos prescriptivos, que delinean los comportamientos no permitidos.
DIAGRAMA DE FLUJO DE DATOS
Los diagramas de flujos de datos tambin son llamados Carta de Burbujas, DFD, Diagramas de burbujas, diagrama de flujo de trabajo o modelo de funcin en la literatura computacional.
A medida que la informacin se mueve a travs del software, es modificada por una serie de transformaciones. El DFD es una tcnica grfica que representa el flujo de la informacin y las transformaciones que se aplican a los datos al moverse desde la entrada hasta la salida.
Componentes de un DFD 1. El proceso: Tambin denominado burbuja, funcin o transformacin. Puede decirse que el proceso muestra una parte del sistema que transforma entradas en salidas; es decir, muestra cmo es que una o ms entradas se transforman en salidas. El proceso se representa grficamente con un valo o un rectngulo con esquinas redondeadas. Estas diferencias son slo de forma, y se deben optar por alguna de ellas y utilizarla en forma consistente.
15
Cabe destacar, que el proceso se nombra con una palabra o frase, que intentan dar una primera aproximacin de lo que hacen, por ejemplo VALIDAR ENTRADA, CONTROL TEMPERATURA, etc.
2. El flujo: Se usa para describir el movimiento de bloques o paquetes de informacin de una parte del sistema a otra. Por ello, los flujos representan datos en movimiento, mientras que los almacenes representan datos en reposo. Adems, el flujo se representa grficamente por medio de una flecha que entra o sale de un proceso. Se utiliza esta presentacin en casi todos los formalismos propuestos.
En la mayora de los sistemas que se modelan, los flujos realmente representarn datos, es decir, bits, caracteres, mensajes, nmeros de punto flotante y los diversos otros tipos de informacin con los que se suele tratar en sistemas computarizados. Esto no significa que los DFD no sean una herramienta til en el modelado de procesos no automatizados computacionalmente, como por ejemplo una lnea de ensamblado. Es til en el modelamiento de procesos productivos.
Los flujos de datos tienen un nombre el que representa el significado del paquete de informacin que se mueve a lo largo del flujo. Adicionalmente, stos pueden converger o divergir en un DFD.
3. El almacn: El almacn se utiliza para modelar un conjunto de paquetes de datos en reposo. Se denota por dos lneas paralelas u otras alternativas grficas. De modo caracterstico, el nombre que se usa para un almacn es el plural del que se usa para los paquetes que entran y salen del almacn por medio de flujos. 16
A menudo, los almacenes de datos se implementan como archivos o bases de datos. Tambin pueden ser implementados en sistemas manuales como archivadores, carpetas, etc.
4. El Terminador: Grficamente se representa con un rectngulo. Los terminadores representan entidades externas con las cuales el sistema se comunica. Comnmente un terminador es una persona o un grupo, por ejemplo una organizacin externa o una agencia gubernamental, o un grupo o departamento que est dentro de la misma compaa u organizacin, pero fuera del control del sistema que se est modelando. En algunos casos, el terminador puede ser otro sistema.
Suele ser muy fcil identificar los terminadores en el sistema que se est modelando. A veces el terminador es el usuario, que dice "pienso entregar los datos A, B y C al sistema y espero que ste me entregue los datos X, Y y Z". En otros casos, el usuario se considera parte del sistema y ayudar a identificar los terminadores relevantes.
Cmo construir un DFD? a. Escoger nombres con significado para los procesos, flujos, almacenes y terminadores. b. Enumerar los procesos. c. Redibujar el DFD tantas veces como sea necesario estticamente. d. Evitar los DFD excesivamente complejos. e. Asegurarse de que el DFD sea internamente consistente y que tambin lo sea con cualquier DFD relacionado con l (evitar procesos con slo entradas o salidas, as como flujos y procesos no etiquetados).
17
Niveles de un DFD Se organiza el DFD global en una serie de niveles de modo que cada uno proporcione sucesivamente ms detalles sobre una porcin del nivel anterior. Esto es anlogo a la organizacin de mapas en un atlas.
El DFD de primer nivel consta slo de una burbuja, que representa el sistema completo; los flujos de datos muestran las interfaces entre el sistema y los terminadores externos (junto con los almacenes externos que pudiera haber). Este DFD especial se conoce como Diagrama de Contexto.
El DFD que sigue del diagrama de Contexto se conoce como la Nivel 0, que representa la vista de ms alto nivel de las principales funciones del sistema, al igual que sus principales interfaces.
El nivel de detalle de un DFD va a depender de lo que se requiera aclarar y precisar con un enfoque determinado del Diagrama de Contexto, para explorar o definir de mejor manera los procesos que requieran de dicho nivel de detalle.
TABLA DE DECISIN
Una tabla de decisin es una herramienta que sirve para representar de manera ms fcil la lgica de un problema cuando est es ms o menos complicada. Para ello se trata de identificar en el problema las acciones que hay que ejecutar y las condiciones que se tienen que cumplir para ejecutar esas acciones. Las acciones normalmente se identifican a travs de los verbos, y las condiciones van a ser las condicionales.
18
Partes de la Tabla de Decisin 1. Conjunto de condiciones: Son las condiciones que intervienen en el problema. Entrada de condiciones: - Son las combinaciones posibles entre los valores de las condiciones. SI, NO, DA IGUAL.
2. Conjunto de acciones: Abarca todas las acciones que se tienen que ejecutar cuando se cumplen un conjunto dado de condiciones.
3. Salida de ejecucin: Se determina cundo se ejecuta cada accin.
4. La regla de decisin: Es una combinacin de un estado en la entrada de condiciones y de una o ms acciones asociadas en la parte de la salida de acciones asociadas en la parte de la salida de acciones siendo N el nmero de condiciones y considerndolas como binarias (SI/NO) habr un nmero mximo de 2 elevado a N reglas.
Cada regla equivale desde el parte de vista de algoritmos a una estructura sientoncesfin si, y en cada momento solo se puede cumplir una regla. Las tablas de decisin las podemos usar para controlar la lgica de control de un algoritmo.
Utilidad Permite representar la descripcin de situaciones decisivas, es decir, se representan las distintas alternativas, estados de la naturaleza y las consecuencias. 19
Proporcionan una descripcin completa, correcta, clara y concisa de una situacin que se resuelve por una decisin tomada en un momento especfico del tiempo.
Cmo se construye la Tabla de Decisin? 1. Determinar las condiciones: - Factores relevantes que afectan la toma de decisiones, esto permite identificar las condiciones en la decisin. - Cada condicin tiene la posibilidad de cumplirse o no. 2. Determinar las acciones posibles 3. Determinar las alternativas para cada condicin. - Tablas limitadas: solo son posible 2 alternativas (si-no) o (verdadero falso). - Tablas extendidas: para cada condicin existe varias alternativas. 4. Calcular el mximo de columnas en la tabla de decisin: se calcula multiplicando el nmero de alternativas de cada condicin. 5. Armar una tabla de cuatro cuadrantes. CONDICIN REGLAS DE DECISIN Identificacin de condiciones Entradas de condiciones Identificacin de acciones Entradas de acciones
6. Determinar las reglas que tendr la tabla de decisin y completar las alternativas, existen dos formas: - Llenar la tabla considerando una condicin a la vez, cada condicin adicional se aade a la tabla sin considerar combinaciones y acciones duplicadas. - Comenzar con la primera condicin, dividir el nmero de columnas por el nmero de alternativas de cada condicin y as sucesivamente con las dems condiciones. 7. Completar la tabla completando con X todas las acciones que debe ejecutarse con cada regla. 20
8. Combinar aquellas reglas en las que aparecen alternativas de condiciones que no influye en el conjunto de acciones. 9. Verificar la tabla para eliminar situaciones imposibles, contradictorias o redundantes. 10. Si es necesario reordenar las condiciones y acciones para hacer la tabla ms clara.
Tipos de Tabla de Decisin 1. Segn el nmero de valores que puedan tomar sus condiciones, en: - Tablas de decisin binaria: cuando todas las condiciones son binarias, es decir la evaluacin de todas las condiciones est limitada a dos valores posibles. Tambin se denominan limitadas. Los valores en general sern SI (S), NO (N), aunque pueden tomar otros valores binarios, por ejemplo, BLANCO (B) o NEGRO(N). - Tablas de decisin mltiples: cuando todas sus condiciones pueden tomar ms de dos valores. Tambin se denominan Ampliadas o Extendidas. - Tablas de decisin mixtas: son aquellas en que intervienen condiciones binarias y mltiples. Se combinan la forma de los valores de las dos tablas anteriores, considerando los valores de las condiciones en forma de entrada extendida e identificando las acciones en forma de entrada limitada, o viceversa.
2. Segn se encadene o no con otras tablas, en: - Tablas abiertas: cuando sus acciones tienen referencia a otra tabla de decisin. - Tablas cerradas: son aquellas que una vez ejecutada la tabla llamada, devuelve el control a la tabla que lo llam.
21
RBOLES DE DECISIN
Los rboles de decisin son diagramas que pretenden mostrar la gama de posibles resultados y las decisiones posteriores realizadas despus de la decisin inicial.
Un rbol de decisin tiene unas entradas las cuales pueden ser un objeto o una situacin descrita por medio de un conjunto de atributos y a partir de esto devuelve una respuesta la cual en ltimas es una decisin que es tomada a partir de las entradas. Los valores que pueden tomar las entradas y las salidas pueden ser valores discretos o continuos. Se utilizan ms los valores discretos por simplicidad, cuando se utilizan valores discretos en las funciones de una aplicacin se denomina clasificacin y cuando se utilizan los continuos se denomina regresin.
Un rbol de decisin lleva a cabo una evaluacin a medida que este se recorre hacia las hojas para alcanzar as una decisin. El rbol de decisin suele contener nodos internos, nodos de probabilidad, nodos hojas y arcos. Un nodo interno contiene un test sobre algn valor de una de las propiedades. Un nodo de probabilidad indica que debe ocurrir un evento aleatorio de acuerdo a la naturaleza del problema, este tipo de nodos es redondo, los dems son cuadrados. Un nodo hoja representa el valor que devolver el rbol de decisin y finalmente las ramas brindan los posibles caminos que se tienen de acuerdo a la decisin tomada.
En el mbito de la inteligencia artificial, se puede decir que el rbol de Decisin viene dado por una base de datos, sobre la cual se construyen diagramas de construcciones lgicas, muy similares a los sistemas de prediccin basados en reglas, que sirven para representar y categorizar una 22
serie de condiciones que ocurren de forma sucesiva, para la resolucin de un problema.
En el diseo de aplicaciones informticas, un rbol de decisin indica las acciones a realizar en funcin del valor de una o varias variables. Es una representacin en forma de rbol cuyas ramas se bifurcan en funcin de los valores tomados por las variables y que terminan en una accin concreta. Se suele utilizar cuando el nmero de condiciones no es muy grande (en tal caso, es mejor utilizar una tabla de decisin).
De forma ms concreta, refirindonos al mbito empresarial, se puede decir que los rboles de decisin son diagramas de decisiones secuenciales muestran sus posibles resultados. stos ayudan a las empresas a determinar cules son sus opciones al mostrarles las distintas decisiones y sus resultados. La opcin que evita una prdida o produce un beneficio extra tiene un valor. La habilidad de crear una opcin, por lo tanto, tiene un valor que puede ser comprado o vendido.
Los rboles de decisin son relativamente fciles de entender cuando hay pocas decisiones y resultados incluidos en el rbol. Los rboles grandes, que incluyen docenas de nodos de decisin (puntos donde las decisiones son hechas nuevas) pueden ser complicados y tener un valor limitado. Cuantas ms decisiones haya en un rbol, es probable que sea menos preciso cualquier resultado esperado. Por ejemplo, si se hace un mapeo del rbol para la decisin de ir a la universidad, probablemente no se podrn predecir con precisin las posibilidades de generar ms de 100.000 dlares en diez aos, pero s se podra ser capaz de estimar con precisin el poder de ganancia despus de salir de la universidad.
23
Ventajas Uno de los aspectos ms tiles de los rboles de decisin es que te obligan a considerar tantos resultados posibles de una decisin como te puedas imaginar. Puede ser peligroso tomar las decisiones sbitas del momento sin tener en cuenta la gama de consecuencias. Un rbol de decisin puede ayudar a sopesar las posibles consecuencias de una decisin en contra de otro. En algunos casos, incluso puede ayudar a calcular pagos esperados de las decisiones. Por ejemplo, si se crean estimaciones en dlares de valor de todos los resultados y las probabilidades asociadas con cada resultado, se pueden utilizar estos nmeros para calcular que la decisin inicial dar lugar a la mayor rentabilidad financiera media. Los rboles de decisiones proporcionarn un marco para considerar la probabilidad y los pagos de las decisiones, lo que puede ayudar a analizar una decisin de tomar la ms informada posible.
- Plantean el problema para que todas las opciones sean analizadas. - Permiten analizar totalmente las posibles consecuencias de tomar una decisin. - Proveen un esquema para cuantificar el costo de un resultado y la probabilidad de que suceda. - Ayudan a realizar las mejores decisiones sobre la base de la informacin existente y de las mejores suposiciones.
Desventajas Un inconveniente de la utilizacin de rboles de decisin es que los resultados, las decisiones y los pagos posteriores se basarn fundamentalmente en las expectativas.
Cuando las decisiones se hacen reales, los beneficios y las decisiones resultantes podran no ser las mismas que las que has planeado. Podra ser 24
imposible planificar para todas las contingencias que pueden surgir como consecuencia de una decisin.
Esto puede conducir a un rbol de decisin no realista que podra orientarte hacia una mala decisin. Adems, los eventos inesperados pueden alterar las decisiones y cambiar los pagos en un rbol de decisin. Por ejemplo, si se espera que los padres de un joven paguen la mitad de colegio cuando ste decida ir a la escuela, pero ms tarde l mismo descubre que tendr que pagar por la totalidad de la matrcula, los pagos esperados sern dramticamente diferentes de la realidad.
- Los resultados, las decisiones y los pagos posteriores se basarn fundamentalmente en las expectativas. - Slo es recomendable para cuando el nmero de acciones es pequeo y no son posibles todas las combinaciones. - Las reglas de asignacin son bastante sencillas a pequeas perturbaciones en los datos. - Dificultad para elegir un rbol ptimo. - Ausencia de una funcin global de las variables y por lo tanto prdida de la representacin. - Los rboles de decisin requieren un gran nmero de datos de los que muchas veces no disponemos.
Tipos de rboles de Decisin 1. rbol de clasificacin: Se debe usar un rbol de clasificacin cuando existen diferentes partes de informacin que se haya calculado para determinar el resultado ms predecible. Con el rbol de decisin por clasificacin se debe usar un proceso binario de categoras y subcategoras para esquematizar las 25
diferentes variables que rodean a un resultado. Este tipo de rbol puede emplearse en probabilidad y estadstica.
2. rbol de regresin: Este tipo de rbol de decisin se usa cuando se tienen diferentes partes de informacin para determinar un nico resultado predeterminado. Durante el proceso de construir este rbol debes dividir las diferentes partes de informacin en secciones y luego subdividir en varios subgrupos. Este tipo de rbol es usado principalmente en clculos de bienes races.
3. rbol de mejora: Este tipo de rbol de decisin se usa cuando se quiere incrementar la precisin del proceso de toma de decisiones. Para esto se debe tomar una sola variable y luego calcularla y estructurarla de manera que la cantidad de errores se minimicen tanto como sea posible. Esto crea informacin ms precisa, debido a que habrs eliminado los errores tanto como se pueda. Este tipo de rbol se usa principalmente en contabilidad y matemticas.
4. Bosques de rboles de decisin: Estos se generan cuando se crean diferentes rboles de decisin y luego se agrupan entre s para hacer una determinacin precisa de lo que pasar con un resultado en particular. A menudo los bosques de rboles de decisin se usarn para evaluar el resultado global de un evento en particular con base a la direccin que estn tomando los diferentes rboles de decisin.
5. rbol de clasificacin y regresin: Este tipo de rbol de decisin es usado para predecir el resultado de un evento usando factores dependientes para hacer la asuncin ms lgica. Para lograrlo se pueden usar indicadores atrasados (lo que ha pasado) e 26
indicadores en tiempo real o categoras claras y especficas para examinar el resultado esperado. Esto se usa principalmente en ciencia.
6. Agrupamiento de las K medias: ste es considerado como el menos preciso de los rboles de decisin. Cuando se usa este rbol de decisin se deben combinar todos los factores diferentes que se han identificado previamente en los que se presume que todos los grupos son iguales. Esta asuncin puede ocasionar que algunos de los resultados esperados sean ampliamente diferentes. Este rbol se usa principalmente en el estudio de la gentica.
27
ANEXOS
Modelos de Datos: Modelo de Datos Jerrquico
Modelo de Datos Red
Modelo de Datos Relacional
28
Componentes de un DFD: Representaciones que se utilizan para los procesos, la de la izquierda corresponde a la que es usada por Gane y Sarson, y la de la derecha es utilizada por Ward y Mellor, as como por Yourdon y De Marco.
sta es la representacin dada por Gane y Sarson a un Flujo de Datos
Representaciones utilizadas para almacenes de datos, la de la izquierda corresponde a la utilizada por Gane y Sarson, y la de la derecha es utilizada por Ward y Mellor, as como por Yourdon y De Marco.
Terminador o "External", que en este caso representa al usuario del sistema. Se utiliza sta presentacin en casi todos los formalismos propuestos.
29
Ejemplo de un DFD con sus niveles Diagrama de Contexto
30
Diagrama nivel 0. Aqu se presenta la primera descomposicin funcional del sistema.
31
Diagrama Nivel 1. En este caso se presenta una descomposicin funcional del mdulo 1.
32
Diagrama nivel 2. En este caso se presenta una descomposicin funcional del mdulo 1.3
Tabla de Decisin
33
Ejemplos de rboles de Decisin
34
CONCLUSIN
Es importante implementar los modelos en el anlisis de datos, porque ayudan a representar mediante grficas una manera fcil y entendible de la realidad, ya sea para tomar decisiones complejas mediante los rboles y tablas de decisin, para un mejor anlisis de los pros y las contras de un determinado problema.
Por otra parte, cabe destacar que los diagramas de datos representan de manera simple ya que stos no pueden ser muy complejos, porque a travs de ellos se logra es comprender y entender el nivel de contexto y luego el detalle de los procesos que sean necesarios de explotar para su mejor precisin acerca de un determinado sistema automatizado que se desee implementar. Adems permiten funcionar para dos propsitos que son indicar cmo se transforman los datos a medida que se avanza en el sistema; y representar las funciones que transforman el flujo de datos.
Posteriormente, se puede decir que el Anlisis Estructurado de Datos se refiere al extremo inicial de un proyecto de desarrollo de sistemas, y que durante el tiempo en que los requisitos del usuario son definidos y documentados, se introduce el uso de las herramientas de documentacin grficas para producir un tipo diferente de especificacin funcional.
35
REFERENCIAS BIBLIOGRFICAS
lvarez, Vctor (s/f). Modelo de Datos Jerrquico, Red y Relacional. [Libro en Lnea]. Disponible en: http://148.204.211.134/polilibros/portal/Polilibros/P_proceso/Bases_de_datos _vers22_Victor_Alvarez/POLILIBRO/UNIDAD2/BASE%20DE%20DATOS- 76.htm
Annimo (2011). Modelos en Anlisis Estructurado. [Documento en Lnea]. Disponible en: http://sistemadeseguimentoacademico.blogspot.com/2011/12/25-modelo-de- analisis-estructurado.html
Castellanos, Luis (2007). rboles y Tablas de Decisiones. [Documento en Lnea] Disponible en: https://luiscastellanos.files.wordpress.com/2007/03/arboles-y-tablas- decisiones-luis-castellanos.pdf
Cuellar, Guillermo (s/f). Modelo de Procesos. [Documento en Lnea]. Disponible en: http://fccea.unicauca.edu.co/old/modelos.htm
Moreno O., Antonio (2000). Modelo de Datos [Documento en Lnea]. Disponible en: http://elies.rediris.es/elies9/4-2.htm