Sei sulla pagina 1di 11

REPBLICA BOLIVARIANA DE VENEZUELA MINISTERIO DEL PODER POPULAR PARA LA EDUCACION UNIVERSITARIA INSTITUTO UNIVERSITARIO DE TECNOLOGA DE MARACAIBO PROGRAMA

NACIONAL DE FORMACIN EN INFORMTICA SECCIN: 341 EGRESADOS

BASES DE DATOS DIFUSAS

AUTORES: FERNNDEZ, FERNANDO C.I.- 16.989.606 ORTEGA, RICHARD C.I.- 16.457.089 PRIMERA, ROXANA C.I.- 17.564.747 SALAZAR, NEDIA C.I.- 15.052.363

MARACAIBO, ENERO DE 2012

Con los avances en tecnologa existentes en la actualidad, en mayor medida, en el aspecto de las tecnologas de informacin, es casi imposible que una empresa no haga uso de la informacin para el desarrollo de sus actividades diarias; tan solo tener la informacin adecuada en el momento preciso, hace del uso de computadoras, como herramientas junto con sistemas capaces de ofrecernos la informacin en forma rpida, ordenada, y concreta, un elemento muy importante y til. La informacin forma parte fundamental de toda empresa para tener un alto nivel de competitividad y posibilidades de desarrollo, por ello se dice que "la informacin es poder. Quien tiene ms y mejor informacin tiene ms probabilidades de sobrevivir. En este sentido la informacin se visualiza como un recurso vital. Producido por los sistemas de informacin. Los registros o bases de datos son herramientas de trabajo capaces de proporcionar informacin sobre cualquier cosa que se requiera. Una base de datos (BD), en un contexto genrico, debe permitir dos operaciones bsicas. Una de ellas es almacenar datos, y la otra es consultar datos, para ello existen diversas herramientas de diseo y lenguajes para modelar, disear e implementar una 8D, segn sea su tipo. Las bases de datos son un conjunto de informacin relacionada, la cual se encuentra agrupada. Hoy en da las bases de datos juegan un papel muy importante en la vida cotidiana, ya que a travs de ellas se puede tener acceso a la informacin de manera muy rpida, esta informacin obtenida puede constituir un elemento fundamental en la toma de decisiones en las empresas. debido a que en las bases de datos se almacena informacin muy valiosa de las transacciones que realizan en las mismas. Las bases de datos ofrecen integridad en la informacin suministrada as como tambin permiten compartir esta informacin con otras personas al mismo tiempo. El diseo de una base de datos se basa en varias etapas una de ellas es la conceptual, la cual parte de la especicacin de requerimientos y su resultado es el esquema conceptual de la base de datos. Un esquema conceptual es una descripcin de alto nivel de la estructura de la base de datos, independientemente del software del SGBD que se use para manipularla. Un modelo conceptual es un lenguaje que se usa para describir esquemas conceptuales. El propsito del diseo conceptual es describir el contenido de informacin de la base de datos, ms que las estructuras de almacenamiento que se necesitaran para manejar esa informacin. Los conceptos de un modelo de datos se construyen por lo regular usando mecanismos de abstraccin y se describen mediante representaciones lingsticas y grficas; es decir, puede denirse una sintaxis y puede desarrollarse una notacin grfica como partes de un modelo de datos. Un modelo de datos conceptual es importante al

momento de especicar los requerimientos de los usuarios que necesitan desarrollar sistemas de informacin. Tambin es importante el tipo de datos que debe considerar dicho modelo, asimismo algunas restricciones que sean necesarias contemplar. Entidades: son objetos reales o abstractos sobre los cuales se almacenar informacin. Las entidades difusas, son aqullas en que cada instancia del tipo de entidad tiene un grado para medir la relacin de esa instancia con su tipo de entidad (su grado de pertenencia a ese tipo de entidad, o su grado de importancia dentro de ese tipo, su grado de certeza). 1. BASES DE DATOS DIFUSAS Una Base de Datos Difusa es una Base de Datos dotada de imprecisin o de incertidumbre. En el modelo de datos relacional difuso se da cabida a la presencia de imprecisin en los datos y de incertidumbre en las relaciones. Los aspectos ms importantes de la informacin que tratamos son: incertidumbre e imprecisin. En el sentido ms amplio, un sistema basado en reglas difusas es un sistema basado en reglas donde la lgica difusa es utilizada como una herramienta para representar diferentes formas de conocimiento acerca del problema a resolver, as como para modelar las interacciones y relaciones que existen entre sus variables. Debido a estas propiedades, los sistemas basados en reglas difusas han sido aplicados de forma exitosa en varios dominios en los que la informacin vaga o imprecisa emerge en diferentes formas. 2. CARACTERSTICAS Imprecisin. Incertidumbre

3. MANEJO DE LAS BASE DE DATOS DIFUSAS: Para el manejo de las bases de datos relacionales difusas (BDRD) se utiliza el lenguaje Fuzzy SQL (FSQL) que es un lenguaje que deriva de SQL, incorporando las siguientes novedades. Etiquetas Lingsticas: En las sentencias FSQL las etiquetas van precedidas del smbolo $, para poder distinguirlas fcilmente.

Comparadores Difusos: Permiten comparar dos atributos o un atributo con una constante. Conectivas Lgicas: Pueden usarse NOT, AND y OR, para enlazar condiciones difusas simples. Umbral de Cumplimiento (threshold) : Tras cada condicin simple puede imponerse un umbral de cumplimiento mnimo (por defecto es 1), con el siguiente formato: <condicin_simple> THOLD La palabra reservada THOLD es opcional y puede sustituirse por un comparador tradicional (=, <, <=...) modificando el sentido de la consulta. Por defecto es equivalente al comparador >=. Constantes Difusas: Pueden usarse en el SELECT todas las constantes difusas ya definidas: UNKNOWN, UNDEFINED y NULL, $[a,b,c,d] (Distrib. de posibilidad Trapezoidal), $label (Etiquetas), [n,m] (Intervalo) y #n (valores aproximados). Funcin CDEG(<atributo>): Usada en la lista de seleccin, la funcin CDEG calcula, para cada tupla, el grado de cumplimiento del atributo del argumento en la condicin de la clusula WHERE. Funcin CDEG(*): Calcula el grado de cumplimiento de cada tupla en la todos sus atributos y no slo para uno de ellos en condicin de forma global, para

particular La funcin CDEG usa, por defecto, los operadores tpicos para la negacin (1 x), conjuncin (t-norma del mnimo) y disyuncin (s-norma del mximo), pero pueden usarse otros (si se definen). Carcter Comodn %: Similar al carcter comodn * de SQL, pero este incluye adems la funcinCDEG aplicada a todos los atributos de la condicin. No incluye CDEG(*). 15 Condicin con IS: Tambin admite condiciones del tipo: <atributo_difuso> IS [NOT] {UNKNOWN | UNDEFINED | NULL} Cuantificadores Difusos: Tiene dos modalidades que se aplican como condicin en la clusula HAVING que sigue a una clusula GROUP BY: o Q elementos de X cumplen A: $Cuantificador FUZZY[r] (condicin_difusa) THOLD .

4. NIVELES O MODELOS DE BASES DE DATOS DIFUSAS 1. Modelo relacional bsico difuso. Este modelo consiste en aadir un grado en el intervalo [0,1]. El significado de este grado puede variar, pero es fundamental y determinante en los procesos de consulta

sobre este tipo de tablas. Formas de aadir ese grado difuso: Grado en cada tupla (considerndose las filas, es decir, las entradas) de la relacin: El grado difuso pertenece a toda la tupla de la relacin, por lo que se difumina es la relacin propiamente dicha. o No permite informacin imprecisa sobre un atributo en particular. Grado en cada valor de cierto atributo: Mide el grado de difuminado de ese valor concreto del atributo en la tupla a la que pertenezca. o Tampoco permiten informacin imprecisa distinta de un nico grado difuso. Por ejemplo, almacenar que cierta persona es Joven. Grado en un conjunto de valores: El grado afecta a varios atributos midiendo, por ejemplo, la incertidumbre que hay en ellos.

Ejemplo: La edad de una persona es un atributo que la caracteriza, entonces el concepto joven, puede ser representado por un conjunto difuso, de la forma: Joven = {0/15, 1/20, 1/25, 0/30}. Esto, quiere decir, que las personas de 15 30 aos no son jvenes, pero s lo son las personas de 20 25 aos. En tanto, que una persona de 26 aos lo es con grado 0.8. En este caso el conjunto difuso es representado por valores numricos. El modelo relacional no permiten el procesamiento de consultas del tipo: Encontrar a todos los gerentes cuyo sueldo no sea muy alto Dado que ni el clculo ni el lgebra relacional, que establecen el resultado de cualquier consulta como una nueva relacin, tienen la capacidad de permitir consultas de una manera difusa. Inconvenientes: No tiene suficiente capacidad para representar adecuadamente gran parte de los tipos difusos.

El manejo de este tipo de informacin se realiza de forma compleja: la tupla asume su carcter difuso de forma global, sin poder determinar cul es la aportacin difusa de cada atributo. Resulta incapaz de satisfacer los requisitos del modelo relacional relativos a la unicidad, a la accesibilidad de cada tupla y a la implementacin de algn operador relacional.

2. Modelo de unificacin mediante relaciones de similitud. Una relacin de similitud permite comparar etiquetas lingsticas definidas en

dominios con referencial no ordenado. Esta relacin indica, que para cada dominio, es necesario definir una funcin de similitud que permita medir la similitud o parecido entre dos valores del dominio. Los tipos de dominio soportados son: Conjunto finito de escalares. Ejemplo: DE = {azul, marrn, negro, verde} Conjunto finito de nmeros. Ejemplo: DN = {20, 21, 22} Conjunto de nmeros difusos. Ejemplo: DD = {muy claro, claro, oscuro, muy oscuro} 2.1. Relacin de similitud. Existe una relacin, sobre cada uno de los dominios para poder representar y manejar la imprecisin. Establece en qu medida se parecen entre si los diferentes valores del dominio sobre el que est definida. Los valores de similitud estn comprendidos entre 0 y 1, donde 0 = totalmente diferentes y 1 = extremadamente parecidos o iguales. Ejemplo:

Supongamos que tenemos el atributo color de pelo, donde el dominio se encuentra definido por cuatro etiquetas lingsticas: Rubio, Moreno, Pelirrojo y Castao. Es este caso el conjunto difuso definido por esas etiquetas, no se encuentra definido en un referencial ordenado, lo que hace necesario la implementacin de una funcin de similitud, que por comodidad, normalmente se presenta en un formato de matriz, tal como lo muestra la tabla: RUBIO RUBIO PELIRROJO CASTAO MORENO 1 0,6 0,4 0 PELIRROJO 0,6 1 0,5 0,1 CASTAO 0,4 0,5 1 0,8 MORENO 0 0,1 0,8 1

Adems la tabla dada es la siguiente: NOMBRE Javi Mara Pedro Ana EDAD 16 17 15 {15,16} ALTURA {muy alto, alto} Bajo Muy Bajo Media COLOR DE PELO Castao Moreno Rubio Pelirrojo

Y se tiene la consulta: Dame las personas y su altura con un color de pelo similar a castao en grado 0,6 Respuesta: Las entradas de similitud son: Entrada (Dcolor_pelo)= 0,6 Esta tabla contiene las clases de equivalencia creadas: NOMBRE {Javi, Mara} Pedro Ana EDAD {16,17} 15 {15,16} ALTURA COLOR DE PELO {Muy alto, alto, bajo} {Castao, Moreno} Muy Bajo Rubio Media Pelirrojo

Cuando se aplican los operadores relacionales, queda como resultado la siguiente tabla: Nombre {Javi, Mara} Altura {Muy alto, alto, bajo}

5. VENTAJAS DE BASES DE DATOS DIFUSAS:

La posibilidad de integrar en un nico sistema una gran diversidad de formatos (imgenes, texto, video, sonido, etc.). Almacenar imprecisin, la informacin que tengamos de un atributo (define una propiedad de un objeto, elemento o archivo) particular de un objeto aunque esta informacin no sea el valor exacto mediante el uso de etiquetas. La posibilidad de ser instalado y usado en un SGBD tradicional. Ofrecen mayor variedad a la hora de representar la informacin. Un gran, y creciente, mercado potencial que augura que se siga investigando activamente en el futuro.

DESVENTAJAS DE BASES DE DATOS DIFUSAS: Lenguaje de consulta incomodo debido al gran nmero de parmetros que deben utilizarse. Comparadores abstractos que hacen difcil la decisin de cul debemos usar. Falta de estandarizacin, derivado de la poca popularidad de este tipo de bases de datos. Lenguaje muy poco comn y apenas se est empezando a conocer.

6. REPRESENTACIN DE LA INFORMACIN Los elementos relacionados con la manipulacin de informacin en un modelo de datos difusos difuso pueden tener representaciones diferentes. Por ejemplo, una distribucin normalizada de probabilidades puede ser representada por diferentes tipos de funciones. Lo mismo puede decirse de la forma en la que se modelan los operadores relacionales difusos as como los dems elementos difusos que aparezcan en el sistema. El criterio empleado para seleccionar la forma de representacin de los mltiples elementos difusos del sistema manejador de base de datos, puede afectar de manera determinante la funcionalidad y desempeo de la base de datos, por lo que debera ser uno de los puntos centrales en los que el experto ajuste la arquitectura del FRDBMS al problema especfico a tratar mediante el mismo. Puede decirse entonces que este criterio de seleccin y ajuste constituye un paso entre la formulacin de una base de datos

relacional difusa y la implementacin de un sistema basado en la misma. La informacin que se puede manejar en una base de datos difusa puede dividirse en los siguientes tipos principales: Datos Imprecisos: Los modelos usualmente consideran dos tipos de

representacin para los datos imprecisos adems de la informacin desconocida o indeterminada que se maneja mediante los tipos unknown, undefined y null: Tipo de dato Indefinido (undefined): Cuando un atributo toma el valor undefined, esto refleja el hecho de que ningn valor de su dominio es permitido. Ejemplo: El nmero de telfono de alguien que no tiene telfono. Tipo de dato desconocido (unknown): Los datos de este tipo expresan nuestra ignorancia sobre el valor que el atributo toma, sin embargo, expresa tambin que puede tomar uno de los valores del dominio. Ejemplo: la fecha de nacimiento de alguien, la desconocemos pero tiene que tener alguna. Tipo de dato nulo (null): Cuando un atributo toma el valor nulo, esto significa que no tenemos informacin sobre l, ya sea porque no conocemos su valor o porque es imposible asignarle un valor del dominio. Ejemplo: el email de alguien es null si desconocemos su valor o si lo tiene o no. Datos imprecisos sobre dominios ordenados: Este grupo de datos contiene distribuciones de probabilidad definidas en dominios continuos o discretos, pero ordenados.

Datos con analogas sobre dominios discretos: Este grupo de datos se construye sobre dominios discretos en los que existen definidas relaciones de proximidad entre sus valores. En este caso se deber almacenar la representacin de los datos adems de la representacin de las relaciones de proximidad definidas para los valores en el dominio. Datos Precisos: Manejados usualmente mediante la representacin provista por la base de datos relacional husped. 7. APLICACIN DE LA BASE DE DATOS DIFUSA La lgica difusa ha demostrado ser una herramienta que permite hacer uso de la experiencia de especialistas en el desarrollo de sistemas de cmputo que emulen la habilidad de estos en la toma de decisiones, como se puede apreciar en el desarrollo de software de diagnstico mdico, el cual tambin puede convertirse en una herramienta para el aprendizaje y evaluacin a los estudiantes de medicina, entre ellas, el diagnstico de enfermedades pulmonares, en la que se consideraron catorce sntomas que son comunes en cinco enfermedades diferentes, dependiendo el diagnstico del grado de incidencia con que cada sntoma se presente. Para cada sntoma (variable lingstica) se establecieron tres valores lingsticos bajo, medio y alto) y de acuerdo a la informacin de un experto (mdico especialista) se generaron las tablas que conforman la base de datos que sern consultadas para obtener, mediante el empleo del lgebra difusa, varios diagnsticos con grados de pertenencia entre 0 y 1, siendo el diagnstico con grado de pertenencia ms cercano a 1 el ms acertado. En la arquitectura de base de datos relacionales empleada, los sntomas constituyen los atributos o elementos asociados a cada registro, o diagnstico, que agrupados conforman el archivo de determinado tipo de enfermedades. El usuario (estudiante) selecciona el tipo de enfermedad en que desea presentar

una evaluacin. Inmediatamente se abre una ventana en la cual se le ofrece dos alternativas. En la primera de ellas el software presenta una serie de sntomas con la incidencia con que se presentan cada uno de ellos; en la otra alternativa el estudiante puede introducir los sntomas y sus incidencias mediante una consulta a un paciente, el cual puede ser el mismo docente.

Potrebbero piacerti anche