Sei sulla pagina 1di 9

Computadoras y gráficos 27 (2003) 61–69

Hacia la recuperación basada en contenido de dibujos técnicos


a través de indexación de alta dimensión

Manuel J. Fonseca *, Joaquim A. Jorge


Departamento de Sistemas de Información e Informática, INESC-ID / IST / Universidad Técnica de Lisboa, Rua Alves Redol,
9 Room 365, 1000-029 Lisboa, Portugal

Aceptado el 18 de octubre de 2002

Resumen

Este documento presenta un nuevo enfoque para clasificar, indexar y recuperar dibujos técnicos por contenido. Nuestro trabajo utiliza relaciones espaciales,
elementos visuales y mecanismos de indexación de alta dimensión para recuperar dibujos complejos de bases de datos CAD. Esto contrasta con los enfoques
convencionales que utilizan principalmente metadatos textuales para el mismo propósito.
Los diseñadores creativos y los dibujantes a menudo reutilizan datos de proyectos anteriores, publicaciones y bibliotecas de componentes listos para usar. Por lo
general, recuperar estos dibujos es un esfuerzo lento, complejo y propenso a errores, que requiere un examen visual exhaustivo, una memoria sólida o ambos.
Desafortunadamente, el uso generalizado de los sistemas CAD, al tiempo que facilita la creación y edición de dibujos, exacerba este problema, en la medida en que el
número de proyectos y dibujos crece enormemente, sin proporcionar mecanismos de recuperación adecuados para respaldar la recuperación de estos documentos.

En este artículo, describimos un enfoque que admite la indexación automática de bases de datos de dibujo técnico a través de técnicas de simplificación de dibujo
basadas en características geométricas y algoritmos eficientes para indexar grandes cantidades de datos. Describimos en detalle la estructura de indexación
(NB-Tree) que hemos desarrollado dentro del contexto de un enfoque más general. La evaluación experimental revela que nuestro enfoque supera a algunas de las
mejores estructuras de indexación publicadas, lo que nos permite buscar en bases de datos de dibujo muy grandes.

r 2002 Elsevier Science Ltd. Todos los derechos reservados.

Palabras clave: Recuperación basada en contenido; Correspondencia de gráficos; Indexación de alta dimensión

1. Introducción Ya logrado. Aunque la reutilización de dibujos ahorra tiempo, el proceso de


búsqueda suele ser lento y problemático.
Estudios recientes [1] refiera que el uso de bibliotecas con casos antiguos es
importante para ayudar a los diseñadores a identificar características relevantes Desafortunadamente, el uso generalizado de los sistemas CAD, al tiempo
para incluir o problemas para evitar. Además, en algunas empresas de diseño, que facilita la creación y edición de nuevos dibujos, exacerba este problema,
los diseñadores a menudo trabajan haciendo o copiando diagramas de sus porque el número de proyectos y dibujos crece enormemente, sin
colegas del equipo de diseño para un mayor desarrollo [2] . Además, en algunas proporcionar mecanismos de recuperación adecuados para soportar la
conversaciones informales con diseñadores, descubrimos que reutilizan dibujos recuperación de documentos. Los sistemas CAD actuales se basan en
antiguos durante la fase de creación de un nuevo proyecto, para obtener consultas convencionales de bases de datos y manipulación directa para
algunas ideas o soluciones. lograr esto.

Algunas de las soluciones [3,4] Para este problema, utilice bases de datos
textuales para organizar la información. Los dibujos se clasifican por palabras
* *Autor correspondiente. Tel .: + 351-21-3100300; Fax: + 35121-3145843.
clave e información adicional, como nombre del diseñador, estilo, fecha y una

Correos electrónicos: mjf@inesc-id.pt (MJ Fonseca), jorgej@acm.org descripción textual. Sin embargo, las soluciones basadas en consultas textuales
(JA Jorge). no son

0097-8493 / 03 / $ - ver tema principal r 2002 Elsevier Science Ltd. Todos los derechos reservados. PII: S 0 0 9 7 - 8 4 9 3
(0 2) 0 0 2 4 4 - 3
62 MJ Fonseca, JA Jorge / Computers & Graphics 27 (2003) 61–69

satisfactorio, porque obligan a los diseñadores a conocer en detalle la El sistema S3 [9] admite la gestión y recuperación de piezas CAD
metainformación utilizada para caracterizar los dibujos y requieren que los industriales, descritas mediante polígonos y atributos temáticos. Recupera
humanos la produzcan. En oposición a la organización textual, proponemos partes usando contornos bidimensionales dibujados usando un editor gráfico o
una clasificación visual basada en la forma y las relaciones espaciales, que partes de muestra almacenadas en una base de datos. Aunque este sistema
consideramos más adecuada para este problema, porque utiliza la memoria presenta buenos resultados en la recuperación de piezas CAD industriales, se
visual que poseen los diseñadores y explora su habilidad para dibujar como basa exclusivamente en contornos coincidentes, ignorando las relaciones
mecanismo de consulta. espaciales y la información de forma, lo que lo hace inadecuado para
recuperar dibujos complejos de formas múltiples.

Además, estudios recientes [5,1] muestran que los diseñadores usan un


pequeño conjunto de elementos gráficos comunes para describir los mismos En [10] , Park describe un enfoque para recuperar
dibujos, validando nuestro enfoque de usar bocetos para especificar consultas a partes mecánicas basadas en la forma dominante. Los objetos se describen
una base de datos de dibujos técnicos. descomponiendo recursivamente su forma en una forma dominante,
componentes auxiliares y sus relaciones espaciales. El pequeño conjunto de
El resto del documento está organizado de la siguiente manera: en la Sección primitivas geométricas y el algoritmo de coincidencia no tan eficiente hacen
2, ofrecemos una descripción general del trabajo relacionado en la recuperación que sea difícil de usar con grandes bases de datos de dibujos.
basada en bocetos. En la Sección 3, describimos la arquitectura del sistema y
todos sus componentes. La Sección 4 explica la idea básica de la estructura de En general, nuestro enfoque mejora en Berchtold [9]
indexación, el NBTree, y presenta una comparación de rendimiento con otras y parque [10] sistemas, ya que nuestro objetivo es recuperar dibujos CAD
estructuras de indexación. Concluimos el documento discutiendo los resultados y técnicos y privilegiar el uso de relaciones espaciales y formas dominantes. De
presentamos más instrucciones de trabajo para nuestro sistema y áreas hecho, nuestro método es más ambicioso en el sentido de que planeamos
relacionadas. hacer una simplificación automática, clasificación e indexación de dibujos
existentes, para hacer que el proceso de recuperación sea más efectivo y
preciso.

2. Trabajo relacionado

3. Arquitectura del sistema


Recientemente, ha habido un considerable interés en consultar bases de datos
multimedia por contenido. Sin embargo, la mayor parte de este trabajo se ha Nuestro enfoque resuelve estos problemas mediante el desarrollo de un
centrado en las bases de datos de imágenes encuestadas por Shi-Kuo Chang [6] . mecanismo para recuperar dibujos técnicos, en formato electrónico, a través
Además, en [7] , el autor analiza varios sistemas de recuperación de imágenes que de consultas bosquejadas a mano, aprovechando la capacidad natural del
utilizan el color y la textura como características principales para describir el diseñador para dibujar y dibujar. Figura 1 ilustra los componentes principales
contenido de la imagen. Por otro lado, los dibujos en formato electrónico (CAD) de nuestro enfoque, que describimos a continuación.
almacenan datos en forma estructurada (gráficos vectoriales) que requieren
diferentes enfoques de los métodos basados ​en imágenes (color, textura). Un poco
de trabajo inicial [3,4] 3.1. Clasificación

intentó indexar dibujos técnicos a través de bases de datos textuales. Sin La mayoría de los dibujos técnicos contienen descripciones detalladas de
embargo, esto no puede utilizar los ricos mecanismos de asociación visual y el los objetos, que no son necesarios para una búsqueda visual y, de hecho,
uso del diseñador de bocetos para recuperar información. aumentan el costo de la búsqueda. Incluimos en nuestro enfoque un proceso
para eliminar detalles visuales (es decir, características a pequeña escala)
Aunque los tres sistemas descritos a continuación abordan el problema mientras se conservan los elementos y formas perceptivamente dominantes
de la recuperación de dibujos basada en el contenido, siguen diferentes en un dibujo. Nuestro método divide el dibujo técnico en varios bloques
principios y diferentes algoritmos para lograr sus objetivos. dominantes, que luego también se dividirán en otros bloques, y extraerán las
relaciones espaciales entre ellos. Solo usamos dos relaciones espaciales, Inclusión
El primero, desarrollado por Mark Gross y Ellen Do, en el contexto de la
servilleta electrónica de cóctel. [5,2,8]
abordó un esquema de recuperación visual basado en diagramas, para y Proximidad. Estas relaciones son débilmente discriminatorias, sin
indexar bases de datos de dibujos arquitectónicos. Los usuarios dibujan embargo, son invariables con la rotación y la traslación.
bocetos de edificios, que se comparan con anotaciones (diagramas),
almacenados en una base de datos y producidos manualmente por los Luego combinamos información de forma con las relaciones espaciales en un gráfico
usuarios. Aunque este sistema funciona bien para pequeños conjuntos de topológico y almacénelo en una base de datos para su uso posterior en los gráficos
dibujos, la falta de indexación y clasificación automática hace que sea de candidatos coincidentes.
imposible de usar para grandes colecciones de dibujos. Figs. 2 y 3 ilustra los diferentes pasos del proceso de clasificación: dibujo
técnico, bloque y
MJ Fonseca, JA Jorge / Computers & Graphics 27 (2003) 61–69 63

Fig. 1. Arquitectura del sistema.

extracción de relaciones espaciales y creación de grafos topológicos, descriptor, que da lugar a colisiones. En [12] , los autores sostienen que esta
respectivamente. frecuencia de colisión es pequeña.
Dado que la coincidencia de gráficos es un problema de NP, intentamos Dado que necesitamos indexar la mayoría de los sub-gráficos de un gráfico
superar esto utilizando información espectral en el gráfico. Para cada gráfico dado para permitir la coincidencia de sub-gráficos, terminamos con una gran
calculamos un descriptor basado en su espectro [11,12] . Para admitir la base de datos que comprende decenas de miles o potencialmente cientos de
coincidencia de gráficos secundarios, también calculamos descriptores para miles de descriptores, incluso para indexar cientos a miles de dibujos técnicos.
los gráficos secundarios del gráfico principal. El cálculo del espectro del Por lo tanto, en el centro de nuestro enfoque, necesitamos tener una estructura
gráfico se basa en el cálculo de los valores propios de la matriz de de indexación eficiente para almacenar descriptores. Esto se detallará en la
adyacencia del gráfico. El descriptor resultante es un punto Sección 4.
multidimensional, cuya dimensión depende de la complejidad del gráfico.
Además, captura la topología local, es invariable para el reordenamiento de
sub-gráfico y es estable, ya que pequeños cambios en el gráfico producen 3.2. Consulta
pequeños cambios en el descriptor. Sin embargo, el descriptor resultante no
es único. Más de un gráfico puede tener el mismo Nuestro sistema incluye una interfaz caligráfica para admitir la definición
de consultas bosquejadas a mano, para complementar y superar las
limitaciones de los textos.

Fig. 2. Dibujo técnico (izquierda) y división de bloques para parte de la planta (derecha).
64 MJ Fonseca, JA Jorge / Computers & Graphics 27 (2003) 61–69

Espacios vectoriales nacionales. Estudios recientes [14] muestran que la mayoría de


las técnicas de indexación son menos eficientes que la búsqueda secuencial, si
consideramos dimensiones mayores que
10. Otras estructuras de indexación son evoluciones incrementales de las
existentes, donde, a veces, el aumento de la complejidad no se corresponde
con las mejoras correspondientes en el rendimiento. Finalmente, existen
otras técnicas de indexación que resultan de la combinación de varios
enfoques, lo que hace que sus algoritmos sean muy complejos y difíciles de
Fig. 3. Gráfico de topología. codificar.

Las técnicas de indexación desarrolladas hasta ahora se pueden


consultas El componente de consulta realiza los mismos pasos del proceso clasificar en tres categorías. Uno que agrega todas las estructuras
de clasificación, con un paso de reconocimiento adicional para identificar derivadas del árbol KD [15] , como el árbol KD VAM-Split [dieciséis] , el árbol
formas bosquejadas. [13] . Después de la identificación de todas las formas, LSD [17] , el LSD h-
el sistema extrae las relaciones espaciales, construye el gráfico topológico y Árbol [18] y más recientemente el árbol híbrido [19] . Fig. 4
calcula el descriptor correspondiente. Este descriptor multidimensional se ilustra la evolución de las estructuras de indexación derivadas del árbol KD.
utilizará como consulta para la estructura de indexación.
Una segunda clase de estructuras está compuesta por árboles derivados
del árbol R [20] , como el árbol R * [21] , el árbol SS [22] , el árbol SR [23] , el
árbol R de VAMSplit
3.3. Pareo [dieciséis] , el árbol X [24] y más recientemente el A-Tree [25] .
Fig. 5 presenta las diversas estructuras basadas en RTree.
Los resultados devueltos por la estructura de indexación son un conjunto de
descriptores similares (cerca del espacio) al descriptor de la consulta. Cada La tercera categoría de estructuras combina varias metodologías para
descriptor devuelto corresponde a un gráfico específico almacenado en la base de mejorar el rendimiento de la estructura final. En esta clase podemos
datos de topología, que se utilizará en el proceso de coincidencia para realizar una encontrar estructuras como el archivo VA [14] , la técnica piramidal [26] , una
comparación más profunda. estructura Voronoibased [27] y más recientemente el IQ-Tree [28] . La
principal diferencia entre las dos primeras categorías es la ruta que utilizan
Nuestro proceso de clasificación y consulta realiza un primer filtrado basado para dividir el espacio de datos. Estructuras en
principalmente en la topología. Este paso reduce drásticamente el número de
gráficos para comparar, seleccionando solo gráficos con una alta probabilidad de
ser isomórficos para el gráfico de consulta.

Como el número de gráficos para comparar se reduce de miles a


docenas, se puede utilizar un algoritmo simple de comparación de gráficos,
sin pérdida de eficiencia. Los gráficos isomórficos se corresponderán con
los dibujos candidatos almacenados en la base de datos.

Para admitir coincidencias aproximadas, nuestra estructura de indexación


debe proporcionar los medios para un esquema de vecinos K más rápido y
confiable, ya que la mayoría de los candidatos interesantes probablemente
arrojarán coincidencias aproximadas a la consulta. Sin embargo, la búsqueda del Fig. 4. Evolución y organización de KD-Tree.

vecino más cercano en espacios de datos de alta dimensión es un problema


difícil. A continuación, presentaremos un algoritmo para resolver esto.

4. Estructura de indexación

Para admitir el procesamiento en grandes cantidades de datos de alta


dimensión, se han propuesto una variedad de estructuras de indexación en los
últimos años. Algunos de ellos son estructuras para datos de baja dimensión
que se adaptaron a espacios de datos de alta dimensión. Sin embargo, tales
estructuras, que proporcionan buenos resultados en datos de baja dimensión,
no funcionan suficientemente bien en altas dimensiones.
Fig. 5. Evolución y organización de R-Tree.
MJ Fonseca, JA Jorge / Computers & Graphics 27 (2003) 61–69 sesenta y cinco

la primera categoría se clasifica como métodos de partición del espacio que


dividen el espacio de datos a lo largo de líneas predefinidas (hiperplanos)
independientemente de la distribución de datos. Las regiones resultantes son
mutuamente disjuntas, siendo su unión el espacio completo. Las estructuras de la
segunda clase se clasifican como estructuras de partición de datos, que dividen el
espacio de datos de acuerdo con la distribución de datos. En esta categoría, las
regiones pueden superponerse.

Las estructuras de datos cada vez más complejas y los enfoques


especializados para la indexación de alta dimensión hacen que sea difícil
determinar si puede haber un enfoque razonablemente rápido y general
para abordar muchos de estos problemas. Creemos que puede haber algún
mérito en dar un paso atrás y buscar enfoques más simples para indexar
estos datos. Motivados por estas ideas, desarrollamos el NB-Tree, una
técnica de indexación basada en un algoritmo simple pero eficiente para
buscar puntos en espacios de alta dimensión, utilizando la reducción de
dimensiones. Los puntos multidimensionales se asignan a una línea 1D
calculando su norma euclidiana. En un segundo paso, los clasificamos
Fig. 6. Reducción de dimensiones para puntos 2D.
utilizando un árbol B + en el que realizamos todas las operaciones
posteriores.

4.1. El algoritmo de árbol NB

El NB-Tree proporciona un medio simple y compacto para indexar


puntos de datos de alta dimensión. Utilizamos una estructura de datos 1D Fig. 7. Seudocódigo del algoritmo de inserción.
eficiente, el árbol B + para indexar los puntos ordenados por su norma
euclidiana ( norte orm +
4.1.2. buscando
B + - Árbol = NÓTESE BIEN- Árbol).
El proceso de búsqueda en el NB-Tree comenzó calculando la norma del
Para lograr fl exibilidad, utilizamos la reducción de dimensiones: los
punto de consulta. Luego realizamos una búsqueda en el árbol 1D B +. Los
puntos multidimensionales se asignan a una línea 1D recta calculando su
siguientes pasos de búsqueda dependerán del tipo de consulta. Las estructuras
Norma Euclidiana. El segundo paso es ordenarlos por la norma euclidiana,
de indexación actuales generalmente admiten tres tipos de consultas. El
usando un árbol B +. De esta manera, todas las operaciones se realizan en
primero es Consulta de puntos, que comprueba si un punto específico pertenece
el árbol B +. Como esta es la estructura 1D más eficiente, el NB-Tree hereda
o no a la base de datos. El segundo tipo de consulta, Consulta de rango, devuelve
su buen rendimiento, específicamente para consultas de puntos.
los puntos dentro de un rango específico de valores. En nuestro caso, ese
rango será especificado por una hiperbola. Finalmente, el Consulta KNN ( K
vecinos más cercanos) devuelve los K vecinos más cercanos del punto de
consulta. Esta es la consulta más utilizada en la recuperación basada en
contenido y es la que describimos con más detalle en este documento, porque
4.1.1 Crear un árbol NB
nuestro componente de coincidencia la utiliza de manera intensiva.
Para crear un árbol NB, comenzamos calculando la norma euclidiana de
cada NORTE- punto dimensional del conjunto de datos, utilizando la fórmula

q ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
Comenzamos la búsqueda de KNN haciendo una consulta de bola (bola pequeña
jj PAGS jj ¼ pags 20 þ pags 21 þ? þ pags 2 norte 1 ; re 1 Þ
en Fig. 8 ) Después de esta consulta de bola, verificamos si tenemos suficientes
puntos dentro de la bola para satisfacer la consulta. Si no, comenzamos un proceso
dónde PAGS ¼ð pags 0; pags 1; y; pags norte 2 1 Þ: iterativo, donde el tamaño de la pelota aumenta gradualmente hasta obtener todos
La norma resultante y la NORTE- El punto dimensional se inserta luego en un árbol los puntos especificados por la consulta. Fig. 8 ilustra la búsqueda KNN (en 2D),
B +, utilizando la norma como clave. Después de insertar todos los puntos, obtenemos mientras que Fig. 9 presenta el pseudocódigo para el algoritmo KNN.
un conjunto de NORTE- puntos dimensionales ordenados por su valor normal.

Fig. 6 muestra un ejemplo de la reducción de dimensión para puntos 2D, Para mejorar el rendimiento de nuestro algoritmo, suponemos que los
mientras Fig. 7 presenta el pseudocódigo para implementar el algoritmo de vecinos más cercanos no estarán a una distancia determinada del punto de
inserción. consulta (la bola más grande en
66 MJ Fonseca, JA Jorge / Computers & Graphics 27 (2003) 61–69

Fig. 8 ) De esta forma almacenamos resultados menos intermedios, acelerando


el proceso de búsqueda. La distancia utilizada para podar los resultados
intermedios depende del número de puntos en la estructura y crece
logarítmicamente con la dimensión de los puntos de datos.

4.2. Evaluación del desempeño

Si bien nuestro enfoque parece ofrecer tiempos comparables a otras


estructuras probadas, tuvimos dificultades para compararlo con otros
enfoques, a saber, el IQ-Tree. De hecho, las implementaciones disponibles no
proporcionaron los resultados correctos y, por lo tanto, es difícil comparar los
tiempos de ejecución que parecen ser conmensurables. Las
implementaciones de otros enfoques populares estaban disponibles, pero
algunas se estrellaron en conjuntos de datos de tamaño significativo, lo que
impidió la comparación. Elegimos el SR-Tree y la Pyramid Technique como
punto de referencia porque existen implementaciones confiables y estables,
que proporcionan resultados correctos y escalan a los tamaños de datos de
Fig. 8. Ejemplo de consulta 2D KNN.
prueba previstos.

En esta sección, describimos la evaluación experimental realizada para


comparar nuestro árbol NB con el SRTree y la técnica de la pirámide.
Llevamos a cabo un conjunto de experimentos para analizar los tiempos de
creación y consulta en función de la dimensión y el tamaño del conjunto de
datos. Todos los experimentos se realizaron en una PC Pentium II @
233MHz con Linux 2.4.8, con 384MB de RAM y 15GB de disco.

Evaluamos las tres estructuras utilizando conjuntos de datos de puntos de


datos distribuidos uniformes generados aleatoriamente de tamaño fijo (100,000)
y dimensión variable (10, 20, 30,
40, 60, 80 y 100). También creamos conjuntos de datos con dimensión fija
(20) y tamaño variable (250,000, 500,000,
750,000 y 1,000,000). Además, generamos aleatoriamente un conjunto de
100 consultas para cada dimensión, que luego usamos para evaluar el
rendimiento de búsqueda de cada enfoque. Seleccionamos el número de
vecinos más cercanos para buscar para que siempre sea 10.

Sin embargo, estos conjuntos de datos, ya que se generan a partir de


coordenadas distribuidas uniformemente, no parecen ser representativos con
precisión de los datos de "problemas reales". Planeamos realizar otra evaluación
experimental tan pronto como tengamos acceso a conjuntos de datos reales. Sin
embargo, podemos considerar que la distribución uniforme de puntos es el peor de
los casos que los datos reales, porque los "datos reales" tienden a concentrarse en
grupos, lo que requiere bolas más pequeñas para capturar a los vecinos más
cercanos.

A continuación presentamos los resultados de nuestra evaluación experimental


para datos uniformes, organizados por creación y tiempos de búsqueda KNN.

4.2.1 Creación
La mayoría del trabajo publicado tiende a ignorar los tiempos de inserción. Esto se
debe a que los escenarios convencionales se centran en grandes bases de datos
estáticas que se consultan con mucha más frecuencia que se actualizan. Sin embargo,
Fig. 9. Seudocódigo de consulta KNN. hay muchas aplicaciones.
MJ Fonseca, JA Jorge / Computers & Graphics 27 (2003) 61–69 67

puntos, el árbol NB requiere 15 minutos y el árbol SR tarda alrededor de 6


h. De esta observación queda claro que el árbol NB y la técnica de la
pirámide son más adecuados para grandes conjuntos de datos que el árbol
SR.
En resumen, y mirando Figs. 10 y 11 , podemos
Digamos que la técnica de la pirámide y el árbol NB tienen tiempos de creación
muy similares, mientras que superan ampliamente al árbol SR.

No pudimos crear el SR-Tree para el conjunto de datos de la dimensión


100, en nuestro sistema, debido a los requisitos de memoria. Por lo tanto,
en los siguientes gráficos de rendimiento no mostramos los valores para la
dimensión 100 correspondiente al SR-Tree.

Fig. 10. Tiempo de creación en función de la dimensión. Tamaño del conjunto de datos constante
4.2.2 KNN Search
(100,000 puntos).
Las consultas del vecino más cercano son útiles cuando queremos ver el
punto en el conjunto de datos que más se acerca a la consulta.

que requieren actualizaciones frecuentes de conjuntos de datos. Para estos, los bajos tiempos de

inserción son un factor de usabilidad importante.


Fig. 12 representa el rendimiento de las búsquedas del vecino más

Hemos comparado los tiempos de creación con los del SR-Tree y la cercano cuando aumenta la dimensión. Podemos ver que el NB-Tree supera

técnica de la pirámide. Fig. 10 muestra el tiempo dedicado a crear cada a la Técnica de la Pirámide y al SR-Tree para cualquier dimensión del

estructura cuando cambia la dimensión de los datos. Como podemos ver, el conjunto de datos. Nuestro enfoque calcula los 10 vecinos más cercanos en

NBTree supera en gran medida al SR-Tree y la técnica de la pirámide menos de 1 s para dimensiones de hasta 40 y menos de 2 s para

supera a ambos. Mientras que la técnica de la pirámide tarda 6 s para dimensiones de hasta 100. Además, podemos observar que el árbol NB

insertar 100.000 puntos de dimensión 10, el árbol NB tarda 24 sy el árbol parece presentar un comportamiento asintótico con la dimensión mientras

SR tarda 23 minutos. Si ahora consideramos dimensiones más altas, como que el SR -tree parece exhibir al menos un crecimiento cuadrático.

80, la diferencia aumenta aún más con la técnica de la pirámide que toma
31 s, el árbol NB toma 2 minutos y el árbol SR toma 40 minutos.
Como podemos ver en Fig. 13 , nuestro enfoque también supera
forma la técnica de la pirámide y el árbol SR para un tamaño de conjunto de datos

variable. El NB-Tree exhibe un crecimiento lineal con el tamaño del conjunto de datos,

mientras que las otras estructuras crecen más rápido cuando aumenta el tamaño del
En Fig. 11 , podemos ver el tiempo para la misma acción,
conjunto de datos.
ahora con el tamaño del conjunto de datos cambiando. Aunque todas las estructuras
presentan un crecimiento lineal con el tamaño del conjunto de datos, los tiempos de
En resumen, el NB-Tree presenta una buena compensación entre los

creación de SRTree crecen más rápido que los de las otras estructuras. Mientras que la
tiempos de creación y búsqueda, superando claramente a algunas de las

técnica de la pirámide no requiere más de 2 minutos para crear un árbol con un millón
mejores estructuras de indexación disponibles, para datos distribuidos

de datos
uniformemente. Puede ser discutido

Fig. 11. Tiempo de creación en función del tamaño de la base de datos. Dimensión constante Fig. 12. Tiempos de búsqueda de KNN en función de la dimensión. Tamaño del conjunto de
(20). datos constante (100,000 puntos).
68 MJ Fonseca, JA Jorge / Computers & Graphics 27 (2003) 61–69

99 y la Comisión Europea, proyecto SmartSketches IST-2000-28169.

Referencias

[1] Haz EY. La herramienta adecuada en el momento adecuado. Tesis doctoral,

Instituto de Tecnología de Georgia, septiembre de 1998. [2] Do EY. ¿Qué hay en


un diagrama que una computadora debería
¿entender? En: Actas de la Sexta Conferencia Internacional sobre Futuros de
Diseño Arquitectónico Asistidos por Computadora (CAADF'95), The Global
Design Studio, Universidad Nacional de Singapur, 1995. p. 469-82. [3] Bakergem
DV. Colecciones de imágenes en el estudio de diseño. En:

Fig. 13. Tiempos de búsqueda de KNN en función del tamaño de la base de datos. El estudio de diseño electrónico: conocimiento arquitectónico y medios en la era
Dimensión constante (20). de la informática. Cambridge, MA: MIT Press,
1990. p. 261–72.

que estos representan un caso peor que, digamos, datos distribuidos (hiper) [4] Clayton M, Wiesenthal H. Mejorando el cuaderno de bocetos.
En: Actas de la Asociación de Diseño Asistido por Computadora en Arquitectura
normalmente, ya que necesitamos usar bolas más grandes para garantizar
(ACADIA '91), Los Ángeles, CA,
estadísticamente que capturemos suficientes puntos para satisfacer la consulta KNN
1991
inicial.
[5] MD bruto. Indexación de bases de datos visuales de diseños con
diagramas En: Koutamanis A, Timmermans H, Vermeulen
Yo, editores. Bases de datos visuales en arquitectura, Aldershot, Reino Unido:
5. Conclusiones y trabajos futuros. Avebury; 1995
[6] Chang SK, Perry B, Rosenfeld A. Multi- basado en contenido
Hemos presentado un enfoque de indexación multidimensional Acceso a la información de los medios. Dordrecht: Kluwer Academic Publishers,

adecuado para la recuperación basada en contenido de gráficos y dibujos 1999.

estructurados. El enfoque se centra en refundir el problema general de [7] Rui Y, TS Huang, Chang SF. Recuperación de imagen: pasado,
presente y futuro. Documento invitado en Int Symp sobre procesamiento de
coincidencia gráfica como una instancia de coincidencia gráfica. Para este
información multimedia, 11-13 de diciembre de 1997, Taipei, Taiwán.
fin, indexamos dibujos usando un gráfico de topología que describe las
relaciones de adyacencia y contención para los bloques de dibujo. Luego
[8] Gross M, Do E. Demostrando el cóctel electrónico
transformamos estos gráficos en vectores descriptores de manera similar al
servilleta: una interfaz similar al papel para el diseño inicial. En: Actas de la
hash para obviar la necesidad de realizar costosos cálculos de isomorfismo Conferencia sobre Factores Humanos en Sistemas de Computación (CHI'96),
gráfico en bases de datos grandes, utilizando un método estable. Vancouver, 1996. p. 5–6. [9] Berchtold S, HP Kriegel. S3: similitud en la base de
Finalmente, una búsqueda KNN en grandes bases de datos proporciona los datos CAD
medios para recuperar de manera eficiente sub-dibujos que coinciden con sistemas. En: Actas de la Conferencia Internacional sobre Gestión de Datos
una consulta dada en términos de su topología. Para optimizar esta etapa, (SIGMOD'97), Tuscon, AZ,

Hemos desarrollado un método rápido pero simple para indexar grandes 1997.
[10] Parque J, Um B. Un nuevo enfoque para la recuperación de similitud de
bases de datos que es flexible y escala mejor que otros métodos conocidos.
Objetos gráficos 2D basados ​en formas dominantes. Pattern Recognition Letters
Mediante un procedimiento de filtrado adecuado, creemos que podremos
1999; 20: 591–616. [11] Cvetkovic D, Rowlinson P, Simic S. Eigenspaces de
tamizar algunas muestras significativas de grandes bases de datos de
documentos gráficos estructurados utilizando solo información gráfica.
gráficos Cambridge, Reino Unido: Cambridge University Press,
Aunque queda trabajo por hacer en las etapas iniciales, de la tubería de 1997.
consulta y clasificación, confiamos en la capacidad de extender este [12] Shokoufandeh A, Dickson S, Siddiqi K, Zucker S.
enfoque a otras clases de datos gráficos, como superficies, que no sean Indexación usando una codificación espectral de estructura topológica, IEEE
dibujos vectoriales estructurados. CVPR 2.
[13] Fonseca MJ, Jorge JA. Evaluación experimental de un
reconocedor de garabatos de línea. Pattern Recognition Letters 2001; 22 (12):
1311–9.
[14] Weber R, Schek HJ, Blott S. Un análisis cuantitativo
y estudio de rendimiento para métodos de búsqueda de similitud en espacios de
alta dimensión. En: Actas de la 24ª Conferencia internacional sobre bases de
datos muy grandes (VLDB'98), Nueva York, Estados Unidos, 1998. p. 194-205.
Agradecimientos [15] Ooi BC, Sacks-Davis R, McDonell KJ. Árbol espacial KD:

Este trabajo fue financiado en parte por la Fundación Portuguesa para la Un mecanismo de indexación para bases de datos espaciales. En: Actas de la
Ciencia y la Tecnología, proyecto 34672 / Conferencia IEEE COMPSAC, Tokio, 1987.
MJ Fonseca, JA Jorge / Computers & Graphics 27 (2003) 61–69 69

[16] White DA, Jain R. Indización de similitud: algoritmos y [23] Katayama N, Satoh S. El árbol SR: una estructura de índice
actuación. En: Actas del almacenamiento y recuperación de SPIE para bases de para consultas vecinas cercanas de alta dimensión. En: Actas de la Conferencia
datos de imagen y video, San José, CA, Internacional sobre Gestión de Datos (SIGMOD '97), Tuscon, AZ: ACM Press,
1996. vol. 2670. 1997.
[17] Henrich A, Six HW, Widmayer P. El árbol LSD: espacial pag. 369-80.
acceso a objetos multidimensionales puntuales y no puntuales. En: Actas de la [24] Berchtold S, Keim DA, Kriegel HP. El árbol X: un índice
15ª Conferencia Internacional sobre Bases de Datos Muy Grandes (VLDB'89), estructura para datos de alta dimensión. En: Actas de la 22ª Conferencia
Amsterdam, Internacional sobre Bases de Datos Muy Grandes (VLDB'96), Mumbai (Bombay),
1989. p. 45-53. India, 1996. [25] Sakurai Y, Yoshikawa M, Uemura S, Kojima H. ​The A-
[18] Henrich A. El árbol LSDh: una estructura de acceso para la función
vectores En: Actas de la 14ª Conferencia Internacional sobre Ingeniería de árbol: una estructura de índice para espacios de alta dimensión usando
Datos (ICDE'98), Orlando, FL, aproximación relativa. En: Actas de la 26ª Conferencia Internacional sobre Bases
1998. p. 362–9. de Datos Muy Grandes (VLDB'00), El Cairo, Egipto, 2000. p. 516–26. [26]
[19] Chakrabarti K, Mehrotra S. El árbol híbrido: un índice Berchtold S, B.
estructura para espacios de características de alta dimensión. En: Actas de la ohmios C, Kriegel HP. La pirámide-
15ª Conferencia Internacional sobre Ingeniería de Datos (ICDE'99), Sydney, 1999. técnica: hacia romper la maldición de la dimensionalidad. En: Actas de la
p. 440-7. [20] Guttman A. R-trees: una estructura de índice dinámico para espacial Conferencia Internacional sobre Gestión de Datos (SIGMOD'98), Seattle, WA:
ACM Press, 1998.
buscando. En: Yormark B, editor. Actas de la Conferencia Internacional sobre
Gestión de Datos (SIGMOD'84), Boston, MA: ACM Press, 1984. p. 47-57. [21] [27] Berchtold S, Keim D, Kriegel HP, Seidi T. Indexing
Beckmann N, Kriegel HP, Schneider R, Seeger B. La r * - El espacio de solución: una nueva técnica para la búsqueda del vecino más
cercano en el espacio de alta dimensión. IEEE Transactions on Knowledge and
árbol: un método de acceso eficiente y robusto para puntos y rectángulos. En: Data Engineering 2000; 12 (1): 45–57.
Garcia-Molina H, Jagadish HV, editores. Actas de la Conferencia Internacional
sobre Gestión de Datos (SIGMOD'90), Atlantic City, NJ: ACM Press, 1990. p. [28] Berchtold S, Bohm C, Jagadish HV, Kriegel HP,
322–31. Sander J. Cuantización independiente: una técnica de compresión de índice
para espacios de datos de alta dimensión. En: Actas de la 16ª Conferencia
[22] White DA, Jain R. Indexación de similitud con el árbol SS. En: Internacional sobre Ingeniería de Datos (ICDE'00), San Diego, EE. UU., 2000.
Actas de la 12ª Conferencia Internacional IEEE sobre Ingeniería de Datos,
Nueva Orleans, LA, 1996. p. 516–23. pag. 577–88.

Potrebbero piacerti anche