Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Resumen
Este documento presenta un nuevo enfoque para clasificar, indexar y recuperar dibujos técnicos por contenido. Nuestro trabajo utiliza relaciones espaciales,
elementos visuales y mecanismos de indexación de alta dimensión para recuperar dibujos complejos de bases de datos CAD. Esto contrasta con los enfoques
convencionales que utilizan principalmente metadatos textuales para el mismo propósito.
Los diseñadores creativos y los dibujantes a menudo reutilizan datos de proyectos anteriores, publicaciones y bibliotecas de componentes listos para usar. Por lo
general, recuperar estos dibujos es un esfuerzo lento, complejo y propenso a errores, que requiere un examen visual exhaustivo, una memoria sólida o ambos.
Desafortunadamente, el uso generalizado de los sistemas CAD, al tiempo que facilita la creación y edición de dibujos, exacerba este problema, en la medida en que el
número de proyectos y dibujos crece enormemente, sin proporcionar mecanismos de recuperación adecuados para respaldar la recuperación de estos documentos.
En este artículo, describimos un enfoque que admite la indexación automática de bases de datos de dibujo técnico a través de técnicas de simplificación de dibujo
basadas en características geométricas y algoritmos eficientes para indexar grandes cantidades de datos. Describimos en detalle la estructura de indexación
(NB-Tree) que hemos desarrollado dentro del contexto de un enfoque más general. La evaluación experimental revela que nuestro enfoque supera a algunas de las
mejores estructuras de indexación publicadas, lo que nos permite buscar en bases de datos de dibujo muy grandes.
Palabras clave: Recuperación basada en contenido; Correspondencia de gráficos; Indexación de alta dimensión
Algunas de las soluciones [3,4] Para este problema, utilice bases de datos
textuales para organizar la información. Los dibujos se clasifican por palabras
* *Autor correspondiente. Tel .: + 351-21-3100300; Fax: + 35121-3145843.
clave e información adicional, como nombre del diseñador, estilo, fecha y una
Correos electrónicos: mjf@inesc-id.pt (MJ Fonseca), jorgej@acm.org descripción textual. Sin embargo, las soluciones basadas en consultas textuales
(JA Jorge). no son
0097-8493 / 03 / $ - ver tema principal r 2002 Elsevier Science Ltd. Todos los derechos reservados. PII: S 0 0 9 7 - 8 4 9 3
(0 2) 0 0 2 4 4 - 3
62 MJ Fonseca, JA Jorge / Computers & Graphics 27 (2003) 61–69
satisfactorio, porque obligan a los diseñadores a conocer en detalle la El sistema S3 [9] admite la gestión y recuperación de piezas CAD
metainformación utilizada para caracterizar los dibujos y requieren que los industriales, descritas mediante polígonos y atributos temáticos. Recupera
humanos la produzcan. En oposición a la organización textual, proponemos partes usando contornos bidimensionales dibujados usando un editor gráfico o
una clasificación visual basada en la forma y las relaciones espaciales, que partes de muestra almacenadas en una base de datos. Aunque este sistema
consideramos más adecuada para este problema, porque utiliza la memoria presenta buenos resultados en la recuperación de piezas CAD industriales, se
visual que poseen los diseñadores y explora su habilidad para dibujar como basa exclusivamente en contornos coincidentes, ignorando las relaciones
mecanismo de consulta. espaciales y la información de forma, lo que lo hace inadecuado para
recuperar dibujos complejos de formas múltiples.
2. Trabajo relacionado
intentó indexar dibujos técnicos a través de bases de datos textuales. Sin La mayoría de los dibujos técnicos contienen descripciones detalladas de
embargo, esto no puede utilizar los ricos mecanismos de asociación visual y el los objetos, que no son necesarios para una búsqueda visual y, de hecho,
uso del diseñador de bocetos para recuperar información. aumentan el costo de la búsqueda. Incluimos en nuestro enfoque un proceso
para eliminar detalles visuales (es decir, características a pequeña escala)
Aunque los tres sistemas descritos a continuación abordan el problema mientras se conservan los elementos y formas perceptivamente dominantes
de la recuperación de dibujos basada en el contenido, siguen diferentes en un dibujo. Nuestro método divide el dibujo técnico en varios bloques
principios y diferentes algoritmos para lograr sus objetivos. dominantes, que luego también se dividirán en otros bloques, y extraerán las
relaciones espaciales entre ellos. Solo usamos dos relaciones espaciales, Inclusión
El primero, desarrollado por Mark Gross y Ellen Do, en el contexto de la
servilleta electrónica de cóctel. [5,2,8]
abordó un esquema de recuperación visual basado en diagramas, para y Proximidad. Estas relaciones son débilmente discriminatorias, sin
indexar bases de datos de dibujos arquitectónicos. Los usuarios dibujan embargo, son invariables con la rotación y la traslación.
bocetos de edificios, que se comparan con anotaciones (diagramas),
almacenados en una base de datos y producidos manualmente por los Luego combinamos información de forma con las relaciones espaciales en un gráfico
usuarios. Aunque este sistema funciona bien para pequeños conjuntos de topológico y almacénelo en una base de datos para su uso posterior en los gráficos
dibujos, la falta de indexación y clasificación automática hace que sea de candidatos coincidentes.
imposible de usar para grandes colecciones de dibujos. Figs. 2 y 3 ilustra los diferentes pasos del proceso de clasificación: dibujo
técnico, bloque y
MJ Fonseca, JA Jorge / Computers & Graphics 27 (2003) 61–69 63
extracción de relaciones espaciales y creación de grafos topológicos, descriptor, que da lugar a colisiones. En [12] , los autores sostienen que esta
respectivamente. frecuencia de colisión es pequeña.
Dado que la coincidencia de gráficos es un problema de NP, intentamos Dado que necesitamos indexar la mayoría de los sub-gráficos de un gráfico
superar esto utilizando información espectral en el gráfico. Para cada gráfico dado para permitir la coincidencia de sub-gráficos, terminamos con una gran
calculamos un descriptor basado en su espectro [11,12] . Para admitir la base de datos que comprende decenas de miles o potencialmente cientos de
coincidencia de gráficos secundarios, también calculamos descriptores para miles de descriptores, incluso para indexar cientos a miles de dibujos técnicos.
los gráficos secundarios del gráfico principal. El cálculo del espectro del Por lo tanto, en el centro de nuestro enfoque, necesitamos tener una estructura
gráfico se basa en el cálculo de los valores propios de la matriz de de indexación eficiente para almacenar descriptores. Esto se detallará en la
adyacencia del gráfico. El descriptor resultante es un punto Sección 4.
multidimensional, cuya dimensión depende de la complejidad del gráfico.
Además, captura la topología local, es invariable para el reordenamiento de
sub-gráfico y es estable, ya que pequeños cambios en el gráfico producen 3.2. Consulta
pequeños cambios en el descriptor. Sin embargo, el descriptor resultante no
es único. Más de un gráfico puede tener el mismo Nuestro sistema incluye una interfaz caligráfica para admitir la definición
de consultas bosquejadas a mano, para complementar y superar las
limitaciones de los textos.
Fig. 2. Dibujo técnico (izquierda) y división de bloques para parte de la planta (derecha).
64 MJ Fonseca, JA Jorge / Computers & Graphics 27 (2003) 61–69
4. Estructura de indexación
q ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
Comenzamos la búsqueda de KNN haciendo una consulta de bola (bola pequeña
jj PAGS jj ¼ pags 20 þ pags 21 þ? þ pags 2 norte 1 ; re 1 Þ
en Fig. 8 ) Después de esta consulta de bola, verificamos si tenemos suficientes
puntos dentro de la bola para satisfacer la consulta. Si no, comenzamos un proceso
dónde PAGS ¼ð pags 0; pags 1; y; pags norte 2 1 Þ: iterativo, donde el tamaño de la pelota aumenta gradualmente hasta obtener todos
La norma resultante y la NORTE- El punto dimensional se inserta luego en un árbol los puntos especificados por la consulta. Fig. 8 ilustra la búsqueda KNN (en 2D),
B +, utilizando la norma como clave. Después de insertar todos los puntos, obtenemos mientras que Fig. 9 presenta el pseudocódigo para el algoritmo KNN.
un conjunto de NORTE- puntos dimensionales ordenados por su valor normal.
Fig. 6 muestra un ejemplo de la reducción de dimensión para puntos 2D, Para mejorar el rendimiento de nuestro algoritmo, suponemos que los
mientras Fig. 7 presenta el pseudocódigo para implementar el algoritmo de vecinos más cercanos no estarán a una distancia determinada del punto de
inserción. consulta (la bola más grande en
66 MJ Fonseca, JA Jorge / Computers & Graphics 27 (2003) 61–69
4.2.1 Creación
La mayoría del trabajo publicado tiende a ignorar los tiempos de inserción. Esto se
debe a que los escenarios convencionales se centran en grandes bases de datos
estáticas que se consultan con mucha más frecuencia que se actualizan. Sin embargo,
Fig. 9. Seudocódigo de consulta KNN. hay muchas aplicaciones.
MJ Fonseca, JA Jorge / Computers & Graphics 27 (2003) 61–69 67
Fig. 10. Tiempo de creación en función de la dimensión. Tamaño del conjunto de datos constante
4.2.2 KNN Search
(100,000 puntos).
Las consultas del vecino más cercano son útiles cuando queremos ver el
punto en el conjunto de datos que más se acerca a la consulta.
que requieren actualizaciones frecuentes de conjuntos de datos. Para estos, los bajos tiempos de
Hemos comparado los tiempos de creación con los del SR-Tree y la cercano cuando aumenta la dimensión. Podemos ver que el NB-Tree supera
técnica de la pirámide. Fig. 10 muestra el tiempo dedicado a crear cada a la Técnica de la Pirámide y al SR-Tree para cualquier dimensión del
estructura cuando cambia la dimensión de los datos. Como podemos ver, el conjunto de datos. Nuestro enfoque calcula los 10 vecinos más cercanos en
NBTree supera en gran medida al SR-Tree y la técnica de la pirámide menos de 1 s para dimensiones de hasta 40 y menos de 2 s para
supera a ambos. Mientras que la técnica de la pirámide tarda 6 s para dimensiones de hasta 100. Además, podemos observar que el árbol NB
insertar 100.000 puntos de dimensión 10, el árbol NB tarda 24 sy el árbol parece presentar un comportamiento asintótico con la dimensión mientras
SR tarda 23 minutos. Si ahora consideramos dimensiones más altas, como que el SR -tree parece exhibir al menos un crecimiento cuadrático.
80, la diferencia aumenta aún más con la técnica de la pirámide que toma
31 s, el árbol NB toma 2 minutos y el árbol SR toma 40 minutos.
Como podemos ver en Fig. 13 , nuestro enfoque también supera
forma la técnica de la pirámide y el árbol SR para un tamaño de conjunto de datos
variable. El NB-Tree exhibe un crecimiento lineal con el tamaño del conjunto de datos,
mientras que las otras estructuras crecen más rápido cuando aumenta el tamaño del
En Fig. 11 , podemos ver el tiempo para la misma acción,
conjunto de datos.
ahora con el tamaño del conjunto de datos cambiando. Aunque todas las estructuras
presentan un crecimiento lineal con el tamaño del conjunto de datos, los tiempos de
En resumen, el NB-Tree presenta una buena compensación entre los
creación de SRTree crecen más rápido que los de las otras estructuras. Mientras que la
tiempos de creación y búsqueda, superando claramente a algunas de las
técnica de la pirámide no requiere más de 2 minutos para crear un árbol con un millón
mejores estructuras de indexación disponibles, para datos distribuidos
de datos
uniformemente. Puede ser discutido
Fig. 11. Tiempo de creación en función del tamaño de la base de datos. Dimensión constante Fig. 12. Tiempos de búsqueda de KNN en función de la dimensión. Tamaño del conjunto de
(20). datos constante (100,000 puntos).
68 MJ Fonseca, JA Jorge / Computers & Graphics 27 (2003) 61–69
Referencias
Fig. 13. Tiempos de búsqueda de KNN en función del tamaño de la base de datos. El estudio de diseño electrónico: conocimiento arquitectónico y medios en la era
Dimensión constante (20). de la informática. Cambridge, MA: MIT Press,
1990. p. 261–72.
que estos representan un caso peor que, digamos, datos distribuidos (hiper) [4] Clayton M, Wiesenthal H. Mejorando el cuaderno de bocetos.
En: Actas de la Asociación de Diseño Asistido por Computadora en Arquitectura
normalmente, ya que necesitamos usar bolas más grandes para garantizar
(ACADIA '91), Los Ángeles, CA,
estadísticamente que capturemos suficientes puntos para satisfacer la consulta KNN
1991
inicial.
[5] MD bruto. Indexación de bases de datos visuales de diseños con
diagramas En: Koutamanis A, Timmermans H, Vermeulen
Yo, editores. Bases de datos visuales en arquitectura, Aldershot, Reino Unido:
5. Conclusiones y trabajos futuros. Avebury; 1995
[6] Chang SK, Perry B, Rosenfeld A. Multi- basado en contenido
Hemos presentado un enfoque de indexación multidimensional Acceso a la información de los medios. Dordrecht: Kluwer Academic Publishers,
estructurados. El enfoque se centra en refundir el problema general de [7] Rui Y, TS Huang, Chang SF. Recuperación de imagen: pasado,
presente y futuro. Documento invitado en Int Symp sobre procesamiento de
coincidencia gráfica como una instancia de coincidencia gráfica. Para este
información multimedia, 11-13 de diciembre de 1997, Taipei, Taiwán.
fin, indexamos dibujos usando un gráfico de topología que describe las
relaciones de adyacencia y contención para los bloques de dibujo. Luego
[8] Gross M, Do E. Demostrando el cóctel electrónico
transformamos estos gráficos en vectores descriptores de manera similar al
servilleta: una interfaz similar al papel para el diseño inicial. En: Actas de la
hash para obviar la necesidad de realizar costosos cálculos de isomorfismo Conferencia sobre Factores Humanos en Sistemas de Computación (CHI'96),
gráfico en bases de datos grandes, utilizando un método estable. Vancouver, 1996. p. 5–6. [9] Berchtold S, HP Kriegel. S3: similitud en la base de
Finalmente, una búsqueda KNN en grandes bases de datos proporciona los datos CAD
medios para recuperar de manera eficiente sub-dibujos que coinciden con sistemas. En: Actas de la Conferencia Internacional sobre Gestión de Datos
una consulta dada en términos de su topología. Para optimizar esta etapa, (SIGMOD'97), Tuscon, AZ,
Hemos desarrollado un método rápido pero simple para indexar grandes 1997.
[10] Parque J, Um B. Un nuevo enfoque para la recuperación de similitud de
bases de datos que es flexible y escala mejor que otros métodos conocidos.
Objetos gráficos 2D basados en formas dominantes. Pattern Recognition Letters
Mediante un procedimiento de filtrado adecuado, creemos que podremos
1999; 20: 591–616. [11] Cvetkovic D, Rowlinson P, Simic S. Eigenspaces de
tamizar algunas muestras significativas de grandes bases de datos de
documentos gráficos estructurados utilizando solo información gráfica.
gráficos Cambridge, Reino Unido: Cambridge University Press,
Aunque queda trabajo por hacer en las etapas iniciales, de la tubería de 1997.
consulta y clasificación, confiamos en la capacidad de extender este [12] Shokoufandeh A, Dickson S, Siddiqi K, Zucker S.
enfoque a otras clases de datos gráficos, como superficies, que no sean Indexación usando una codificación espectral de estructura topológica, IEEE
dibujos vectoriales estructurados. CVPR 2.
[13] Fonseca MJ, Jorge JA. Evaluación experimental de un
reconocedor de garabatos de línea. Pattern Recognition Letters 2001; 22 (12):
1311–9.
[14] Weber R, Schek HJ, Blott S. Un análisis cuantitativo
y estudio de rendimiento para métodos de búsqueda de similitud en espacios de
alta dimensión. En: Actas de la 24ª Conferencia internacional sobre bases de
datos muy grandes (VLDB'98), Nueva York, Estados Unidos, 1998. p. 194-205.
Agradecimientos [15] Ooi BC, Sacks-Davis R, McDonell KJ. Árbol espacial KD:
Este trabajo fue financiado en parte por la Fundación Portuguesa para la Un mecanismo de indexación para bases de datos espaciales. En: Actas de la
Ciencia y la Tecnología, proyecto 34672 / Conferencia IEEE COMPSAC, Tokio, 1987.
MJ Fonseca, JA Jorge / Computers & Graphics 27 (2003) 61–69 69
[16] White DA, Jain R. Indización de similitud: algoritmos y [23] Katayama N, Satoh S. El árbol SR: una estructura de índice
actuación. En: Actas del almacenamiento y recuperación de SPIE para bases de para consultas vecinas cercanas de alta dimensión. En: Actas de la Conferencia
datos de imagen y video, San José, CA, Internacional sobre Gestión de Datos (SIGMOD '97), Tuscon, AZ: ACM Press,
1996. vol. 2670. 1997.
[17] Henrich A, Six HW, Widmayer P. El árbol LSD: espacial pag. 369-80.
acceso a objetos multidimensionales puntuales y no puntuales. En: Actas de la [24] Berchtold S, Keim DA, Kriegel HP. El árbol X: un índice
15ª Conferencia Internacional sobre Bases de Datos Muy Grandes (VLDB'89), estructura para datos de alta dimensión. En: Actas de la 22ª Conferencia
Amsterdam, Internacional sobre Bases de Datos Muy Grandes (VLDB'96), Mumbai (Bombay),
1989. p. 45-53. India, 1996. [25] Sakurai Y, Yoshikawa M, Uemura S, Kojima H. The A-
[18] Henrich A. El árbol LSDh: una estructura de acceso para la función
vectores En: Actas de la 14ª Conferencia Internacional sobre Ingeniería de árbol: una estructura de índice para espacios de alta dimensión usando
Datos (ICDE'98), Orlando, FL, aproximación relativa. En: Actas de la 26ª Conferencia Internacional sobre Bases
1998. p. 362–9. de Datos Muy Grandes (VLDB'00), El Cairo, Egipto, 2000. p. 516–26. [26]
[19] Chakrabarti K, Mehrotra S. El árbol híbrido: un índice Berchtold S, B.
estructura para espacios de características de alta dimensión. En: Actas de la ohmios C, Kriegel HP. La pirámide-
15ª Conferencia Internacional sobre Ingeniería de Datos (ICDE'99), Sydney, 1999. técnica: hacia romper la maldición de la dimensionalidad. En: Actas de la
p. 440-7. [20] Guttman A. R-trees: una estructura de índice dinámico para espacial Conferencia Internacional sobre Gestión de Datos (SIGMOD'98), Seattle, WA:
ACM Press, 1998.
buscando. En: Yormark B, editor. Actas de la Conferencia Internacional sobre
Gestión de Datos (SIGMOD'84), Boston, MA: ACM Press, 1984. p. 47-57. [21] [27] Berchtold S, Keim D, Kriegel HP, Seidi T. Indexing
Beckmann N, Kriegel HP, Schneider R, Seeger B. La r * - El espacio de solución: una nueva técnica para la búsqueda del vecino más
cercano en el espacio de alta dimensión. IEEE Transactions on Knowledge and
árbol: un método de acceso eficiente y robusto para puntos y rectángulos. En: Data Engineering 2000; 12 (1): 45–57.
Garcia-Molina H, Jagadish HV, editores. Actas de la Conferencia Internacional
sobre Gestión de Datos (SIGMOD'90), Atlantic City, NJ: ACM Press, 1990. p. [28] Berchtold S, Bohm C, Jagadish HV, Kriegel HP,
322–31. Sander J. Cuantización independiente: una técnica de compresión de índice
para espacios de datos de alta dimensión. En: Actas de la 16ª Conferencia
[22] White DA, Jain R. Indexación de similitud con el árbol SS. En: Internacional sobre Ingeniería de Datos (ICDE'00), San Diego, EE. UU., 2000.
Actas de la 12ª Conferencia Internacional IEEE sobre Ingeniería de Datos,
Nueva Orleans, LA, 1996. p. 516–23. pag. 577–88.