Sei sulla pagina 1di 1

Árbol de mirador

Un árbol de puntos estratégicos (o árbol VP ) es un árbol métrico que segrega datos en un espacio métrico eligiendo una posición en el espacio (el "punto estratégico") y dividiendo los puntos de datos en dos partes: los puntos que están más cerca de el punto de ventaja que un umbral, y aquellos puntos que no lo son. Al aplicar este procedimiento de forma recursiva para dividir los datos en conjuntos cada vez más pequeños, se crea una estructura de datos de árbol donde los vecinos del árbol probablemente sean vecinos en el espacio. [1]

Una generalización se denomina árbol de puntos de vista múltiple o árbol MVP : una estructura de datos para indexar objetos de grandes espacios métricos para consultas de búsqueda de similitud . Utiliza más de un punto para dividir cada nivel. [2] [3]

Contenido
historia
Comprensión de un árbol de puntos de vista
Búsqueda a través de un árbol de punto de vista
Ventajas de un árbol de punto de vista
Complejidad
referencias
enlaces externos

Historia
Peter Yianilos afirmó que él (Peter Yianilos) y Jeffrey Uhlmann descubrieron el árbol de la posición ventajosa de forma independiente . [1] Sin embargo, Uhlmann publicó este método antes de Yianilos en 1991. [4] Uhlmann llamó a la estructura de datos un árbol métrico , el nombre VP-árbol fue propuesto por Yianilos. Nielsen et al. Han generalizado los árboles de puntos de vista a espacios no métricos utilizando las divergencias de Bregman. [5]

Este proceso de particionamiento iterativo es similar al de un árbol k -d , pero utiliza particiones circulares (o esféricas, hipersféricas, etc.) en lugar de particiones rectilíneas. En el espacio euclidiano bidimensional, esto se puede visualizar como una serie de círculos que segregan los datos.

El árbol de puntos de vista es particularmente útil para dividir datos en un espacio métrico no estándar en un árbol métrico.

Comprensión de un árbol de puntos de vista


La forma en que un árbol de punto de vista almacena datos puede representarse mediante un círculo. [6] Primero, comprenda que cada nodo de este árbol contiene un punto de entrada y un radio. Todos los elementos secundarios izquierdos de un nodo dado son los puntos dentro del círculo y todos los elementos secundarios derechos de un nodo dado están fuera del círculo. El árbol en sí no necesita saber ninguna otra información sobre lo que se está almacenando. Todo lo que necesita es la función de distancia que satisfaga las propiedades del espacio métrico . [6]

Buscando a través de un árbol de puntos de vista


Se puede usar un árbol de puntos de vista para encontrar el vecino más cercano de un punto x . El algoritmo de búsqueda es recursivo. En cualquier paso dado estamos trabajando con un nodo del árbol que tiene un punto de vista vy una distancia umbral t . El punto de interés x estará a cierta distancia del punto de vista v . Si esa distancia d es menor que t , utilice el algoritmo de forma recursiva para buscar el subárbol del nodo que contiene los puntos más cercanos al punto de ventaja que el umbral t ; de lo contrario, recurrirá al subárbol del nodo que contiene los puntos que están más lejos que el punto de ventaja que el umbral t. Si el uso recursivo del algoritmo encuentra un punto vecino n con una distancia a x que es menor que
| t - d | entonces no puede ayudar buscar el otro subárbol de este nodo; se devuelve el nodo descubierto n . De lo contrario, el otro subárbol también debe buscarse de forma recursiva.

Un enfoque similar funciona para encontrar los k vecinos más cercanos de un punto x . En la recursión, se busca en el otro subárbol k - k ′ vecinos más cercanos del punto x siempre que solo k ′ (< k ) de los vecinos más cercanos encontrados hasta ahora tengan una distancia menor que | t - d | .

Ventajas de un árbol de puntos de vista


1. En lugar de inferir puntos multidimensionales para el dominio antes de que se construya el índice, construimos el índice directamente en función de la distancia. [6] Al hacer esto, se evitan los pasos de preprocesamiento.
2. Actualizar un árbol de puntos de vista es relativamente fácil en comparación con el enfoque de mapa rápido. Para mapas rápidos, después de insertar o eliminar datos, llegará un momento en que el mapa rápido tendrá que volver a escanearse. Eso lleva demasiado tiempo y no está claro cuándo comenzará el nuevo escaneo.
3. Los métodos basados en la distancia son flexibles. Es "capaz de indexar objetos que se representan como vectores de características de un número fijo de dimensiones". [6]

Complejidad
El costo de tiempo para construir un árbol Vantage-Point es aproximadamente O ( n log n ) . Para cada elemento, el árbol desciende por log n niveles para encontrar su ubicación. Sin embargo, hay un factor constante k donde k es el número de puntos estratégicos por nodo de árbol. [3]

El costo de tiempo para buscar un árbol de Miranda para encontrar un vecino más cercano es O (log n ) . Hay log n niveles, cada uno de los cuales involucra k cálculos de distancia, donde k es el número de puntos estratégicos (elementos) en esa posición en el árbol.

El costo de tiempo para buscar un rango de un punto de vista para un rango, que puede ser el atributo más importante, puede variar mucho dependiendo de los detalles del algoritmo utilizado y los parámetros. El documento de Brin [3] da el resultado de experimentos con varios algoritmos de puntos estratégicos con varios parámetros para investigar el costo, medido en número de cálculos de distancia.

El costo de espacio para un árbol Vantage-Point es aproximadamente n . Cada elemento se almacena y cada elemento de árbol en cada nodo no hoja requiere un puntero a sus nodos descendientes. (Consulte Brin para obtener detalles sobre una opción de implementación. El parámetro para el número de elementos en cada nodo juega un factor).

2
Tenga en cuenta que algunas herramientas de espacio métrico requieren una matriz de valores de distancia por pares, que cuestan O ( n ) , pero eso no se requiere con los árboles de puntos de vista.

Referencias
1. Yianilos (1993). Estructuras de datos y algoritmos para la búsqueda de vecinos más cercanos en espacios métricos generales (http://web.cs.iastate.edu/~honavar/nndatastructures.pdf) (PDF) . Cuarto simposio anual ACM-SIAM sobre algoritmos discretos. Sociedad de Matemáticas Industriales y Aplicadas Filadelfia, PA, EE. UU. pp. 311–321. pny93 . Consultado el 22 de agosto de 2008 .
2. Bozkaya, Tolga; Ozsoyoglu, Meral (septiembre de 1999). "Indexación de grandes espacios métricos para consultas de búsqueda de similitud". ACM Trans. Syst . 24 (3): 361–404. doi : 10.1145 / 328939.328959 (https://doi.org/10.1145%2F328939.328959) . ISSN 0362-5915 (https://www.worldcat.org/issn/0362-5915) .
3. Brin, Sergey (septiembre de 1995). "Búsqueda de vecinos cercanos en grandes espacios métricos" (https://dl.acm.org/citation.cfm?id=673006) . VLDB '95 Actas de la 21ª Conferencia Internacional sobre bases de datos muy grandes . Zurich, Suiza: Morgan Kaufmann Publishers Inc .: 574–584.
4. Uhlmann, Jeffrey (1991). "Satisfaciendo consultas de proximidad / similitud general con árboles métricos". Cartas de procesamiento de información . 40 (4): 175-179. doi : 10.1016 / 0020-0190 (91) 90074-r (https://doi.org/10.1016%2F0020-0190%2891%2990074-r) .
5. Nielsen, Frank (2009). "Árboles de puntos de vista de Bregman para consultas vecinas más cercanas eficientes". Actas de Multimedia y Exp (ICME) . IEEE pp. 878–881.
6. Fu, Ada Wai-chee; Polly Mei-shuen Chan; Yin-Ling Cheung; Yiu Sang Moon (2000). "Indización dinámica del árbol vp para la búsqueda de vecinos n -más cercanos dadas distancias por pares" (http://dl.acm.org/citation.cfm?id=765232&bnc=1) . The VLDB Journal - The International Journal on Very Large Data Bases . Springer-Verlag Nueva York, Inc. Secaucus, NJ, EE. UU. pp. 154-173. vp . Consultado el 2 de octubre de 2012 .

Enlaces externos
Comprensión de los árboles VP (http://stevehanov.ca/blog/index.php?id=130)

Obtenido de " https://en.wikipedia.org/w/index.php?title=Vantage-point_tree&oldid=919394287 "

Esta página fue editada por última vez el 3 de octubre de 2019, a las 14:19 (UTC) .

El texto está disponible bajo la Licencia Creative Commons Reconocimiento-CompartirIgual ; Se pueden aplicar términos adicionales. Al usar este sitio, usted acepta los Términos de uso y la Política de privacidad . Wikipedia® es una marca registrada de Wikimedia Foundation, Inc. , una organización sin fines de lucro.

Potrebbero piacerti anche