Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Un árbol de puntos estratégicos (o árbol VP ) es un árbol métrico que segrega datos en un espacio métrico eligiendo una posición en el espacio (el "punto estratégico") y dividiendo los puntos de datos en dos partes: los puntos que están más cerca de el punto de ventaja que un umbral, y aquellos puntos que no lo son. Al aplicar este procedimiento de forma recursiva para dividir los datos en conjuntos cada vez más pequeños, se crea una estructura de datos de árbol donde los vecinos del árbol probablemente sean vecinos en el espacio. [1]
Una generalización se denomina árbol de puntos de vista múltiple o árbol MVP : una estructura de datos para indexar objetos de grandes espacios métricos para consultas de búsqueda de similitud . Utiliza más de un punto para dividir cada nivel. [2] [3]
Contenido
historia
Comprensión de un árbol de puntos de vista
Búsqueda a través de un árbol de punto de vista
Ventajas de un árbol de punto de vista
Complejidad
referencias
enlaces externos
Historia
Peter Yianilos afirmó que él (Peter Yianilos) y Jeffrey Uhlmann descubrieron el árbol de la posición ventajosa de forma independiente . [1] Sin embargo, Uhlmann publicó este método antes de Yianilos en 1991. [4] Uhlmann llamó a la estructura de datos un árbol métrico , el nombre VP-árbol fue propuesto por Yianilos. Nielsen et al. Han generalizado los árboles de puntos de vista a espacios no métricos utilizando las divergencias de Bregman. [5]
Este proceso de particionamiento iterativo es similar al de un árbol k -d , pero utiliza particiones circulares (o esféricas, hipersféricas, etc.) en lugar de particiones rectilíneas. En el espacio euclidiano bidimensional, esto se puede visualizar como una serie de círculos que segregan los datos.
El árbol de puntos de vista es particularmente útil para dividir datos en un espacio métrico no estándar en un árbol métrico.
Un enfoque similar funciona para encontrar los k vecinos más cercanos de un punto x . En la recursión, se busca en el otro subárbol k - k ′ vecinos más cercanos del punto x siempre que solo k ′ (< k ) de los vecinos más cercanos encontrados hasta ahora tengan una distancia menor que | t - d | .
Complejidad
El costo de tiempo para construir un árbol Vantage-Point es aproximadamente O ( n log n ) . Para cada elemento, el árbol desciende por log n niveles para encontrar su ubicación. Sin embargo, hay un factor constante k donde k es el número de puntos estratégicos por nodo de árbol. [3]
El costo de tiempo para buscar un árbol de Miranda para encontrar un vecino más cercano es O (log n ) . Hay log n niveles, cada uno de los cuales involucra k cálculos de distancia, donde k es el número de puntos estratégicos (elementos) en esa posición en el árbol.
El costo de tiempo para buscar un rango de un punto de vista para un rango, que puede ser el atributo más importante, puede variar mucho dependiendo de los detalles del algoritmo utilizado y los parámetros. El documento de Brin [3] da el resultado de experimentos con varios algoritmos de puntos estratégicos con varios parámetros para investigar el costo, medido en número de cálculos de distancia.
El costo de espacio para un árbol Vantage-Point es aproximadamente n . Cada elemento se almacena y cada elemento de árbol en cada nodo no hoja requiere un puntero a sus nodos descendientes. (Consulte Brin para obtener detalles sobre una opción de implementación. El parámetro para el número de elementos en cada nodo juega un factor).
2
Tenga en cuenta que algunas herramientas de espacio métrico requieren una matriz de valores de distancia por pares, que cuestan O ( n ) , pero eso no se requiere con los árboles de puntos de vista.
Referencias
1. Yianilos (1993). Estructuras de datos y algoritmos para la búsqueda de vecinos más cercanos en espacios métricos generales (http://web.cs.iastate.edu/~honavar/nndatastructures.pdf) (PDF) . Cuarto simposio anual ACM-SIAM sobre algoritmos discretos. Sociedad de Matemáticas Industriales y Aplicadas Filadelfia, PA, EE. UU. pp. 311–321. pny93 . Consultado el 22 de agosto de 2008 .
2. Bozkaya, Tolga; Ozsoyoglu, Meral (septiembre de 1999). "Indexación de grandes espacios métricos para consultas de búsqueda de similitud". ACM Trans. Syst . 24 (3): 361–404. doi : 10.1145 / 328939.328959 (https://doi.org/10.1145%2F328939.328959) . ISSN 0362-5915 (https://www.worldcat.org/issn/0362-5915) .
3. Brin, Sergey (septiembre de 1995). "Búsqueda de vecinos cercanos en grandes espacios métricos" (https://dl.acm.org/citation.cfm?id=673006) . VLDB '95 Actas de la 21ª Conferencia Internacional sobre bases de datos muy grandes . Zurich, Suiza: Morgan Kaufmann Publishers Inc .: 574–584.
4. Uhlmann, Jeffrey (1991). "Satisfaciendo consultas de proximidad / similitud general con árboles métricos". Cartas de procesamiento de información . 40 (4): 175-179. doi : 10.1016 / 0020-0190 (91) 90074-r (https://doi.org/10.1016%2F0020-0190%2891%2990074-r) .
5. Nielsen, Frank (2009). "Árboles de puntos de vista de Bregman para consultas vecinas más cercanas eficientes". Actas de Multimedia y Exp (ICME) . IEEE pp. 878–881.
6. Fu, Ada Wai-chee; Polly Mei-shuen Chan; Yin-Ling Cheung; Yiu Sang Moon (2000). "Indización dinámica del árbol vp para la búsqueda de vecinos n -más cercanos dadas distancias por pares" (http://dl.acm.org/citation.cfm?id=765232&bnc=1) . The VLDB Journal - The International Journal on Very Large Data Bases . Springer-Verlag Nueva York, Inc. Secaucus, NJ, EE. UU. pp. 154-173. vp . Consultado el 2 de octubre de 2012 .
Enlaces externos
Comprensión de los árboles VP (http://stevehanov.ca/blog/index.php?id=130)
Esta página fue editada por última vez el 3 de octubre de 2019, a las 14:19 (UTC) .
El texto está disponible bajo la Licencia Creative Commons Reconocimiento-CompartirIgual ; Se pueden aplicar términos adicionales. Al usar este sitio, usted acepta los Términos de uso y la Política de privacidad . Wikipedia® es una marca registrada de Wikimedia Foundation, Inc. , una organización sin fines de lucro.