IA - Trabajo Práctico 5 - Visión Artificial

Inteligencia Artificial
TP 5: Deteccin de Objetos mediante Visin Artificial
Profesores: Eduardo Amar Laura Aquili Alumnos: Federico Maccaroni - 37755 - federicomaccaroni@hotmail.com Nicols Milcoff - 36691 - nicolasmilcoff@hotmail.com.ar Alberto Silveira - 36550 - alberto.silveira.gazzano@gmail.com
Contenido
Presentacin ................................................................................................................................................. 3 Introduccin .................................................................................................................................................. 4 Definicin ...................................................................................................................................................... 6 Motivacin .................................................................................................................................................... 8 Componentes de un sistema de visin artificial ......................................................................................... 10 Funcionamiento de la deteccin de objetos............................................................................................... 12 Aplicaciones ................................................................................................................................................ 21 Conclusin ................................................................................................................................................... 23 Bibliografa .................................................................................................................................................. 24
Presentacin
La Visin Artificial es un campo muy amplio dentro del contexto de la Inteligencia Artificial. En el presente trabajo, intentamos encuadrar la pregunta Pueden las mquinas pensar? en el contexto de la vida diaria, dado que uno de los sentidos ms utilizados por los seres humanos es la vista. Cmo puede la IA, y en particular la VA ayudarnos a resolver "problemas cotidianos que se relacionen con los sentidos y en particular la visin? Muchas veces pensamos en VA aplicada en niveles muy altos como militares, biolgicos, cientficos, etc. pero rara vez pensamos en usar la VA en el contexto de una foto familiar sacada con un simple celular o ayudarnos a estacionar cuando vamos al cine. Nos hemos trazado el objetivo de ser claros y precisos en el desarrollo de la Deteccin de Objetos y as brindar informacin sobre un aspecto de la VA, a fin de despertar en el lector el inters en sta rea. Por lo tanto, nuestra tarea estar cumplida si logramos motivar al lector por la investigacin en otras ramas de la VA.
Introduccin
Uno de los sentidos ms importantes de los seres humanos es la visin. sta es empleada para obtener la informacin visual del entorno fsico.
De hecho, se calcula que ms de 70% de las tareas del cerebro son empleadas en el anlisis de la informacin visual. El refrn popular de Una imagen vale ms que mil palabras tiene mucho que ver con los aspectos cognitivos de la especie humana. Casi todas las disciplinas cientficas emplean medios grficos para transmitir conocimiento. Por ejemplo, en Ingeniera Electrnica se emplean esquemas de circuitos, a modo grfico, para describirlos. Se podra hacerlo mediante texto, pero para la especie humana resulta mucho ms eficiente procesar imgenes que procesar texto. La visin humana es el sentido ms desarrollado y el que menos se conoce debido a su gran complejidad. Es una actividad inconsciente y difcil de saber cmo se produce. De hecho, hoy en da, se carece de una teora que explique cmo los humanos perciben el exterior a travs de la vista.
La visin artificial est muy ligada a la inteligencia artificial aunque tambin est ligada a otras reas como son el procesamiento de la seal o el reconocimiento de patrones. Se puede afirmar que la parte del proceso ms ligada a la inteligencia artificial es el reconocimiento en s de la imagen una vez que ha sido procesada (adquisicin, segmentacin de la imagen, deteccin de contornos, ...). Un sistema de visin ha de poder distinguir qu elementos hay en la imagen; eso lleva a procesos de razonamiento, algoritmos de resolucin de problemas (habitualmente satisfaccin de restricciones), representacin del conocimiento y tareas de aprendizaje automtico. Dotar a las computadoras de la capacidad de ver no es una tarea fcil debido a: Cambios de iluminacin Cambios de escala Deformacin Oclusin Movimiento Prdida de informacin Etctera
Definicin
Aristteles: visin es saber qu hay y dnde mediante la vista". Gibson1: visin es recuperar de la informacin de los sentidos (vista) propiedades vlidas del mundo exterior." Marr2: "visin es un proceso que produce, a partir de las imgenes del mundo exterior, una descripcin que es til para el observador y que no tiene informacin irrelevante." La definicin de Marr es la que mejor describe el concepto de visin artificial.Esta definicin tiene en cuenta tres aspectos importantes: La visin es un proceso computacional. La descripcin a obtener depende del observador. Reduccin de informacin: es necesario eliminar la informacin que no sea til.
Podemos definir entonces la Visin Artificial como un campo de la Inteligencia Artificial que, mediante la utilizacin de las tcnicas adecuadas, permite la obtencin, procesamiento y anlisis de cualquier tipo de informacin especial obtenida a travs de imgenes digitales. La visin artificial la componen un conjunto de procesos destinados a realizar el anlisis de imgenes. Estos procesos son: captacin de imgenes, memorizacin de la informacin, procesado e interpretacin de los resultados. La deteccin de objetos es una tecnologa de computacin relacionada con la visin artificial y el procesamiento de imgenes, que se ocupa de la deteccin de de objetos semnticos de una clase determinada (por ejemplo, los seres humanos, edificios o coches) en imgenes digitales y videos.
1 1 2
J. J. Gibson, The Ecological Approach to Visual Perception. Boston: Houghton Miin, 1979.
D. Marr, Vision. San Francisco: Freeman, 1982
El reconocimiento de rostros y peatones, han sido dominios bien investigados. La deteccin de objetos tiene aplicaciones en muchas reas de la visin artificial, incluyendo recuperacin de imgenes y video vigilancia.
Motivacin
El hombre ha recurrido muchas veces en la construccin de artefactos, a imitar a la naturaleza. En visin artificial tambin se cumple este enunciado, siendo una cmara la encargada de imitar al ojo humano y un sistema computacional el que lleva a cabo las tareas de procesamiento - emulando al cerebro. En la actualidad y tal como se dijo anteriormente, no se conocen los mecanismos que el cerebro utiliza para obtener informacin de aquello que percibe; es capaz de forma inconsciente de determinar distancias y reconocer objetos an cuando estn rotados y con informacin parcialmente oculta. Luego es lgico pensar, que la visin artificial tambin presentar muchsimas limitaciones en cuanto a sus posibilidades, pero ha sido durante los ltimos aos una disciplina que ha colaborado intensamente en el conocimiento de nuestro propio sentido de la visin. En sus aspectos prcticos, la deteccin de objetos mediante la visin artificial es capaz de realizar actividades que al ojo humano le resultan muy dificultosas, ya que una cmara artificial puede por ejemplo utilizarse ininterrumpidamente, y puede focalizar y prestar atencin a todo aquello que percibe a la vez. Un ojo artificial tampoco presenta problemas en ilusiones pticas en las que nuestra visin nos engaa:
Por otro lado, la visin artificial tambin encuentra limitaciones en casos donde nuestra visin es capaz de desenvolverse exitosamente y en un tiempo muy corto; un ejemplo bien conocido son los captchas que se encuentran habitualmente en internet:
Si bien la visin es, de forma general, el sentido ms desarrollado que poseemos actualmente los seres humanos, se encuentra muy limitada en comparacin con otros seres vivos y con el potencial de un sistema de visin artificial. Slo basta observar el rango de amplitud que posee nuestro ojo en el espectro electromagntico para tomar conciencia de este hecho:
Mediante una cmara es posible entonces, detectar objetos que para el ser humano pasan desapercibidos, por lo que la utilidad de los sistemas de visin artificial es muy elevada. Por ltimo, una cmara posee una ventaja competitiva con respecto a una persona al estar integrada al mundo virtual. En el caso de una persona que observa algo, se requiere que l mismo sea quien introduzca la informacin mediante alguna interfaz; pero en el caso de una cmara toda la informacin fluye rpidamente a travs de los cirtuitos y redes. En relacin al contexto, el estudio de esta disciplina ha crecido sbitamente con el abaratamiento y mayor capacidad de las cmaras y las computadoras. Tambin proporcionan ventajas a los sectores corporativos, como por ejemplo reduccin de mano de obra, optimizacin de procesos, incremento en la calidad y mnimo nivel de errores y fallas.
Componentes de un sistema de visin artificial

Un sistema de visin artificial en la mayora de los casos consta de: Sistema de iluminacin: es un aspecto de vital importancia, ya que se deben proporcionar unas condiciones de iluminacin uniformes e independientes del entorno. Las variaciones en la iluminacin sern percibidas como variaciones en los objetos, por lo que debe prestarse especial atencin a este aspecto. En algunos casos este elemento ser simplemente la iluminacin ambiental. Lente de la cmara: se debe tener en cuenta la distancia de trabajo y el campo de visin necesarios. Es posible aadirle distintos filtros pticos para resaltar algn elemento segn sea necesario. Cmara(s): en la actualidad existe una variedad numerosa de posibilidades en cuanto para la eleccin de este elemento. Desde cmaras analgicas a digitales, desde cmaras lineales (producen imgenes de una sola lnea de pixeles) a cmaras bidimensionales y desde cmaras simples hasta cmaras inteligentes (aquellas que poseen microprocesadores y permiten realizar todo el procesamiento y edicin de imgenes sin necesidad de una computadora). Su tamao y resolucin depender del contexto para el que se plantea el sistema de visin artificial. Tarjeta de captura de imgenes: es la interfaz entre el lente y la computadora o mdulo de proceso (en cmaras inteligentes) que permite al mismo tiempo disponer de la informacin capturada por el sensor de imagen. La imagen de entrada -una matriz bidimensional de niveles energticos - se divide en pxeles. Estos forman filas y columnas que abarcan toda la zona de la imagen y representan los niveles de gris en una imagen monocromtica o la codificacin de color en una imagen en color. Algoritmos de anlisis de imgenes: es la parte inteligente del sistema; su misin consiste en aplicar las necesarias transformaciones y extracciones de informacin de las imgenes capturadas, con el fin de obtener los resultados para los que haya sido diseado. Interfaz de salida de resultados: existen muchas posibilidades para volcar los resultados del anlisis de las imgenes, y el escogido depender del objetivo a cumplir, y las necesidades de informacin. 10
11
Funcionamiento de la deteccin de objetos

En los sistemas de visin artificial se encuentran diversas funcionalidades bsicas que son comunes a todos ellos, estas son: Adquisicin de Imagen Pre-procesamiento Extraccin de Caractersticas Deteccin / Segmentacin Procesamiento de Alto Nivel Toma de Decisiones
A continuacin, se especificar cada uno de ellos:
Adquisicin de imagen
En esta etapa, se utilizan diversos dispositivos o sensores para obtener las imgenes digitales, entre los que se pueden nombrar: cmaras digitales, cmaras ultrasnicas, radares, tomgrafos, etc. Dependiendo del tipo de herramienta utilizada, se obtendrn resultados 2D, 3D o secuencias de imgenes.
Preprocesamiento
En el nivel de escala de grises, el procesamiento de imgenes confunde mucha informacin fsica til. Con respecto a esto, el procesamiento de imgenes es una coleccin de transformaciones degenerativas. Sin embargo, dicha informacin no est totalmente perdida, ya que hay mucha redundancia espacial: Pixeles vecinos tienen similares sino los mismos 12
parmetros fsicos. Por lo tanto, existen un conjunto de tcnicas, denominadas de preprocesamiento, que explotan dicha redundancia para deshacer esas degeneraciones producidas al procesar la imagen. Luego de aplicarlas, se obtendrn las llamadas imgenes parmetro o imgenes intrnsecas, las cuales reflejarn las propiedades espaciales de la escena capturada. Algunos parmetros intrnsecos comunes son: discontinuidades en la superficie, distancias, orientacin de la superficie y velocidad. Existen seis categoras principales de tcnicas de preprocesamiento: Filtrado: Es un nombre genrico para las tcnicas en que varan el nivel de grises de la imagen para mejorar la apariencia de objetos. Generalmente, significa aplicar transformaciones que hagan ms prominente la intensidad de las discontinuidades entre regiones. Estas transformaciones tambin son dependientes de las caractersticas principales de los objetos. Por ejemplo, si se espera que los objetos de inters sean relativamente grandes, se puede hacer borrosa la imagen para borrar las pequeas discontinuidades de intensidad, manteniendo las del borde del objeto. Operadores de Bordes: Detectan y miden discontinuidades locales en intensidad o su gradiente. Usualmente, el resultado es la magnitud u orientacin de dicha discontinuidad. Transformacin de Distancias: Utiliza geometra conocida de las imgenes estereo3 para inferir las distancias desde el punto de vista del observador. Estas transformaciones hacen uso de la transformada de perspectiva inversa para interpretar cmo los puntos en un espacio tridimensional se proyectan en pares estreo. La correspondencia entre puntos de dos imgenes estreo de geometra conocida determina la distancia entre dichos puntos. Orientacin de Superficie: Puede ser calculado si la fuente de iluminacin y las propiedades de reflectancia de la superficie son conocidas. Tambin llamado Forma desde sombras, puede ser fcilmente calculado cuando la fuente de iluminacin puede ser controlada. Flujo ptico: Tambin denominado campos de velocidad de puntos de imagen, puede ser calculado desde variaciones locales, temporales y espaciales en secuencias de niveles de gris de imgenes. Pirmide: Es una estructura general para representar copias de la imagen en mltiples resoluciones. La misma es utilizada para mejorar drsticamente la velocidad y efectividad de muchos algoritmos de preprocesamiento y de segmentacin.
Imgenes estreo (Stereoimaging) es un trmino de la jerga del audio utilizado para referirse al grabado y reproduccin de sonido respecto a localizacin espacial de la(s) fuente(s) del sonido, tanto lateralmente como en profundidad.
13
Extraccin de Caractersticas
El concepto de reconocimiento de caractersticas de una imagen refiere a mtodos que apuntan a abstracciones computacionales de la informacin de la imagen y a la toma de decisiones locales de una imagen por cada punto de la misma y verificar si hay o no una caracterstica de un determinado tipo en dicho punto. No hay un fuerte consenso en lo que refiere a la definicin de caracterstica de una imagen, ya que depende del problema que se est abordando. Por lo que una aproximacin a su definicin generalizada sera: una caracterstica es una parte interesante de la imagen y las mismas son utilizadas como base en distintos algoritmos de la visin artificial. Como tipos de caractersticas de imagen principales se pueden nombrar: Borde: Se define como puntos donde hay un lmite o borde entre dos regiones de la imagen. Otra definicin, aunque ms tcnica, conjunto de puntos de la imagen que presentan una alta magnitud de gradiente. Adems, presentaunaestructura local unidimensional. Esquina / Punto de Inters: Trminos utilizados indistintamente para denotar puntos de la imagen que poseen una estructura local bidimensional. Los mismos son detectados mediante el anlisis de la curvatura que presenta el gradiente en determinadas zonas de la imagen. Mancha / Regin de Inters: Describe partes de la estructura de la imagen como regiones, a diferencia de las esquinas que la presenta como una estructura tipo punto. Cresta: En objetos alargados es fundamental la deteccin de este tipo de caractersticas. Desde un punto de vista prctico, puede ser definido como una curva unidimensional que representa un eje de simetra. Para una mejor idea se puede decir que se asemeja a la forma de una montaa.
Deteccin / Segmentacin
La segmentacin consiste en detectar un coherente rasgo unidimensional (borde) de varios elementos de bordes locales e individuales. Este rasgo puede corresponder a los lmites del objeto o a cualquier lmite significativo entre entidades de la escena. Un ejemplo de lo que se debe enfrentar mediante este procedimiento es el de la siguiente figura en el cual se utiliza un operador para congregar los bordes locales de una radiografa de pecho.
14
Los mtodos que se presentan a continuacin estn ordenados de acuerdo a la cantidad de conocimiento incorporado en la operacin de agrupamiento que mapea los elementos de borde en lmites. En este contexto, se denomina conocimiento a las restricciones implcitas o explcitas de la probabilidad de un agrupamiento dado. Las mismas pueden proceder de argumentos fsicos generales o, generalmente, de fuertes restricciones que estn en la imagen y corresponden a consideraciones dependientes del dominio en cuestin. Si hay mucho conocimiento, implica que la forma global del lmite y su relacin a otras estructuras de imagen est muy acotada. Poco conocimiento implica que la segmentacin debe proceder ms en la base de pistas locales, evidencias y asunciones generales con pocas expectativas y restricciones en el resultado del lmite final, por lo que no ser tan preciso como el anterior. Estas restricciones toman diversas formas. Adems, el conocimiento de dnde esperar un lmite permite bsquedas mucho ms rpidas y precisas para verificar el borde. En muchos casos, el conocimiento del dominio determina el tipo de curva (tanto su parametrizacin o su forma funcional) como el proceso de ruido relevante. Siguiendo con el ejemplo de la radiografa de pecho, los lmites de las costillas humanas aparecen aproximadamente como secciones cnicas en dichas imgenes, aunque las radiografas tienen estructuras de bordes complejas que compiten con las costillas, todo este conocimiento especfico puede y debe guiar la eleccin del mtodo de agrupamiento. Los mtodos principales que se utilizan para realizar este procedimiento son: Bsqueda cerca de una ubicacin aproximada: Estos mtodos refinan un lmite dada una estimacin inicial. Esto es, si una aproximacin o una probable ubicacin de un lmite se ha determinado a priori, puede ser utilizado para guiar el trabajo de definir dicho lmite. La ubicacin aproximada puede ser encontrada utilizando algunos mtodos que funcionan sobre imgenes de poca resolucin o utilizando una gran cantidad de conocimiento. 15
Una de las tcnicas utilizadas, denominada Ajuste de lmites a priori, realiza bsquedas locales a intervalos regulares a lo largo de direcciones perpendiculares al lmite aproximado (a priori). Un operador de borde es aplicado a cada uno de los puntos discretos a lo largo de cada una de estas direcciones perpendiculares. Para cada una de estas direcciones, el borde con la mayor magnitud es seleccionado entre los que sus orientaciones son casi paralelas a la tangente en el punto de la cercana del lmite a priori. Si la cantidad de elementos suficientes son encontrados, entonces se puede aproximar su ubicacin por medio de una curva analtica como una polinomial de bajo grado, siendo finalmente esta curva la representacin del lmite. La transformada de Hough: Se utiliza para detectar lmites cuya forma puede ser descrita mediante una curva paramtrica (por ejemplo, lneas rectas o cnicas). Sus ventajas principales son que es insignificantemente afectada por huecos en las curvas y por ruido en la imagen. Considerando el problema de detectar lneas rectas y suponiendo que por algn mtodo se han seleccionado puntos de la imagen de tal manera que sea muy probable obtener lmites lineales, la transformada de Hough organiza estos puntos en lneas rectas, bsicamente examinando todas las posibles lneas rectas y puntundolas segn qu tan bien se adecuen a los datos de la imagen.
Bsqueda por grafo: Representa los elementos de borde como un grafo, ya que un lmite es un camino a travs del grafo. Como la transformada de Hough, estas tcnicas se aplican generalmente. Los arcos entre los nodos del grafo tienen costos o pesos asociados a los mismos, por lo que la bsqueda del lmite de un objeto queda sujeta a la bsqueda del camino de menor costo de dos nodos del grafo ponderado.
16
Por medio de un operador gradiente aplicado a la imagen, se tiene como resultado la magnitud de imagen s(x) y la direccin de la imagen (x). Luego se interpretan los elementos con direccin de imagen (x) (ver imagen a) como nodos en el grafo, cada uno con un factor de ponderacin s(x). Los nodos xi, xj tienen arcos entre ellos si las direcciones del contorno (xi), (xj) estn apropiadamente alineadas con el arco dirigido en el mismo sentido que la direccin del contorno (ver imagen b). Finalmente, suponiendo que el camino sigue contornos que estn dirigidos de un nodo xA a otro xB, se tiene un mtodo para generar los nodos sucesores de un nodo dado y se tiene una funcin de evaluacin f(xj) que da como resultado una estimacin del costo ptimo del camino desde xA a xB restringido a pasar por algn nodo xj; se utiliza un algoritmo de bsqueda, por ejemplo el Algoritmo A, para encontrar dicho camino y, por ende, obtener el contorno / lmite delimitado por el mismo. Programacin dinmica: Tambin un mtodo muy general, utiliza formulaciones matemticas del mejor lmite global y puede buscar lmites en imgenes ruidosas. Esta tcnica se utiliza para resolver problemas de optimizacin cuando no todas las variables en la funcin de evaluacin estn interrelacionadas simultneamente. Para esto se debe definir una funcin de evaluacin que exprese la nocin del mejor lmite. Adems, debido a los conceptos de programacin dinmica, se debe poder descomponer el problema en subproblemas donde se obtiene la solucin ptima a cada uno de dichos problemas para luego poder resolver el problema original conjuntamente.
17
Seguimiento del contorno: Esta tcnica de escalada de montaas funciona mejor mientras mejor datos de la imagen se tenga. Asimismo, si nada es sabido acerca de la forma del contorno, pero algunas regiones representativas han sido encontradas en la imagen, dicho contorno puede ser recobrado por una de las operaciones ms simples de seguimiento de bordes en imgenes: Buscador de manchas. Esto se simplifica an ms con imgenes binarias. Dada una imagen binaria, el objetivo es encontrar los contornos que delimitan distintas regiones de la imagen. Esto se logra fcilmente segn el siguiente procedimiento: o o Escanear la imagen hasta que un pxel de regin4 sea encontrado. Si es un pxel de regin, moverse hacia la izquierda y escalonar (trasladarse hacia arriba o abajo segn se requiera); sino, moverse hacia la derecha y escalonar. o Si se est sobre el pxel inicial terminar; sino volver al paso anterior.
Pxel de regin, es un pxel que comparte propiedades similares a los de una regin de la imagen.
18
Procesamiento de Alto Nivel

Luego de la segmentacin, se tiene como entrada un pequeo conjunto de datos, por ejemplo un conjunto de puntos o una regin que se supone contiene un objeto; los cuales se someten a este procedimiento, el cual se enfrenta principalmente a: Verificar que los datos de entrada cumplen con los requerimientos y suposiciones del modelo Estimacin de los parmetros especficos de la aplicacin, como el tamao del objeto y la postura del mismo (posicin, rotacin, entre otros) Reconocimiento de Imagen, elementalmente se trata de clasificar los objetos detectados a su categora correspondiente y, adems reconocer de qu objeto se trata. Para los humanos esta tarea se realiza sin esfuerzo alguno, pero la visin artificial sigue teniendo problemas a la hora de detectarlos en determinadas condiciones. Existen distintos tipos de Reconocimiento: Reconocimiento de objetos: Se tienen especificados o aprendidos Identificacin: una instancia individual de un objeto es reconocida, por Deteccin: Los datos son analizados para encontrar una determinada previamente objetos o clases de objetos que pueden ser reconocidas. ejemplo una cara o huella digital especfica o un auto en particular. condicin en la imagen. Variados ejemplos son encontrados en el mbito medicinal, por ejemplo la deteccin de clulas o tejidos anormales. Luego de ser reconocidos, se continuar con su posterior anlisis, y as producir, mediante tcnicas computacionales ms especficas, su correcta interpretacin.
Registracin de Imagen, cuya tarea fundamental es encontrar la relacin entre dos imgenes tomadas, por ejemplo, en distintos en diferentes momentos, por distintos sensores, o puntos de vista. Ejemplos especficos, en los que el uso de esta tcnica es esencial, son: relacionar un objetivo con una imagen en tiempo real tomada para reconocimiento de objetivos, monitorizacin del uso global de la tierra utilizando imgenes satelitales, alineacin de imgenes de distintas modalidades mdicas para su diagnosis, entre otros. Para poder realizar esta tarea se utilizan distintas tcnicas segn las variaciones que presente la imagen. Se pueden distinguir tres grandes grupos de ellas: El primer tipo de variacin es debida a las diferentes formas en las que se adquiere la imagen y, por ende, causa una desalineacin entre las imgenes evaluadas. Para resolverlo se realizan transformaciones espaciales dentro de las mismas. El segundo tipo es similar a la primera, pero en este caso no es tan fcil su modelado, por ejemplo luminosidad y condiciones atmosfricas. Las del ltimo tipo son diferencias especficas dentro de la imagen en los objetos de inters, es decir, 19
movimientos, tamaos u otros cambios de la escena. Las variaciones de segundo y tercer tipo, usualmente no pueden ser completamente removidas por esta tcnica, adems es recomendable que no se haga con las de tercer tipo ya que se necesita dicha informacin en algunos sistemas para anlisis posterior que de otra manera sera borrada5.
Toma de decisiones
Finalmente, uno de los pasos ms importantes en la deteccin del objeto, ya que de nada sirve realizar todo este trabajo sino se tiene un fin o problema a resolver. En esta etapa, donde ya se tiene una considerable cantidad de informacin sobre la imagen estudiada, llega la hora de la toma de decisiones, esto es por ejemplo: aprobar o desaprobar inspecciones automticamente mediante una aplicacin, que el sistema indique si reconoce o no en aplicaciones de reconocimiento (facial, dactilar, etc.); y en otros casos, dejar asentado dicho caso para futura revisin humana ya que no son suficientes los datos adquiridos como para tomar la decisin definitiva, dado ejemplos en las aplicaciones medicinales como las militares, de seguridad y de reconocimiento.
Brown, Lisa Gottesfeld (1992). A survey of image registration techniques.Abstract. Universidad de Columbia, New York, EEUU. http://dl.acm.org/citation.cfm?id=146374. Recursoconsultado el da 30-09-2013 20
Aplicaciones
La visin artificial an no ha alcanzado un nivel de madurez que la ubique a la par de otras ramas de la inteligencia artificial, pero eso no significa que no est siendo utilizada fuera del campo cientfico. Son numerosas las reas que hacen uso de las ventajas que esta disciplina ofrece en comparacin con los mtodos utilizados en el pasado. A continuacin se presentan algunos ejemplos:
Adems de los mencionados, existen otras reas de aplicacin de la deteccin de objetos: Identificacin biomtrica: este uso es quizs uno de los ms extendidos en el mundo junto con la deteccin de matrculas de automviles; comprende la identificacin mediante huellas dactilares, iris, pisadas. Control automatizado de stock: al existir la posibilidad de identificar los artculos y montar una cmara en un robot, es posible que la organizacin, mantenimiento y control del stock sea manejado de forma automatizada. Marketing - publicidad: con la expansin de los dispositivos mviles, el nmero de personas que posee una cmara en su bolsillo durante todo el tiempo es increblemente elevado. Al enfocar con el lente a un determinado objeto que existe en la realidad y
21
reconocerlo, es posible aadir comportamiento e informacin sobre el mismo de forma que pueda ser visible en la pantalla. Bsqueda por imgenes: esta funcin se encuentra implementada en los grandes buscadores existentes en la web (Google, Bing). Mediante el reconocimiento de objetos y caractersticas dentro de las imgenes, se produce una bsqueda que brinda resultados de utilidad para el usuario. Traduccin automtica: existen aplicaciones en el mercado que permiten, a partir de una imagen (fotografa), traducir el texto que se encuentre en ella a cualquier otro idioma. Para sto se utilizan las tcnicas de deteccin antes descritas y luego se efecta la traduccin de lenguaje. Ayuda a la conduccin: la deteccin de vehculos y objetos de inters para el trnsito (accidentes, animales en el camino, etctera) es de gran importancia para un sistema de transporte inteligente. Existen ciudades en todo el mundo que han incorporado sistemas de semforos inteligentes que, mediante la deteccin de la densidad de trfico existente, ajustan sus parmetros. Videojuegos: la industria del entretenimiento se encuentra hace aos sosteniendo un crecimiento elevado, motivado por la constante innovacin e incorporacin de tecnologas provenientes de otros sectores. Sin dudas la inteligencia artificial es una de las disciplinas que ms contribuyen, y as tambin lo es la visin artificial. La deteccin de objetos provee nuevas posibilidades de interaccin para los usuarios, que disfrutan de videojuegos cada vez ms realistas, y en los que ellos son realmente los protagonistas. Como puede observarse, los campos de aplicacin de esta disciplina son amplios y variados. Donde se presentan los mayores avances es, en los contextos en los que el ojo humano no es efectivo o donde la precisin es un factor determinante. Con el advenimiento de las tecnologas mviles es de esperarse que nuevos usos y tecnologas aparezcan en escena.
22
Conclusin
Tras finalizar la investigacin y el informe sobre el tema, hemos comprendido que la visin artificial se encuentra en los comienzos de un gran crecimiento y expansin, principalmente inspirado por las facilidades que el contexto otorga, con precios cada vez ms accesibles y tecnologas cada vez ms poderosas. La deteccin de objetos mediante visin artificial, se enfrenta al igual que otros campos tecnolgicos, al dilema privacidad vs. innovacin. Detectar objetos o personas en el mundo real es una herramienta poderosa y sin precedentes en la humanidad, que puede ser utilizada con distintos fines.
Avin del ejrcito estadounidense (Dron)
Robot cirujano (Da Vinci)
Lo que desde nuestro punto de vista quisiramos resaltar es que no se trata de una posibilidad, de un futuro esperable o de una visin futurista. Las aplicaciones de la inteligencia artificial son una realidad hoy en da, y la proliferacin de la visin artificial es algo de lo que seremos testigos en nuestras vidas. Hemos comprendido que las computadoras no necesitan ver las cosas de la misma forma que los seres humanos para identificar elementos y realizar sus objetivos. Tambin son superiores y ms eficientes en muchos aspectos. Una vez ms, como sucede en muchos otros campos de innovacin cientfica y tecnolgica, como futuros ingenieros en sistemas de informacin podemos estar al margen o acompaar los avances y el cambio que esta disciplina propone.
23
Bibliografa
1. Asignatura de grficos en computacin (2010). Visin artificial e interaccin sin mandos. Universidade da Corua. http://sabia.tic.udc.es/gc/Contenidos%20adicionales/trabajos/3D/VisionArtificial/index.ht ml. Recurso consultado el da 29-09-2013. 2. Ballard, D. - Brown, C (1982). Computer Vision. New Jersey: Prentice Hall. 3. Brown, Lisa Gottesfeld (1992). A survey of image registration techniques. Universidad de Columbia, New York, EEUU. http://dl.acm.org/citation.cfm?id=146374. Recursoconsultado el da 30-09-2013. 4. Fernndez Garca, Nicols Luis (2011). Introduccin a la visin artificial. Universidad de Crdoba. http://www.uco.es/users/ma1fegan/2011-2012/vision/Temas/Visionartificial.pdf. Recurso consultado el da 24-09-2013. 5. Platero Dueas, Carlos (2009). Introduccin a la visin artificial. Departamento de electrnica, automtica e informtica industrial. http://www.elai.upm.es/webantigua/spain/Asignaturas/MIP_VisionArtificial/ApuntesVA/ca p1IntroVA.pdf. Recurso consultado el da 24-09-2013. 6. Rodrguez Arajo, Jorge (2011). Introduccin a los sistemas de visin artificial. http://es.scribd.com/doc/8343510/Vision-Artificial. Recursoconsultado el da 24-09-2013. 7. http://www.etitudela.com/celula/downloads/visionartificial.pdf. Recurso consultado el da 24-09-2013.
24

IA - Trabajo Práctico 5 - Visión Artificial

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

IA - Trabajo Práctico 5 - Visión Artificial

Caricato da

Copyright:

Formati disponibili

Inteligencia Artificial

TP 5: Deteccin de Objetos mediante Visin Artificial

D. Marr, Vision. San Francisco: Freeman, 1982

Componentes de un sistema de visin artificial

Funcionamiento de la deteccin de objetos

A continuacin, se especificar cada uno de ellos:

Procesamiento de Alto Nivel

Avin del ejrcito estadounidense (Dron)

Robot cirujano (Da Vinci)

Potrebbero piacerti anche