Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
PROYECTO DE TESIS
DISEO E IMPLEMENTACION DE UN SISTEMA PARA DETECTAR OBJETOS EN MOVIMIENTO UTILIZANDO ALGORITMOS DE TRATAMIENTO DIGITAL DE IMAGENES
PRESENTADA POR: LUIS PAZ RUMICHE ASESORADO POR: ARTURO SANDOVAL RIVERA
Piura, 2013
1. INTRODUCCIN
En la actualidad, el reconocimiento de imgenes es una herramienta de gran utilidad en el rea de control (Seguridad Video Vigilancia) y automatizacin en procesos industriales o de produccin. En el presente proyecto, titulado Tracking Object basada en comparacin de objetos y alerta empleando un dispositivo de sonido, se propone resolver el problema de identificar objetos nuevos, de un escenario predefinido y avisar de esta anomala, a travs de una imagen, desde el servidor donde se encuentra la aplicacin hasta una maquina remota encargada de la vigilancia, la imagen enviada sealara la ubicacin del objeto extrao en el escenario enmarcada con color verde claro sealando la ubicacin.
Un aspecto importante del sistema de video vigilancia es la gestin de video para la visualizacin, grabacin, reproduccin y almacenamiento en directo.
El avance hacia los sistemas de video, combinados con los beneficios de las Imgenes digitales a travs de cmaras inteligentes, constituye un medio de vigilancia, seguridad y monitorizacin remota mucho ms efectivo que los conseguidos hasta el momento
Por otro lado los algoritmos y las tcnicas de optimizacin que han tenido que desarrollarse para el procesamiento digital de imgenes son muy sofisticados y elaborados. Una de las tcnicas para capturar el movimiento es realizando diferencias entre las imgenes.
2. PROBLEMA DE FORMULACIN
INVESTIGACIN:
DESCRIPCIN
2.1. DESCRIPCIN DEL PROBLEMA En la actualidad la mayora de sistemas de vigilancia electrnica emplean sistemas que monitorean la zona a vigilar, grabando en video todos los sucesos ocurridos, para que luego un operario informe sobre anomalas en el proceso.
Lastimosamente esto es una desventaja al momento de tomar una accin con un retraso en el manejo de la seguridad.
Esto se puede solucionar utilizando sistemas de procesamiento automatizados como el propuesto en esta investigacin, ya que a medida que ocurren diversos sucesos en un rea X a monitorear, esto va siendo procesado y almacenado en una base de datos y porque no enviado a travs de algn servicio web o mediante un operador telefnico hacia un cliente o el operador del sistema en la comodidad de su oficina u hogar.
Como la implementacin del sistema de deteccin de objetos en movimiento empleando algoritmos de tdi lograra un buen reconocimiento de imgenes sin la ayuda de sensores electrnicos.
IMPORTANCIA
BENEFICIARIOS
DE
LA
Actualmente la mayora de dispositivos de vigilancia electrnica basados especficamente en monitoreo de imgenes digitales son en s demasiado costosos para alguien que desea mantener la seguridad de su negocio. Esto se debe a que estos dispositivos emplean sensores electrnicos y estos son costosos.
Importancia:
Un sistema de Video Vigilancia es importante para mantener la seguridad e integridad de la privacidad, su utilidad tambin se manifiesta en los procesos de produccin y control de la calidad como la separacin de objetos defectuosos en el caso de que no cumplan con las medidas estandarizadas para el producto en el proceso.
Beneficiarios:
El proyecto nace en parte para apoyar a las pequeas empresas o para la seguridad domestica en caso de riesgo a robos. Debido a su bajo costo de implementacin ya que el sistema funciona con una simple cmara de video, pero para mejorar la performance se necesitara una cmara con mejor resolucin.
Desarrollar e Implementar una aplicacin de Video vigilancia, basada en Procesamiento de imgenes, y que en tiempo real capture objetos ajenos a un escenario por medio de un dispositivo de cmara digital y que emita un mensaje de alarma y a su vez avise al encargado de la seguridad de que algo malo ocurre en las instalaciones.
4.2. OBJETIVOS ESPECFICOS Desarrollar el Algoritmo para la deteccin del objeto en movimiento con ayuda de los algoritmos de TDI.
Realizar un tratamiento inteligente de las imgenes recibidas en el ordenador para as analizar y reconocer los objetos en ella.
Diseo y desarrollo de los algoritmos de procesamiento digital de imgenes para reconocer formas en el servidor.
5. MARCO TERICO
5.1. MARCO TEORICO 5.1.1. Captura de ptica de movimiento por substraccin de video En el campo de la captura de movimiento (Motion Capture) las tcnicas de substraccin de video, son una de las ms sencillas. Esta tcnica consiste en tomar una imagen de la escena sin movimiento, a la que llamaremos fondo, y a partir de ah, restrsela a cada nueva imagen capturada en la escena.
Se realiza, en el flujo de video que proviene de la cmara, una substraccin entre cada fotograma y el fotograma de referencia, el fondo (figura 1). Esta resta se realiza operando pxel por pxel, de una de estas imgenes, con sus respectivos pxeles de la otra imagen. Cuando los pxeles de una y otra imagen coinciden, la substraccin entre valores idnticos resulta cero, lo que traducido a color es el negro (cero luz, o falta total de luz); y en el caso contrario aparecen otros tonos. De esta forma, es fcil descubrir los pxeles que cambiaron entre los dos fotogramas (el actual y el fondo), dado que adoptan tonos diferentes al negro y de ah que los movimientos que se realicen frente a la cmara queden distinguidos de entre un fondo negro.
Este tipo de captura es muy sencilla, dado que no requiere que el sujeto del movimiento est intervenido de ninguna forma; es decir, por ejemplo, si se quiere capturar el movimiento de una persona, no requiere que se lo coloque nada a la persona, ni trajes especiales, ni sensores. La captura se realiza por simple comparacin de imgenes. Esto, que en principio es una ventaja, tiene como desventaja el hacer a esta tcnica muy sensible a los cambios de iluminacin. Dado que el criterio es considerar equivalentes el cambio de imagen a la existencia de movimiento, cualquier cambio en la imagen es automticamente tomado por un movimiento.
Las dos fuentes ms comunes de errores en este tipo de captura, son los cambios de iluminacin y los movimientos de cmara. Por ejemplo, si se utiliza una tcnica de este tipo, en un espacio donde ingresa luz natural, es probable que los
cambios de iluminacin de las diferentes horas del da generen problemas. Otro problema posible, es cuando la cmara sufre algn tipo de movimiento, por ejemplo,
por un leve golpe o alguna vibracin del piso. Cualquiera de estas dos cosas, podra hacer, en algunos casos, que la tcnica deje de ser efectiva y capte movimiento donde no lo hay.
Otro de los problemas que existen, es que este sistema requiere un buen contraste en la imagen que obtiene la cmara, dado que es necesario aplicar un filtro para distinguir entre cambios de imagen y ruido de la cmara o la iluminacin. Por esto, es un sistema que requiere un buen nivel de luz para funcionar correctamente. Esto a veces complica la situacin a la hora de querer trabajar con captura de movimiento en lugares donde se realizan proyecciones de video y que requieren penumbra u oscuridad. Sin embargo esto se puede solucionar con la utilizacin de cmaras y luces infrarrojas.
Es muy sensible a las condiciones de luz y alteracin de la imagen en general (como Los movimientos de cmara). Sirve para captar la silueta del Objeto en movimiento.
Si bien en un principio responde igual que la SIR, rpidamente se estabiliza, lo que los hace un Mtodo bastante seguro. No sirve para captar la silueta, sino la diferencia de movimiento entre Fotogramas.
Si hay algn cambio de iluminacin o movimiento de cmara, el mtodo deja de Funcionar. Sirve para captar presencia
5.2. MARCO CONCEPTUAL Para el desarrollo de esta investigacin es fundamental conocer ciertos trminos que sern usados para su desarrollo. COMPONENTES DE UN SISTEMA DE VISIN:
El buen desempeo de un sistema de visin depende en gran parte de sus componentes que lo forman, existiendo 6 partes primordiales para que el sistema funcione adecuadamente.
Segmentacin: Es el proceso que divide a un imagen en objetos que sean de nuestro inters.
Descripcin: Es el proceso mediante el cual se obtienen caractersticas convenientes para diferenciar un tipo de objeto de otro, por ejemplo tamao y forma.
La imagen es divida en una matriz de 3x3, inicialmente se desarrolla este tipo de segmentacin, para disminuir problemas de confusin de piezas. Normalmente este uso se segmentacin en clulas acumulativas se implementa en algoritmos bsicos de segmentacin de tipo similitud como es la transformada de Hough. El tipo de segmentacin utilizado es Segmentacin General.
La idea principal de Obtener Caractersticas por Color es sacar datos relevantes en formato RGB de objetos, para crear caractersticas que puedan ser utilizadas por otros procesos para llegar a un resultado.
Por la naturaleza de la captura de la imagen, se trabaja en formato RGB, por lo cual se trabaja con un formato sensorial en lugar del un formato de percepcin como el HSI.
Adems se pueden aplicar las mismas tcnicas que se utilizan en imgenes monocromticas. Para esto se toma cada componente (R, G, B) como una imagen monocromtica y se aplica algn operador o mtodo a cada una independientemente.
Modelo Sensorial
El modelo RGB es el modelo bsico que utiliza las componentes primarias rojo, verde y azul, normalizadas. En este modelo se basan las cmaras y receptores de televisin. Sin embargo se tienen problemas al aplicarlo al procesamiento de imgenes (ecualizacin).
Modelo Perceptual.
Modelo HSI (Hue, Saturation, Intensity) se puede ver como una transformacin del espacio RGB al espacio perceptual. En principio los modelos perceptales deben ser mejores ya que nosotros detectamos los cambios en estas componentes. Sin embargo, es compleja la implementacin de la deteccin de orillas en croma por no ser lineal.
Otra alternativa es definir tcnicas especiales para deteccin de orillas en imgenes a color.
El procesamiento de imgenes a color es relativamente reciente, por los altos requerimientos de memoria y cmputo necesarios.
Los contornos caracterizan los lmites de un objeto. Un contorno se caracteriza por presentar una transicin de claro a oscuro o viceversa. Por esto se presenta un mtodo para detectar bordes como Sobel.
Sobel
Una plantilla detecta contornos horizontales y la otra verticales, obteniendo dos imgenes de gradientes Ig1,Ig2. Para determinar si en un pxel determinado hay un contorno o no, se define un umbral a partir del cual se considera la existencia de contorno:
Una forma alternativa para calcular el borde de objetos en imgenes en color, es hacer una transformacin de formato RGB a HSI, y aplicar cualquier mtodo matemtico estadstico para la deteccin de bordes, como Sobel o Robert, sin embargo se aplica a cada componente de color HSI, y despus se combinan todas las orillas detectadas, considerando normalmente el mximo o promedio.
La intensidad (I) y saturacin (S) estn normalizada (entre cero y uno) y el croma (H) est entre 0 y 360 grados.
Cualquier color visible al ojo humano puede representarse de esta manera. Por ejemplo el color negro se codifica como R=0, V=0, A=0 y el color blanco (R, V, A) = (255, 255,255). Desde este punto de vista, una imagen es un arreglo bidimensional de pixeles cada uno codificado en 3 bytes que puede tener 256x256x256=16.8 millones de diferentes colores.
Esta tcnica se conoce como codificacin RGB y est adaptada a la visin humana. Sin embargo hay otras tcnicas de codificacin donde las cmaras o dispositivos de medicin juegan un papel predominante.
El rango de 0 a 255 se acord por dos razones. La primera debido a que el ojo humano no es lo suficientemente sensible como para diferenciar ms de 256 niveles de intensidad para un color y por otro lado es la capacidad de almacenamiento para un byte desde el punto de vista de la computacin.
Bajo esta interpretacin pueden aplicarse algunos conceptos de la geometra analtica en el tratamiento de colores y en la generacin de filtros o transformaciones.
Una imagen es una codificacin en un dominio espacial bidimensional esttico y esto nos permite que podamos contar con nuevas imgenes a partir de las originales sin tener que modificarlas haciendo uso de transformaciones o filtros aplicados a sus pixeles.
Si consideramos una imagen con resolucin de 512 x 384 pixeles, su almacenamiento sin compresin ser en 590Kbytes y otra de 2592 x 1728 pixeles estar almacenada en 13.4Mbytes. Con tcnicas de compresin, esta ltima puede almacenarse en un archivo de 2.9Mbytes. Para las transformaciones y filtros que aplicaremos estaremos tratando con las imgenes, con esos espacios bidimensionales, que difieren mucho de los diferentes formatos de archivos en que las podemos almacenar en un disco duro por ejemplo.
Deteccin de orillas
De lo mencionado en prrafos anteriores, podemos cuantificar la diferencia entre dos colores calculando la distancia geomtrica entre los vectores que los representan.
Consideremos dos colores C1 = (R1, G1, B1) y C2 = (R2, G2, B2), la distancia entre ellos est dada por la frmula:
El objetivo en la deteccin de orillas es determinar las orillas de las formas en una imagen y ser capaz de dibujar un bitmap resultante donde las orillas estn en blanco sobre un fondo negro. La idea es muy sencilla, nos desplazamos por la imagen pixel por pixel comparando el color de cada uno con su vecino de la derecha y de abajo. Si alguna de estas comparaciones resulta en una diferencia muy grande el pixel estudiado es parte
Entonces:
El mayor valor que puede tomar esta expresin es 255 v3 y como debemos cuidar que la magnitud de esta expresin nunca rebase 255 debemos multiplicando por 1/ 3 normalizarla
As:
Teniendo esto en mente, haremos un mtodo para recorrer todos los pixeles de una imagen para generar su componente gris.
Comprob que existen principalmente dos formas diferentes para resolver el problema: los mtodos basados en alinear las imgenes frente a los mtodos que detectan el movimiento directamente en la secuencia.
Eligi el mtodo de deshacer el movimiento de la cmara para detectar en fases posteriores a travs de tcnicas de segmentacin para cmaras estticas y tracking los objetos que aparecan en la secuencia.
Este mtodo fue el elegido para resolver el problema en lugar de utilizar los mtodos basados en ujo ptico ms vulnerables al ruido y con mayor coste computacional.
6. HIPOTESIS
Se puede mejorar la captura de objetos utilizando adems de los algoritmos de TDI, algunos algoritmos y mtodos estadsticos que manejen probabilidades de incidencias de un objeto en un escenario.
Educativa Scrates definiremos las siguientes variables tanto cualitativas como cuantitativas para el uso del anlisis y desarrollo de la investigacin.
Eficacia de Seguimiento.
Permanencia del Valor de las Coordenadas. Seguimiento del Objeto, sin perder la concentridad de la imagen de salida.
Tiempo de Respuesta.
Pixeles.
Numero de Pixeles.
dimensionalidad de un grupo de datos, es que retiene aquellas caractersticas del conjunto de datos que contribuyen ms a su varianza, manteniendo un orden de bajo nivel de los componentes principales e ignorando los de alto nivel.
Diseo no experimental Se Diseara e Implementara un Sistema para la deteccin de objetos en movimiento basado en algoritmos de tratamiento digital de imgenes, utilizando mtodos analticos como estadsticos, siendo estos ltimos los mas ptimos para esta implementacin, esta investigacin utiliza como base algunas implementaciones y conclusiones planteadas por otros autores como resultado de una ardua investigacin. Pero en este caso se utilizara como entorno de desarrollo JAVA , utilizando su api para la manipulacin de informacin multimedia JAVA MEDIA FRAMEWORK.
8. CRONOGRAMA
ABRIL MESES MAYO JUNIO JULIO AGOSTO Septiembre
ACTIVIDADES Entrega del Anteproyecto Bsqueda de Apoyo tcnico Investigacin de Algoritmos sobre imgenes Informacin sobre el Manejo de JMF Diseo de la propuesta Redaccin del informe Presentacin del trabajo final