Sei sulla pagina 1di 25

UNIVERSIDAD NACIONAL DE PIURA

FACULTAD DE INGENIERA INDUSTRIAL ESCUELA PROFESIONAL DE INGENIERA INFORMTICA

PROYECTO DE TESIS

DISEO E IMPLEMENTACION DE UN SISTEMA PARA DETECTAR OBJETOS EN MOVIMIENTO UTILIZANDO ALGORITMOS DE TRATAMIENTO DIGITAL DE IMAGENES

PRESENTADA POR: LUIS PAZ RUMICHE ASESORADO POR: ARTURO SANDOVAL RIVERA

Piura, 2013

1. INTRODUCCIN
En la actualidad, el reconocimiento de imgenes es una herramienta de gran utilidad en el rea de control (Seguridad Video Vigilancia) y automatizacin en procesos industriales o de produccin. En el presente proyecto, titulado Tracking Object basada en comparacin de objetos y alerta empleando un dispositivo de sonido, se propone resolver el problema de identificar objetos nuevos, de un escenario predefinido y avisar de esta anomala, a travs de una imagen, desde el servidor donde se encuentra la aplicacin hasta una maquina remota encargada de la vigilancia, la imagen enviada sealara la ubicacin del objeto extrao en el escenario enmarcada con color verde claro sealando la ubicacin.

Un aspecto importante del sistema de video vigilancia es la gestin de video para la visualizacin, grabacin, reproduccin y almacenamiento en directo.

El avance hacia los sistemas de video, combinados con los beneficios de las Imgenes digitales a travs de cmaras inteligentes, constituye un medio de vigilancia, seguridad y monitorizacin remota mucho ms efectivo que los conseguidos hasta el momento

Por otro lado los algoritmos y las tcnicas de optimizacin que han tenido que desarrollarse para el procesamiento digital de imgenes son muy sofisticados y elaborados. Una de las tcnicas para capturar el movimiento es realizando diferencias entre las imgenes.

2. PROBLEMA DE FORMULACIN

INVESTIGACIN:

DESCRIPCIN

2.1. DESCRIPCIN DEL PROBLEMA En la actualidad la mayora de sistemas de vigilancia electrnica emplean sistemas que monitorean la zona a vigilar, grabando en video todos los sucesos ocurridos, para que luego un operario informe sobre anomalas en el proceso.

Lastimosamente esto es una desventaja al momento de tomar una accin con un retraso en el manejo de la seguridad.

Esto se puede solucionar utilizando sistemas de procesamiento automatizados como el propuesto en esta investigacin, ya que a medida que ocurren diversos sucesos en un rea X a monitorear, esto va siendo procesado y almacenado en una base de datos y porque no enviado a travs de algn servicio web o mediante un operador telefnico hacia un cliente o el operador del sistema en la comodidad de su oficina u hogar.

2.2. FORMULACIN DEL PROBLEMA

Como la implementacin del sistema de deteccin de objetos en movimiento empleando algoritmos de tdi lograra un buen reconocimiento de imgenes sin la ayuda de sensores electrnicos.

3. JUSTIFICACIN, INVESTIGACIN Justificacin:

IMPORTANCIA

BENEFICIARIOS

DE

LA

Actualmente la mayora de dispositivos de vigilancia electrnica basados especficamente en monitoreo de imgenes digitales son en s demasiado costosos para alguien que desea mantener la seguridad de su negocio. Esto se debe a que estos dispositivos emplean sensores electrnicos y estos son costosos.

Importancia:

Un sistema de Video Vigilancia es importante para mantener la seguridad e integridad de la privacidad, su utilidad tambin se manifiesta en los procesos de produccin y control de la calidad como la separacin de objetos defectuosos en el caso de que no cumplan con las medidas estandarizadas para el producto en el proceso.

Beneficiarios:
El proyecto nace en parte para apoyar a las pequeas empresas o para la seguridad domestica en caso de riesgo a robos. Debido a su bajo costo de implementacin ya que el sistema funciona con una simple cmara de video, pero para mejorar la performance se necesitara una cmara con mejor resolucin.

4. OBJETIVOS: GENERAL Y ESPECFICOS DE LA INVESTIGACIN


4.1. OBJETIVO GENERAL

Desarrollar e Implementar una aplicacin de Video vigilancia, basada en Procesamiento de imgenes, y que en tiempo real capture objetos ajenos a un escenario por medio de un dispositivo de cmara digital y que emita un mensaje de alarma y a su vez avise al encargado de la seguridad de que algo malo ocurre en las instalaciones.

4.2. OBJETIVOS ESPECFICOS Desarrollar el Algoritmo para la deteccin del objeto en movimiento con ayuda de los algoritmos de TDI.

Realizar un tratamiento inteligente de las imgenes recibidas en el ordenador para as analizar y reconocer los objetos en ella.

Diseo y desarrollo de los algoritmos de procesamiento digital de imgenes para reconocer formas en el servidor.

5. MARCO TERICO
5.1. MARCO TEORICO 5.1.1. Captura de ptica de movimiento por substraccin de video En el campo de la captura de movimiento (Motion Capture) las tcnicas de substraccin de video, son una de las ms sencillas. Esta tcnica consiste en tomar una imagen de la escena sin movimiento, a la que llamaremos fondo, y a partir de ah, restrsela a cada nueva imagen capturada en la escena.

Se realiza, en el flujo de video que proviene de la cmara, una substraccin entre cada fotograma y el fotograma de referencia, el fondo (figura 1). Esta resta se realiza operando pxel por pxel, de una de estas imgenes, con sus respectivos pxeles de la otra imagen. Cuando los pxeles de una y otra imagen coinciden, la substraccin entre valores idnticos resulta cero, lo que traducido a color es el negro (cero luz, o falta total de luz); y en el caso contrario aparecen otros tonos. De esta forma, es fcil descubrir los pxeles que cambiaron entre los dos fotogramas (el actual y el fondo), dado que adoptan tonos diferentes al negro y de ah que los movimientos que se realicen frente a la cmara queden distinguidos de entre un fondo negro.

Este tipo de captura es muy sencilla, dado que no requiere que el sujeto del movimiento est intervenido de ninguna forma; es decir, por ejemplo, si se quiere capturar el movimiento de una persona, no requiere que se lo coloque nada a la persona, ni trajes especiales, ni sensores. La captura se realiza por simple comparacin de imgenes. Esto, que en principio es una ventaja, tiene como desventaja el hacer a esta tcnica muy sensible a los cambios de iluminacin. Dado que el criterio es considerar equivalentes el cambio de imagen a la existencia de movimiento, cualquier cambio en la imagen es automticamente tomado por un movimiento.

Las dos fuentes ms comunes de errores en este tipo de captura, son los cambios de iluminacin y los movimientos de cmara. Por ejemplo, si se utiliza una tcnica de este tipo, en un espacio donde ingresa luz natural, es probable que los

cambios de iluminacin de las diferentes horas del da generen problemas. Otro problema posible, es cuando la cmara sufre algn tipo de movimiento, por ejemplo,

por un leve golpe o alguna vibracin del piso. Cualquiera de estas dos cosas, podra hacer, en algunos casos, que la tcnica deje de ser efectiva y capte movimiento donde no lo hay.

Otro de los problemas que existen, es que este sistema requiere un buen contraste en la imagen que obtiene la cmara, dado que es necesario aplicar un filtro para distinguir entre cambios de imagen y ruido de la cmara o la iluminacin. Por esto, es un sistema que requiere un buen nivel de luz para funcionar correctamente. Esto a veces complica la situacin a la hora de querer trabajar con captura de movimiento en lugares donde se realizan proyecciones de video y que requieren penumbra u oscuridad. Sin embargo esto se puede solucionar con la utilizacin de cmaras y luces infrarrojas.

SIR (Substraccin de Imagen de Referencia)

SFA (Substraccin de la Imagen Anterior)

Es muy sensible a las condiciones de luz y alteracin de la imagen en general (como Los movimientos de cmara). Sirve para captar la silueta del Objeto en movimiento.

Si bien en un principio responde igual que la SIR, rpidamente se estabiliza, lo que los hace un Mtodo bastante seguro. No sirve para captar la silueta, sino la diferencia de movimiento entre Fotogramas.

Si hay algn cambio de iluminacin o movimiento de cmara, el mtodo deja de Funcionar. Sirve para captar presencia

Si el sujeto se queda quieto, el Mtodo es incapaz de captarlo.

Sirve para captar cantidad de movimiento

5.2. MARCO CONCEPTUAL Para el desarrollo de esta investigacin es fundamental conocer ciertos trminos que sern usados para su desarrollo. COMPONENTES DE UN SISTEMA DE VISIN:

El buen desempeo de un sistema de visin depende en gran parte de sus componentes que lo forman, existiendo 6 partes primordiales para que el sistema funcione adecuadamente.

Captacin: Es el proceso a travs del cual se obtiene una imagen visual.

Preprocesamiento: Incluye tcnicas tales como la reduccin de ruido y realce de detalles.

Segmentacin: Es el proceso que divide a un imagen en objetos que sean de nuestro inters.

Descripcin: Es el proceso mediante el cual se obtienen caractersticas convenientes para diferenciar un tipo de objeto de otro, por ejemplo tamao y forma.

Reconocimiento: Es el proceso que asocia un significado a un conjunto de objetos reconocidos.

Mtodo de Preprocesamiento de imagen.


Segmentacin: Es el proceso en que se divide una escena percibida en sus partes para extraer objetos para su posterior reconocimiento y anlisis. Por lo que se ha una subdivisin del espacio de parmetros llamados clulas de acumulacin donde (amax, amin) y (bmax , bmin ) son los intervalos.

La imagen es divida en una matriz de 3x3, inicialmente se desarrolla este tipo de segmentacin, para disminuir problemas de confusin de piezas. Normalmente este uso se segmentacin en clulas acumulativas se implementa en algoritmos bsicos de segmentacin de tipo similitud como es la transformada de Hough. El tipo de segmentacin utilizado es Segmentacin General.

Mtodos de procesamiento de imgenes


La mayora de procesamiento de imgenes se aplica directamente sobre imgenes en escala de grises, debido al bajo consumo de cmputo de ste; la mayora de mtodos matemticos deterministas que se utilizan en su procesamiento, estn basados en la diferencia de niveles de grises, por lo que no existen muchos mtodos para procesamiento de imgenes en color, aun cuando estos pueden ser utilizados en este tipo de formato de imagen.

Obtencin de caractersticas del objeto por Color


Existen varias representaciones o modelos de color. Estos modelos se dividen en dos clases de modelos. Unos son modelos sensoriales y otros se denominan modelos preceptales.

La idea principal de Obtener Caractersticas por Color es sacar datos relevantes en formato RGB de objetos, para crear caractersticas que puedan ser utilizadas por otros procesos para llegar a un resultado.

Por la naturaleza de la captura de la imagen, se trabaja en formato RGB, por lo cual se trabaja con un formato sensorial en lugar del un formato de percepcin como el HSI.

Adems se pueden aplicar las mismas tcnicas que se utilizan en imgenes monocromticas. Para esto se toma cada componente (R, G, B) como una imagen monocromtica y se aplica algn operador o mtodo a cada una independientemente.

Despus se combinan todas (considerando normalmente el mximo o el promedio).

Modelo Sensorial

El modelo RGB es el modelo bsico que utiliza las componentes primarias rojo, verde y azul, normalizadas. En este modelo se basan las cmaras y receptores de televisin. Sin embargo se tienen problemas al aplicarlo al procesamiento de imgenes (ecualizacin).

Modelo Perceptual.

Modelo HSI (Hue, Saturation, Intensity) se puede ver como una transformacin del espacio RGB al espacio perceptual. En principio los modelos perceptales deben ser mejores ya que nosotros detectamos los cambios en estas componentes. Sin embargo, es compleja la implementacin de la deteccin de orillas en croma por no ser lineal.

Otra alternativa es definir tcnicas especiales para deteccin de orillas en imgenes a color.

El procesamiento de imgenes a color es relativamente reciente, por los altos requerimientos de memoria y cmputo necesarios.

Procesos para Deteccin de Bordes:

Los contornos caracterizan los lmites de un objeto. Un contorno se caracteriza por presentar una transicin de claro a oscuro o viceversa. Por esto se presenta un mtodo para detectar bordes como Sobel.

Sobel

Se detecta el borde, calculando el gradiente de la imagen en dos direcciones ortogonales.

El operador utilizado es Sobel, el cual se presenta de la siguiente manera.

Una plantilla detecta contornos horizontales y la otra verticales, obteniendo dos imgenes de gradientes Ig1,Ig2. Para determinar si en un pxel determinado hay un contorno o no, se define un umbral a partir del cual se considera la existencia de contorno:

La imagen de contornos Ic(x, y) se puede formar a partir de:

Deteccin de bordes en color


Este mtodo se aplica a cada una de las componentes bsicas de RGB, como si se tratara de una imagen monocromtica, y se hace una combinacin de todas ellas, considerndose el mximo o el promedio, sin embargo puede presentar orillas que no impliquen un cambio fuerte en ninguna componente, pero si son notables en color o saturacin. Adems este mtodo se plantea para detectar bordes de piezas no convexas y convexas.

Una forma alternativa para calcular el borde de objetos en imgenes en color, es hacer una transformacin de formato RGB a HSI, y aplicar cualquier mtodo matemtico estadstico para la deteccin de bordes, como Sobel o Robert, sin embargo se aplica a cada componente de color HSI, y despus se combinan todas las orillas detectadas, considerando normalmente el mximo o promedio.

La transformacin de RGB a HSI se realiza mediante la siguiente ecuacin:

La intensidad (I) y saturacin (S) estn normalizada (entre cero y uno) y el croma (H) est entre 0 y 360 grados.

Distancia de Color entre Pxeles


Se toma la distancia de cada pxel a sus vecinos (mscara de 3x3), se suman y se normalizan (dividir entre 8). De esta forma la magnitud de la orilla aumenta al aumentar la diferencia en intensidad, croma o saturacin.

Bitmaps (mapas de bits)


La manera bsica y original de representar una imagen digital con color en la memoria de la computadora es un bitmap. Un bitmap est formado por filas de pixeles, donde cada uno en particular tiene un valor que determina su color. Este valor est formado por tres nmeros en el rango 0 a 255, asociados a los colores primarios Rojo, Verde y Azul.

Cualquier color visible al ojo humano puede representarse de esta manera. Por ejemplo el color negro se codifica como R=0, V=0, A=0 y el color blanco (R, V, A) = (255, 255,255). Desde este punto de vista, una imagen es un arreglo bidimensional de pixeles cada uno codificado en 3 bytes que puede tener 256x256x256=16.8 millones de diferentes colores.

Esta tcnica se conoce como codificacin RGB y est adaptada a la visin humana. Sin embargo hay otras tcnicas de codificacin donde las cmaras o dispositivos de medicin juegan un papel predominante.

El rango de 0 a 255 se acord por dos razones. La primera debido a que el ojo humano no es lo suficientemente sensible como para diferenciar ms de 256 niveles de intensidad para un color y por otro lado es la capacidad de almacenamiento para un byte desde el punto de vista de la computacin.

Representacin vectorial de los colores


Como hemos mencionado, en un mapa de bits, los colores se codifican en tres bytes representando su descomposicin en los tres colores primarios. Matemticamente puede interpretarse un color como un vector en el espacio tridimensional de Rojo, Verde y Azul.

Bajo esta interpretacin pueden aplicarse algunos conceptos de la geometra analtica en el tratamiento de colores y en la generacin de filtros o transformaciones.

Espacio tridimensional de colores

Una imagen es una codificacin en un dominio espacial bidimensional esttico y esto nos permite que podamos contar con nuevas imgenes a partir de las originales sin tener que modificarlas haciendo uso de transformaciones o filtros aplicados a sus pixeles.

Si consideramos una imagen con resolucin de 512 x 384 pixeles, su almacenamiento sin compresin ser en 590Kbytes y otra de 2592 x 1728 pixeles estar almacenada en 13.4Mbytes. Con tcnicas de compresin, esta ltima puede almacenarse en un archivo de 2.9Mbytes. Para las transformaciones y filtros que aplicaremos estaremos tratando con las imgenes, con esos espacios bidimensionales, que difieren mucho de los diferentes formatos de archivos en que las podemos almacenar en un disco duro por ejemplo.

Deteccin de orillas
De lo mencionado en prrafos anteriores, podemos cuantificar la diferencia entre dos colores calculando la distancia geomtrica entre los vectores que los representan.

Consideremos dos colores C1 = (R1, G1, B1) y C2 = (R2, G2, B2), la distancia entre ellos est dada por la frmula:

El objetivo en la deteccin de orillas es determinar las orillas de las formas en una imagen y ser capaz de dibujar un bitmap resultante donde las orillas estn en blanco sobre un fondo negro. La idea es muy sencilla, nos desplazamos por la imagen pixel por pixel comparando el color de cada uno con su vecino de la derecha y de abajo. Si alguna de estas comparaciones resulta en una diferencia muy grande el pixel estudiado es parte

de una orilla y debe ponerse en blanco, de otra manera se pone en negro.

Representacin de una imagen de dimensin Width x Height

Escala de grises (grayscale)


En el espacio de colores, los vectores en la direccin del vector (1, 1, 1) representan diferentes tonalidades de gris. As, cualquier pxel (r, g, b) de una imagen, proyectado sobre este vector nos dar su contribucin gris a una nueva imagen que formemos con todas las proyecciones de los pixeles originales.

Espacio Vectorial de Colores

Del lgebra de vectores sabemos que el producto escalar:

Que nos da al calcular las magnitudes de los vectores:

Pero como la proyeccin de C en la direccin de u es:

Entonces:

El mayor valor que puede tomar esta expresin es 255 v3 y como debemos cuidar que la magnitud de esta expresin nunca rebase 255 debemos multiplicando por 1/ 3 normalizarla

As:

Es la proyeccin normalizada de un pxel en la direccin de los grises.

Teniendo esto en mente, haremos un mtodo para recorrer todos los pixeles de una imagen para generar su componente gris.

5.3. MARCO REFERENCIAL


DETECCIN Y SEGUIMIENTO DE OBJETOS CON CMARAS EN

MOVIMIENTO (Hctor Lpez Paredes Setiembre 2011).

Comprob que existen principalmente dos formas diferentes para resolver el problema: los mtodos basados en alinear las imgenes frente a los mtodos que detectan el movimiento directamente en la secuencia.

Eligi el mtodo de deshacer el movimiento de la cmara para detectar en fases posteriores a travs de tcnicas de segmentacin para cmaras estticas y tracking los objetos que aparecan en la secuencia.

Este mtodo fue el elegido para resolver el problema en lugar de utilizar los mtodos basados en ujo ptico ms vulnerables al ruido y con mayor coste computacional.

6. HIPOTESIS

6.1. HIPOTESIS GENERAL

Se puede mejorar la captura de objetos utilizando adems de los algoritmos de TDI, algunos algoritmos y mtodos estadsticos que manejen probabilidades de incidencias de un objeto en un escenario.

6.2. IDENTIFICACION DE VARIABLES


Para el desarrollo de nuestro proyecto de aula virtual para la Institucin

Educativa Scrates definiremos las siguientes variables tanto cualitativas como cuantitativas para el uso del anlisis y desarrollo de la investigacin.

Variable Posicin del Centroide del Objeto. Elasticidad.

Indicador Pixel Central.

Valoracin Coordenadas de los Pixeles.

Eficacia de Seguimiento.

Permanencia del Valor de las Coordenadas. Seguimiento del Objeto, sin perder la concentridad de la imagen de salida.

Velocidad de respuesta de la implementacin del Sistema.

Tiempo de Respuesta.

Porcentaje de Reconocimiento del Objeto

Pixeles.

Numero de Pixeles.

7. METODOLOGIA : METODOS Y MATERIALES

7.1. TIPO DE INVESTIGACION


El tipo de investigacin que se realizara en este proyecto de Diseo e Implementacin de Deteccin de Objetos ser de tipo descriptiva porque se recolectara la informacin necesaria para evaluar y entender los tipos de Algoritmos de TDI que Existen para llevar cabo una buena implementacin y captura de datos en tiempo real, a su vez se har una investigacin de los posibles algoritmos estadsticos que existen para optimizar la captura de objetos , ya que estos emplean PCA(Anlisis de Componentes Principales) reconocimiento por

, cuya ventaja es que reduce la

dimensionalidad de un grupo de datos, es que retiene aquellas caractersticas del conjunto de datos que contribuyen ms a su varianza, manteniendo un orden de bajo nivel de los componentes principales e ignorando los de alto nivel.

7.2. EL DISEO DE LA INVESTIGACION :

Diseo no experimental Se Diseara e Implementara un Sistema para la deteccin de objetos en movimiento basado en algoritmos de tratamiento digital de imgenes, utilizando mtodos analticos como estadsticos, siendo estos ltimos los mas ptimos para esta implementacin, esta investigacin utiliza como base algunas implementaciones y conclusiones planteadas por otros autores como resultado de una ardua investigacin. Pero en este caso se utilizara como entorno de desarrollo JAVA , utilizando su api para la manipulacin de informacin multimedia JAVA MEDIA FRAMEWORK.

8. CRONOGRAMA
ABRIL MESES MAYO JUNIO JULIO AGOSTO Septiembre

ACTIVIDADES Entrega del Anteproyecto Bsqueda de Apoyo tcnico Investigacin de Algoritmos sobre imgenes Informacin sobre el Manejo de JMF Diseo de la propuesta Redaccin del informe Presentacin del trabajo final

Potrebbero piacerti anche