Sei sulla pagina 1di 23

RECOCIMIENTO DE CARACTERES OPTICOS (OCR)

Juan Jacob Ceron Vlez juanjacobceron@gmail.com Maestra Matemticas Aplicadas Universidad EAFIT

Presentacin Que es OCR?


El objetivo del reconocimiento de caracteres pticos (OCR) es identificar patrones dentro de una imagen digital como caracteres alfanumricos. El proceso de OCR involucra varios pasos que incluyen segmentacin, extraccin de patrones, y por ultimo clasificacin.

Objetivos
Desarrollar una aplicacin que permita obtener una serie de caracteres a partir de una imagen. Facilitar el proceso de escanear informacin.

Aplicaciones
Es usual que las personas quieran escanear un documento con el fin de tener el documento en Word.

Reconocimiento de Placas
El reconocimiento de vehculos ha ganado bastante importancia en los ltimos aos, algunos ejemplos son:

Sistema de Transito del Centro de Londres


230 cmaras instaladas en el centro de Londres identifican automticamente a cualquier vehculo que entre a esta zona y posteriormente el sistema cobra un peaje de 8

Sistema de Peajes en California


L . a autopista FasTrack usa un sistema de OCR para reconocer a los vehculos que pasan por el peaje y les facturan automticamente a una tarjeta asociada a la placa del vehculo.

El Algoritmo
Como funciona? Pre-proceso Extraccin del carcter Identificacin (clasificacin) del carcter

Como Funciona?
Las imgenes estn formadas por miles de puntos (pxeles), a cada pxel le corresponde un color, este color esta determinado por un vector de 3 componentes, R (Rojo), G (Verde), B(Azul).

Representacin de los Colores


Ntese que cualquier color es un elemento del siguiente conjunto: { ( X , Y , Z ) X , Y , Z {0,1,2,....255}}

V=

Ejemplo
255 0 0 255 0 255 0 255 0 0 0 255 0 255 0 255 0 255 0 255 255 0 255 0 255 0 0 0 255 0 255 0 255 0 255 0

Pre-proceso
1. Alistamiento: Estandarizar la imagen para que pueda ser procesada satisfactoriamente. a. Binarizacin: Pasar la imagen de una N matriz de N M 3 a una de M ,en tonos de grises (grayscale).

Extraccin del Carcter

Extraccin del Carcter


La funcin edge (detecta bordes) :

Extraccin del Carcter


La funcin regionprops (recorta regin):

Extraccin del Carcter


La funcin bwlabel (enumera objetos) :
0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 0 0 1 0 0 0 1 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 2 2 2 2 2 2 2 2 2 0 0 2 0 0 0 2 0 0 0 2 0 0 2 0 0 0 2 0 0 0 2 0 0 0 2 2 2 0 2 2 2 0 0 0 0 0 0 0 0 0 0 0 0 0

Identificacin del Carcter

Ya teniendo aislado un carcter como se reconoce que letra o nmero es?

Identificacin del Carcter


1. Momentos de la imagen a. Masa total (numero de pixeles negros en el sector). b. Curtosis. c. Sesgo. d. Momentos de alto orden.

Identificacin del Carcter


2. Correlacin entre matrices Funcin en MATLAB: corr2

til si uno tiene una imagen base (tipo plantilla) para poder sacar la correlacin.

Identificacin del Carcter


2. Correlacin entre matrices
?

Identificacin del Carcter


3. Otros a. Transformada de Fourier. b. Medidas usadas en la fsica como el centroide, etc. c. Redes Neuronales.

Trabajo Futuro
Convertidor de PDF a WORD. Reconocimiento de caracteres mas complejos. Personalizacin de tipo de letra (tipo tablet-pc). Otras mas.

Bibliografa
R. Gonzalez ; R. E. Woods, Digital Image Processing, Prentice Hall, 2002. K. S. Fu, Syntactic Pattern Recognition and Applications, Prentice Hall, 1982. E. A. Patrick, Fundamentals of Pattern Recognition, Prentice Hall, 1972 J.T. Tou ; R.C. Gonzalez, Pattern Recognition Principles, Addison-Wesley Publishing Company, Inc.

Potrebbero piacerti anche