Red Neuronal OCR

Redes Neuronales aplicadas en los Sistemas de
Reconocimiento ptico de caracteres (OCR)
Curso:
Inteligencia Artificial
Ciclo:
2015-0
Preparado por:
U201200278 Moscaiza Moncada, Omar I.
U201000119 Neyra Rangel, Ral
Revisado por:
Bruno Vargas Tamani
Lima, 17 de febrero de 2015
ndice
Redes Neuronales aplicadas en los Sistemas

de Reconocimiento ptico de caracteres
(OCR)
I.
Moscaiza M.,
Omar Neyra R.
Ral
INTRODUCCIN.....................................................................................5
II.
ANTECEDENTES..................................................................................6
III.
OBJETIVOS.........................................................................................7
IV.
ALCANCE............................................................................................ 8
V.
RED NEURONAL ARTIFICIAL.................................................................9
VI.
SISTEMA DE RECONOCIMIENTO DE CARACTERES.................................14
VII.
DESARROLLO..............................................................................19
VIII.
CONCLUSIONES...........................................................................21
IX.
BIBLIOGRAFIA...................................................................................22

(OCR)
Moscaiza M.,
Omar Neyra R.
Ral
INDICE DE FIGURAS
Figura 1 Aprendizaje por Correccin de Error.................................................................................12
Figura 2. Neurona Artificial.............................................................................................................. 14
Figura 3. Umbral neuronal............................................................................................................... 14
Figura 4. Cambio estado por sumatoria.......................................................................................... 15
Figura 5. Capa de nodos de entradas, capa de neuronas ocultas y capa de neuronas de salida...15
Figura 6. Definicin de neuronas por pixels.....................................................................................16
Figura 7. Vectores........................................................................................................................... 16
Figura 8. Patrn de entrada letra A.................................................................................................. 17
Figura 9. Letra A con ruido............................................................................................................... 18
Figura 10. Red neuronal de dos capas............................................................................................ 19
Figura 11. Programa iniciado con red cargada................................................................................20
Figura 12. Digitalizacin de trazos................................................................................................... 21
Figura 13. Reconocimiento de caracteres.......................................................................................22
Figura 14.Simulando una imagen con ruido....................................................................................22
Figura 15. Adicin del valor requerido por el aprendizaje supervisado............................................23
Figura 16. Aplicando el aprendizaje no supervisado.......................................................................24
Figura 17. Reconocimiento de aprendizaje.....................................................................................24
Figura 18. Mtodo de aprendizaje no supervisado..........................................................................25
Figura 19. Reconocimiento de carcter........................................................................................... 26
Figura 20. Renombrando el carcter............................................................................................... 26
Figura 21. Aplicando la red aprendida con otros caracteres............................................................27

(OCR)
I.
Moscaiza M.,
Omar Neyra R.
Ral
Introduccin
Un programa de OCR consiste en un software que trata de convertir la imagen

digitalizada de un documento manuscrito, fotocopiado, etc., en un archivo de texto
plausible de ser utilizado por algn procesador de texto.
Los programas de OCR diseados sobre bases algortmicas son los ms
populares hasta el momento, pero poseen un grado apreciable de inexactitud
cuando el texto presenta "ruido", es decir cuando el original contiene manchas
(como las producidas al fotocopiar una pgina) o smbolos mezclados con el texto
(un dibujo).
Los programas de OCR basados en el reconocimiento de patrones (como las
redes neuronales) son capaces de leer y reconocer textos manuscritos o escritos
a mquina, de imprenta o de impresora, convirtindolos en texto ASCII, editable
por el usuario con cualquier programa de tratamiento de textos convencional.
Resulta muy til para documentos en otros idiomas que pueden ser digitalizados
usando el OCR para traducirlos despus con un software apropiado, o para
digitalizar formularios escritos, especialmente cuando hay que hacerlo en grandes
volmenes.

(OCR)
II.
Moscaiza M.,
Omar Neyra R.
Ral
Antecedentes
Los primeros modelos de redes neuronales datan de 1943 por los neurlogos
McCulloch y Pitts. Aos ms tarde, en 1949, Donald Hebb desarroll sus ideas
sobre el aprendizaje neuronal, quedando reflejado en la "regla de Hebb". En 1958,
Rosemblatt desarroll el perceptrn simple, y en 1960, Widrow y Hoff
desarrollaron el ADALINE, que fue la primera aplicacin industrial real.
En los aos siguientes, se redujo la investigacin, debido a la falta de modelos de
aprendizaje y el estudio de Minsky y Papert sobre las limitaciones del perceptrn.
Sin embargo, en los aos 80, volvieron a resurgir las RNA gracias al desarrollo de
la red de Hopfield, y en especial, al algoritmo de aprendizaje de retropropagacin
(BackPropagation) ideado por Rumelhart y McLellan en 1986 que fue aplicado en
el desarrollo de los perceptrones multicapa.
Un ejemplo tpico de red neuronal aplicada al reconocimiento de patrones son los
OCR o programas de reconocimiento ptico de caracteres escritos. De acuerdo
con Werbos (1998) el 50% de los sistemas de OCR se basan en redes
neuronales.

(OCR)
III.
Moscaiza M.,
Omar Neyra R.
Ral
Objetivos
3.1. General
Demostrar es uso prctico que tiene las redes neuronales aplicadas en los
sistemas de reconocimiento ptico de caracteres (OCR)
3.2. Especficos
Describir las redes neuronales
Describir el reconocimiento de caracteres mediante usando redes

neuronales
Demostracin de caso practico

(OCR)
IV.
Moscaiza M.,
Omar Neyra R.
Ral
Alcance
El presente trabajo tendr como finalidad dar a conocer los conceptos sobre redes
neuronales, y su importancia en el proceso de reconocimiento ptico de
caracteres (OCR).
Como funciona esta metodologa utilizando los principios y fundamentos de
inteligencia artificial, es lo que el equipo de trabajo pretende resolver con la
elaboracin del presente trabajo.
Tambin, se demostrara un caso prctico sobre el tema es cual es un software,
donde se podr entender cmo funcionan las redes neuronales y como mediante
el aprendizaje va mejorando el OCR.

(OCR)
V.
Moscaiza M.,
Omar Neyra R.
Ral
RED NEURONAL ARTIFICIAL
Las redes neuronales artificiales (RNAs) o Neuronal Networks Artificial (NNS) son
una rama destacada de la inteligencia artificial, son algoritmos matemticos que
utilizan una estructura jerrquica, los cuales intentan imitar el comportamiento de
cerebro humano, destacando el aprendizaje atreves de la experiencia y la
extraccin de conocimiento a partir de un conjunto de datos.
Los elementos bsicos del algoritmo de redes neuronales artificiales:
El conjunto de neuronas o nodos.
Los pesos nmero, que se modifica durante el entrenamiento de la red

neuronal, y es aqu por tanto donde se almacena la informacin que har
que la red sirva para un propsito u otro.
Una regla de propagacin. Con las entradas y los pesos se suele hacer
algn tipo de operacin para obtener el valor del potencial.
Una funcin de activacin. El valor obtenido con la regla de propagacin,

se filtra a travs de una funcin conocida como funcin de activacin y es
la que nos da la salida de la neurona. (Diez, 2003)
Las neuronas o nodos son unidades o elementos de procesamiento las cuales se

pueden dividir en tres grupos diferentes:
a) Las que reciben la informacin del exterior, tambin denominadas como
neuronas de entradas.
b) Las que transmiten informacin al exterior, denominadas neuronas de
salida.
c) Por ltimo las que no tienen ningn contacto con el exterior y solamente
intercambian informacin con otras neuronas de la red, a estas se las llama
neuronas ocultas.
Los nodos de entrada reciben seales del entorno por medio de sensores, nodos
de salida envan seales fuera del sistema una vez finalizado el tratamiento de la
informacin y los nodos ocultos son los que reciben estmulos de los nodos de
8

(OCR)
Moscaiza M.,
Omar Neyra R.
Ral
entrada y emiten salidas hacia los nodos de salida, en ellos se lleva e acabo el
procesamiento de la informacin.
Los pesos se pueden modificar durante el entrenamiento de la red neuronal, el
aprendizaje es el proceso en el cual la red neuronal crea, modifica o destruye sus
pesos en respuesta a una informacin de entrada. Una red neuronal es entrenada
con compartimiento normal o anormal, estos valores dependen de la forma en que
se desee detectar una intrusin. En un sistema de deteccin de intrusos la red es
entrenada para prediccin de una accin o comando de usuario.
A medida que la red neuronal artificial aprende el conjunto de datos, los pesos de
conexin se cambian las conexiones con importancia permanecen y las
conexiones sin relevancia son castigadas. Los datos se escriben en los nodos de
entrada, procesados a travs de los nodos ocultos, y los pesos de conexin a los
nodos de salida son ajustados.
Mediante su empleo es posible detectar variaciones de ataques o de carcter
desconocidos, que difieren de los patrones iniciales con que fue entrenada la red.
Las redes neuronales artificiales (RNAs) estn inspiradas en el sistema lgico
natural, como es conocido en este sistema la neurona es la unidad de
procesamiento y aunque las (RNAs) sean mucho menos complejas en un sistema
informtico tambin realizan clculos complejos para procesar informacin. (Daz,
2012)
Las redes neuronales artificiales se clasifican en base a su paradigma de
aprendizaje, cada una de ellas ha sido diseada para fines ms o menos
especficos, algunos tipos son:
Back propagation.- conocida tambin como perceptron multicapa o retro

propagacin, este algoritmo ofrece un solucin a las redes neuronales mas
complejas por eso es una de las tcnicas ms utilizadas, tambin tiene un
gran facilidad aprendizaje, en esta tcnica los errores son propagados
hacia atrs desde la capa de salida, los pesos se van modificando desde el

(OCR)
Moscaiza M.,
Omar Neyra R.
Ral
nodo de salida hasta el nodo de entrada. Las limitaciones de black

propagation o propagacin hacia atrs es que necesita mucho tiempo para
el aprendizaje y muchos ejemplos. Algunas de sus aplicaciones de este
algoritmo son Sntesis de voz desde texto, control de robots, prediccinreconocimiento de patrones.
Redes auto organizadas (SOFM). - Es una red de tipo unidireccional, y se

organiza en dos capas: la primera capa est formada por las neuronas de
entrada, y la segunda consiste en un array de neuronas de dos
dimensiones. En este caso se necesitan dos ndices para etiquetar cada
neurona, los pesos asociados a cada neurona tendrn tres ndices donde
dos de ellos indican la posicin de la neurona en la capa y el tercero la
conexin con cierta neurona de entrada. (Diez, 2003).
Este algoritmo de aprendizaje es una de las tcnicas ms tiles, se entrena
con aprendizaje no supervisado para generar dos capas de neuronas la
primera de ellas le recogen seales exteriores y los transmiten a la
siguiente capa, el procesamiento de informacin se lleva en la segunda
capa que adems acta como salida del sistema. La desventaja es que
requiere mucho entrenamiento. Las aplicaciones de este algoritmo de
aprendizaje son reconocimiento de patrones, codificacin de datos,
optimizacin.
Redes de funcin de base radial (RBF). - Este tipo de redes se caracteriza

por tener un aprendizaje o entrenamiento hbrido. La arquitectura de estas
redes se caracteriza por la presencia de tres capas: una de entrada, una
nica
capa
oculta
una
capa
de
salida.
(Diez,
2003)
Una red de funciones de base radial es una red neuronal que utiliza
funciones de base radial como funciones de activacin. Este es un
algoritmo hibrido ya que su mtodo de aprendizaje consta de dos fases, la
fase no supervisada en la cual trabaja con la capa oculta y la fase
supervisada donde los pesos y los valores de la capa de salida.
10

(OCR)
Redes learning vector
quantization (LVQ).
- Es un
Moscaiza M.,
Omar Neyra R.
Ral
algoritmo
de
clasificacin de patrones de tipo supervisado, tambin es un algoritmo

hibrido ya que cuenta con una esta capa supervisada y la otra no
supervisada, tiene como principal objetivo la clasificacin de patrones, se
divide en dos capas donde cada neurona de la primera capa es asignada a
una sub-clase corresponde a su vez a una neurona de la segunda capa.
Este algoritmo se diferencia las redes auto organizados es que trabaja con
salidas en una sola dimensin, la salida en el SOFM es bidimensional.
Las redes neuronales se pueden clasificar segn sus mtodos de entrenamiento
como:
Redes de pesos fijos.- Para las redes de pesos fijos no hay ningn tipo de
entrenamiento.
Redes no supervisadas.- Durante el aprendizaje el tutor indica a la red que

debe de producir en la salida. Estas son utilizadas para el anlisis de
clsteres en aplicaciones.
Redes de entrenamiento supervisado.- La red es independiente, localiza

sobre los datos de entrada propiedades que le sirvan para la separacin de
patrones. Este tipo de red son mayormente utilizadas para problemas de
clasificacin.
Aprendizaje por correccin de Error
El entrenamiento consiste en presentar al sistema un conjunto de pares de
datos, representando la entrada y la salida deseada para dicha entrada.
Este conjunto recibe el nombre de conjunto de entrenamiento. El objetivo
es tratar de minimizar el error entre la Salida Deseada y la salida actual
11

(OCR)
Moscaiza M.,
Omar Neyra R.
Ral
Figura 1 Aprendizaje por Correccin de Error
Algoritmos de Aprendizaje por Correccin del error

Los pesos se ajustan en funcin de la diferencia entre los valores deseados
y los obtenidos en la salida.
wij = xi (dj - xj )
donde:
wij Variacin en el peso de la conexin entre el i-simo nodo y el j-simo.
Umbral en el aprendizaje que regula velocidad
y precisin (0 < 1)
xi Salida del i-simo nodo
xj Salida del j-simo nodo
dj Valor de salida deseado del j-sima unidad de procesamiento
Regla de mnimo Error cuadrado
Widrow y Hoff definieron una funcin que permita cuantificar el error global
cometido en cualquier momento durante el proceso de entrenamiento,
agilizando este proceso
12

(OCR)
Moscaiza M.,
Omar Neyra R.
Ral
La frmula calcula
n = nmero de nodos de salida
p = nmero de tramas de entrenamiento
Error cometido en el aprendizaje de la k-sima trama.
Se trata de modificar los pesos para que las conexiones de la red
minimicen esta funcin de error, se puede hacer de manera proporcionada
a la variacin relativa del error.
VI. SISTEMA DE RECONOCIMIENTO DE

CARACTERES
El Reconocimiento ptico de caracteres es una de las aplicaciones ms usada
con Redes Neuronales. Esto es posible por la naturaleza de las Redes
Neuronales.
Al hablar de naturaleza de las redes neuronales hacemos referencia a que es
unos de las ramas de la Inteligencia Artificial capaz de aprender patrones y de
acuerdo a una entrada de datos puede predecir los resultados. Esto es, la red
aprende un conjunto de patrones/caracteres y luego de acuerdo a las entradas
posteriores la red puede deducir la salida gracias al aprendizaje que hizo de esos
patrones.
Estas redes simulan en cierto modo el funcionamiento de las neuronas que
naturalmente poseemos los humanos, y son un campo que est dando grandes
resultados en los ltimos aos; son especialmente buenas cuando se trata de
reconocer patrones con un cierto "ruido" de fondo, dado que por ejemplo, una
palabra nunca es pronunciada exactamente igual dos veces, siempre hay
pequeas variaciones.
Otro gran ejemplo son las letras escaneadas de un papel (incluso letras de
imprenta), que debido a suciedad, moho, borrones en el papel, errores en su
13

(OCR)
Moscaiza M.,
Omar Neyra R.
Ral
impresin, e incluso un pobre proceso de escaneado, nunca es exactamente

igual. Sin embargo una persona generalmente no encuentra dificultades a la hora
de entender una palabra que le digan o una letra impresa, salvo que sean muy
confusas; pues esta ventaja es la que aportan las redes neuronales, posibilitando
programas como los OCR.
Figura 2. Neurona Artificial
Donde:
X1Xn indican un bit que corresponden al carcter que estoy tratando de
reconocer y son las entradas de la red.
W1Wn son los pesos de las entradas de la red. Cada X tiene su peso. El
valor para W vara entre 0 y 1.
Y es la salida de la red y est en funcin de las entradas y sus respectivos
pesos.
En el contexto de las redes neuronales lo que est dentro de la elipse es el
proceso interno de la red y es donde se encuentra lo que se conoce como el
Umbral. Este es un escaln unitario y determina si se dispara o no una celular
neuronal.
14

(OCR)
Moscaiza M.,
Omar Neyra R.
Ral
Figura 3. Umbral neuronal
0 >= Wi <= 1
Xi * Wi > a
Cuando la sumatoria es mayor que a cambia de estado; es decir, atraviesa o no
el umbral.
Figura 4. Cambio estado por sumatoria
Ahora que ya hablamos de las neuronas, pasemos a las redes neuronales

propiamente dicha, la cual est constituida por un conjunto de neuronas
interconectadas.
Figura 5. Capa de nodos de entradas, capa de neuronas ocultas y capa de neuronas de

salida.
Como se puede apreciar en el grfico la capa de entrada corresponde a lo que

viene del ambiente (como por ejemplo el nervio ptico). En esta capa se
encuentran los patrones de enseanza.
Las neuronas de la capa intermedia propagan su efecto a travs de las diferentes
capas sucesivas y como consecuencia produce un vector de salida. Durante este
proceso, los pesos de las entradas de la red son fijos y no se modifican.
15

(OCR)
Moscaiza M.,
Omar Neyra R.
Ral
En el reconocimiento de patrones hay un nmero fijo de categoras en las cuales

las muestras de entrada deben clasificarse. Para ello primero se requiere una fase
de entrenamiento en la que se presenta a la red los patrones que debe aprender y
la categora en cual clasificarlo. Entonces se le presenta a la red un patrn nuevo
y desconocido pero que pertenece a alguna de las categoras aprendidas y esta
debe decidir a qu categora se parece ms.
Para el desarrollo de la aplicacin OCR usamos la Red Neuronal de Kohonen.
Esta es un tipo de red No Supervisada. Lo ms importante en este tipo de redes
es que el resultado no lo conozco.
Funcionamiento de la red:
Si ocupamos un vector para definir las neuronas, por ejemplo de 30 elementos,
tendremos:
Figura 6. Definicin de neuronas por pixels
A esta matriz la ocuparemos para determinar un carcter. Cada cuadro de la

matriz puede tener un valor 0 1. Si es igual a 0 no tiene nada, caso contrario el
cuadro est lleno.
Vamos a ocupar adems un crculo unitario donde estarn representados todos
los vectores, uno por cada neurona
16

(OCR)
Moscaiza M.,
Omar Neyra R.
Ral
Figura 7. Vectores
En este crculo habr 30 vectores

Los vectores pueden tener cualquier direccin. Al hacer que todos los vectores
tengan mdulo 1, slo nos preocupamos por calcular el ngulo con la abcisa.
El uso del crculo y los ngulos de los vectores sirve para normalizarlos (que
tengan mdulo 1) y para determinar el ngulo. Este ngulo determinar cun
cerca est una neurona (vector) u otra del patrn de entrada que se quiere
reconocer.
Figura 8. Patrn de entrada letra A
Supongamos que el patrn de entrada a la red es la letra A.

Se puede apreciar que hay cuadros llenos (1) y cuadros vacos (0). Este patrn
ingresa a la red neuronal para que esta lo aprenda. Este proceso se conoce como
el entrenamiento de la red.
Luego de aprender viene un segundo paso que consiste en el reconocimiento del
carcter. Se supone que con el entrenamiento la red es capaz de reconocer un
17

(OCR)
Moscaiza M.,
Omar Neyra R.
Ral
carcter igual o similar que ingrese nuevamente a ella. Siempre habr un margen
de error.
Supongamos que ingresamos un documento escaneado y le pedimos al sistema
que reconozca los caracteres impresos en l y asumamos que hay cierto ruido o
suciedad en la hoja y la letra A aparece en el documento como muestra la
siguiente figura:
Figura 9. Letra A con ruido
En ella vemos que falta parte de la letra.

Lo que har la red en este caso es buscar el vector ms prximo (gracias al
ngulo) para obtener el resultado deseado. En otras palabras la red buscar entre
los vectores lo que ms se aproximen para completar el carcter que queremos.
De aqu surge que hay neuronas ganadoras y neuronas perdedoras. Las
ganadoras son las que se activan y se disparan para obtener el resultado
deseado. Si entre las neuronas no hay proximidad con el carcter que se
pretende reconocer no hay un resultado posible por lo que no hay neuronas
ganadoras, es decir no hay vectores prximos.
Respecto de la aplicacin, se desarroll en Builder C++ Versin 6.0.
VII. DESARROLLO
Este software permite aprender y reconocer caracteres y smbolos. Usa redes
neuronales para identificar los caracteres trazados con el mouse en ese espacio.
Fcilmente se le puede ensear a reconocer nuevos caracteres. La precisin del
18

(OCR)
Moscaiza M.,
Omar Neyra R.
Ral
programa de mejora, ya que aprende de su (escritura con el mouse) escritura a

mano.
Se trata principalmente de un programa educativo. Recog demuestra la diferencia
entre un aprendizaje supervisado y no supervisado.
Figura 10. Red neuronal de dos capas
Recog utiliza una red neural de dos capas grande (pero simple) para aprender y
reconocer patrones. La imagen de la escritura a mano se digitaliza en una rejilla
de neuronas de entrada. Cada respuesta posible est representada por una sola
neurona de salida. Cada neurona de entrada est vinculado directamente a cada
neurona de salida (no hay capas ocultas). Como en la mayora de las redes
neuronales, la data (o programacin) se codifica en los vnculos entre las
neuronas. Si un enlace entre una neurona de entrada y una neurona de salida es
positiva, ello significara que si la entrada est en la puntuacin total para esa
neurona de salida se incrementa en una pequea cantidad. Si el enlace es
negativo, entonces se sigue que si la entrada est activada, la salida
correspondiente tendr su resultado disminuido en una cantidad. La neurona de
salida con la puntuacin ms alta (y por lo tanto la mejor coincidencia) se
considerad el ganador. Esto se conoce como una red competitiva. Para ver los
puntos fuertes o el peso de los vnculos entre la rejilla de entrada y una de salida
19

(OCR)
Moscaiza M.,
Omar Neyra R.
Ral
determinada, se deber hacer doble clic en uno de los caracteres de la lista de

reconocimiento.
El procedimiento de aprendizaje Recog es extremadamente simple. No hay Back
Propagation, Delta-rule, u otras complejidades; es simple aritmtica. Todos los
enlaces entre las neuronas de entrada activas y las neuronas de salida
seleccionadas han aumentado sus pesos por uno. Todos los enlaces entre
entradas de neuronas inactivas y la neurona de salida seleccionada tendrn sus
pesos reducidos a uno. Se deber hacer doble clic en uno de los caracteres de la
lista de reconocimiento y ver cmo sus pesos cambian a medida que Recog
aprende el carcter.
Recog reconoce individualmente los caracteres impresos y poco a poco se adapta
al estilo de escritura que el usuario tiene. Esto puede sonar sospechosamente
similar a la antigua PDA de Apple (asistente personal de datos), Newton.
Newton no utiliza redes neuronales, lo que hace que sea menos flexible (y menos
voltil) que este software. Una diferencia clave es que Newton engaa al ver el
orden en el que se hacen los trazos de las letras. Este se mantiene en
observacin constante mientras se escribe mas no despus.
El Palm Pilot era otra PDA que reconoce la escritura a mano. Sin embargo, su
reconocimiento no es modificable e inalterable. No hay ninguna adaptacin o
aprendizaje en la parte de la computadora; es el humano que debe adaptarse a la
PalmPilot.
20

(OCR)
Moscaiza M.,
Omar Neyra R.
Ral
Figura 11. Programa iniciado con red cargada.

Al abrir la aplicacin nos encontramos con dos botones, la de la izquierda harn la
funcin de digitalizar los trazos hechos por nosotros y el de la derecha cumple la
funcin de reconocer el dibujo digitalizado y mostrarnos el patrn que
corresponde a esa imagen.
En la parte superior observamos 4 pestaas:
File: encontraremos las opciones para poder abrir y/o grabar una red neuronal,
establecer nuevos trazos, abrir trazos o grabarlos.
Edit: Deshace la digitalizacin, copia/pega caracteres, copia/pega trazos y
opciones para cambiar el tamao del panel.
Learning: Aqu podremos definir qu tipo de Aprendizaje deseamos, ninguno,
Supervisado o No Supervisado.
Ayuda: Tutorial para mejor entendimiento del software.
Ahora probaremos el programa buscando que reconozca un carcter ingresado
desde el sector de dibujo/escritura. Una vez realizados los trazos que deseamos
reconocer se procede a presionar el botn de digitalizar, a fin de que se obtenga
21

(OCR)
Moscaiza M.,
Omar Neyra R.
Ral
la imagen digitalizado del trazo y luego de ello con una red previamente cargada,
en este caso (A, E, I, O, U, Y) procederemos a presionar el botn de reconocer.
Figura 12. Digitalizacin de trazos.

De acuerdo al entrenamiento de la red cargada previamente, el resultado sera
ordenado porcentualmente, siendo el primero el patrn reconocido por el
aplicativo.
Figura 13. Reconocimiento de caracteres.

22

(OCR)
Moscaiza M.,
Omar Neyra R.
Ral
Adems a travs de la figura siguiente podemos observar que a pesar de borrar

algunas partes y obtener una imagen no tan legible, la solucin siegue mostrando
un perfil de reconocimiento para la letra A.
Figura 14.Simulando una imagen con ruido.
El aplicativo tiene la opcin de poder ensearle a una red de modo Supervisado,

por lo que luego de haber hecho nuestros trazos en el sector de dibujo y haber
hecho click en reconocer, el boton add(aadir) sera el encargado de hacer que se
genere una nueva entrada en nuestra red, mostrandose as la opcion de aadir
carcter, solicitandonos el nombre del carcter reconocido.
23

(OCR)
Moscaiza M.,
Omar Neyra R.
Ral
Figura 15. Adicin del valor requerido por el aprendizaje supervisado.
Luego procedemos a presionar de aprender, con el se le asignar al dibujo el

Aprendizaje de un 100% para el trazo realizado.
24

(OCR)
Moscaiza M.,
Omar Neyra R.
Ral
Figura 16. Aplicando el aprendizaje no supervisado.
Figura 17. Reconocimiento de aprendizaje
El otro metodo de enseanza es el no supervisado, para ello se tendr que

seleccionar previamente la opcin tal cual como se detalla en la figura debajo
adjunta.
25

(OCR)
Moscaiza M.,
Omar Neyra R.
Ral
Figura 18. Mtodo de aprendizaje no supervisado.
Luego de digitalizar la imagen y presionar reconocer, el aplicativo nos mostrar el

valor del 100%. Adems observamos dos opciones debajo:
Create Limit: Si el mejor reconocimiento es inferior a este porcentaje, entonces se
crear un nuevo caracter.
Learn Limit: Si el mejor reconocimiento se encuentra por encima de este
porcentaje, entonces el aprendizaje se llevar a cabo en ese carcter.
26

(OCR)
Moscaiza M.,
Omar Neyra R.
Ral
Figura 19. Reconocimiento de carcter
Luego de haber reconocido se deber hacer doble click en el nombre del carcter
a fin de poder renombrarlo.
Figura 20. Renombrando el carcter.
27

(OCR)
Moscaiza M.,
Omar Neyra R.
Ral
En esta imagen podemos observar como luego de haber entrenado una red no
supervisada,
el
reconocimiento
de
caracteres
funciona
correctamente,
reconociendo las letras en este ejemplo.
Figura 21. Aplicando la red aprendida con otros caracteres

El aplicativo no se limita solamente a caracteres, sino tambin a smbolos y a
diferentes patrones de trazo que uno desee vincular para satisfacer una
necesidad.
28

(OCR)
Moscaiza M.,
Omar Neyra R.
Ral
VIII. CONCLUSIONES
1. Es evidente que el trmino redes neuronales artificiales abarcan una gran
variedad de diferentes paquetes de software con muchos tipos diferentes
de neuronas artificiales, arquitecturas de red y reglas de aprendizaje. Estas
diferentes redes pueden, a su vez, pueden aplicarse a una amplia gama de
funciones desde la fabricacin de cerveza hasta a una mejor comprensin
de las propiedades de los cerebros biolgicos en los que se basa.
2. Como resultado del desarrollo de este trabajo, concluimos que el uso de las
Redes Neuronales es una gran alternativa para la solucin de muchas
necesidades, no limitndose en el reconocimiento de caracteres sino que
usando esto como base para otras aplicaciones.
3. Con la ayuda del aplicativo es posible dar solucin a problemas ms
complejos como por ejemplo, reconocimiento y traduccin de texto,
resolucin de sudoku, identificacin de placas vehiculares, facturas, etc.
4. Una debilidad de la aplicacin es que es bsica, pero nos permite
comprender como se origina el proceso de reconocimiento de texto, los
pasos que se siguen y que mtodo se usa.
5. El ms notable es el hecho de que no puede manejar grandes variaciones
en la traslacin, rotacin o escala. Son necesarios unos pocos pasos de
pre procesamiento para poder implementarlo con el fin de dar cuenta de
estas variaciones, pero en general son difciles de resolver completamente
29

(OCR)
Moscaiza M.,
Omar Neyra R.
Ral
IX. BIBLIOGRAFIA
1. McCulloch, Warren; Walter Pitts (1943). "A Logical Calculus of Ideas
Immanent in Nervous Activity". Bulletin of Mathematical Biophysics 5 (4):
115133. doi:10.1007/BF02478259.
2. Hebb, Donald (1949). The Organization of Behavior. New York: Wiley.
3. Farley, B.G.; W.A. Clark (1954). "Simulation of Self-Organizing Systems by
Digital Computer".IRE Transactions on Information Theory 4 (4): 76
84. doi:10.1109/TIT.1954.1057468.
4. Rochester, N.; J.H. Holland, L.H. Habit, and W.L. Duda (1956). "Tests on
a cell assembly theory of the action of the brain, using a large digital
computer". IRE Transactions on Information Theory 2(3): 80
93. doi:10.1109/TIT.1956.1056810.
5. Hilera J, Martnez V. 1995. Redes neuronales artificiales: fundamentos,
modelos y aplicaciones. Madrid: Addison-Wesley Iberoamericana. RAMA. 390 p.
6. Snchez E, Alanis A. 2006. Redes neuronales: conceptos fundamentales
y aplicaciones a control automtico. Madrid. Prentice-Hall. 210.
7. Dowla F, Rogers L. 1996. Solving problems in environmental engineering
and geosciences with artificial neural networks. Cambridge. MIT Press.
310 p.
8. Bishop C, 2006. Neural Networks for Pattern Recognition. New York.
Oxford University Press. 504 p.
30

Red Neuronal OCR

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Red Neuronal OCR

Caricato da

Copyright:

Formati disponibili

Redes Neuronales aplicadas en los Sistemas de

Reconocimiento ptico de caracteres (OCR)

U201200278 Moscaiza Moncada, Omar I.

U201000119 Neyra Rangel, Ral

Lima, 17 de febrero de 2015

Redes Neuronales aplicadas en los Sistemas

RED NEURONAL ARTIFICIAL.................................................................9

SISTEMA DE RECONOCIMIENTO DE CARACTERES.................................14

Redes Neuronales aplicadas en los Sistemas

Redes Neuronales aplicadas en los Sistemas

Un programa de OCR consiste en un software que trata de convertir la imagen

Redes Neuronales aplicadas en los Sistemas

Redes Neuronales aplicadas en los Sistemas

Describir las redes neuronales

Describir el reconocimiento de caracteres mediante usando redes

Demostracin de caso practico

Redes Neuronales aplicadas en los Sistemas

Redes Neuronales aplicadas en los Sistemas

RED NEURONAL ARTIFICIAL

El conjunto de neuronas o nodos.

Los pesos nmero, que se modifica durante el entrenamiento de la red

Una funcin de activacin. El valor obtenido con la regla de propagacin,

Las neuronas o nodos son unidades o elementos de procesamiento las cuales se

Redes Neuronales aplicadas en los Sistemas

Back propagation.- conocida tambin como perceptron multicapa o retro

Redes Neuronales aplicadas en los Sistemas

nodo de salida hasta el nodo de entrada. Las limitaciones de black

Redes auto organizadas (SOFM). - Es una red de tipo unidireccional, y se

Redes de funcin de base radial (RBF). - Este tipo de redes se caracteriza

Redes Neuronales aplicadas en los Sistemas

Redes learning vector

clasificacin de patrones de tipo supervisado, tambin es un algoritmo

Redes no supervisadas.- Durante el aprendizaje el tutor indica a la red que

Redes de entrenamiento supervisado.- La red es independiente, localiza

Redes Neuronales aplicadas en los Sistemas

Figura 1 Aprendizaje por Correccin de Error

Algoritmos de Aprendizaje por Correccin del error

Redes Neuronales aplicadas en los Sistemas

VI. SISTEMA DE RECONOCIMIENTO DE

Redes Neuronales aplicadas en los Sistemas

impresin, e incluso un pobre proceso de escaneado, nunca es exactamente

Figura 2. Neurona Artificial

Redes Neuronales aplicadas en los Sistemas

Figura 3. Umbral neuronal

Figura 4. Cambio estado por sumatoria

Ahora que ya hablamos de las neuronas, pasemos a las redes neuronales

Figura 5. Capa de nodos de entradas, capa de neuronas ocultas y capa de neuronas de

Como se puede apreciar en el grfico la capa de entrada corresponde a lo que

Redes Neuronales aplicadas en los Sistemas

En el reconocimiento de patrones hay un nmero fijo de categoras en las cuales

Figura 6. Definicin de neuronas por pixels

A esta matriz la ocuparemos para determinar un carcter. Cada cuadro de la

Redes Neuronales aplicadas en los Sistemas

En este crculo habr 30 vectores

Figura 8. Patrn de entrada letra A

Supongamos que el patrn de entrada a la red es la letra A.

Redes Neuronales aplicadas en los Sistemas

Figura 9. Letra A con ruido

En ella vemos que falta parte de la letra.

Redes Neuronales aplicadas en los Sistemas

programa de mejora, ya que aprende de su (escritura con el mouse) escritura a

Figura 10. Red neuronal de dos capas

Redes Neuronales aplicadas en los Sistemas

determinada, se deber hacer doble clic en uno de los caracteres de la lista de