Resumen de Tesis

ESCUELA SUPERIOR POLITECNICA DEL LITORAL
INSTITUTO DE CIENCIAS MATEMTICAS
APLICACIN DE REDES NEURONALES PARA EL

ANLISIS DE LA CARTERA VENCIDA DE EMPRESAS,
CON EL FIN DE MEJORAR SU RENTABILIDAD
RESUMEN DE LA TESIS DE GRADO
Previa a la obtencin del Ttulo de:
INGENIERO EN ESTADISTICA INFORMATICA
Presentada por:
LUIS ALBERTO MUOZ SANTA CRUZ
GUAYAQUIL - ECUADOR
2002
RESUMEN
La presente aplicacin es tablece una metodolog a a seg uir para la
realizaci n del an lisis crediticio de un solicitante de un ser vicio. He tomado
como caso partic ular la compa a operadora de te lefo na celula r, BellSo ut h
Gua yaq uil, co n s u produc to crdito, ya q ue s us ana listas es tn to mando
decisiones crediticias basndose en el fac tor de ingresos fut uros, a ntes que
en la liquidez del clie nte.
BellSout h necesita automati zar e l proceso de i nspeccin de C uentas, ya q ue
es un p rocedimiento m uy lento y costoso e n trmi nos de recursos utili zados;
dado que incluye t res etapas ntimame nte relacio nadas: a)Ob tenci n de
informaci n del solicitante, b)An lisis de esa informacin para determi nar el
valo r crediticio del solicitante, c) Toma de decisin sobre e l crdito. La
decisin sobre el crdito a su vez estab lece si el crdito debe otorgarse y el
plan tarifa rio que puede acceder.
Se requiere de estruct uras de redes ne uro nales para logra r la automati zacin
de la verificacin de calidad crediticia de las Cuentas aceptadas, las que
utili za ndo el co ncepto de sistema a utom tico para el control de las Cue ntas
por Cobrar red ucir n la ca ntidad de tiempo q ue se usa en ste a n lisis.

INTRODUCCIN
El presente trabajo es la aplicacin de un modelo de Redes Neuronales,
utilizando un software para resolver el problema de la cartera vencida. En l
se han analizado cuales son las caractersticas que estn ntimamente
relacionadas con el riesgo de que se conviertan en cuentas perdidas, lo que
se logra sobre la base de una solucin factible en la aproximacin de Redes
Neuronales.
La actividad primordial es identificar el problema crediticio con la capacidad
de obtener una funcin de regresin cualitativa que el anlisis discriminante
posee. Si bien es cierto que esta tesis intenta resolver el problema
microeconmico a travs de la teora de las redes neuronales, servir
principalmente para entender que la forma matemtica usualmente
empleada no ser utilizada y se mostrar que hay ms de una forma de
resolver un problema de la vida real.
Sin duda lo que se busca es obtener la manera de que una computadora
sirva de apoyo en la toma de decisin con respecto de la probabilidad de que
determinado cliente sea o no sea un buen sujeto de crdito. Un anlisis
discriminante efecta, matemticamente, una diferenciacin entre perfiles de
diversos clientes clasificndolos entre buenos y malos sujetos de crdito,

por eso, y porque parte de la teora inicial de las redes neuronales se basa
en la discriminacin matemtica.
La base terica se fundamenta en las redes neuronales artificiales. Una
buena parte de la teora existente busca solucionar problemas matemticos
de aproximaciones funcionales no lineales tales como el de la O-Exclusiva,
un claro caso de anlisis discriminante.
Las redes de propagacin hacia atrs (un modelo de redes neuronales) son
necesariamente la opcin ms adecuada para ser utilizada en la
determinacin de si un cliente es o no es un buen sujeto de crdito.
Al someter los datos obtenidos de Bellsouth a un proceso de aprendizaje de
un modelo de redes neuronales previamente diseado y por medio de algn
paquete computacional obtendremos un resultado esperando que este sea
positivo. As, al final podremos ya tener un proceso neuro-discriminatorio
artificial para diferenciar posibles sujetos de crdito de los que
probablemente no lo sean.
CONTENIDO
ANTECEDENTES DE LA CARTERA VENCIDA DE BELLSOUTH,
PERODO JUNIO DEL 2000 JUNIO DEL 2001
Las compaas operadoras de telefona celular tienen que vender dos
productos: servicio y crdito. En particular nos interesa el producto crdito y
slo una fase de aquel. En este perodo que vive el pas, de incertidumbre,
los analistas de crdito de BellSouth estn tomando decisiones crediticias
basndose en el factor de ingresos futuros, antes que el de la liquidez del
cliente del servicio.
Uno de los factores principales en el anlisis del crdito que debe destacarse
para poder llegar a una decisin de otorgamiento de crdito es el cliente. El
juicio del oficial de crditos y su confianza en dicha persona pesa
fuertemente al tomar la decisin. Existe una reconocida premisa que dice,
que un crdito concedido adecuadamente puede considerarse cobrado en un
50%.
En las figuras 1 y 2 observamos los montos de cartera vencida y los
porcentajes de recuperacin de cada una en el perodo de Junio del 2000 a
Junio del 2001.

Monto de Carteras Vencidas
80.000
70.000
60.000
50.000
Dlares
40.000
30.000
20.000
10.000
-
Jun-00
Jul-00
Ago-00
Sep -00
Nov-00
Ene-01
Feb -01
Abr-01
May -01
Jun-01
Oct-00
Dic-00
Mar-01
Meses
Figura 1. Monto de cartera vencida del Perodo Jun-00 a Jun-01
Porcentaje de recuperacion
70%
60%
50%
Porcentaje
40%
30%
20%
10%
0%
Ago-00
Oct-00
Nov-00
Dic -00
Mar-01
Jun-00
Jul-00
Sep-00
Ene-01
Feb-01
Abr-01
May-01
Jun-01
Meses
Figura 2. Porcentaje de Recuperacin de Cartera vencida del
Perodo Jun-00 a Jun-01
LA CARTERA VENCIDA DESDE EL PUNTO DE VISTA
DE REDES NEURONALES.
El anlisis de crditos en las redes neuronales es completo, de forma tal,
que las condiciones reales, y no las aparentes, del solicitante del crdito
pueden ser desentraadas. Este anlisis involucra un estudio diligente y una
comprensin inteligente y viable de las condiciones bsicas financieras del

cliente en perspectiva; adems tiene la capacidad de medir la aptitud o
ineptitud natural del cliente para liquidar sus deudas dentro de los plazos
pactados.
El aspecto ms serio, sin embargo es la cantidad de conocimiento que
necesita el sistema, no existe una regla explcita para guiarse; es muy similar
al aprendizaje de conceptos, se debe introducir una regla a partir de un
conjunto de ejemplos de entrenamientos para as obtener una inteligencia
artificial y crear nuestro sistema de Redes Neuronales que organice las
experiencias, las generalice y utilice para resolver nuevos problemas.
BREVE DESCRIPCIN DEL ANLISIS DISCRIMINANTE.
El anlisis discriminante es exploratorio en naturaleza. Como un
procedimiento separativo, a veces es empleado en una base nica con el
objeto de investigar las diferencias observables cuando las relaciones
causales no son bien entendidas. Los procedimientos clasificatorios son
menos exploratorios en el sentido que conllevan hacia reglas bien definidas,
que pueden ser usadas para asignar nuevos objetos. La clasificacin
ordinariamente requiere ms estructura del problema que la discriminacin.
Para este estudio ha sido menester explicar el problema de clasificacin
desde la ptica genrica del anlisis discriminante. Aunque esta tesis no

incluye un anlisis discriminante tradicional, si es vlido decir que el proceso
clasificatorio que lleva a cabo una red neuronal tiene naturaleza discriminante
y la tarea o fin, es exactamente el mismo, aunque los procedimientos sean
distintos. Debido a esto, no se incluye ms que una explicacin somera del
anlisis discriminante, ya que, entrar en materia ms profunda escapa al
alcance de esta tesis.
A la operadora celular Bellsouth acuden cierto nmero de clientes con
diferentes caractersticas crediticias que podemos agrupar como variables en
un vector i de entrada. As mismo, luego de aceptar al cliente, este sujeto de
crdito genera un historial en una base de datos de cobranzas. Evaluando al
cliente en funcin de su historial mas no de sus caractersticas crediticias
podremos decir que tan buen pagador es el cliente a travs de sus pagos
registrados en la base de datos. Sean estos resultados agrupados en un
vector d de salida. Entonces tendramos ya material suficiente para entrenar
una red de back-propagation a reconocer los patrones de comportamiento de
los clientes utilizando sus variables crediticias. Esta es la red que, una vez
entrenada, podr repetir dicho comportamiento y evaluar los datos del
cliente.
Las redes de propagacin hacia atrs son necesariamente la opcin ms
adecuada para ser utilizada en la determinacin de si un cliente es o no es

un buen sujeto de crdito. Esto ocurre primariamente por la capacidad de la
red de imitar una correspondencia funcional entre un conjunto de entrada y
otro de salida.
A continuacin se resolver el problema de la neuroclasificacin de los datos
obtenidos de Bellsouth al someterlos a un proceso de aprendizaje de un
modelo de redes neuronales previamente diseado y por medio de un
paquete computacional obtendremos un resultado esperando que este sea
positivo. As, al final podremos tener un proceso neuro-discriminatorio
artificial para diferenciar posibles suje tos de crdito de los que
probablemente no lo sean.
Las variables utilizadas son: i1: Edad (entero), i2: Estado Civil (boolean), i3:
Casa Propia / alquilada (boolean), i4: Trabajo Empleado-Operativo /
Ejecutivo-Propietario (boolean), i5: Aos en el ltimo trabajo (entero), i6:
Pago con Dbito-Cuenta / Dbito-Tarjeta (boolean). La variable de resultado
es d1: Aparece eventualmente en mora por ms de un mes (boolean).
Estos datos constituyen una muestra de aquellos clientes cuyos planes
tarifarios son cuentas individuales de Bellsouth guayaquil del perodo julio
2000 julio 2001. El total de la muestra es n = 100 sujetos. No se toma en
cuenta ningn caso de planes de prepago por obvias razones. La muestra

Figura 3 Estructura de la red neuronal que resuelve el problema
es tan reducida debido a lo confidencial de los datos y sobretodo a la mala
calidad de la informacin. En todos los casos no haba ms que papeles
(cero registros digitalizados) y en la mayora haba datos incompletos o
ilegibles; tambin debemos tener en cuenta que es muy probable que exista
algn tipo de sesgo.
Como podemos observar en la figura 3, esa es la estructura o esqueleto de
la red que utilizaremos: 3 capas, una de entrada con 6 nodos, una
intermedia tambin con 6 nodos y una de salida con un nico nodo. Todos
los nodos de la capa anterior se interconectan con todos los nodos de la
capa posterior, como es usual en Back-Propagation.
La simple lgica nos explica por qu tenemos 6 nodos en la capa de entrada
y 1 en la capa de salida: cada nodo de la capa de entrada representar la
entrada de cada variable de la hoja de riesgo, esto es i1, i2, ..., i6; y el nodo
de la capa de salida representa el resultado del anlisis crediticio d1. El

nmero de capas ocultas y nodos en la misma provienen de razones un tanto
distintas.
La figura 4 muestra el diseo de la capa de entrada. En la capa oculta
procedemos a parametrizarla conforme lo antes establecido. Tenemos 6
nodos, utilizamos una suma ponderada (en la figura se ve: dot product) y
una funcin de transferencia sigmoide (establece una especie de umbral 0-
1).
Figura 4 Parametrizacin en la capa de entrada

En la figura 5 vemos adems que las tasas de velocidad de aprendizaje y de
momento antes discutidas se han elegido con valores de 0.09 y 0.07
respectivamente.
Figura 5 Parametrizacin de la red en la capa oculta
Estos valores fueron elegidos conforme hicimos algunos ensayos hasta
encontrarlos como los ms adecuados al equilibrar la velocidad del
aprendizaje y el riesgo de caer en mnimos locales.
En el primer intento por elegir una tasa de aprendizaje optamos por 0.01 y
probamos que era una tasa muy baja ya que el aprendizaje era muy lento.
La mayor parte del aprendizaje la hace la capa oculta en este caso debido al
mayor nmero de nodos que esta tiene con respecto a la capa de salida.
En la figura 6 observamos la parametrizacin de la capa de salida. Se ve un
nico nodo cuya funcin de resultado o transferencia tambin es una
sigmoide.
De la misma figura 6 ntese que los parmetros de velocidad y momento
escogidos fueron 0.05 y 0.03 respectivamente. La razn de ser de estos
valores es similar a la expuesta en la capa oculta con la diferencia que en
esta capa la velocidad del aprendizaje no es muy influenciada debido a la
existencia de un nico nodo.
Figura 6 Parametrizacin de la red en la capa de salida

El procedimiento de importacin de datos de entrenamiento y prueba es
bastante sencillo. Lo que hay que cuidar es digitar la informacin
previamente de tal manera que ThinksPro pueda reconocerla sin ningn
problema. Por ejemplo no se debe grabar los datos con el encabezado como
nombre de la variable ya que el programa lo hace por omisin.
Simplemente optamos por el comando File / Import File / Training set y File
/ Import File / Test set y para importar los archivos prueba11.txt y
prueba22.txt que previamente guardamos desde MSExcel.
Figura 7 Muestra de las hojas de datos en ThinksPro
En la figura 7 observamos el caso para los conjuntos de entrenamiento y
prueba.
En la figura 8 se puede ver que el error baja rpidamente hasta que
Figura 8 Evolucin del error global conforme la red es entrenada
encuentra el criterio de convergencia. La lnea de color roja representa el
error al que nos referimos: ETrn o error de entrenamiento.

OBTENCIN DE LOS RESULTADOS
Parte de los resultados ya los hemos mostrado en lo que respecta del valor
final del error. Observemos la figura 9.
Figura 9 Resultados de ThinksPro al cabo de 933 iteraciones
Para los casos en que el resultado deseado es deudor (es decir, d1 = 1) el
valor actual de o1 es muy cercano a 1, y para los casos en que el resultado
deseado es no deudor (d1 = 0) el valor actual de o1 es muy cercano a cero;
cosa que constituye otra prueba que el entrenamiento ha sido eficaz. De
manera novedosa se crea una escala de colores que varia desde cero hasta
uno. Esta escala representa todos los posibles valores que o1 puede tomar.
Caso por caso se puede ver como aquellos valores cercanos a cero tienen
un color muy oscuro (negro=0) y que los valores cercanos a uno tienen un
color claro (blanco=1).
Resulta ilgico el generalizar que el sesgo consiste en una mayora de casos
de aquellos clientes que pagan a travs de su tarjeta de crdito se reportan
como deudores en la muestra. Con esto queremos decir que tal y como est
entrenada la red no fuera suficiente (ni confiable) para que esta evale a un
nuevo cliente y lo clasifique dentro del grupo deudor o no deudor.
El origen de este sesgo proviene de las pocas fuentes confiables de datos
que obtuvimos. Lo lgico es pensar que la mayora de deudores que
digitamos provenan de algn archivo especficamente de tarjeta habientes.
La red neuronal entrenada me servir para que de ahora en adelante yo
pueda tener un mejor criterio de a quin aprobarle los planes y a quin no, de
la siguiente manera: En el conjunto de datos de Prueba inserto un nuevo
caso. Este nuevo registro representa al nuevo potencial cliente y sus
variables crediticias a ser evaluadas. En el campo d1 no debemos ingresar
valor alguno ya que no sabemos a priori si es que este nuevo sujeto ser
deudor o no.
Al ejecutar el archivo de prueba desde su visor de datos obtenemos
inmediatamente un valor para o1. Al hacer la misma ejecucin desde el visor
de colores obtenemos lo mismo, que es un nuevo color (o valor) para o1.
Entonces si este nuevo valor se aproxima a 1 sabremos que probablemente
este cliente no sea un buen pagador y si se aproximara a cero pensramos lo
contrario. Es as como finalmente hemos utilizado una tecnologa
complicada en una idea sencilla. Obviamente que a medida que la base de
datos es alimentada habra que re-entrenar la red peridicamente.
CONCLUSIONES
Primeramente, se puede afirmar que lo que no puede generalizarse para
cualquier caso ya que dependiendo de que datos se tenga y su relacin real
con el resultado esperado se esperar un mejor o peor entrenamiento y por
ende una respuesta distinta de la red. Es obvio que en el fondo esto debe
ser un juego de correlaciones.
Entonces se puede recomendar para futuros trabajos e investigaciones el
hacer un anlisis de correlaciones antes de proseguir con el modelamiento
de la red, claro est, esto no es estrictamente necesario ya que la red
aprender ms de las variables que ms aporten sin importar el resto de las

variables. Adems no podemos pedir que todo modelador de redes y peor
que todo analista de crdito sea estadstico.
Se recomienda que se lleven registros digitalizados con la informacin
tomada y que no se llenen papeles para abandonarlos en alguna bodega, por
increble que parezca esto es lo que ocurra y ya vemos cul es el resultado
de esto.
Tambin es importante el afirmar que las variables que se usan en la hoja de
administracin de riesgo no son necesariamente las adecuadas. De hecho,
segn autores en anlisis multivariante lo recomendable en el caso crediticio
ser utilizar, tamao de la familia, ingresos, avalo de la casa, edad y aos
de trabajo. Vemos entonces que gran parte de este grupo de variables no es
utilizado en Bellsouth.
BIBLIOGRAFA
a. Jordan, M.I., & Jacobs, R.A. Hierarchies of adaptive experts, Advances in
Neural Information Processing Systems. 4ta, pp. 965-992
b. Brown, Robert Jay, An Artificial Neural Network Experiment, Dr. Dobbs
Journal, pp 16-71, April 1987
c. Jones, William P., Hoskins, Josiah, Back Propagation, A Generalized
Delta Learning Rule. BYTE Magazine, 1000 Boone Ave. N., Golden
Valley, MN, 1989.
d. Reece, Peter, Perceptrons and Neural Nets. AI Expert, Volumen 2, 1987

e. Freeman, James, & Skapura, David, Redes Neuronales, Addison-
Wesley, Massachusetts, 1991, pp 93-132
f. Powerful Neural Network Software,
Http://www.sigma-research.com/bookshelf/rtthinks.htm
g. Neural Networks and Artificial Intelligence,
Htpp://members.aol.com/martinhwj/neuro0.htm

Resumen de Tesis

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Resumen de Tesis

Caricato da

Copyright:

Formati disponibili

ESCUELA SUPERIOR POLITECNICA DEL LITORAL

INSTITUTO DE CIENCIAS MATEMTICAS

APLICACIN DE REDES NEURONALES PARA EL

RESUMEN DE LA TESIS DE GRADO

Previa a la obtencin del Ttulo de:

INGENIERO EN ESTADISTICA INFORMATICA

LUIS ALBERTO MUOZ SANTA CRUZ

La presente aplicacin es tablece una metodolog a a seg uir para la

realizaci n del an lisis crediticio de un solicitante de un ser vicio. He tomado

como caso partic ular la compa a operadora de te lefo na celula r, BellSo ut h

Gua yaq uil, co n s u produc to crdito, ya q ue s us ana listas es tn to mando

en la liquidez del clie nte.

BellSout h necesita automati zar e l proceso de i nspeccin de C uentas, ya q ue

es un p rocedimiento m uy lento y costoso e n trmi nos de recursos utili zados;

valo r crediticio del solicitante, c) Toma de decisin sobre e l crdito. La

decisin sobre el crdito a su vez estab lece si el crdito debe otorgarse y el

plan tarifa rio que puede acceder.

de la verificacin de calidad crediticia de las Cuentas aceptadas, las que

por Cobrar red ucir n la ca ntidad de tiempo q ue se usa en ste a n lisis.

El presente trabajo es la aplicacin de un modelo de Redes Neuronales,

utilizando un software para resolver el problema de la cartera vencida. En l

se han analizado cuales son las caractersticas que estn ntimamente

relacionadas con el riesgo de que se conviertan en cuentas perdidas, lo que

se logra sobre la base de una solucin factible en la aproximacin de Redes

La actividad primordial es identificar el problema crediticio con la capacidad

de obtener una funcin de regresin cualitativa que el anlisis discriminante

posee. Si bien es cierto que esta tesis intenta resolver el problema

microeconmico a travs de la teora de las redes neuronales, servir

principalmente para entender que la forma matemtica usualmente

empleada no ser utilizada y se mostrar que hay ms de una forma de

resolver un problema de la vida real.

Sin duda lo que se busca es obtener la manera de que una computadora

sirva de apoyo en la toma de decisin con respecto de la probabilidad de que

determinado cliente sea o no sea un buen sujeto de crdito. Un anlisis

discriminante efecta, matemticamente, una diferenciacin entre perfiles de

diversos clientes clasificndolos entre buenos y malos sujetos de crdito,

La base terica se fundamenta en las redes neuronales artificiales. Una

buena parte de la teora existente busca solucionar problemas matemticos

de aproximaciones funcionales no lineales tales como el de la O-Exclusiva,

un claro caso de anlisis discriminante.

necesariamente la opcin ms adecuada para ser utilizada en la

determinacin de si un cliente es o no es un buen sujeto de crdito.

Al someter los datos obtenidos de Bellsouth a un proceso de aprendizaje de

un modelo de redes neuronales previamente diseado y por medio de algn

paquete computacional obtendremos un resultado esperando que este sea

positivo. As, al final podremos ya tener un proceso neuro-discriminatorio

artificial para diferenciar posibles sujetos de crdito de los que

ANTECEDENTES DE LA CARTERA VENCIDA DE BELLSOUTH,

PERODO JUNIO DEL 2000 JUNIO DEL 2001

Las compaas operadoras de telefona celular tienen que vender dos

productos: servicio y crdito. En particular nos interesa el producto crdito y

los analistas de crdito de BellSouth estn tomando decisiones crediticias

basndose en el factor de ingresos futuros, antes que el de la liquidez del

cliente del servicio.

para poder llegar a una decisin de otorgamiento de crdito es el cliente. El

juicio del oficial de crditos y su confianza en dicha persona pesa

fuertemente al tomar la decisin. Existe una reconocida premisa que dice,

que un crdito concedido adecuadamente puede considerarse cobrado en un

En las figuras 1 y 2 observamos los montos de cartera vencida y los

porcentajes de recuperacin de cada una en el perodo de Junio del 2000 a

Junio del 2001.

Figura 1. Monto de cartera vencida del Perodo Jun-00 a Jun-01

Figura 2. Porcentaje de Recuperacin de Cartera vencida del

Perodo Jun-00 a Jun-01