Sei sulla pagina 1di 21

ESCUELA SUPERIOR POLITECNICA DEL LITORAL

INSTITUTO DE CIENCIAS MATEMTICAS

APLICACIN DE REDES NEURONALES PARA EL


ANLISIS DE LA CARTERA VENCIDA DE EMPRESAS,
CON EL FIN DE MEJORAR SU RENTABILIDAD

RESUMEN DE LA TESIS DE GRADO

Previa a la obtencin del Ttulo de:

INGENIERO EN ESTADISTICA INFORMATICA

Presentada por:

LUIS ALBERTO MUOZ SANTA CRUZ

GUAYAQUIL - ECUADOR

2002
RESUMEN

La presente aplicacin es tablece una metodolog a a seg uir para la

realizaci n del an lisis crediticio de un solicitante de un ser vicio. He tomado

como caso partic ular la compa a operadora de te lefo na celula r, BellSo ut h

Gua yaq uil, co n s u produc to crdito, ya q ue s us ana listas es tn to mando

decisiones crediticias basndose en el fac tor de ingresos fut uros, a ntes que

en la liquidez del clie nte.

BellSout h necesita automati zar e l proceso de i nspeccin de C uentas, ya q ue

es un p rocedimiento m uy lento y costoso e n trmi nos de recursos utili zados;

dado que incluye t res etapas ntimame nte relacio nadas: a)Ob tenci n de

informaci n del solicitante, b)An lisis de esa informacin para determi nar el

valo r crediticio del solicitante, c) Toma de decisin sobre e l crdito. La

decisin sobre el crdito a su vez estab lece si el crdito debe otorgarse y el

plan tarifa rio que puede acceder.

Se requiere de estruct uras de redes ne uro nales para logra r la automati zacin

de la verificacin de calidad crediticia de las Cuentas aceptadas, las que

utili za ndo el co ncepto de sistema a utom tico para el control de las Cue ntas

por Cobrar red ucir n la ca ntidad de tiempo q ue se usa en ste a n lisis.


INTRODUCCIN

El presente trabajo es la aplicacin de un modelo de Redes Neuronales,

utilizando un software para resolver el problema de la cartera vencida. En l

se han analizado cuales son las caractersticas que estn ntimamente

relacionadas con el riesgo de que se conviertan en cuentas perdidas, lo que

se logra sobre la base de una solucin factible en la aproximacin de Redes

Neuronales.

La actividad primordial es identificar el problema crediticio con la capacidad

de obtener una funcin de regresin cualitativa que el anlisis discriminante

posee. Si bien es cierto que esta tesis intenta resolver el problema

microeconmico a travs de la teora de las redes neuronales, servir

principalmente para entender que la forma matemtica usualmente

empleada no ser utilizada y se mostrar que hay ms de una forma de

resolver un problema de la vida real.

Sin duda lo que se busca es obtener la manera de que una computadora

sirva de apoyo en la toma de decisin con respecto de la probabilidad de que

determinado cliente sea o no sea un buen sujeto de crdito. Un anlisis

discriminante efecta, matemticamente, una diferenciacin entre perfiles de

diversos clientes clasificndolos entre buenos y malos sujetos de crdito,


por eso, y porque parte de la teora inicial de las redes neuronales se basa

en la discriminacin matemtica.

La base terica se fundamenta en las redes neuronales artificiales. Una

buena parte de la teora existente busca solucionar problemas matemticos

de aproximaciones funcionales no lineales tales como el de la O-Exclusiva,

un claro caso de anlisis discriminante.

Las redes de propagacin hacia atrs (un modelo de redes neuronales) son

necesariamente la opcin ms adecuada para ser utilizada en la

determinacin de si un cliente es o no es un buen sujeto de crdito.

Al someter los datos obtenidos de Bellsouth a un proceso de aprendizaje de

un modelo de redes neuronales previamente diseado y por medio de algn

paquete computacional obtendremos un resultado esperando que este sea

positivo. As, al final podremos ya tener un proceso neuro-discriminatorio

artificial para diferenciar posibles sujetos de crdito de los que

probablemente no lo sean.
CONTENIDO

ANTECEDENTES DE LA CARTERA VENCIDA DE BELLSOUTH,

PERODO JUNIO DEL 2000 JUNIO DEL 2001

Las compaas operadoras de telefona celular tienen que vender dos

productos: servicio y crdito. En particular nos interesa el producto crdito y

slo una fase de aquel. En este perodo que vive el pas, de incertidumbre,

los analistas de crdito de BellSouth estn tomando decisiones crediticias

basndose en el factor de ingresos futuros, antes que el de la liquidez del

cliente del servicio.

Uno de los factores principales en el anlisis del crdito que debe destacarse

para poder llegar a una decisin de otorgamiento de crdito es el cliente. El

juicio del oficial de crditos y su confianza en dicha persona pesa

fuertemente al tomar la decisin. Existe una reconocida premisa que dice,

que un crdito concedido adecuadamente puede considerarse cobrado en un

50%.

En las figuras 1 y 2 observamos los montos de cartera vencida y los

porcentajes de recuperacin de cada una en el perodo de Junio del 2000 a

Junio del 2001.


Monto de Carteras Vencidas

80.000
70.000
60.000
50.000
Dlares

40.000
30.000
20.000
10.000
-
Jun-00

Jul-00

Ago-00

Sep -00

Nov-00

Ene-01

Feb -01

Abr-01

May -01

Jun-01
Oct-00

Dic-00

Mar-01
Meses

Figura 1. Monto de cartera vencida del Perodo Jun-00 a Jun-01

Porcentaje de recuperacion

70%
60%
50%
Porcentaje

40%
30%
20%
10%
0%
Ago-00

Oct-00

Nov-00

Dic -00

Mar-01
Jun-00

Jul-00

Sep-00

Ene-01

Feb-01

Abr-01

May-01

Jun-01
Meses

Figura 2. Porcentaje de Recuperacin de Cartera vencida del

Perodo Jun-00 a Jun-01

LA CARTERA VENCIDA DESDE EL PUNTO DE VISTA

DE REDES NEURONALES.

El anlisis de crditos en las redes neuronales es completo, de forma tal,

que las condiciones reales, y no las aparentes, del solicitante del crdito

pueden ser desentraadas. Este anlisis involucra un estudio diligente y una

comprensin inteligente y viable de las condiciones bsicas financieras del


cliente en perspectiva; adems tiene la capacidad de medir la aptitud o

ineptitud natural del cliente para liquidar sus deudas dentro de los plazos

pactados.

El aspecto ms serio, sin embargo es la cantidad de conocimiento que

necesita el sistema, no existe una regla explcita para guiarse; es muy similar

al aprendizaje de conceptos, se debe introducir una regla a partir de un

conjunto de ejemplos de entrenamientos para as obtener una inteligencia

artificial y crear nuestro sistema de Redes Neuronales que organice las

experiencias, las generalice y utilice para resolver nuevos problemas.

BREVE DESCRIPCIN DEL ANLISIS DISCRIMINANTE.

El anlisis discriminante es exploratorio en naturaleza. Como un

procedimiento separativo, a veces es empleado en una base nica con el

objeto de investigar las diferencias observables cuando las relaciones

causales no son bien entendidas. Los procedimientos clasificatorios son

menos exploratorios en el sentido que conllevan hacia reglas bien definidas,

que pueden ser usadas para asignar nuevos objetos. La clasificacin

ordinariamente requiere ms estructura del problema que la discriminacin.

Para este estudio ha sido menester explicar el problema de clasificacin

desde la ptica genrica del anlisis discriminante. Aunque esta tesis no


incluye un anlisis discriminante tradicional, si es vlido decir que el proceso

clasificatorio que lleva a cabo una red neuronal tiene naturaleza discriminante

y la tarea o fin, es exactamente el mismo, aunque los procedimientos sean

distintos. Debido a esto, no se incluye ms que una explicacin somera del

anlisis discriminante, ya que, entrar en materia ms profunda escapa al

alcance de esta tesis.

A la operadora celular Bellsouth acuden cierto nmero de clientes con

diferentes caractersticas crediticias que podemos agrupar como variables en

un vector i de entrada. As mismo, luego de aceptar al cliente, este sujeto de

crdito genera un historial en una base de datos de cobranzas. Evaluando al

cliente en funcin de su historial mas no de sus caractersticas crediticias

podremos decir que tan buen pagador es el cliente a travs de sus pagos

registrados en la base de datos. Sean estos resultados agrupados en un

vector d de salida. Entonces tendramos ya material suficiente para entrenar

una red de back-propagation a reconocer los patrones de comportamiento de

los clientes utilizando sus variables crediticias. Esta es la red que, una vez

entrenada, podr repetir dicho comportamiento y evaluar los datos del

cliente.

Las redes de propagacin hacia atrs son necesariamente la opcin ms

adecuada para ser utilizada en la determinacin de si un cliente es o no es


un buen sujeto de crdito. Esto ocurre primariamente por la capacidad de la

red de imitar una correspondencia funcional entre un conjunto de entrada y

otro de salida.

A continuacin se resolver el problema de la neuroclasificacin de los datos

obtenidos de Bellsouth al someterlos a un proceso de aprendizaje de un

modelo de redes neuronales previamente diseado y por medio de un

paquete computacional obtendremos un resultado esperando que este sea

positivo. As, al final podremos tener un proceso neuro-discriminatorio

artificial para diferenciar posibles suje tos de crdito de los que

probablemente no lo sean.

Las variables utilizadas son: i1: Edad (entero), i2: Estado Civil (boolean), i3:

Casa Propia / alquilada (boolean), i4: Trabajo Empleado-Operativo /

Ejecutivo-Propietario (boolean), i5: Aos en el ltimo trabajo (entero), i6:

Pago con Dbito-Cuenta / Dbito-Tarjeta (boolean). La variable de resultado

es d1: Aparece eventualmente en mora por ms de un mes (boolean).

Estos datos constituyen una muestra de aquellos clientes cuyos planes

tarifarios son cuentas individuales de Bellsouth guayaquil del perodo julio

2000 julio 2001. El total de la muestra es n = 100 sujetos. No se toma en

cuenta ningn caso de planes de prepago por obvias razones. La muestra


Figura 3 Estructura de la red neuronal que resuelve el problema

es tan reducida debido a lo confidencial de los datos y sobretodo a la mala

calidad de la informacin. En todos los casos no haba ms que papeles

(cero registros digitalizados) y en la mayora haba datos incompletos o

ilegibles; tambin debemos tener en cuenta que es muy probable que exista

algn tipo de sesgo.

Como podemos observar en la figura 3, esa es la estructura o esqueleto de

la red que utilizaremos: 3 capas, una de entrada con 6 nodos, una

intermedia tambin con 6 nodos y una de salida con un nico nodo. Todos

los nodos de la capa anterior se interconectan con todos los nodos de la

capa posterior, como es usual en Back-Propagation.

La simple lgica nos explica por qu tenemos 6 nodos en la capa de entrada

y 1 en la capa de salida: cada nodo de la capa de entrada representar la

entrada de cada variable de la hoja de riesgo, esto es i1, i2, ..., i6; y el nodo

de la capa de salida representa el resultado del anlisis crediticio d1. El


nmero de capas ocultas y nodos en la misma provienen de razones un tanto

distintas.

La figura 4 muestra el diseo de la capa de entrada. En la capa oculta

procedemos a parametrizarla conforme lo antes establecido. Tenemos 6

nodos, utilizamos una suma ponderada (en la figura se ve: dot product) y

una funcin de transferencia sigmoide (establece una especie de umbral 0-

1).

Figura 4 Parametrizacin en la capa de entrada


En la figura 5 vemos adems que las tasas de velocidad de aprendizaje y de

momento antes discutidas se han elegido con valores de 0.09 y 0.07

respectivamente.

Figura 5 Parametrizacin de la red en la capa oculta

Estos valores fueron elegidos conforme hicimos algunos ensayos hasta

encontrarlos como los ms adecuados al equilibrar la velocidad del

aprendizaje y el riesgo de caer en mnimos locales.

En el primer intento por elegir una tasa de aprendizaje optamos por 0.01 y

probamos que era una tasa muy baja ya que el aprendizaje era muy lento.

La mayor parte del aprendizaje la hace la capa oculta en este caso debido al

mayor nmero de nodos que esta tiene con respecto a la capa de salida.
En la figura 6 observamos la parametrizacin de la capa de salida. Se ve un

nico nodo cuya funcin de resultado o transferencia tambin es una

sigmoide.

De la misma figura 6 ntese que los parmetros de velocidad y momento

escogidos fueron 0.05 y 0.03 respectivamente. La razn de ser de estos

valores es similar a la expuesta en la capa oculta con la diferencia que en

esta capa la velocidad del aprendizaje no es muy influenciada debido a la

existencia de un nico nodo.

Figura 6 Parametrizacin de la red en la capa de salida


El procedimiento de importacin de datos de entrenamiento y prueba es

bastante sencillo. Lo que hay que cuidar es digitar la informacin

previamente de tal manera que ThinksPro pueda reconocerla sin ningn

problema. Por ejemplo no se debe grabar los datos con el encabezado como

nombre de la variable ya que el programa lo hace por omisin.

Simplemente optamos por el comando File / Import File / Training set y File

/ Import File / Test set y para importar los archivos prueba11.txt y

prueba22.txt que previamente guardamos desde MSExcel.

Figura 7 Muestra de las hojas de datos en ThinksPro

En la figura 7 observamos el caso para los conjuntos de entrenamiento y

prueba.
En la figura 8 se puede ver que el error baja rpidamente hasta que

Figura 8 Evolucin del error global conforme la red es entrenada

encuentra el criterio de convergencia. La lnea de color roja representa el

error al que nos referimos: ETrn o error de entrenamiento.


OBTENCIN DE LOS RESULTADOS

Parte de los resultados ya los hemos mostrado en lo que respecta del valor

final del error. Observemos la figura 9.

Figura 9 Resultados de ThinksPro al cabo de 933 iteraciones

Para los casos en que el resultado deseado es deudor (es decir, d1 = 1) el

valor actual de o1 es muy cercano a 1, y para los casos en que el resultado

deseado es no deudor (d1 = 0) el valor actual de o1 es muy cercano a cero;

cosa que constituye otra prueba que el entrenamiento ha sido eficaz. De

manera novedosa se crea una escala de colores que varia desde cero hasta

uno. Esta escala representa todos los posibles valores que o1 puede tomar.
Caso por caso se puede ver como aquellos valores cercanos a cero tienen

un color muy oscuro (negro=0) y que los valores cercanos a uno tienen un

color claro (blanco=1).

Resulta ilgico el generalizar que el sesgo consiste en una mayora de casos

de aquellos clientes que pagan a travs de su tarjeta de crdito se reportan

como deudores en la muestra. Con esto queremos decir que tal y como est

entrenada la red no fuera suficiente (ni confiable) para que esta evale a un

nuevo cliente y lo clasifique dentro del grupo deudor o no deudor.

El origen de este sesgo proviene de las pocas fuentes confiables de datos

que obtuvimos. Lo lgico es pensar que la mayora de deudores que

digitamos provenan de algn archivo especficamente de tarjeta habientes.

La red neuronal entrenada me servir para que de ahora en adelante yo

pueda tener un mejor criterio de a quin aprobarle los planes y a quin no, de

la siguiente manera: En el conjunto de datos de Prueba inserto un nuevo

caso. Este nuevo registro representa al nuevo potencial cliente y sus

variables crediticias a ser evaluadas. En el campo d1 no debemos ingresar

valor alguno ya que no sabemos a priori si es que este nuevo sujeto ser

deudor o no.
Al ejecutar el archivo de prueba desde su visor de datos obtenemos

inmediatamente un valor para o1. Al hacer la misma ejecucin desde el visor

de colores obtenemos lo mismo, que es un nuevo color (o valor) para o1.

Entonces si este nuevo valor se aproxima a 1 sabremos que probablemente

este cliente no sea un buen pagador y si se aproximara a cero pensramos lo

contrario. Es as como finalmente hemos utilizado una tecnologa

complicada en una idea sencilla. Obviamente que a medida que la base de

datos es alimentada habra que re-entrenar la red peridicamente.

CONCLUSIONES

Primeramente, se puede afirmar que lo que no puede generalizarse para

cualquier caso ya que dependiendo de que datos se tenga y su relacin real

con el resultado esperado se esperar un mejor o peor entrenamiento y por

ende una respuesta distinta de la red. Es obvio que en el fondo esto debe

ser un juego de correlaciones.

Entonces se puede recomendar para futuros trabajos e investigaciones el

hacer un anlisis de correlaciones antes de proseguir con el modelamiento

de la red, claro est, esto no es estrictamente necesario ya que la red

aprender ms de las variables que ms aporten sin importar el resto de las


variables. Adems no podemos pedir que todo modelador de redes y peor

que todo analista de crdito sea estadstico.

Se recomienda que se lleven registros digitalizados con la informacin

tomada y que no se llenen papeles para abandonarlos en alguna bodega, por

increble que parezca esto es lo que ocurra y ya vemos cul es el resultado

de esto.

Tambin es importante el afirmar que las variables que se usan en la hoja de

administracin de riesgo no son necesariamente las adecuadas. De hecho,

segn autores en anlisis multivariante lo recomendable en el caso crediticio

ser utilizar, tamao de la familia, ingresos, avalo de la casa, edad y aos

de trabajo. Vemos entonces que gran parte de este grupo de variables no es

utilizado en Bellsouth.
BIBLIOGRAFA

a. Jordan, M.I., & Jacobs, R.A. Hierarchies of adaptive experts, Advances in

Neural Information Processing Systems. 4ta, pp. 965-992

b. Brown, Robert Jay, An Artificial Neural Network Experiment, Dr. Dobbs

Journal, pp 16-71, April 1987

c. Jones, William P., Hoskins, Josiah, Back Propagation, A Generalized

Delta Learning Rule. BYTE Magazine, 1000 Boone Ave. N., Golden

Valley, MN, 1989.

d. Reece, Peter, Perceptrons and Neural Nets. AI Expert, Volumen 2, 1987


e. Freeman, James, & Skapura, David, Redes Neuronales, Addison-

Wesley, Massachusetts, 1991, pp 93-132

f. Powerful Neural Network Software,

Http://www.sigma-research.com/bookshelf/rtthinks.htm

g. Neural Networks and Artificial Intelligence,

Htpp://members.aol.com/martinhwj/neuro0.htm

Potrebbero piacerti anche