Sei sulla pagina 1di 5

BSQUEDA ESTRATGICA DE CONOCIMIENTO

Msc. Ral Oscar Klenzi, Msc. Mara Alejandra Malberti, Msc. Graciela Elida
Beguer, Lic. Silvina Migani, Lic. Laura Gutierrez, Ing. Carlos Correa, Prog. Luis
Olguin y Lic. Juan Manuel Cuneo

Departamento de Informtica- Facultad de Ciencias Exactas, Fsicas y Naturales.
Universidad Nacional de San Juan.

RESUMEN
La bsqueda de conocimiento inmerso en datos por medio de estrategias de minera de
datos Data Mining- DM, y su validacin mediante herramientas estadsticas y de software
especficas, es el rea donde el proyecto Bsqueda estratgica de conocimiento en los
datos de Biblioteca y Alumnos de la FCEFN - 21/E824, se desarrolla. En este documento
se exponen las lneas de investigacin abordadas, las actividades realizadas y los resultados
alcanzados.


Palabras clave: Gestin del Conocimiento - Data Mining - Satisfaccin de Usuarios
Desercin Universitaria


1. CONTEXTO

En la actualidad, la universidad toda y en particular
la Facultad de Ciencias Exactas Fsicas y Naturales
de la Universidad Nacional de San Juan, FCEFN-
UNSJ, est abocada a la etapa de auto evaluacin
institucional con miras a mejorar la calidad de la
institucin. Con el propsito de acompaar este
proceso, en esta propuesta se realiza la gestin de
conocimiento sobre los datos pertenecientes a los
Sistemas de Biblioteca y de Alumnos de la
mencionada facultad. As mismo se analiza le
desercin estudiantil en el mbito del Departamento
de Informtica de esta Facultad, el cual se encuentra
inmerso en el proceso de acreditacin de sus
carreras.
Lograr una efectiva transferencia de conocimiento a
diferentes ctedras de las carreras pertenecientes al
Departamento de Informtica y ofrecer a la
comunidad distintos cursos de actualizacin,
perfeccionamiento y posgrado, son algunos de los
objetivos que se procuran alcanzar.


2. INTRODUCCIN

Los acaecimientos en la tecnologa computacional
permiten no slo capturar y almacenar grandes
cantidades de datos, sino tambin encontrar
patrones, tendencias o anomalas en ellos.
Resumirlos a travs de modelos cuantitativos
simples, no es una tarea trivial, ya que los datos
deben convertirse en informacin, y la
informacin convertirse en conocimiento, lo que
representa uno de los grandes desafos de la era de
la informacin (Larose, D. 2006), (Hernndez
Orallo, J. y otros, 2008).
La construccin de Datawarehouses-DW y la
utilizacin de herramientas de DM se presentan
como elementos esenciales y complementarios que
hacen posible contar por primera vez, con una
memoria corporativa que provee informacin
accesible, consistente, adaptable y segura; adems
de transformarla en conocimiento. Dicha
transformacin es el cimiento en la toma de
decisiones de toda organizacin. (Kimball y otros,
2004), (Inmon, 2002). Lo citado promueve
considerables beneficios en las organizaciones que
lo aplican, pues tienen la oportunidad de descubrir
patrones rentables, y tendencias novedosas para su
negocio.
A partir de ello, la construccin de DW y DM se
presenta como una tecnologa emergente con varias
ventajas:
- Ahorra grandes cantidades de dinero a las
empresas y organizaciones en general.
- Abre nuevas oportunidades de negocios.
- Mejora los servicios brindados a los usuarios de
cualquier organizacin, an en aquellas aplicaciones
en las que no se vislumbran importantes beneficios
monetarios.
- Resulta un buen punto de encuentro entre los
investigadores y las personas de negocios.
En esta nueva rea, relacionada a los Sistemas de
Soporte de Decisin, confluyen distintas reas de
conocimiento, tales como: Bases de Datos,
Estadstica, Inteligencia Artificial, Aprendizaje
Automtico, Tcnicas de Visualizacin, etc.
Especficamente hablando de DM, el propsito de
sta es encontrar modelos matemticos obtenidos
mediante tcnicas de aprendizaje, supervisadas o no,
que desde los datos rescaten patrones, relaciones, y
conocimiento anteriormente no percibido por otras
tcnicas, y desde all estimar predicciones sobre las
variables analizadas.

DM aplicado a datos inherentes a una biblioteca
recibe el nombre Bibliomining (Nicholson, S. y
otro, 2003). En el marco de este proyecto el caso de
estudio central ha sido la biblioteca de la FCEFN-
UNSJ, desde los datos del movimiento bibliogrfico
y estructura que la caracterizan, como as tambin
desde la perspectiva que sus usuarios tienen de
aquella.

El Sistema de Biblioteca lleva ms de 15 aos de uso
en las bibliotecas de esta Universidad como as
tambin, a travs de la distribucin por parte de la
Comisin Nacional de Bibliotecas Populares
(CONABIP) del software SIGEBI, en cientos de
Bibliotecas Populares de la Argentina. Este sistema
utiliza el formato catalogrfico LIBRI, catlogo
diseado por la Direccin General de Bibliotecas de
la Universidad Nacional de San Juan, con la
colaboracin del Instituto de Informtica de la
FCEFN-UNSJ.
Actualmente existe un estndar internacional, que
permite el intercambio y la representacin de
informacin bibliogrfica por medio de
computadoras, llamado MARC (Machine Readable
Cataloging). En consecuencia, se conform un
equipo interdisciplinario con bibliotecarios e
informticos de la Facultad, docentes del Instituto
Superior de Bibliotecologa de San Juan y
bibliotecarios de la Biblioteca Popular Franklin para
concensuar la tabla de migracin de datos entre el
formato local LIBRI y el formato internacional
MARC.

La bsqueda de la satisfaccin de usuarios de
bibliotecas y la aplicacin de tcnicas de minera de
datos, abarca una primer etapa exploratoria y
descriptiva realizada sobre las respuestas obtenidas
de encuestas practicada a los alumnos y usuarios de
las bibliotecas de FCEFN y FI de la UNSJ, validada
oportunamente en (Beguer, G., 2006) (Beguer, G.
2007) y analizadas mediante tcnicas de
Segmentacin, Clasificacin, y Reglas de
Asociacin en (Klenzi,R., 2008) (Malberti, M.,
2008). En este proyecto esencialmente se han
realizado tareas de descripcin, encontrando
atributos inductores entre los que conforman la
encuesta (Klenzi, R. y otros, 2008) que,
conjuntamente con el procesamiento de los datos de
circulacin de material bibliogrfico de diferentes
aos ha permitido proponer polticas a futuro
(redistribuciones presupuestarias, y de material en
estanteras, refacciones edilicias, etc.). Similar
procedimiento, en cuanto a la satisfaccin de
usuarios, se ha aplicado a encuestas realizadas a
usuarios de software libre, con el propsito de
encontrar los inductores que permiten inferir
ventajas y desventajas de tales softwares segn la
perspectiva de sus usuarios.
En el marco del proyecto, tambin, se plantea el
anlisis de trabajos y teoras que abordan el problema
de la desercin universitaria, tratando de inferir,
desde los distintos estudios y enfoques, instrumentos
para as redisear un cuestionario que permita la
evaluacin y el seguimiento del estudiante, en
carreras de la FCEFN.


3. LNEAS DE INVESTIGACIN y
DESARROLLO

En el proceso de desarrollo del proyecto, se
realizan tareas de DM, Bibliomining, Text Mining y
Web Mining:

En el DW construido a partir de los datos del
departamento alumnos de la FCEFN y de los
datos de circulacin de material bibliogrfico
(Migani, y otro, 2006) (Migani, y otros, 2007).
En encuestas, de satisfaccin de usuarios de la
Biblioteca de la citada facultad, de la facultad
de ingeniera y de usuarios de herramientas
cdigo libre.
En documentos de texto, con el propsito de
encontrar o no similitudes sintcticas,
posteriormente semnticas, entre documentos.
En los logs de acceso desde Internet a consulta
bibliogrfica, y diferentes sitios web de la
FCEFN.

Para el desarrollo de las tareas mencionadas, se hace
uso de las siguientes herramientas:
R, WEKA-(Waikato Enviroment Knowledge
Algorithms), RapidMiner (Originalmente
denominado YALE Yet Another Learning
Environment), KNIME (o Konstanz Information
Miner) bajo licencias GNU.
ORACLE Warehouse Builder y ORACLE Data
Miner., del administrador de Base de datos
ORACLE , bajo licencia OTN.
Microsoft SQL Server 2005, en particular SQL
Server Business Intelligence Development
Studio.
Google Analytics, servicio gratuito de
estadsticas de sitios web.

Conjuntamente a la indagacin terica inherente a
cada una de las estrategias de DM abordadas, se
realizan anlisis de los algoritmos que las integran y
se promueve el anlisis comparativo entre las
distintas herramientas usadas, tanto en lo referente a
la capacidad de las mismas en la bsqueda de
conocimiento, como de los algoritmos que proveen.
En este aspecto se ha realizado un sucinto anlisis
comparativo entre herramientas de software libre,
aplicables en el rea de la minera de datos
(Gonzalez, y otros, 2008). Entre las herramientas
analizadas, se destacan: WEKA - versin 3.5.8,
Universidad de Waikato en Nueva Zelandia con
licencia GNU General Public License (GPL)
(Witten I. H. & Frank E. 2005), RAPIDMINER
(Versin Original YALE) 4.2.000 con licencia
AGPL versin 3, R Project que es un lenguaje y
entorno de programacin para anlisis estadstico y
grfico (R Development Core Team. 2006). R se
distribuye bajo la licencia GNU GPL. Todas las
herramientas mencionadas estn disponibles para
los sistemas Operativos Windows, Macintosh, Unix,
y GNU/Linux.

En el transcurso de ao 2009 se practic una
encuesta a los alumnos de 3 ao de todas las carreras
dependientes de la Facultad de Ingeniera de la UNSJ
con el propsito de extender el anlisis sobre
percepcin de usuarios de biblioteca, semejante al ya
realizado en la Biblioteca Emiliano Pedro Aparicio
de la FCEFN. En esa oportunidad se obtuvieron 149
encuestas, vlidas, las cuales estn siendo analizadas
por medio de herramientas estadsticas y de DM.

En el marco del anlisis de trabajos y teoras que
abordan la desercin estudiantil, se ha realizado un
cotejo entre los conceptos de desercin propuestos
por Vielka de Escobar (Doctorada en Ciencias de
la Educacin), la Red Iberoamericana para la
Acreditacin de la Calidad de la Educacin
Superior (RIACES), por el Instituto Internacional
para la Educacin Superior en Amrica Latina y el
Caribe (I E S A L C), por Romo y Hernndez entre
otros. As mismo se ha tenido en cuenta los
distintos tipos de desertores.

Como alternativa de intercambio de informacin
entre diferentes bases de datos se estudia el lenguaje
XML (eXtensible Markup Language) el cual es un
lenguaje de marcado, de carcter general, que
brinda una forma simple para representar datos. Un
archivo escrito en XML adems de proporcionar
informacin, se describe asimismo permitiendo al
receptor entender la informacin recibida y por lo
tanto procesarla. Este tiene el formato de un
archivo de texto plano, lo cual facilita enormemente
la transferencia de informacin, logrando
independencia con respecto a las diferentes
plataformas.


4. RESULTADOS OBTENIDOS/ESPERADOS

Divulgacin de las Actividades del Proyecto
21/E824. Beguer; Malberti; Klenzi,. Seminario
de Bibliotecas Universitarias, Los Cambios de
Paradigmas en su Gestin. Universidad Nacional
de San Juan- Junta de Bibliotecarios. 29 y 30 de
Agosto de 2008.
Problemas de Asignacin de Aulas, Docentes y
Materias en I nstituciones Educativas. Aballay;
Klenzi. CACIC 2008.
Anlisis comparativo entre estrategias de
clasificacin y reglas de asociacin, en la
determinacin de inductores, en encuesta de
satisfaccin de usuarios de una biblioteca
universitaria. Klenzi, Malberti, Beguer.
Jornadas Chilenas de Computacin 2008, XX
Encuentro Chileno de Computacin 2008.
Mineria de datos con herramientas de software
libre. Gonzlez; Aciar; Martinez. 1 Congreso
Nacional de Software Libre- San Juan. 2008
J OOMLA en la implementacin de un prototipo
de autoevaluacin, en una ctedra
universitaria. Echegaray, Klenzi, Malberti. 5
Jornada de Informtica y Educacin. U. N. V. M.
Argentina. 2008

En el mbito de la FCEFN, conjuntamente con otro
proyecto de la facultad, se organiz en el ao 2008
un Workshop de actualizacin en
Telecomunicaciones y Gestin del Conocimiento en
Bibliotecas, en el marco del cual se presentaron los
siguientes trabajos:
Datamarts y Olap en Oracle 11g. Silvina
Migani, Hector Lpez, Ariel Gonzlez.
Minera de texto. Conceptos y
Herramientas. Laura Gutirrez, Raul
Klenzi
Computacin Paralela y sus Aplicaciones.
Dra. Piccoli (Invitada)
I sisMarc Cliente-Servidor. I +D aplicado a
la reingeniera de un producto. Lic.
Marmonti. (Invitado).
Catalogo de Bibliotecas en el marco de la
web 2.0 y las redes sociales. Lic.
Marmonti.

Transformando datos en conocimiento: Nuevas
prcticas. . Mag. Ral Klenzi, Mag Graciela
Beguer, Mag Alejandra Malberti y Lic. Silvina
Migani. WICC 2009 XI Workshop de
Investigadores en Ciencias de la Computacin, abril
de 2009,
Extrayendo Conocimiento, desde los datos de
Circulacin de material Bibliogrfico, en una
biblioteca universitaria. Mag. Ral O. Klenzi y
Mag. Mara Alejandra Malberti. Jornadas Chilenas
de Computacin 2009. Santiago de Chile-Chile.

En la Jornada de Investigacin sobre la Universidad,
realizada por la Comisin de Evaluacin y
Desarrollo Institucional de la UNSJ en junio de 2009,
se expusieron los avances y resultados alcanzados en
el presente proyecto.

En el mbito de la FCEFN, se desarroll el WICCSI
2009- Workshop de Investigadores en Ciencias de la
Computacin y en Sistemas de Informacin-. En este
evento se presentaron los siguientes trabajos:
Reflejando la evolucin de los datos en un
Datawarehouse. Lic. Silvina Migani.
Oracle 11g como herramienta en los
procesos de implementacin, carga y
actualizacin de un datawarehouse. Lic.
Hectot Lepez
I ntroduccin al Anlisis WEB mediante
Google Analytics. Rafael Jurez Dobjanschi,
Mauro Gabriel Avendao Fager, Mag. Mara
Alejandra Malberti Riveros

Migracin de registros catalogrficos en formato
LI BRI (UNSJ ) hacia MARC21. Prog.Luis Alberto
Olguin, Nora Maroto, Cristina Coria, Gabriela
Rodrguez. WICC 2010- XII Workshop de
Investigadores en Ciencias de la Computacin.
Universidad Nacional de la Patagonia Austral. El
Calafate. Santa Cruz

Se realiz la coordinacin y organizacin de las
charlas-taller, desarrolladas los das 29 y 30 de abril
de 2010:
Arquitectura para el desarrollo de
aplicaciones WEB en NET. Caso de
estudio: Arquitectura para el desarrollo de
sistemas informticos de la ANSES. Lic.
Juan Jos Benzonelli. Gerencia de
arquitectura e Innovacin tecnolgica-
ANSES
Re-hosting de aplicaciones Mainframe a
entorno UNI X. Caso de estudio: Migracion
de aplicaciones a ambiente abierto. Lic.
Leonardo Merino. Gerencia de arquitectura
e Innovacin tecnolgica- ANSES.

Se organizaron, conjuntamente con el Departamento
de Informtica y el proyecto Arquitectura de Acceso
a Web Service desde mviles heterogneos, las
2das. Jornadas de Actualizacin Informtica - 25
aos del Departamento de Informtica. En este
marco, entre otras, se desarrollaron las siguientes
presentaciones:
Lanzamiento de Visual Studio 2010. Miguel
ngel Saez (Developer Envangelist y
Responsable del Programa Acadmico
Microsoft
Data Warehouse y Business I ntelligence
con herramientas Microsoft. Oscar Flores


Respecto del anlisis de desercin, hasta el momento,
y como actividades del proyecto, se han realizado
entrevistas a algunos estudiantes con el propsito de
indagar los diferentes inconvenientes que han tenido
que soslayar, agrupndolos en las categoras:
Acadmicos, Laborales, Financieros, Familiares,
Sociales, Personales e Institucionales. Como
resultado casi unnime se encuentra la formacin con
la que llegan a la universidad y en determinadas
carreras, la falta de informacin fehaciente respecto a
las mismas.
Se pretende aplicar, tambin, diferentes test y
modelos tales como los considerados por Pace, C. R.
o Pascarella y Terenzini, de modo de poder medir los
grados de adaptacin de los alumnos al esfuerzo y
persistencia para alcanzar logros.
En particular, y a partir de la inquietud de decanato
de la FCEFN, de comenzar un estudio en el primer
ao de todas las carreras de la facultad sobre
desercin estudiantil, canalizada por medio de la
Secretara de Asuntos Estudiantiles y con la
participacin del Lic. Hector Vidal, socilogo
dependiente del Rectorado de la UNSJ, miembros del
proyecto 21/E824 implementaron una encuesta,
confeccionada por el Lic. Vidal, en DYANE 2.0 para
facilitar, tanto la carga de datos por parte de alumnos
pasantes como su posterior anlisis. En su
implementacin, cada encuesta es desglosada en 50
campos, los que abarcan distintos aspectos inherentes
a los alumnos: Situacin Socioeconmica, Estudios
Cursados, Salud y Motivacin en la eleccin de la
carrera. Con estos datos, se realizaron tanto
estadsticas simples, como cruzadas, priorizando en
este caso el anlisis por carrera.


5. FORMACIN DE RECURSOS HUMANOS

En lo referente a la formacin de recursos humanos,
en el marco del proyecto se han desarrollado
diferentes tesis de posgrado, de grado y direccin de
becarios.
Se realiz la defensa de dos Tesis de Maestra,
correspondientes a la Maestra en Informtica
dependiente de la Universidad Nacional de La
Matanza. Ellas son:
Aplicacin de minera de reglas de asociacin en
una biblioteca universitaria: una tecnologa
apropiada. Lic. A. Malberti
Aplicacin de minera de datos a la gestin
bibliotecaria. Ing. R. Klenzi.

Se dirigi una Tesis de Maestra, correspondiente a
la Maestra en Logstica dependiente de la
Universidad Nacional de Cuyo:
Propuesta de Autoevaluacin de una Biblioteca
Universitaria en un marco de Gestin Logstica.
Prof.V. Mrquez.

Se dirigieron tres trabajos finales, de la carrera
Licenciatura en Ciencias de la Informacin:
I mplementacin de Autoevaluaciones en entorno
WEB. F. Echegaray. Defendido en agosto de
2008.
Minera de Datos Aplicada a un DW. Utilizacin
de la Herramienta ORACLE para el desarrollo
del DW y la extraccin de informacin oculta.
H. Lpez, A. Gonzlez. Defendido en diciembre
de 2008.
Bsqueda de satisfaccin en usuarios de software
libre. Sebastian Martinez y Javier Aciar,
Defendido en diciembre de 2009

En Agosto de 2009 se elevaron los informes de dos
Becas de Investigacin para alumnos avanzados, de
la UNSJ:
Proceso de Extraccin, Transformacin,
Carga y Refresco de un DW con datos de
provenientes del sistema de alumnos y de
biblioteca. Becario H. Lpez.
Aplicacin de Minera de Datos a Encuesta
de Satisfaccin de Usuarios de una
Biblioteca Universitaria. Becario A.
Gonzlez.

A partir del ao 2009, se incorporaron al proyecto 4
adscriptos Alumnos:
Sergio Quiroga y Edgar Faras, para trabajar en
Minera de Reglas de Asociacin.
Rafael Jurez y Mauro Avendao, para
trabajar en Redes Bayesianas y anlisis
WEB.
as como el Adscripto Egresado, Prog. Oscar Adrin
Flores, para trabajar en la temtica Bussines
Intelligence en SQL Server.

En la convocatoria 2009, se desarroll la Beca para
Alumnos Avanzados XML como base para el
intercambio de informacin entre Base de Datos,
por parte de la becaria Cristina Vera.


6. BIBLIOGRAFA

Beguer, G., Olgun, L. (2006). Estudio sobre
la Percepcin del Usuario en una Biblioteca
Universitaria. Normas I SO 11620, I RAM
I SO 11620. Publicado en:
http://www.uniram.com.ar/jornadas/XXV/TC-
14.pdf
Beguer, G. (2007) Logstica como garanta de
satisfaccin del usuario. Tesis de Maestra-
Universidad Nacional de Cuyo.
Gonzalez A., Aciar J., Martinez S. (2008)
Minera de Datos con Herramientas de
Software Libre (Anlisis Comparativo de
Herramientas de Software Libre Aplicadas al
rea de la Minera De Datos) 1 Congreso
Nacional de Software libre. San Juan 2008

Hernndez Orallo J., Ramirez Quintana, J, Ferri
Ramirez, C. (2008) I ntroduccin a la Minera
de Datos. Pearson-Prentice Hall.

Inmon (2002). Building the Data Warehouse
Third Edition. Wiley Computer Publishing
Kimball R., Reeves L., Ross M., Thornthwhite
W. The Data Warehouse Life Cycle Toolkit
Expert Methods for Designing, Developing
and Deploying Data Warehouses. John Wiley
& Sons.405 pag.

Kimball. The Data Warehouse Toolkit. Segunda
Edicin.

Klenzi, Ral O. (2008). Aplicacin de minera
de datos a la gestin bibliotecaria. Tesis de
Maestra. Maestra en Informtica. Universidad
Nacional de la Matanza.
Klenzi, R.; Malberti, M. A.; Beguer, G. (2008)
Anlisis comparativo entre estrategias de
clasificacin y reglas de asociacin, en la
determinacin de inductores, en encuesta de
satisfaccin de usuarios de una biblioteca
universitaria. Jornadas Chilenas de
Computacin 2008 (JCC 08) en el marco del
XX Encuentro Chileno de Computacin 2008
(ECC 08). Punta Arenas- Chile
Larose, D. (2006). Data Mining Methods and
Model,. Published by John Wiley & Sons, Inc.,
Hoboken, New Jersey.
Malberti, Mara A. (2008). Aplicacin de
Minera de Reglas de Asociacin en una
Biblioteca Universitaria. Tesis de Maestra.
Maestra en Informtica. Universidad Nacional
de la Matanza.
Migani, S.; Chavez, S. (2006) Diseo
Conceptual de un Data Warehouse. Revista
Ciencias. N1 2006 Pag. 83 a 90.
Migani, S.; Chavez, S. Klenzi, R; (2007)
Construccin de un Data Warehouse-Parte I .
Revista Ciencias. N1 2007 Pag. 45 a 56.
Nicholson, S. and Stanton, J. (2003). Gaining
Strategic Advantage through Bibliomining:
Data Mining for Management Decisions in
Corporate, Special, Digital, and Traditional
Libraries. Organizational Data Mining:
Leveraging Enterprise Data Resources for
Optimal Performance, H. Nemati and C. Barko,
eds. (Hershey, Penn.: Idea Group Pub.).

Oracle - Data Warehousing Guide 10g
Release 1 (10.1)

Pace, C. R. (1980). Measuring the quality of
student effort. Current I ssues in Higher
Education.
http://www.scielo.cl/scielo.php?pid=S0718-
07052007000100001&script=sci_arttext

Paulraj Pona (2001) Data Warehousing
Fundamentals: A Comprehensive Guide for
IT Professionals.

R Development Core Team. (2006). R: A
language and environment for statistical
computing. R Foundation for Statistical
Computing, Vienna, Austria.
http://www.Rproject. org.

Witten I. H. & Frank E. (2005). Data Mining,
practical Machine Learning Tools and
techniques. Second Edition. Morgan Kaufmann
Publisher.

Con formato: Izquierda, Sangra:
Izquierda: 0,6 cm, Derecha: 0 cm

Potrebbero piacerti anche