Sei sulla pagina 1di 24

Revista de Lexicografa, Volumen 111, 1996-1997, 111-134

GEISA: Un diccionario de sinnimos en formato


electrnico.
Santona, o.; Prez, j.; Carreras, F.;
Santos, s.; Rodrguez, G.; Hernndez, Z.
Grupo de Investigacin en Estructuras de Datos
Departamento de Informtica y Sistemas
Universidad de Las Palmas de Gran Canaria
http://protos. dis. ulpgc. es.

O.

INTRODUCCiN

Con la popularizacin y el uso generalizado de los ordenadores cada vez


se hace ms patente la necesidad de facilitar la comunicacin entre las personas y las mquinas; paralelamente, la lingstica ha experimentado un
desarrollo importante en los ltimos aos y ha interesado a la informtica
hasta constituir una disciplina que se ha dado en llamar lingstica computacional. Es menester resaltar que de lo que trata este encuentro no es precisamente de acercar el lenguaje humano al de la mquina, sino ms bien de
todo lo contrario, lograr que el ajeno y fro lenguaje del ordenador y su
modus operandi se aproximen cada vez ms a las necesidades de la persona.
Bajo este enfoque evolucionan las tcnicas de procesamiento de lenguaje
natural y la tendencia a que la interfaz hombre-mquina sea cada vez ms
agradable: es el reto de las industrias de la lengua.
En esa lnea de facilitar la tarea humana figuran:
a) el desarrollo de herramientas de ayuda para la generacin de textos
escritos, (diccionarios de significados, de sinonimia, ideolgicos, tesauros, ...)
b) el anlisis de textos para la deteccin de vicios y depuracin de estilos (frecuencias de aparicin de palabras, empleo de formas verbales y no
verbales, aliteraciones, ...)
.
c) la mecanizacin de la correccin ortogrfica, etctera.

11 2

Santanal

o.; Prez

j.; Carrerasl F.; Santosl

s.; Rodrguez

G.; Hernndezl

z.

Los objetivos perseguidos son:


1.- Situar en un sistema informtico un diccionario de sinnimos y
antnimos conforme con un equilibrio adecuado entre ocupacin
y tiempo de respuesta.
2.- Considerar como entradas las voces consignadas en el diccionario
que tomamos como base y cualquiera de sus formas flexionadas o
derivadas.
3.- Navegacin clsica que adelanta la lista de sinnimos-antnimos
correspondiente a un elemento de la anterior.
4.- Proporcionar formas alternativas de navegacin por medio de palabras morfolgicamente relacionadas.
5.- Ofrecer el sinnimo o antnimo elegido con sus accidentes gramaticales en concordancia con la palabra de entrada.
6.- Interaccin con el diccionario en un entorno cmodo.

1.- EL

DICCIONARIO DE SINNIMOS Y ANTNIMOS EN UN SISTEMA INFORMTICO

Para comprobar la eficacia del sistema se toma el Gran Diccionario de


Sinnimos y Antnimos de Espasa-Calpe. Tal diccionario dispone de unas
35.000 entradas: cada una posee una lista de sinnimos y antnimos -incluye frases- con un tamao promedio de 10 elementos por lista. El universo
de palabras de este diccionario est compuesto de unos 20.000 sustantivos,
10.000 adjetivos, 6.000 verbos, 400 adverbios de modo y otras 400 formas
invariantes tales como preposiciones, conjunciones, interjecciones, locuciones o frases y palabras de otros idiomas.
Como el manejo de un diccionario de sinnimos no requiere una extrema velocidad de acceso a sus listas, queda almacenado en memoria externa, lo cual facilita su consulta a usuarios que no disponen de ordenadores
muy potentes. El acceso a los artculos se lleva a cabo mediante una funcin de dispersin por divisin con tratamiento para convertir su carcter
alfabtico en valor numrico; las colisiones se resuelven por cadenas separadas. Cada registro contiene una entrada y su lista de sinnimos, antnimos y frases sinnimas y antnimas. Se permite la redundancia que
implica el que cada registro contenga los sinnimos en forma explcita ya

113

GEI5A: un diccionario de sinnimos en formato electrnico

que no es significativa la reduccin de almacenamiento externo que se


conseguira sustituyndolos por un cdigo numrico o empleando algoritmos de compresin.
Diccionario
Control

1-______- .- _._ .. _ .... _._


_._.- -

.....

_._ .. _

_ .. _._.-

_._

_._

_ .. _._.-

La solucin llevada a cabo usa dos ficheros externos, uno de Control


(384Kb) y el propio Diccionario (2,18Mb). El disponer de Control-registros
de tamao fijo- que permite direccionar a Diccionario -registros de tamao variable- donde se almacenan las listas, implica un ahorro de espacio
debido a que evita la existencia de huecos en el fichero. Se necesitan hacer
tantos accesos a Control como colisiones haya y uno a Diccionario por cada
una de sus resoluciones.
A costa de hipotecar memoria principal, una opcin que disminuira los
requerimientos de almacenamiento secundario y el nmero de accesos consistira en disponer de Control en memoria interna ya que el proceso tratara
con memoria secundaria una sola vez en lugar de dos por colisin. Dado el
bajo nmero de colisiones (1,3 por entrada), no se ha optado por este arreglo a pesar de que con un costo de memoria interna no demasiado alto
podra mejorar la velocidad.
Es posible reducir la ocupacin del Diccionario reemplazando las palabras de las listas de sinnimos por direcciones a posiciones donde se alojaran todas ellas sin repeticin alguna; en este caso, Diccionario ocupara en
torno a l/5Mb y el vector de palabras menos de O,5Mb. Esta alternativa tendra sentido si se localizaran en memoria principal Control, Diccionario y vector de palabras (aproximadamente 2,3Mb), en tanto que los accesos a
memoria secundaria seran nulos y se alcanzara una velocidad de navegacin
mucho mayor. No se ha elegido esta solucin para la aplicacin porque el
aumento de velocidad no justificara la memoria necesaria.

114
2.-

Santona, O.; Prez,

J.;

Carreras, F.; Santos, S.; Rodrguez, C.; Hernndez, Z.

REDUCCiN MORFOLGICA PARA ACCEDER A LAS ENTRADAS DEL DICCIONARIO

A fin de permitir el acceso mediante formas flexionadas o derivadas de


las voces que hay en el diccionario, se realiza un anlisis morfolgico de la
palabra entrada del que resultan las formas cannicas de las que proviene y
su relacin de flexin o derivacin con cada una de ellas. Para una mejor realizacin, el sistema que soporta la morfologa se orienta ms a datos que a
reglas gracias a una estructuracin adecuada que recoge las caractersticas
morfolgicas del espaol y cierta informacin sintctica.
Debido a que la cardinalidad del universo compuesto por las formas flexionadas y derivadas representara algo ms de sesenta veces el nmero de
formas cannicas, este trabajo aprovecha la morfologa del espaol como
lengua flexiva para la divisin de las palabras en races y terminaciones y
obtiene una reduccin considerable de datos: la cantidad de races no duplica el nmero de formas cannicas y las terminaciones necesarias son apenas
unos cientos. La eficacia del proceso de reconocimiento se mantiene alta.
El anlisis de una palabra se realiza a travs de: a) segmentacin en posibles pares raz-terminacin', b) localizacin de cada una de las races,
c) decodificacin de la terminacin y d) construccin de la forma principal
de la que proviene. A partir de la palabra de entrada se forman sus posibles
pares raz-terminacin por medio de un catlogo de terminaciones adecuado a las flexiones y derivaciones consideradas. Para cada una de las races que
resultan, se lleva a cabo su bsqueda, mediante una funcin de dispersin,
en la estructura que organiza por races el universo de palabras. Tal estructura posee informacin de qu terminaciones se pueden concatenar con cada
una de las races y qu flexin o derivacin representa cada una de ellas; las
caractersticas flexivas del espaol permiten representar sintticamente los
diferentes grupos de terminaciones. Por estar cada raz vinculada a la de la
forma cannica de la que proviene, el analizador puede reconstruir las voces
que hay en el diccionario, con sus respectivas categoras gramaticales y las
flexiones que las relacionan con la palabra original.
'
Las flexiones y derivaciones consideradas para los sustantivos son las de:

o gnero,
pedagogo e> pedagogo, pedagoga
autor e> autor, autora
alcahuete c:> alcahuete, alcahueta

1 Los trminos raz y terminacin se usan en sentido estrictamente grfico y no


exactamente gramatical.

GEI5A: un diccionario de sinnimos en formato electrnico

115

0nmero

pedagogo o pedagogos, pedagogas


0y sufijacin apreciativa:
lB)

aumentativos,

casa ~ casn, casern 2, casarn 2 (masculino singular) 3


t::> casaza, casona, casota, casacha (femenino singular)
t::> casones, caserones 2 , casarones 2 (masculino plural) 3
t::> casazas, casonas, casotas, casachas (femenino plural)
[B)

diminutivos

casa ~ casita, casilla, casina, casica, casuela, casuca 2 (femenino singular)


t::> casitas, casillas, casinas, casicas, casue/as, casucas 2 (fem. plural)
lB)

y peyorativos.

casa ~ casucho, casern2 (masculino singular) 3


t::> caseja, casucha, casuca2 (femenino singular)
t::> casuchos, caserones2 (masculino plural) 3
t::> casejas, casuchas, casucas2 (femenino plural)

Para los adjetivos se considera:


0el gnero,

bueno o bueno, buena


abrasador o abrasador, abrasadora
grandote o grandote, grandota
0el nmero,

bueno o buenos, buenas

2 Adems de los sufijos discrecionales (-azo, -n, -ote y -acho para aumentativos; -ito, -illo, -ico, -n y -ue/o para diminutivos; -ucho y -ejo para peyorativos) se
tienen en cuenta otros en casos particulares.
3 Un sustantivo puede cambiar su gnero con la apreciacin.

11 6

Santona, O.; Prez,

J.; Carreras, F.; Santos, S.; Rodrguez, G.; Hernndez, Z.

o la sufijacin apreciativa:
lB> aumentativos,
bueno ~ buenazo, bonazo 4, buenn, buenote, buenacho, bonachn
(masculino singular)
t:> buenaza, bonaza 4, buenona, buenota, buenacha, bonachona s
(femenino singular)
t:> buenazos, bonazos 4, buenones, buenotes, buenachos, bonachones s
(masculino plural)
t:> buenazas, bonazas 4, buenonas, buenotas, buenachas, bonachonas s
(femenino plural)
lB> diminutivos
bueno ~ buenecito, buenecillo, buenecico, buenecn, buenezuelo, bonito 4,
bonillo 4, bonico 4 (masculino singular)
t:> buenecita, buenecilla, buenecica, buenecina, buenezuela, bonita 4,
bonilla 4, bonica 4 (femenino singular)
t:> buenecitos, buenecillos, buenecicos, buenecines, buenezuelos,
bonitos 4, bonillos 4, bonicos 4 (masculino plural)
t:> buenecitas, buenecillas, buenecicas, buenecinas, buenezuelas,
bonitas 4, bonillas 4, bonicas 4 (femenino plural)
lB> Y peyorativos;
bueno ~ buenejo, buenucho (masculino singular)
t:> bueneja, buenucha (femenino singular)
t:> buenejos, buenuchos (masculino plural)
t:> buenejas, buenuchas (femenino plural)

o el grado superlativo (con sus irregularidades),


bueno

buensimo, bonsimo 6, ptimo 6 (masculino singular)


t:> buensima, bonsima 6, ptima 6 (femenino singular)
t:> buensimos, bonsimos 6, ptimos 6 (masculino plural)
t:> buensimas, bonsimas 6, ptimas 6 (femenino plural)

4 Como consecuencia de las operaciones de flexin y derivacin pueden aparecer alteraciones en las races e incluso races completamente diferentes, al menos
desde el punto de vista grfico y formal.
5 Puede combinarse una raz alterada con una terminacin atpica.
6 En el grado superlativo pueden aparecer alteraciones en las races e incluso
races completamente diferentes desde el punto de vista sincrnico, como en el caso
de las irregularidades: pobre Q pauprrimo.

GEI5A: un diccionario de sinnimos en formato electrnico

117

o la adverbializacin
bueno c::> buenamente

o y la adverbializacin del superlativo.


bueno c::> buensimamente, bonsimamente 6 ptimamente 6

Para los adverbios que lo admiten se consideran sus formas:

o superlativas,
cerca c::> cerqusima 7
lejos c::> lejsimos

o y apreciativas:
[E)

aumentativas,
arriba c::> arribota
lejos c::> lejotes

[E)

diminutivas
ahora c::> ahorita, ahoritita 8, ahoritica 8, horitica 9
arriba c::> arribita
lejos c::> lejitos, lejillos, lejuelos

[E)

y peyorativas.
arriba c::> arribota

Para los verbos se considera la conjugacin.


Al lema verbal callar se accede con sus formas conjugadas:

7 Cerca como sustantivo femenino tiene los apreciativos correspondientes y su


funcin adverbial es compatible con la nominal. como en el caso del adverbio afuera
con el sustantivo afueras.
8 Puede aparecer cualquier sufijo.
9 Admite modificaciones en la raz (usado en Colombia segn el diccionario de
dudas y dificultades de la lengua espaola de M. Seco).

11 8

Santana/ o.; Prez/ j.; Carreras/ F.; Santos, S.; Rodrguez, G.; Hernndez, Z.

presente

pretrito

callo
callas

call
callaste

condicional
indefinido

pretrito
im erfecto

callara
callaras

presente
imperfecto

pretrito
imperfecto

calle
calles

callara o callase
callaras o callases

futuro
im erfecto

callaba
callabas

callar
callars

futuro

presente

callare
callares

calla

Se supera a la palabra como elemento de entrada y se identifica como conjugacin de un verbo la pareja que representa su tiempo compuesto.
De esta forma conducen al lema verbal callar sus tiempos compuestos

pretrito
perfecto

pretrito
anterior

condicional
perfecto

he callado
has callado

hube callado
hubiste callado

habra callado
habras callado

haba callado
habas callado

habr callado

pretrito
perfecto

pretrito
pluscuap.

futuro
perfecto

haya callado
hayas callado

hubiera o hubiese callado


hubieras o hubieses callado

habiere callado
habieres callado

Las formas no personales tambin son admitidas tanto en sus formas


simples como compuestas:

GE/5A: un diccionario de sinnimos en formato electrnico

infinitivo c:> callar


gerundio c:> callando
participio c:> callado

119

infinitivo c:> haber callado


gerundio c:> habiendo callado
participio c:> habido callado

En los escasos casos que procede se reconoce el diminutivo del gerundio c:> callandito
y el participio admite su flexin como adjetivo verbal:
masculino singular c:> callado
femenino singular c:> callada
grado superlativo c:>

masculino plural c:> callados


femenino plura/r=> calladas

calladsimo (masculino singular)


t:> calladsima (femenino singular)
t:> calladsimos (masculino plural)
t:> calladsimas (femenino plural)

adverbializacin c:> calladamente


adverbializacin del superlativo c:> ca"adsimamente

En la conjugacin de los verbos se incluye la posibilidad de hasta tres


pronombres enclticos tanto en las formas simples como en las compuestas;
as se accede al lema callar desde: callndoselo 10, cllate 10, callaos ",
callmonos 11; hboselo callado...
Se consideran las irregularidades propias de la conjugacin verbal, sean
formales o grficas:
a) que afectan a la raz
- voclicas
concibo c:> concebir (cambiar e por i)
cuelgo c:> colgar (cambiar o por ue)

- consonnticas
conozco c:> conocer (aadir una z)
hago c:> hacer (cambiar c por g)

- mixtas
sepa c:> saber (cambiar ab por ep)
caigo c:> caer (aadir ig)
10 Se producen alteraciones en la forma grfica, pues han de llevar la tilde
como consecuencia de la incorporacin de los pronombres enclticos.
11 Aparecen alteraciones que afectan al ltimo carcter del verbo.

120

Santona, O.; Prez, j.; Carreras, F.; Santos, S.; Rodrguez, G.; Hernndez, Z.
b) que afectan al tema

di c:> decir
haz c:> hacer
doy c:> dar
voy c:> ir
c) otras
- supletivismo
-

fueron, era c:> ser


participios y gerundios irregulares
escrito c::> escribir
durmiendo c:> dormir

d) se consideran tambin los cambios ortogrficos


sigo c:> seguir (cambiar gu por 9 delante de e o i)
delinca c:> delinquir (cambiar qu por e delante de a u o)
quepo c:> caber (cambiar e por qu delante de e)
leyendo c:> leer (cambiar el carcter que representa el fonema)
La entrada puede llevar prefijos: as, de submundos o de cualquier otra flexin
o derivacin se accede a mundo y preprocesadas da lugar a procesado y procesar. Puede incorporarse ms de un prefijo: subprecondicin conduce a

condicin.
Son consideradas las reglas gramaticales para la unin de los prefijos a
las formas.

contrarrevolucionaria
transiberianos
irrealidades
combeneficiaditos

Prefijo

Forma cannica

contra
trans
in
con

revolucionario
siberiano
realidad
beneficiado

Relacin Gramatical
femenino singular
masculino plural
femenino plural
diminutivo
masculino plural

No se flexionan ni derivan, como es lgico, preposIciones, conjunciones, interjecciones, locuciones o frases, ni palabras de otros idiomas.

121

GEI5A: un diccionario de sinnimos en formato electrnico

3.

FLEXiN O DERIVACiN DEL SINNIMO O ANTNIMO ELEGIDO

Al objeto de obtener el sinnimo o antnimo elegido afectado por los mismos accidentes gramaticales que interesan a la forma introducida, se hace uso de
un generador morfolgico. La propia estructura de datos que usa el anlisis morfolgico concede la generacin de flexiones y derivaciones de las formas cannicas.. El procedimiento consiste en: a) detectar la raz de la forma cannica y
b) buscar la terminacin que corresponda a la forma que se desea generar. Se
extrae la raz gramatical de la forma cannica y se busca en la estructura que organiza por races el universo de palabras mediante una funcin de dispersin; para
obtener la flexin o derivacin buscada se concatena la raz con la terminacin
adecuada. A veces es necesario recorrer races alternativas que representan alteraciones tipogrficas en la raz producidas al flexionar o derivar como consecuencia
de reglas fonolgicas, ortogrficas o de cualquier irregularidad.
Como resultado del anlisis morfolgico se obtiene para cada forma
cannica su relacin de flexin o derivacin con la palabra original; ello permite aplicar al sinnimo-antnimo elegido la misma flexin o derivacin que
relaciona la palabra original con la forma cannica donde comenz la navegacin, lo que en ocasiones da lugar a ms de una palabra.

Forma de partida

Caminando

Formas alcanzadas
Sinnimos concordados

--------------1......

Forma base
de partida
(verbo)
caminar

Relacin de flexin o
derivacin resultante de
reconocimiento

Forma base
alcanzada
(verbo)

_Sinnimo
_ _--11.......

andar

andando

---ubfl"?M~~~~:W

Concordar

122

M. Cristina Tabernero Sala

Forma de partida

Formas alcanzadas

Sinnimos concordados

elevadsimas --------------.......
Forma base
de partida
(adjetivo)

superlativo femenino
plural de un adjetivo

altsimas, sumas

Forma base
alcanzada
(adjetivo)
superlativo femenino
plural de un adjetivo

Sinnimo

elevado ------........ alto

Relacin de flexin o
derivacin resultante de
reconocimiento

Concordar

Forma de partida
subevalurante

pret. impero
con pronombre
LE de un verbo
con prefijo SUB-

Formas alcanzadas

Sinnimos concordados
- - - - - - - - - - - - - 1.......
Forma base
de partida
(verbo)

Forma base
alcanzada
(verbo)

,
Sinnimo
,
evaluar - - - - -........ estimar

Relacin de flexin o
derivacin resultante de
reconocimiento

diminutivo masculino
plural de un adjetivo

Relacin de
derivacin resultante de
reconocimiento

3a pers. pI. pret.


subj. con prOll0rrlbre
encltico LE un verbo
con prefijo SUBConcordar

Forma de partida

pequeines

subestimranle
subestimsenle

Formas alcanzadas

chicorroticos, chicorrotillos, chicorroticoncordados


_Sinnimos
_____
_ _ _ _ _.......... nes, chicorrotitos, chicuelos, chiquicos,
chiquilines, chiquillos, chiquines, chiquirriticos, chiquirritillos, chiquirritines,
chiquirrititos, chiquitines, chiquitos
Forma base
Forma base
de partida
alcanzada
(adjetivo)
(adjetivo)
diminutivo masculino
plural de un adjetivo
Sinnimo ...
pequeo

c hico

Concordar

123

GElSA: un diccionario de sinnimos en formato electrnico

Para poder concordar formas con diferente categora gramatical se dispone


de procedimientos que proporcionan flexiones y derivaciones alternativas:

a) al generar cualquier forma flexionada o derivada puede ser necesario un cambio de gnero -es frecuente en sustantivos- o de
nmero;

Forma de partida

Formas alcanzadas
navecitas, navecillas,
navecicas, navecinas,
navezuelas, navetas,
navculas, navichuelas

Sinnimos concordados

veleritos

Forma base de partida


(sust. masculino)

Forma base alcanzada


(sust. femenino)

Sinnimo

....

nave

Relacin de flexin o
derivacin resultante de
reconocimiento

Concordar

Forma de partida

inversin

Formas alcanzadas
Sinnimos concordados

--------------------1.........

Forma base
alcanzada
(sustantivo)

Forma base
de partida
(sustantivo)
. femenino singular
sustantivo

finanzas

Sinnimo

inversiones - - - .......

finanzas

Relacin de flexin o
derivacin resultante de
reconocimiento

Concordar

, 24

Santana, o.; Prez, j.; Carreras, F.; Santos, S.; Rodrguez, G.; Hernndez, Z.
b) toda declinacin de un adjetivo se concuerda con un verbo a travs de su participio y viceversa;
Forma de partida

amadsima

Formas alcanzadas
Sinnimos concordados

-------------.......
Forma base
de partida
(adjetivo)

superlativo femenino
singular de un adjetivo

--..... amado -

Forma base
alcanzada
(verbo)

Sinnimo

......... apasionar

Relacin de flexin o
derivacin resultante de
reconocimiento

Concordar

Forma de partida

Formas alcanzadas
Sinnimos concordados

apreciados

adjetivacin masculino
plural
de un verbo

Relacin de flexin o
derivacin resultante de
reconocimiento

apasionadsima

...

Forma base
de partida
(verbo)

Forma base
alcanzada
(adjetivo)

----..... apreciar

- - - ........ estimado

estimados

Sinnimo

Concordar

125

GE/SA: un diccionario de sinnimos en formato electrnico

c) los adverbios de modo, las adverbializaciones de los adjetivos y la


adverbializacin del participio verbal son alternativas entre s;

Forma de partida

Formas alcanzadas

Sinnimos concordados
afortunadamente - - - - - - - - - - - -........... dichosamente

Forma base de
partida
(adv. de modo)
forma cannica de
adverbio de modo

Forma base
alcanzada
(adjetivo)
Sinnimo

-....... afortunadamente - - -........... dichoso

Relacin de flexin o
derivacin resultante de
reconocimiento

Concordar

Forma de partida

Formas alcanzadas

Sinnimos concordados
lgicamente - - - - - - - - - - - - - - _....... razonadamente

Forma base
alcanzada
(verbo)

Forma base de
partida
(adjetivo)

-:dverbializacin de un
adjetivo

Sinnimo

lgico -------....... razonar

Relacin de flexin o
derivacin resultante de
reconocimiento

Concordar

126

Santona, O.; Prez, j.; Carreras, F.; Santos, 5.; Rodrguez, G.; Hernndez, Z.

Sinnimos concordados

infelizmente

desgraciadamente

Forma base de
partida
(verbo)
adverbializacin de
un verbo

Formas alcanzadas

Forma de partida

'Sinnimo
--"""desgraciar

Forma base
alcanzada
(adjetivo)

........ infeliz

Relacin de flexin o
derivacin resultante de
reconocimiento

Concordar

d) la adverbializacin del superlativo de un adjetivo lo hace con


la adverbializacin del superlativo del participio de un verbo.
Formas alcanzadas

Forma de partida

Sinnimos concordados
ptimamente - - - - - - - - - - - - _........ escogidsimamente

Forma base de
partida
(adjetivo)

Forma base
alcanzada
(verbo)

adverbializacin
del superlativo de un adjeSinnimo
tivo
-...,.bueno - - - - -........ escoger
Relacin de flexin o
derivacin resultante de
reconocimiento

Concordar

GEI5A: un diccionario de sinnimos en formato electrnico

4.

127

NAVEGACiN A TRAVS DE PALABRAS MORFOLGICAMENTE RELACIONADAS

Se dispone de relaciones morfolgicas entre diferentes formas cannicas que


facultan la obtencin de un conjunto de entradas del diccionario. Permite mayores
posibilidades de acceso a las opciones de exploracin que la que ofrece el diccionario impreso; mientras la solucin manual slo admite ojear palabras alfabticamente
cercanas, esta propuesta sugiere novedosas posibilidades para recorrerlo: las relaciones sufijales eliminan cabeceras molestas alfabticamente prximas, y las prefijales
proponen alternativas interesantes que aparecen en pginas distantes.
Las relaciones establecidas para los verbos son: sustantivos y adjetivos
deverbales y verbos relacionados por cambio prefija!. Para los sustantivos se
tienen los verbos derivados. Los adjetivos se enlazan con los verbos que se
derivan de ellos y con el adverbio de modo correspondiente. Y para los
adverbios de modo se tiene el adjetivo del que provienen.

cario
emisin

hombre
matar
saber
total
ver

5.-

carioso, encariado, cariito, cariosamente, encariar


emisor, emisora, transmisor, emisin, transmisin, retransmisin,
emitir, transmitir, retransmitir
hombruna, hombruno, hombrada, hombracho, hombrecillo,
hombra, hombrn, hombrear
matador, rematado, matachn, matadero, matadura, matanza, matn, remate,
matonismo, rematadamente, rematar
sabedor, sabido, sabio, sapiente, resabido, sabidur~, sapiencia, resabio, resabiar
totalidad, totalmente, totalizar
vidente, visible, visto, vistoso, previsto, visionario, revisable,
revisor, supervisor, visin, videncia, vista, vistazo, viso, visor,
visual, previsin, visa, visado, visualizacin, revisin, televisin,
supervisin, visiblemente, entrever, rever, prever, visar, revisar,
divisar, televisar, supervisar

INTERACCiN CON EL DICCIONARIO EN UN ENTORNO CMODO.

La versin informatizada del diccionario de sinnimos y antnimos presenta


las siguientes caractersticas: a) uso fcil y claro, b) acceso tanto por sus entradas
exactas como a partir de sus formas flexionadas o derivadas, c) flexibilidad en la
exploracin merced a navegaciones alternativas basadas en palabras relacionadas
morfolgicamente, d) recuperacin simple de la historia de una navegacin apoyada en hasta tres entradas simultneamente visibles, e) obtencin de la respuesta morfolgicamente concordante con la palabra de partida y f) facultad para dar
respuesta a cualquier inconsistencia en la concordancia mediante un abundamiento en la flexin y derivacin.

128

Santona, O.; Prez, J.; Carreras, F.; Santos, S.; Rodrguez, G.; Hernndez, Z.
A continuacin se expone la forma de funcionamiento de la interfaz utilizada.

En esta ventana aparecen inhabilitados todos los botones salvo Cerrar; la aplicacin los habilita en cuanto tenga sentido su uso. A medida que se escribe en Palabra Original se realiza simultneamente el anlisis morfolgico, que admite no slo
las entradas en el diccionario, sino cualquiera de sus formas flexionadas o derivadas.

GEI5A: un diccionario de sinnimos en formato electrnico

129

La primera ventana presenta el resultado del reconocimiento bajo una


ttulo donde muestra Palabra Original, inscrita entre asteriscos para distinguirla del resto de las ventanas. Mantiene un vnculo entre cada una de las
respuestas del reconocedor morfolgico con Palabra Original: al recorrer las
diferentes opciones aparecen en el rea de mensajes sus categoras y la relacin morfolgica de flexin o derivacin con Palabra Original. Seleccionar
una forma cannica conlleva: a) fijar la categora gramatical y la flexin de
Palabra Original y b) usarla como entrada al diccionario de sinnimos para
comenzar la navegacin; implica adems c) copiarla en Palabra Actual y
d) habilitar los botones Ixpandir, {oncordar y Morfologa.

A la izquierda de cada palabra, aparece el nmero de elementos que


posee su lista de sinnimos y antnimos al objeto de anticipar informacin
que ayude a decidir por dnde continuar la investigacin. Un doble clic o la
tecla de entrada hace progresar la navegacin por el diccionario: consiste en
exponer en la siguiente ventana la lista de sinnimos y antnimos que corresponde. Para destacar el recorrido, la palabra seleccionada queda sealada
con una marca y aparece en el ttulo de la ventana que contiene su lista.
Resaltar una palabra en cualquier ventana que no sea la inicial conlleva que
sea expuesta su categora gramatical como informacin general -de particular inters para la concordancia- adems de situarla en Palabra Actual.

1 30

Santana, o.; Prez, J.; Carreras, F.; Santos, S.; Rodrguez, G.; Hernndez, Z.

Si el tamao de las listas de sinnimos y antnimos supera al de la ventana, la interfaz activa el correspondiente desplazamiento vertical u horizontal.
Dado que el proceso puede extenderse ms all de las tres ventanas que permanecen simultneamente visibles, quedan habilitados los botones o
para visualizar las listas que han quedado fuera. La marca de la tercera ventana
apunta al ttulo que se oculta por la derecha y el ttulo de la primera coincide
con la palabra marcada en la ventana que ha desaparecido por la izquierda.

GEI5A: un diccionario de sinnimos en formato electrnico

131

El botn fxpandirpermanece activado siempre que exista una palabra resaltada


en cualquiera de las ventanas y su accin despliega el abanico de entradas del diccionario relacionadas morfolgicamente, clasificadas segn su categora gramatical.

Actuar sobre ~oncordar permite flexionar o derivar Palabra Actual en concordancia con Palabra Original: significa aplicar a Palabra Actual la misma flexin o
derivacin que representa Palabra Original respecto a la opcin elegida en la ventana que muestra su reconocimiento. Ya que tal operacin puede dar lugar a ms
de una posibilidad, presenta una lista con las formas concordantes; elegir una
implica colocarla en Palabra Actual para su transferencia a otras aplicaciones.

132

Santona, O.; Prez,

J.;

Carreras, F.; Santos, S.; Rodrguez, G.; Hernndez, Z.

Si existe alguna dificultad o se produce una violacin gramatical y no es


factible conseguir la concordancia, la interfaz juega con dos tipos de mensaje: a) Atencin, indica cmo se ha producido la flexin o <derivacin y b) Fallo,
seala el error y aconseja pasar a la ventana de Morfologa para dar con una
forma flexionada, derivada o relacionada que se considere idnea, lo que
faculta una mayor riqueza de matices en la forma final.
El botn Morfologa transfiere Palabra Actual a un procesador morfolgico para generar libremente cualquier flexin o derivacin de ella. Posibilita
tanto la flexin y derivacin verbal como la nominal. La parte verbal permite conjugacin, incorporacin de hasta tres pronombres enclticos, flexin
del participio como adjetivo verbal, diminutivo del gerundio, sustantivacin,
adjetivacin y adverbializacin. La seccin nominal incluye para sustantivos y
adjetivos gnero, nmero, sufijacin apreciativa y verbalizacin; para los
adjetivos, adems se tienen en cuenta el grado superlativo, la adverbializacin, la adverbializacin del superlativo y la sustantivacin, y para los sustantivos, la adjetivacin; en los adverbios se consideran sus formas superlativas,
aumentativas, diminutivas y peyorativas. Permite incorporar prefijos a las
palabras. Evidentemente, como ya se dijo, no flexiona aquellas piezas que
carecen de flexin como preposiciones, conjunciones, interjecciones, locuciones o frases, ni palabras de otros idiomas, pues est concebido para el
espaol.

6.

CONCLUSIONES y PERSPECTIVAS

Se aporta una solucin a la gestin integral de un diccionario de sinnimos y antnimos de notable dimensin: a) tanto en la entrada como en la
obtencin del resultado admite prcticamente todas las posibilidades flexivas
y derivativas del espaol, b) proporciona abundante informacin gramatical,
c) una de las principales aportaciones consiste en que la respuesta se puede
obtener en forma concordante con la entrada para su inmediata sustitucin
en un texto, d) como novedosa contribucin incluye la capacidad de navegar a travs de formas morfolgicamente relacionadas, sugiriendo pistas
alternativas para encontrar el sinnimo ms adecuado.
Se ha conseguido una aplicacin en espaol diseada para ser de utilidad a quienes tratan con documentos: lexiclogos, analistas de estilo, recuperadores de informacin textual, traductores automticos, ... Permite una
interaccin hombre-mquina intensa y muy sencilla, fundada en ventanas de
dilogo, botones y dems herramientas que caracterizan a una interfaz grfica. Necesita de pocos recursos informticos.

GEI5A: un diccionario de sinnimos en formato electrnico

133

Entre otras posibilidades, la actual propuesta evolucionar hacia la


implantacin sobre otros soportes como Unix o entorno de red~*

RESUMEN
Se desarrolla una aplicacin para la gestin de un diccionario de sinnimos y antnimos con una interfaz clara que: a) admite como entradas los
lemas del diccionario y cualquiera de sus formas flexionadas o derivadas,
b) permite la navegacin clsica en estos diccionarios, c) ofrece formas de
exploracin alternativas por medio de entradas relacionadas morfolgicamente y d) considera la salida con los accidentes gramaticales que afectan a
la entrada.
BIBLIOGRAFA
A'iT-MoKHTAR, S.; RODRIGO MATEaS, J. L. (1995): "Segmentacin y anlisis morfolgico de textos en espaol utilizando el sistema SMORPH", Boletn de
la Sociedad Espaola para el Procesamiento del Lenguaje Natural (SEPLN),
17, pp. 29-41.
ALARCOS LLORACH, E. (1994): Gramtica de la Lengua Espaola, Madrid, Espasa-Calpe.
ALVAR EZQUERRA, M. (1993): La formacin de palabras en espaol, Madrid,
Arco/Libros.
ARONOFF, M. (1976): Word Formation in Generative Grammar, Cambridge,
M.I.T. Press.
BEAR, J. (1986): "A Morphological Recogniser with Syntactic and Phonological Rules", 11 th International Conference on Computational Linguistics
(COLING-86), Bonn.
BELLO, A. (1984): Gramtica de la Lengua Castellana, Madrid, EDAF.
CALDER, J. (1989): "Paradigmatic Morphology", Proceedings of 4th Conference
of European Chapter of ACL, Manchester, pp. 58-65.
ESPASA (1991): Gran Diccionario de Sinnimos y Antnimos, Madrid, Espasa-Calpe, 4 ed.
GAZDAR, G.: "Review ar~icle: Finite State Morphology", Linguistics, Berln, 23,
pp. 597-607.
GILI GAYA, S. (1985): Curso superior de sintaxis espaola, VOX, Barcelona,
Biblograf.
* Queremos agradecer al profesor Dr. Manuel Alvar Ezquerra y al Dr. Juan Manuel Carda Platero del
Departamento de Filologa Espaola I de la Universidad de Mlaga su colaboracin en cuantas consultas le hemos
formulado a lo largo del desarrollo del presente trabajo.

134

Santona, O.; Prez, J.; Carreras, F.; Santos, S.; Rodrguez, G.; Hernndez, Z.

GONZLEZ COLLAR, A. L.; GOI MENOYO, J. M.; GONZLEZ CRISTBAL, J. C. (1995):


"Un Analizador Morfolgico para el castellano basado en Chart", Actas
de la VI Conferencia de la Asociacin Espaola para la Inteligencia Artificial
(CAEPIA'95), Alicante.
HALLE, M. (1973): "Prolegomena to a Theory of Word Formation", Linguistic
Inquiry, 4, pp. 3-16.
KAY, M. (1973): "Nonconcatenative Finite-State Morphology", Proceedings of
the Third Conference of the European Chapter of the ACL, Copenhague,

pp. 2-10.
MART, M. A. (1986): "Un sistema de anlisis morfolgico por ordenador",
Boletn de la Sociedad Espaola para el Procesamiento del Lenguaje Natural (SEPLN), 4, pp. 104-11 O.
MATIHEWS, P. H. (1980): Morfologa: Introduccin a la Teora de la Estructura de
la Palabra, Madrid, Paraninfo.

MEYA, M. (1986): "Anlisis morfolgico como ayuda a la recuperacin de


informacin", Boletn de la Sociedad Espaola para el Procesamiento del
Lenguaje Natural (SEPLN), 4, pp. 91-103.
MORENO SANDOVAL, A. (1992): Un Modelo Computacional basado en la Unificacin para el Anlisis y la Generacin de la Morfologa del Espaol, Universidad Autnoma de Madrid, Tesis Doctoral.
REAL ACADEMIA ESPAOLA (1973): Esbozo de una Nueva Gramtica de la Lengua
Espaola, Madrid, Espasa-Calpe.
RODRGUEZ, G.; HERNNDEZ, l.; SANTANA, o. (1993): "Agrupaciones de Tiempos
Verbales en un Texto", Anales de las 11 Jornadas de Ingeniera de Sistemas
Informticos y de Computacin, Quito (Ecuador), pp. 132-137.
RODRGUEZ MAGRO, C.; SOPEA, L.; VALLADARES, C.; VILLAR, C. (1990): "Clasificacin morfolgica del lxico castellano para un analizador en ordenador", Actas del VII Congreso Nacional de Lingstica Aplicada, Sevilla,
pp. 491-503.
RODRGUEZ MAGRO, C.; SOPEA, L.; VILLAR, C. (1990): "Confeccin de un diccionario de sinnimos en ordenador: Teora, metodologa y resultados",
Lingstica Espaola Actual, 12, pp. 81/101.
SANTANA, O.; HERNNDEZ, l. J.; RODRGUEZ, G. (1993): "Conjugaciones Verbales", Boletn de la Sociedad Espaola para el Procesamiento del Lenguaje
Natural (SEPLN), 13, pp. 443-450.
SANTANA, O.; RODRGUEZ, J. C.; GONZLEZ, J. D. (1993): "FRECTEXT: Una Aplicacin de Ayuda a la Elaboracin de Documentos", Boletn de la Sociedad
Espaola para el Procesamiento del Lenguaje Natural (SEPLN), 13,

pp. 451-462.
SCALlSE, S. (1987): Morfologa Generativa, Madrid, Alianza.
SECO, M. (1991): Diccionario de dudas y dificultades de la lengua espaola,
Madrid, Espasa-Calpe, 9 ed.
VOX (1990): Diccionario Actual de la Lengua Espaola, Barcelona, Biblograf.

Potrebbero piacerti anche