Sei sulla pagina 1di 3

Los miembros de una comunidad usan las palabras, en general, con el mismo significado; de otro

modo resultaría muy difícil el entendimiento. El comportamiento lingüístico es una parte del
conjunto de modelos sociales de conducta que caracterizan a los grupos humanos: cada uno de
ellos tiene unas costumbres y unas convenciones distintas.

Clasificación del léxico

Según el origen y la difusión

El léxico puede clasificarse desde el punto de vista de su origen histórico o amplitud de uso en:

Desde el punto de vista de la función:

Categorías léxicas, formada por la clase de palabras con referente que constituyen una clase
abierta en principio ampliable por cualquiera de los procesos de formación de palabras.

Categorías funcionales, formada por las palabras con función puramente gramatical que permiten
especificar las relaciones entre los intervinientes en una predicación verbal. Forman una clase
cerrada.

Procesos de formación de palabras

Las palabras que forman parte de las categorías léxicas pueden combinarse entre sí para dar lugar
a nuevas palabras, para ello las lenguas del mundo usan diversos procedimientos:

Composición (lingüística)

Derivación (lingüística)

Parasíntesis

Clases de unidades léxicas

Según su naturaleza, las unidades del léxico pueden distinguirse entre:2

Categorías léxicas o abiertas: Son aquellas que poseen carácter referencial (es decir, las que
designan procesos, propiedades, acciones o entidades). Se caracterizan por formar un inventario
abierto (es decir que no existe un número específico y limitado para estas unidades). Los
sustantivos, los verbos y los adjetivos son representantes canónicos de este tipo de unidades
léxicas.

Categorías funcionales o cerradas: Son aquellas que sólo poseen significado gramatical (es decir,
que son fundamentales para la generación de una oración pero que, sin embargo, no tienen
significado referencial). Se caracterizan por formar un inventario cerrado. Las conjunciones y los
artículos son representantes de este tipo de unidad.

Clases de rasgos léxicos

Las unidades léxicas distinguen tres tipos de rasgos (no todos los modelos gramaticales utilizan los
mismos rasgos léxicos. Lo que se da a continuación es una generalización):

Rasgos formales: Contienen información sobre el tipo de palabra de la que se trata (sustantivo,
verbo, preposición), sobre el contexto sintáctico en el que pueden aparecer y sobre el tipo de
flexión (regular o irregular) que requieren.

Rasgos semánticos: Contienen información sobre la estructura argumental requerida por una
unidad léxica (un verbo como "destruir" requiere un agente que destruya y un tema a ser
destruido), sobre las propiedades inherentes de cada unidad (un nombre como "niño" tiene rasgos
[+humano] [+contable] etc.).

Rasgos fonológicos: Contiene la información necesaria para asignarle representación fonética a la


unidad.

El léxico en la traducción automática

En un diccionario tradicional típico, las entradas se identifican mediante una forma base o
"canónica" de la palabra. Esta forma canónica varía según el idioma: los verbos en inglés se
representan mediante la raíz no flexionada, mientras en francés o español se representan con el
infinitivo del verbo. Además de la definición estos diccionarios tradicionales incluyen en cada
entrada información adicional como la pronunciación, la categoría gramatical o su etimología.

El léxico o diccionario empleado en la traducción automática presenta algunas diferencias, al


compararlo con uno tradicional. Algunos programas de traducción automática cuentan
únicamente con diccionarios de formas flexionadas, es decir, listas de palabras con todas las
formas e información gramaticales correspondientes. Un léxico de esta forma contendría las
palabras comer, comida, comiendo, comido por separado, como unidades diferenciadas. Esta
aproximación no es nada eficiente en lenguas como el español, que posee una flexión rica y
compleja. En estos casos, el léxico suele proporcionar una raíz a partir de la cual el componente
morfológico se encargará de generar las formas apropiadas.

Este léxico para la traducción automática debe suministrar la información necesaria para el análisis
sintáctico y semántico:

categoría gramatical (nombre, verbo, etc.)


rasgos de subcategorización, subcategoría del apartado anterior (verbo transitivo o intransitivo,
sustantivo masculino o femenino, etc.)

información semántica (nombre animado, verbo que exige un sujeto animado, etc.)

A menudo estos dos últimos tipos de información se emplean conjuntamente a la hora de definir,
por ejemplo, una subcategoría en términos de restricciones de selección. Esta información ayuda a
determinar el contexto en el que pueden aparecer las palabras. Así, por ejemplo, el verbo amar
restringe la selección de su sujeto, de manera que este debe ser animado.

Además, un léxico empleado en la traducción automática debe aportar información relativa a la


correspondencia entre las unidades léxicas de distintas lenguas. Debido a la complejidad que
puede entrañar esta tarea, muchos sistemas optan por establecer una separación entre dos tipos
de información: por un lado, la información necesaria para el análisis o producción de textos en
una lengua particular y, por otro lado, la información relativa a las correspondencias léxicas entre
dos pares de lenguas. Estas correspondencias incluyen las condiciones en las que se produce la
equivalencia:

categorías gramaticales (bote: verbo o nombre)

categorías semánticas (banco: asiento o establecimiento que realiza negocios con dinero)

contexto sintáctico (tratar una enfermedad o tratar de conseguir algo)

Potrebbero piacerti anche