Sei sulla pagina 1di 31

CHAPTER Two

LINGufSTICA DE CORPUS
y VALENC IA VERBAL

JOSE MARfA GARCfA-MIGUEL

1. Introduction
Las propiedades combinatorias, 0 valencia, de los verbos y otros
eleme ntos lexicos constituyen un problema c1ave para el estudio de las
interrelaciones entre lexico y sintaxis y entre sintaxis y semantica. El
concepto y el termino de valencia proceden de Tesniere ( 1 959), quien
establece una analogfa entre los verbos y los elementos qufmicos,
On peut comparer le verbe a une sorte de atome crochu susceptible de
exercer son attraction sur un nombre plus ou moins eleve d' actants, selon
qu'il comporte un nombre plus ou moins eleve de crochets pour les
maintenir dans sa dependance. Le nombre de crochets que presente un
verbe et par consequent le nombre d'actants qu'il est susceptible de regir,
constitue ce que nous appellerons la valence du verbe (Tesniere 1 959: 238)

Tanto en la propia obra de Tesniere como en la elaboraci6n del


concepto de valencia por parte, sobre todo, de lingiiistas alemanes queda
c1aro que la valencia verbal no se limita al mlmero de actantes, si no que
tambien concierne a sus caracterfsticas sintacticas y semanticas, por 10 que
suele hablarse, siguiendo a Helbig ( 1 992) de valencia cuantitativa 0
valencia 16gica, de valencia sintactica (propiedades y relaciones sintacticas
de cada actante) y de valencia semantic a (propiedades y relaciones
semantic as de cada actante). Esto convierte la teorfa de la valencia en un
marco te6rico adecuado para describir todo tipo de propiedades
sintagmaticas de los actantes, 10 cua1 inc1uye 10 que en otros marcos
te6ricos se conoce como marcos de subcategorizaci6n (Chomsky 1 965),
marcos predicativos (Dik 1 989), estructura argumenta1, esquemas
sintactico-semanticos y otros. El conj unto de conceptos re1acionados con

30

Chapter Two

la valencia ha demostrado su importancia para la lingiiistica en general; y


en especial para la lingiiistica de corpus, para la lexicografia y para el
procesamiento del lenguaje natural. En opini6n de Schulte im Walde
(2009: 954), en procesamiento del lenguaje la mitad de los fallo s de
parsing estan causados por informaci6n valencial inadecuada.
La teoria de la valencia permite sistematizar las superficiales
indicaciones sintacticas de los diccionarios "tradicionales". Por ejemplo, el
Diccionario de la lengua espaiiola de la Real Academia Espafiola (DRAE)
limita su informaci6n sintactica a abreviaturas del tipo tr. "transitivo", intr.
"intransitivo", U.t.c.intr. "usase tambien como intransitivo", y similares.
Ciertamente, tambien se emprendieron monumentales obras como el
Diccionario de construccion y regimen de la lengua castellana (Cuervo
1 994 [ 1 872-] ), que no pudo completarse hasta mucho despues de iniciado;
pero s610 con la aplicaci6n a la lexicografia de la teoria de la valencia, a
partir de los afios 70, se empieza a sistematizar la informaci6n sintactica
en los diccionarios. A partir de la publicaci6n de la obra de G. Helbig y W.
Schenkel ( 1 969) Worterbuch zur Valenz und Distribution deutscher
Verben y, posteriormente, del Kleines Valenzlexikon deutscher Verben de
U. Engel y H. Schumacher ( 1 976), se ha ido generalizando progresivamente
la confecci6n de numerosos diccionarios de valencias, esto es, diccionarios
destinados a ofrecer informaci6n sobre las posibilidades combinatorias de
los verbos 0 de otras unidades Iexicas como los nombres y adj etivos. En la
decada de los ochenta y los noventa, se han ido publicando trabaj os
lexicograficos sobre la valencia, regimen verbal, 0 construcciones
sintacticas de los verbos para lenguas como el frances (Busse y Dubost
1 977), el portugues (B orba 1 990, Busse 1 994, Luft 1 995), el ingIes
(Garrudo 1 99 1 ), el polaco (Polanski et al. 1 980- 1 992), el eslovaco
(Niznikova y Sokolova 1 998) 0 el italiano (Blumenthal y Rovere 1 998),
por mencionar algunas diccionarios monolingiies, a 10 que habria que
afiadir proyectos de diccionarios bilingiies como el Diccionario contrastivo
de valencias verbales espafiol-aleman (Dominguez et al. 2008).
Entre las obras recientes mas destacadas, habrfa que citar el
Valenzworterbuch deutscher Verben (VALBU) de Schumacher et al.
(2004) y el Valency Dictionary of English (VDE) de Herbst et al. (2004).
VALBU, desarrollado en Institut fiir Deutsche Sprache (IDS) de
Mannheim, es un diccionario monolingiie de valencia verbales de aleman
que contiene 638 lemas, con unas 3000 acepciones verbales, para los que
se ofrece ademas de informaci6n valencial tambien detallada informaci6n
morfol6gica, fraseol6gica y estilfstica. La versi6n electr6nica on-line E
VALBU (http://hypermedia2.ids-mannheim.de/evalbuJ) no es una simple
copia de la versi6n en papel sino que presenta una reorganizaci6n del

Lingiiistica de Corpus y Valencia Verbal

31

parcial d e l a Tabla 1 , e n l a que no se


u
forrnato de cad a artIc lo. La rnuestra
ues t:a el pan: 6n basico del erbo, su
aprec ian las difere nci as de color,
y
signi fic ad o, la lista de actantes obhgatonos opclOnales, y las pnncipales
realizaci ones sint actica s de cada actante.
Tabla 1. Muestra (parciaI) de una entrada en E-VALBU

Belegungsregeln:

Ksub: NP im NomIProP im NomlGWS

Kakk: NP im Akk/ProP im AkkIGWS


Kprp: gegen +Akk
Kadv: Art und Weise
P IAdvP Idurch+Akk lin+Akk: Im it+Dat Inach+Dat

El Valency Dictio nary of English [VDE] (Herbst et al. 2004) describe


la valencia de 5 1 1 verb o s , 274 nombres y 544 adjectivos del ingIes
contemporaneo, co n ejemplos tornados del c orpus B ank of E ngli sh de 320
millo nes de palabras.
,

Tabla 2. VDE: Preambulo y significado de WIN

[N]A/[by
N]
[V-ing]A
[that-CL]A

Tl
Tl
Dl TI-4
Tl
T3

[against N]p

D2 TS-6 Q

[at N]p
[by
N/SCORE]
[SCORE]
[fromN]

D3
D4 T2.6
DS

TS
T4

Chapter Two

32

Las propiedades verbales codificadas en VDE incluyen el minimo y


maximo de actantes en c1ausulas activas y pasivas, un inventario de
actantes semanticos (I -VII,
) descritos en terminos de categorfas
sintacticas (por jemplo, [N]A/[by N] , para sujeto activo y frase con by de
la pasiva), y una lista de los esquemas sintacticos en los que se registra
cada actante el corpus analizado (T1, D 1, )
Tanto VALBU como VDE son diccionarios basados en corpus. Estos y
otros proyectos similares (mas adelante nos detendremos en el proyecto
ADESSE) nos animan a reflexionar sobre las aportaciones de la lingiifstica
de corpus a la descripci6n de la valencia verbal (y viceversa). Hay muchas
maneras de hacer lingiifstica con corpus, pero tambien algunas constantes
que caracterizan esta metodologia emergente. En primer lugar, el mismo
hecho de trabaj ar con corpus, esto es con conjuntos de textos naturales en
soporte informatico que se toman como representativos de una lengua 0
variedad de lengua, da una perspectiva diferente que si tomamos como
datos ejemplos construidos artificialmente. Pero ademas los metodos
caracterfsticos de la lingiifstica de corpus consisten en el analisis
sistematico y e:xhaustivo de todos los datos, el analisis cuantitativo
(frecuencias, probabilidades, . . . ) y prioritariamente en la descripci6n a
partir de patrones de coaparici6n, 10 que otorga especial relevancia al
contexto (Ories 2006: 4). En mi opini6n, destaca especialmente el hecho
de que el manej o de corpus textuales obliga a intentar un examen
exhaustivo de todos los casos contenidos en el corpus:
. . .

There is no prior selection of data which we are meant to be accounting for


and data we have decided to ignore as irrelevant to our theory. This
principle of "total accountatibility" for the available observed data is an
important

strength

of

CCL[=

computer

corpus

linguistics]

(Leech,

1 992: 1 12).

La exhaustividad implica una revisi6n continua de las categorias


cualitativas preestablecidas y un movimiento continuo de ida y vuelta de
los datos a la teoria y viceversa. Por eso, no hay 0 no deberfa haber una
contraposici6n entre lingiifsticas te6ricos "de si1l6n" y lingiiistas de
corpus, sino que "the two kinds of linguists, wherever possible, should
exist in the same body" (Fillmore 1992: 35). De la misma manera, es
artificial 0 simplemente un cuesti6n de perspectiva la contraposici6n entre
"corpus-based linguistics" y "corpus-driven linguistics" (Tognini-Bonelli
2001), segun se ponga el enfasis en el camino que va de los categorfas
descriptivas a los datos del corpus 0 el que va de los datos del corpus a las
categorfas que emergen de el. Ciertamente, si el punto de partida es el
corpus no analizado y no anotado, la metodologfa de la lingiifstica de

Lingiiistica de Corpus y Valencia Verbal

33

c orpu s se limita en gran medida a fen6menos a los que s6lo puede


acce ders e hacie ndo bilsquedas sobre palabras particulares, tales como
ej empl os contextualizados (concordancias KWIC) , combinaciones
frecue ntes de palabras ("colocaciones") y s6lo tras un cierto proceso de
abstr ac ci6n patrones como los que constituyen la Pattern Grammar de
Hunston Y Francis (2000).
Sin embargo, la investigaci6n en sintaxis y semantic a (y la valencia es
un fen 6meno sintactico y semantico) requiere el analisis de propiedades
estructurales mas abstractas que las que pueden observarse facilmente de
esa manera (Manning 2003: 294) . Es decir, resulta necesario ir mas alla
del texto como cadena de caracteres, porque no siempre es suficiente con
busc ar en texto pIano, ni siquiera basta siempre con corpus anotados
morfosintacticamente. Ademas de corpus con anotaci6n morfosintactica,
necesitamos tambien corpus con anotaci6n sintactica, semantica, discursiva,
. . . 10 cual implica categorizaci6n (agrupaci6n de casos similares) . Pero por
otro lado, ningiln conjunto de categorfas preestablecidas suele valer para
analizar exhaustiva e indiscutiblemente un corpus cualquiera. Ademas, la
lingiiistic a de corpus reciente ha mostrado que debe superarse una manera
de hacer sintaxis basada en categorias abstractas que pueden ser ocupadas
por elementos Iexicos : "The evidence now becoming available casts grave
doubts on the wisdom of postulating separate domains of lexis and syntax"
(Sinclair 1991: 104). La idea de un continuo lexico-sintaxis con un amplio
mlmero de expresiones idiomatic as y combinaciones preconstruidas es
comp artida tambien por la Gramatica de Construcciones (Goldberg 2003).
El concepto de valencia se asocia con el nilmero de huecos ["slots"]
abiertos por un predicado para ser ocupados por categorias sintacticas y
elementos Iexicos. Pero tambien tiene que ver con las restricciones
impuestas sobre cada hueco y debe ser compatible, como veremos, con la
probabilidad de que los actantes adopten ciertas realizaciones especificas,
10 cual debe comprobarse con datos cuantitativos basados en corpus.
Ademas, el concepto de valencia deberia ser compatible con el principio
de idiomaticidad, 10 que obliga a definir patrones combinatorios a
diferentes niveles de abstracci6n, y no s610 para lexemas verbales.
En este contexto, han aparecido en los illtimos afios un nilmero
considerable de recursos informatizados directamente relacionados con la
valencia y la lingiiistica de corpus. Ademas de diccionarios de valencias
basados en corpus, como VALBU y VDE, algunos de ellos en versi6n
electr6nica como el propio E-V ALB U 0 el lexico valencial del checo
VALLEX (Zabokrtsky and Lopatkova 2007), tenemos tambien otros tipos
de diccionarios combinatorios basados en corpus como el DEC (Mel'uk
et al. 1984-1999) 0, para el espafiol, REDES (Bosque 2004). Pero sobre

34

Chapter Two

todo, tenemos una serie de recursos basados en corpus que incluyen como
parte esencial la sistematizaci6n de las propiedades sintacticas y
semantic as de los verbos y otras unidades lexicas, incluyendo su
descripci6n y clasificaci6n semantic a y sus propiedades combinatorias.
Entre esos recursos destacaremos para el ingles PropB ank (Palmer et al.
2005), FrameNet (Fillmore et al. 2003 . Fillmore 2(07) y Pattern
Dictionary of English Verbs (Hanks and Pustejovsky 2005), y para el
espafiol Spanish FrameNet (Subirats 2009), SenSem (Vazquez et al. 2006)
y el lexico derivado de AnCora (Taule et al. 2008), ademas de ADESSE,
que comentaremos a continuaci6n. Muchos de estos recursos apenas
ofrecen informaci6n sobre frecuencia en el corpus de cada patr6n
sintagmatico, a diferencia de 10 que ofrece VALEX (Korhonen et al.
200 6), un lexic6n con la frecuencia de los patrones de subcategorizaci6n
de 6 397 verbos del ingles. A cambio, tenemos recursos con informaci6n
semantica bastante detallada. Su desarrollo demuestra tambien la
necesidad de anotaci6n sintactica y semantica bien del corpus bien de los
recursos lexicos derivados de corpus de las nociones claves de la valencia
semantica no pueden deducirse de otras mas superficiales, por 10 que la
anotaci6n sintactico-semantica de corpus requiere ineludiblemente
anotaci6n manual, aunque los recursos Iexicos en desarrollo pudieran
servir de base para la automatizaci6n de anotaciones semantic as ulteriores.
Frente al desarrollo de diversos "treebanks" y similares desde los afios 90,
la primera decada del siglo XXI ha visto el desarrollo de varios proyectos
que afiaden a la anotaci6n sintactica tambien informaci6n semantica
relevante. Ademas de los proyectos ya mencionados, destaquemos el
Prague Dependency Treebank (Haj ic 2004) para el checo, y SALSA
(Burchardt et al. 2006), que incorpora informaci6n semantic a de FrameNet
al treebank Tiger del aleman.

2.ADESSE
En la paginas siguientes hablaremos de ADESSE, "Base de datos de
verbos, Altemancias de Diatesis y Esquemas Sintactico-Semanticos del
Espafiol" (http://adesse.uvigo.es/), un proyecto1 de la Universidade de
Vigo cuyo objetivo es disponer de una base de datos con informaci6n
sintactica y semantic a sobre los verbos y chiusulas de un corpus del
espafiol (corpus ARTHUS de 1 ,5 millones de palabras). ADESSE es una
versi6n, ampliada con informaci6n semantica, de BDS, "Base de datos
sintacticos del espafiol" (http://www.bds.usc.es/). un proyecto desarrollado
en la Universidade de Santiago de Compostela en los afios 90 (Roj o 2(0 1 ) .
Una diferencia importante con respecto a los diccionarios de valencias

Lingtiistica de Corpus

y Valencia Verbal

35

public ados es que en ADES SE no se analizan s610 los patrones valenciales


de un numero limitado de verbos, para los que se han seleccionado
ejemp los s ufic ientes en el corpus (por ejemplo, 51 1 verbos en VDE, 638
verbo s en VALB U), sino que se desarr o lla con intenci6n de exhaustividad:
todas las chiusulas del corpus, no una selecci6n suficiente para la
des cripci 6n de los verbos. Se pretende incluir el amilisis de los patrones
valenc iales de todos los ejemplos de todos los verbos. Dado el tamafio del
corpus y la distrib uci6n estadfstica esperable, tendremos muchos ejemplos
de unos poc os verbo s, y muy pocos ejemplos de la mayorfa de los verbos
registrado s en el corpus.
Tabla 3. ADESSE: Numero de verbos y frecuencia en numero de
chiusulas (no se cuentan verbos auxiliares, anotados junto con el verbo
principal)

25
45
276
472
1 2 10
1672
3433

>1 000
>500
> 1 00
>50
> 10
>5
>0

El tamafio (y la composici6n) del corpus son insuficientes para una


descripci6n detallada del 16xico y, en menor medida, la gramatica del
espafiol. Pero ese tamafio reducido es adecuado para un analisis manual
exhaustivo de numerosos fen6menos l6xicos, sintacticos y semanticos,
permitiendo que se convierta en un interesante campo de pruebas que
sedan irrealizables en corpus mas amplios. Las principales propiedades
que se han anotado en la base de datos (sumando las anotaciones de BDS y
ADESSE) aparecen ejemplificadas en la Tabla 4.

36

Chapter Two

Tabla

4. (Parte de) una ficha en ADESSE: Los hermanos Vicario les


habian contado sus propositos a mas de doce personas [eRO: 61, 22]

Emisor
Rol
Argl
lndice_arg
Suj
Funci6n sint.
3pl.Suj [-!1]
Concordancia
FN
Categ0 rfa
[hermano]
Nacleo /exico
semantico Animado

I
"

,'

Receptor
Arg3
OInd
3pl.Dat [Ies]
FN
FN
fJ2.ro/2.6sito] fJ2.ersona]
Abstracto
Animado

Mensaje
Arg2
ODir

Las principales dimensiones codificadas en ADESSE comprenden,


para cada argumento nuclear: funci6n sinrnctica, realizaci6n morfo-sintactica
(categoria, preposici6n, etc.), rol semantico, tipo semantico (animado,
inanimado, abstracto, proposicional), nucleo lexico, posici6n (con respecto
al verbo), determinaci6n y numero. Ademas, para para cada verba y cada
clausula, se ha anotado la voz (activa, media, pasiva), el significado del
verbo (acepci6n), el tipo semantico de proceso, categorias fIexivas
(tiempo, aspecto, modo), perifrasis verbales, polaridad, modalidad, y
algunos otros rasgos morfosintcicticos.
En la versi6n online de la base de datos (http://adesse.uvigo.es/data) se
pueden obtener informes sobre verbos (acepciones, potencial valencial,
realizaciones valenciales y perfil combinatorio), sobre clases semanticas
de verbos (roles de participantes, verbos mas frecuentes y construcciones
mas frecuentes de la clase) , sobre esquemas sintacticos (verbos y clases
mas frecuentes) y existe un formulario de busquedas avanzadas, que
permite obtener casi cualquier combinaci6n de verbo, clase y propiedades
lexicas, sintacticas y semantic as de argumentos.
En la base de datos hay anotaciones sobre argumentos [actantes], pero
no circunstantes. El criterio basico para determinar que actantes reciben
anotaci6n son la obligatoriedad semantica y la especificidad. Ademas se
han anotado siempre las funciones sintacticas centrales (SUJ, ODIR,
OIND), aunque no sean obligatorias. Secundariamente, se han anotado

Lingiiistica de Corpus

y Valencia Verbal

37

tambien muchos argumentos adicionales evocados semanticamente por el


predic ado, aunque no sean obligatorios.

3. Verbos y esquemas construccionales:


Aspectos de la valencia en el corpus

3.1. Valencia semantica


Aunque frecuentemente se ha presentado la valencia como exigencia
de determinados constituyentes sintacticos, la idea que subyace a ADESSE
es que las bases de la estructura argumental deben buscarse en la
semantica y en el discurso, no en propiedades puramente formales de los
elementos lexicos. Los verbos y los esquemas sintacticos de una lengua
nos proporcionan instrumentos para representar escenas 0 situaciones del
mundo real 0 imaginado, de modo que al utilizar una palabra (un verbo) 0
una construcci6n gramatical (esquema) estamos conceptualizando una
situaci6n como realizaci6n 0 ej emplar de cierta clase 0 tipo. Por ejemplo,
10s verbos siguientes conceptualizan ciertos tipos de escenas de las que
podemos decir que ocurren cuando intervienen los actantes que se indican
con cada verbo:
( 1 ) Situaciones y actantes
CASARSE: alguien (AI) SE CASA con alguien (A2)
SENTIR: alguien (AI) SIENTE algo (A2)
REGALAR: alguien (AI) REGALA algo (A2) a alguien (A3)
AVISAR: alguien (AI) AVISA [de] algo (A2) a alguien (A3)
GANAR: alguien (AI) GANA algo (A2) a alguien (A3)
Dando algunos pasos mas en el mismo proceso de abstracci6n, cabe
generalizar sobre diferentes tipos de situaciones abstrayendo 10 que tienen
en comun las situaciones definidas por verbos semanticamente
relacionados. Por ejemplo, ganar, veneer y perder aunque diferentes
semanticamente evocan un mismo tipo de escena en la que compiten un
competidor y un antagonista. Este punto de vista semantico-conceptual
esta en lfnea con la perspectiva adoptada por FrameNet: "the semantic
valence properties of a word are expressed in terms of the kinds of entities
that can participate in frames of the type evoked by the word. We call
these roles frame elements" (Fillmore et al. 2003 : 237). En la Tabla 5
tenemos un ejemplo :

Chapter Two

38

Tabla 5. Elementos del marco conceptual "Finish_Competition" en


FrameNet (http://framenet.icsi.berkeley.edul)2

Core Frame Elements:


The event in which the Competitors compete with each
Competition
other.
The individuals who compete against each other.
Competitors
The individual involved in the Competition.
Competitor
The individual that the Competitor has been competing
Opponent
against.
Non-Core:
The rank (according to Score) that a Competitor
Rank
achieves.
A quantity whereby progress is measured during the
Score
game, and Rank and Prizes are awarded to the
Competitors afterward.
The amount by which the Competitor' s and Opponent' s
Margin
Scores differ.
Lexical Units:

draw. n, lose. v, loss.n, tie. v, victory. n, win. n, win. v,


winner. n , . .
.

ADESSE tiene prop6sitos diferentes y no inc1uye la definici6n de


marcos conceptuales similares a los de FrameNet. Pero necesita tambien
una caracterizaci6n de tipos de situaciones y de participantes en esas
situaciones. En el nivel mas baj o de abstracci6n, cada verbo 0 cada sentido
verbal evoca un tipo particular de situaci6n. En sucesivos procesos de
abstracci6n se agrupan los verbos en c1ases jerarquizadas que definen tipos
de procesos (Albertuz 2007). En la Tabla 6 se muestran los dos niveles
mas altos de la j erarquia utilizada en ADESSE (similar, pero no igual, a la
tipologia de procesos de Halliday 1 985) junto con el mlmero de verbos que
se han adscrito a cada c1ase en la base de datos. Para cada una se han
definido tambien c1ases mas espedficas hasta un total de 62 c1ases en la
versi6n mas reciente.

Lingtiistica de Corpus y Valencia Verbal

39

Tabla 6. Tip os de situaciones: clases primarias de verb os en ADESSE

2 RELACIONAL

3 MATERIAL

4 VERBAL

12
13
21
22
31
32
33
34

Percepci6n
on
Co
Atribuci6n
Ser
Tener
Posesi6n
Ir
Espacio
Cambio
Abrir
Otros hechos Tocar
Conductas
Refr
Decir
.

5 EXISTENCIAL

Haber

6 MODULACION

Hacer-II

425
11
2302
(5 8%)

29.8 1 6
52.082
(33%)

336

1 5 .595
1 1 568
.

161

TO TAL

1 3 .444
158922

En cuanto a los papeles de los participantes, ADESSE comparte con


FrameNet la idea de no utilizar una lista unica de roles semanticos (0
"papeles tematicos") de validez general y definirlos en relaci6n con el tipo
de situaci6n 0 marco conceptual. As! se definen roles en diferentes niveles
de generalidad (Garcia-Miguel and Vaamonde 20 1 0) . Tendremos pues
roles especificos de cada VERBO (representan "potencial valencial") :
(2)
ESCRIBIR: <AO:Escritor, Al : Texto, A2:Receptor , A3 :Asunto>
ENSENAR: <AO: Docente, AI: Discente; A2: Contenido >
GANAR: <AI: Ganador, A2 :Perdedor>
VENCER: < AI: Vencedor, A2 :Vencido >
Y para cada clase semantica, que agrupa entradas verbales a diferentes

niveles de abstracci6n, se definen roles de participantes especificos de


cada clase:
(3)
41 Comunicaci6n <Comunicador, Mensaje, Receptor, Asunto>
1 3 Cognici6n <Conocedor, Contenido>
338 Competici6n <Competidor, Antagonista>

40

Chapter Two

Tanto en la definici6n de tipos de escena designados por un verba


como en los designados por una clase se utiliza un sistema de numeraci6n
correlativa para cada argumento semantico (AO, AI, A2, etc ... ) que en
parte es arbitrario, en parte refleja probabilidad de aparici6n, y en parte
refleja roles semanticos generalizados: por ejemplo, AO es siempre el
Iniciador en procesos causativos.
Los esquemas sintactico-semanticos 0 patrones valenciales consisten
explfcitamente en el emparejamiento de cada funci6n sintactica con el
indice de uno de los argumentos especfficos del verbo.

3.2. Actantes obligatorios y opcionales


Definida la valencia como el numero de actantes que un verba es
susceptible de regir (Tesniere 1 95 9: 238), el propio Tesniere afiade que
"certains valences peuvent rester inemployees ou libres. C'est le cas
lorsqu'on dit Alfred chante en face de Alfred chante une chanson"
(Tesniere 1 95 9 : 239). En consonancia con esto, al presentar los
diccionarios de valencias 10 que Helbig ( 1 992) llama "valencia
cuantitativa" 0 "valencia 16gica" suelen ofrecer bien una cuantificaci6n de
actantes obligatorios y opcionales, como hace el VDE 0 bien una !ista de
actantes caracterizados formalmente donde se indican entre parentesis los
opcionales, como hace VALBU
,

[VDE] win Active: 1/4


[VALBU] gewinnen: NomE, (AkkE), (PdipE), (AdvE)

La distinci6n entre 10 que es posible con un verba y 10 que esta


sintacticamente realizado, tambien es utilizada en ADESSE. Por ejemplo,
el marco conceptual de escribir puede describirse por medio de cuatro
roles semanticos: AO-Escritor, Al-Texto, A2-Receptor y A3-Asunto.
Aunque ocasionalmente podriamos encontrar expllcitos esos cuatro
argumentos, como en (a), los esquemas sintacticos de escribir suelen
seleccionar un subconjunto, destacando ciertos participantes en la escena y
dej an los demas no expresados, como en (b) 0 (c):
(4)
Juan [AO] le escribi6 una carta [AI] a su madre [A2] sobre su recuerdos de
infancia [A3]
Juan [AO] escribi6 una carta [AI]
Juan [AO] le escribi6 a su madre [A2]

Lingtiistica de Corpus y Valencia Verbal

41

Sin embarg o, la observaci6n del corpus no nos permite una distinci6n


y opcionales. Los esquemas valenciales
es tricta entra actantes obligatorios
de un verbo aparecen en el corpus con diferente frecuencia, desde los mas
us uale s hasta los raros 0 inesperados. Es decir, la obligatoriedad u
o pcionalidad de los argumentos de un predicado no es una cuesti6n de sf 0
no, sin o una gradaci 6n; por 10 que debemos entender que los actantes
ob ligatorio s son aquellos elementos (referenciales) mas frecuentemente
vinc uladas al verbo en los textos.
Tabla 7. Argumentos of Escribir (N clausulas

321)

Ninguno de los actantes de escribir es estrictamente obligatorio, pero


las diferencias en la frecuencia de realizaci6n sugieren diferentes grados
de implicaci6n por parte del lexema verbal y generan expectativas sobre
que podemos encontrarnos al usar un verbo. El verbo eseribir parece
asociarse mas bien con un participante "escritor" y, en menor medida, un
"texto". Ambos, ademas, parecen evocados incluso cuando no estan
presentes, pues diffcilmente puede concebirse el evento que llamamos
escribir sin ellos, y en ese sentido son semanticamente obligatorios. Pero
los argumentos "receptor" y "asunto" deben considerarse como argumentos
opcionales, compatibles con ese verbo pero de ningun modo obligatorios.
L6gicamente, el grado variable de exigencia de los actantes por parte
de cada verbo puede diferenciar verbos cuasi-sin6nimos. Por ejemplo,
tanto ganar como veneer admiten hasta tres actantes (competidor-ganador,
antagonista-perdedor y competici6n-objetivo), pero mientras veneer se
combina frecuentemente con los dos primeros (alguien vence a alguien y
raramente con el tercero, ganar exige el primero (alguien gana) y admite
opcionalmente tanto el segundo (alguien gana a alguien) como el tercero
(alguien gana algo):

42

Chapter Two

Tabla 8. Argumentos of Ganar y Veneer

Pero las diferencias de frecuencia de los actantes plantean un problema


de mas largo alcance, pues ponen en cuesti6n la posibilidad de establecer
de manera categ6rica que combinaciones sintagmaticas admite un verbo.
Many subcategorization distinctions presented in the linguistics literature
as categorical are actually counterexemplified in studies of large corpora of
written language use. We can get a much better picture of what is going on
by estimating a probability mass function (pmf) over the subcategorization
patterns for the verbs in question. We can put a probability function over
the kinds of dependents to expect with a verb or class, conditioned on
various features. (Manning 2003: 302)

Desde una perspectiva funcional, basada en el uso, los patrones


valenciales son generalizaciones sobre uso registrado, donde se hace
abstracci6n de detalles particulares y cada ejemplar se interpreta por
analogia con ejemplares previamente percibidos. En este tipo de model os
la frecuencia de uso es un factor crucial para explicar el conocimiento del
lenguaje y su adquisici6n. Y, por supuesto, esto es tambien valido para la
estructura argumental, 0 valencia:
"Argument structure" needs to be replaced by a greatly enriched
probabilistic theory capturing the entire range of combinations of
predicates and participants that people have stored as sorted and organized
memories of what they have heard and repeated over a lifetime of language
use" (Thompson and Hopper 2001: 47)

Es decir, {m vez de argumentos obligatorios y opcionales, nuestra


experiencia lingiiistica nos proporciona expectativas sobre la referencia a
cierto tipo de participante en las escenas evocadas por el verbo, a partir de
la frecuencia de usos previos. Como la obligatoriedad es uno de los
principales criterios para la distinci6n entre actantes y circunstantes
[argumentos y adjuntos] , esta distinci6n tambien es gradual.
However, such a frequency-based account is not satisfactory, because
frequency of occurrence needs to be distinguished from argument status.

Lingiiistica de Corpus y Valencia Verbal

43

Many arguments are optional, while some adjuncts are (almost) compulsory
(e.g., a how adjunct for worded as in He worded the proposal very well ).
(M anning 2 003: 305)

Por eso , una cosa es el grado de obligatoriedad y otra que complementos


cuentan para des cribir la valencia del verbo. En BDS , y ADESSE, se
utilizan co mo criterios adicionales a la exigencia semantica de los
parti cipantes (aunque no siempre esten expresados), la especificidad
(c omplemento s que no se combinan con cualquier clase de verbos) y en
cualquier caso, siempre se anotan los actantes destacados por el hecho de
expresarse mediante las funciones sintacticas centrales (SUJ, OD, 01),
aunque no este n exigidos por el verbo. Esto ultimo nos permite destacar
que la val encia verbal no se limita a los participantes semanticamente
obligatorios. Y esto es especialmente importante en una perspectiva
construccionista. Encontramos frecuentemente que los verbos aparecen en
construcciones que incluyen argumentos adicionales que no se deducen
del significado del verbo. Pero incluso si consideramos s6lo los actantes
mas esenciales es necesario considerar los esquemas construccionales
como tales y no como simple concatenaci6n de actantes individuales :
With regard to the view of whether valency phenomena are to be described
more appropriately in terms of a complement inventory or also in terms of
valency patterns, it seems that both views will have to be considered
(Herbst

2 007:

27)

Veremos a continuaci6n algunos aspectos de la asociaci6n entre verbos


y construcciones argumentales (es decir, patrones valenciales).

3.3. Esquemas construccionales


Entendemos por construcci6n cualquier patr6n de aSOClaClOn entre
expresi6n y contenido ["constructions are stored pairings of form and
function" (Goldberg 2003 : 2 1 9). Una construcci6n argumental ("Argument
Structure Construction") es un tipo de construcci6n que proporciona los
medios basicos de expresi6n clausal en una lengua. . Los esquemas
construccionales argumentales admiten diferentes formatos alternativos 0
combinados
Categorfas sintacticas: NP tells NP that-clause
Casos: Gewinnen: Nom Akk gegen+Akk
Funciones sintacticas: Ensefiar: Suj ODir OInd

44

Chapter

Two

En un corpus con anotaci6n morfosintactica (el tipo mas comtin de


anotaci6n gramatical) es relativamente simple encontrar patrones de
categorfas sintacticas. Por eso, el formato en terminos de categorfas
sintacticas puede guardar cierta similitud con algunas f6rmulas de la
llamada Pattern grammar (Hunston and Francis 2000), una sistematizaci6n
de las preferencias contextuales inducidas del corpus en una gramatica de
esquemas 0 patrones ["patterns"] , yendo de los patterns a los items
presentes en el y luego a otros patterns en los que esos items ocurren. En
opini6n de los proponentes de esta metodologfa, el anaIisis estructural en
terminos de funciones sintacticas "is a pointless exercise" (Hunston and
Francis 2000: 1 52), que no afiade nada. Sin embargo, Teubert (2007)
argumenta que no es suficiente con patrones Iexico-categoriales y que
necesitamos los conceptos basic os de la teorfa de la valencia "to link local,
lexical grammar to general grammar" (225) . A eso debemos afiadir que la
estructura del ingles y del aleman permiten deducir, muchas veces, la
funci6n sintactica de patrones categoriales 0 de caso, respectivamente. En
espafiol, es imprescindible el recurso a funciones sintacticas debido al
orden relativamente libre y a la realizaci6n de actantes mediante
concordancia 0 clfticos. (a) tiene el mismo esquema sintactico que (b): Suj
ODir OInd. La diferencia esta que en (a) cada actante se expresa mediante
una frase, mientras que en (b) OInd y ODir se expresan s6lo mediante los
clfticos se y la, respectivamente, mientras que la frase que funciona como
sujeto aparece pospuesta al verbo.
(5)
a. El padre le ensefiaba latfn al hijo.
b. Se 10 ensefi6 su padre.
Otra cosa es que la informaci6n puramente categorial 0 funcional sea
suficiente para definir los patrones valenciales admitidos por un verbo.
Volveremos mas adelante sobre el grado de detalle necesario.
La estrategia basica aplicada en ADESSE para anotar esquemas
valenciales parte de la distinci6n entre potencial valencial y realizaciones
valenciales ( Agel 1 995) . El potencial valencial de un verbo se entiende
como el conj unto de argumentos semanticos admitidos por ese verbo, esto
es, los participantes inherentes 0 compatibles con la escena evocada por el
verbo. Las realizaciones valenciales son el conjunto de patrones
argumentales efectivamente expresados por las estructuras sintacticas. Por
ejemplo, hemos visto en la Tabla 8 actantes evocados por los verbos ganar
y veneer, y el diferente grado de obligatoriedad que muestra cada uno de
ellos. De ahi se deriva tambien que de cada verbo se encontraran el corpus

Lingtlistica de Corpus y Valencia Verbal

45

patrones valenciales alternantes, que escogen entre los actantes posibles y


focali zan alguno s de ellos sobre otros. En las tablas siguientes se ofrecen,
c on ej empl os, las realizaciones valenciales registradas con veneer y ganar
I1, y la frecuenci a de cada esquema.
Tabla 9. Argumentos y esquemas sintactico-semanticos del verbo
Veneer en ADESSE

Al : S uj

A2:0Dir

Al : S uj

65

Los liberales vencieron a la


Iglesia [TIE:151]

12

Habfan vencido los buenos.


[USOS :OI3]

los carlistas vencieron en la


batalla de Lacar [TER:OI9]

A3:0bl ( en )

Al :Suj

Tabla 10. Argumentos y esquemas sintactico-semanticos del verbo


Ganar-ll en voz activa en

Al: Suj

ADESSE

16

Javier Sanchez gano a Tomas


Carbonell [IVOZ:47]

34

Ustedes ganan, pero no tienen


razon [PAS :08 1 ]

A3:0Dir

22

Guus Hiddink gano cuatro


[lVOZ:42]

A2:0Dir

Al :Suj
A l : Suj

Al: Suj

A2:0Ind

A3:0Dir

Nos gano la guerra America


[MAD:278]

Al: Suj

A2:0Ind

A3:0bl(a)

A limpia no me ganaba nadie


[LAB: 269]

46

Chapter Two

La observaci6n del corpus nos muestra que es extremadamente raro


que un verbo se asocie con una sola estructura sintactica, por 10 que no
puede concluirse que el lexico determine unfvocamente la sintaxis. Sin
embargo, sobre la asociaci6n de verbos y construcciones existen dos
puntos de vista complementarios, aunque no necesariamente incompatibles.
Por un lado la perspectiva lexicalista (por ejemplo, Levin 1993), que toma
el punto de vista del verbo y observa altemancias de esquemas sintactico
semanticos admitidos los elementos Iexicos, mas 0 menos en la linea de 10
mostrado en Tabla 9 y Tabla 1 0. Por otro lado, tenemos la perspectiva
construccionista (Goldberg 1 995 , 2002), que adopta el punto de vista de la
construcci6n y busca "generalizaciones surperficiales" relativas a los usos
de un esquema construccional con diferentes elementos lexicos, es decir,
10 que tienen en comun los ejemplos de cada una de las lineas siguientes:
(6)
Me ensefiaba ingles-Me daba ingIes-Me decfa cosas en ingles
Me ensefi6 a cantar-Me ayud6 a cantar-Me oblig6 a cantar
Carg6 los tomates en el carro-Puso los tomates en el carro
Carg6 el carro de tomates-Llen6 el carro de tomates
Les gan6 el partido-Ies rob6 el partido-le quit6 el dinero-le compr6 el
coche
Gan6 al ajedrez-jug6 al ajedrez
La teorfa de la valencia es una teorfa lexicalista, pero necesitamos
construcciones, definidas con relativa independencia del lexico, para dar
cuenta al menos de construcciones no previstas por el significado verbal y
de actantes adicionales, no esenciales en la escena evocada por el verbo.
En (7a), Goldberg utiliza un verbo basicamente intransitivo en la que
llama construcci6n de mOVlmlento causado ["caused motion
construction"]: Subj V Obj Obl, con el significado "X causes Y move Z
(by doing V)" que es aportado por la construcci6n y no por el verbo. En
(7b) tenemos un verbo basicamente biactancial [Romper: <AO:Agte, AI:
Pac>] , que presenta un actante adicional gracias a la presencia de un
dativo posesivo, 10 que permite desdoblar el participante afectado con
referencia al todo personal y la parte del cuerpo inmediatamente afectada:
(7)
a. She sneezed the napkin off the table (Goldberg 1 995)
b. Le rompio la cara

Lingiiistica de Corpus y Valencia Verbal

47

En general, necesitaremos hacer referencia a la interaccion de verbos y


esquemas construccionales siempre que debamos referirnos a mecanismos
de coerci on en la adaptacion del verbo al significado registrado para la
c on s trucci on y viceversa (Welke 2009). En cualquiera de las direcciones
utilizadas, verbo 0 construccion, encontraremos una red de sentidos
relacionados, que se acomodan al significado de los elementos combinados.
Los esquemas construccionales acomodan su significado primariamente al
de los verbos que entran en la construccion, como podemos comprobar en
la polisemia d el esquema <Suj ODir OInd> en espafiol :
(8)
a. Vsop + N: Esa le dio rabia
b. Trans ferencia de posesion: Se la entreg6
c. Comunicacion: Se la dijo
d. Cau sativo de proceso mental: Se la ensefi6
e. Desplazamiento: Se la llev6
f. Adquisicion + Origen: Se la rob6
g. Beneficiario: Se la hizo
h. Dativo posesivo: Le bes6 la man 0
1.

Sin entrar en detalles, la base de datos sint,ktico-semanticos nos podnl


proporcionar tambien datos cuantitativos sobre que verbos entran en cada
esquema. Una tecnica estadistica refinada para medir esas asociaciones ha
sid o elaborada por Ories y Stefanowitsch, con el nombre de analisis
colostruccional:
"Collostructional analysis always starts with a particular construction and
investigates which lexemes are strongly attracted or repelled by a particular
slot in the construction (i.e. occur more frequently or less frequently than
expected); crucially, such "slots" can exist at different levels of linguistic
structure" (Stefanowitsch and Gries 2003, 214)

Si observamos las estructuras argumentales desde el punto de vista del


verbo, los diferentes esquemas en que encontramos un verbo suponen
diferentes maneras de organizar sintactica y semanticamente el contenido
evocado. Sobre la escena evocada que sirve de base, tanto el verbo como
el esquema construccional pueden focalizar 0 perfilar ciertas relaciones, 10
que determina la probabilidad, que podemos comprobar en el corpus, de
que el verba aparezca en cierto esquema. Muchos trabajos (sobre todo
desde Levin 1 993) caracterizan la sintaxis de los verbos atendiendo a si
admiten cierto tipo de alternancia construccional. Por ejemplo, la llamada

48

Chapter Two

alternancia causativa que relaciona ciertas estructuras tranSlt1vas e


intransitivas es admitida por el verbo cambiar pero no por el verbo crecer
(9)
a.Los ninos cambiaron-Algo cambi6 a los ninos
b. Los ninos crecieron-* Algo creci6 a 10s ninos
Pero tampoco aquf hay una dicotomfa sf/no. Volvemos a tener
gradaciones y cierta probabilidad de que un verbo admita alguna de varias
construcciones alternativas. Lo mas relevante del perfil combinatorio de
un verbo consiste en los esquemas construccionales en los que entra, las
realizaciones sintacticas y lexicas de sus argumentos, y las frecuencias de
esquemas y realizaciones argumentales. Dos verbos de la misma c1ase
pueden admitir combinaciones sintagmaticas similares y diferenciarse en
la frecuencia relativa de cada combinaci6n, y en consecuencia en la
frecuencia relativa de sus argumentos centrales. Los cambios de estado,
por ejemplo, pueden producirse de modo espontaneo por propiedades
inherentes de la entidad que cambia de estado 0 pueden admitir en
distintos grados un participante adicional que inicia el cambio de estado.
En la tabla siguiente, tenemos algunos verbos de cambio de estado y su
frecuencia en ADESSE con la construcci6n transitiva causativa
(Suj =Iniciador, ObjDir=Paciente) 0 con la construcci6n intransitiva
(Suj=Paciente)
Tabla 11. Transitividad de algunos verbos de cambio de estado

DESPERTAR
MEJORAR
AUMENTAR
CAMBIAR
EMPEORAR
CRECER
,
: :

1 09
35
71
222
7
93

Por otro lado, debe tenerse en cuenta tambien que la contraposici6n


entre verbos y construcciones es mas aparente que real (Croft 2003) . Ni
los verbos ocurren aislados, pues de usos contextualizados abstraemos
esquemas valenciales particulares y un potencial valencial, ni los esquemas
sintactico-semanticos ocurren en abstracto: de usos contextualizados
abstraemos esquemas construccionales en diferentes niveles de generalidad

Lingiii stica de Corpus y Valencia Verbal

49

(esq uemas valenciales de un verbo - esquemas propios de una clase e squemas sintacticos abstractos). En cualquier nivel y vfa de abstracci6n
las re alizaciones posibles muestran una distribuci6n estadistica no
uni forme, de la que obtenemos indicios sobre significados centrales del
es decir, sobre el potencial semiintico del
esquema y posibles extensiones,
.
verbo 0 del esquema .

3.4. Realizaciones de argumentos


La relaci6n entre verbos y esquemas construccionales 0 patrones
valenciales no puede reducirse a una lista de funciones 0 categorias
sintiicticas. Determinar la. valencia de un verbo consiste en especificar para
cada actante cuiiles son sus realizaciones sintacticas, Iexicas y semanticas.
Por realizaciones sintiicticas entendemos ademas de la funci6n sintactica
(Sujeto, Objeto, Oblicuo, . . . ) y la categorfa sintiictica (FN, clausula en
indicativo / subjuntivo / infinitivo. , . . . ), tambien cualesquiera otras
propiedades formales (caso, preposici6n, . . . ) que pueda presentar una
distribuci6n 0 restricci6n idiosincratica. En cuanto a las realizaciones
16xico-semanticas de la valencia, habria que especificar para cada actante
que tipo de entidades, que clases de elementos lexicos y que elementos
lexicos particulares pueden entrar en esa posici6n estructural.
El analisis de las combinaciones lexicas particulares ("colocaciones")
ha sido uno de los temas preferidos desde que existe la lingiifstica de
corpus y uno en los que mej or ha demostrado su potencial (Sinclair 1 99 1 ) .
La definici6n de colocaci6n como "relationship o f habitual co-occurrence
between words" (Stubbs 1 995 : 23) da lugar a una metodologfa consistente
en buscar en corpus (lematizados 0 no) palabras frecuentes ("collocates ")
dentro de un cierto contexto medido en mlmero de palabras ["span"]
alrededor de un nodo, y en aplicar sencillos test estadisticos ( MI , t-score,
. . . ) para decidir si la asociaci6n entre node y colocado es superior a 10
e sperado por la casualidad. El metodo permite obtener patrones
sintagmaticos y otros aspectos bastante sutiles del perfil combinatorio de
cada palabra que tomemos como nodo.
Sin embargo, hay varias facetas en las que seria mejorable el estudio de
las colocaciones. En primer lugar, conviene distinguir (B osque 200 1 ;
2004) entre combinaciones frecuentes y combinaciones restringidas:
independientemente de que la combinaci6n dar + un paseo sea mas
frecuente de 10 que se: deriva de la frecuencia de cada palabra por
separado, es esa una asociaci6n convencional en espafiol y no *hacer un
paseo. a diferencia de 10 que ocurre en otras lenguas (frances "faire une
promenade", italiano "fare una passeggiatina"). Es decir, entre las

50

Chapter Two

ocupantes frecuentes de una posici6n argumental podemos tener conceptos


tfpicamente asociados a una situaci6n, derivados de nuestro conocimiento
del mundo (por ejemplo, "leer"+"libro") y palabras que se asocian
convencionalmente con combinaciones restringidas. En segundo lugar,
conviene ir mas alla de las listas de combinaciones frecuentes de palabras
y definir tipos semanticos 0 conj untos Iexicos ["lexical sets"] (Hanks
1 996) para caracterizar las posibilidades combinatorias de verbos y otras
palabras . En tercer lugar, y vinculado con 10 anterior, conviene ir mas alla
de alla de la busqueda de colocaciones en un entorno medido en numero
de palabras, para buscar mas bien "structure-sensitive collocates"
(Stefanowitsch and Gries 2009, 2), es decir, colocaciones que sean
sensibles a la estructura sintactica (Suj , Obj , . . . ) y/o semantic a (Arg 1 ,
Arg2, . . . ) .
Este ultimo aspecto es especialmente relevante para la descripci6n de
la valencia verbal. Si quisieramos buscar que posibles nombres admiten
los verbos ganar y veneer como objeto directo, podrfamos utilizar un
corpus con anotaci6n morfosintactica como el Corpus del espafiol
(http://corpusdelespanol.org/) y buscar nombres que aparecieran entre las
4 0 5 palabras a la derecha del verbo. Encontrarfamos entre los resultados
mas frecuentes que veneer se combina con difieultad, obstaeulo,
resistencia, !uerza, repugnancia, batalla, enemigo, etc . Todo esto es
informaci6n contextual altamente relevante, que diferencia veneer de
verbos casi-sin6nimos como ganar (que se combina mas bien con dinero,
eleeci6n, tiempo, premio, etc . . . )
El problema con este tipo de resultados, aparte de los habituales e
inevitables errores de etiquetaci6n y lematizaci6n automatica, es que no
son sensibles a la estructura sintactica, pues los nombres a la derecha
[span=4] del verba son en general ODIR, pero tambien hay SUJETO y
elementos no argumentales.
.

( 1 0)
a. que ha durado la guerra de tierra tres dfas, que en seguida han vencido
las fuerzas aliadas, y claro, . . .
b. Venus Williams, que la ha vencido dos veces esta temporada . . .
c. Maiiana vence el plazo que tenemos.
Ademas, las busquedas en corpus que tienen anotaci6n morfosintactica
no pueden ser sensibles a diferencias de significado (ni en la colocaci6n ni
en el colocativo) . Una imagen mas elaborada de la combinatoria de las
palabras 10 obtenemos de los "Word Sketches" (Kilgarrif et at. 2004), que
proporciona listas de colocados en diferentes huecos ["slots"] sintacticos

51

Lingll i stica de Corpus y Valencia Verbal

ero finalmente encontraremos 10s mismos


"
( s ubjecCnp" , "object_np") p
as si se identifican automaticamente como obj eto los nombres que
probl em
del verba y como suj eto los que aparecen a la
a arec e n a la derecha
p
i zq ui erda.

por otro lado , no basta tampoco con encontrar colocativos en cada


p os ici o n argu mental, tenemos que dar cuenta de otras probabilidades de
ia comprobables en corpus, de entidades de diferente nivel de
c o oc urre nc
generalidad , co mo las categorias sintacticas 0 que tipos semanticos caben
en una posi cion argumental. En la(s) tabla(s) siguiente(s) se muestra e l
tipo de informaci6n combinatoria que puede obtenerse directamente de
ADES SE (otras propiedades combinatorias que pueden derivarse de la
base de datos no aparecen reflej adas aquf).
,

Tabla 12. Resumen eomparativo del p erfd eombinatorio de Ganar-ll


y Veneer -I en ADE SSE
VENeER I

GANAR II
" Superar 0 aventaj ar

"Superar [alguien (0 algo)] [a un adversario 0


una dificultad]"

[alguien] ([a alguienD ([una competicionD"


anotados
80

SUJ
AGT

77
3

por

FN

36

Pro

Anim.
Abstr

75

ODIR

89

anotados

79

ODIR

65

SUJ

10

ODIR

16

OIND

OBL

SUJ

SUJ

Dat (le)

AcID at
D at

7
5

Acus (lo)

AcIDat

13

FN

13

FN

21

Abstr

curiosidad

msomnlO

apatfa

semana_s- 1

chiismo

expansion

SUJ

AGT

L OC

Acus (lo) 6

Ani m

25

25

AD J

Inf

Abstr

25

2
guerra
partido
batalla
carrera

7
4
2

por

FN

39

Pro

35

en

FN

49

FN

Ani m.

68

Animado 52

Abstr.

17

Abstracto 17

Concr.

Concreto

sueiio

4
2

obstaculo 3

cansanci0 2

timidez

tension

nieve

dificultad

jatiga

tanque

Abstracto 2

partido

batalla

52

Chapter Two

La Tabla 1 2 resume las principales diferencias combinatorias entre lo s


verbos cuasi-sinonimos ganar y veneer (quedan aparte otros significados
de ganar y veneer que corresponden a otras entradas lexicas) tal como
estan registrados en ADESSE. Estas diferencias comienzan por la
diferencias de frecuencia de los tres argumentos basicos admitidos por
cada uno, y continuan en la mayor propension del segundo argumento de
ganar hacia el CIND/dativo (ganarle a alguien vs. veneerlo / veneerle), en
la seleccion de preposicion para el argumento A3 (ganar a algo vs. veneer
en algo) y en la rareza de un argumento A2 inanimado con ganar,
mientras que se veneen no solo personas sino entidades concretas
utilizadas por las personas como los tanques, fenomenos meteorologicos
como la nieve y sobre todo situaciones abstractas negati vas como
obstaculos y dificultades.
Con todo ello, nos aproximamos a una caracterizacion mas precisa del
perfil combinatorio de los verbos del espafiol, entendiendo por tal el
conj unto de probabilidades de coocurrencia con elementos lexicos y
gramaticales de cualquier nivel de generalidad. Tambien damos pasos en
la direccion deseable de sustituir los esquemas valenciales por "marcos
predicativos enriquecidos" (Butler 200 1 ), que den cuenta de los elementos
lexicos y gramaticales que se registran el corpus en combinacion con un
predicado junto con las probabilidades de aparicion de cada elemento en
un hueco estructural.

.
.

.
.
;
;

;
I

Notes
1

El proyecto se ha benefidado de las ayudas ministeriales de referenda BFF20020 1 197 (2002-2005), HUM2oo5 -0 1 573 (2006-2008) Y FFI2008-0 1 953 (2009-20 1 1 )

References

Agel, Vilmos. ' 'Valenzrealisierung, Grammatik und Valenz." ZeitsehriJt


fUr germanistisehe Linguistik 23 ( 1 995) : 2-32.
Albertuz, Francisco J. "Sintaxis, semantica y c1ases de verbos. Clasificacion
verbal en (l proyecto ADESSE." In Aetas del VI Congreso de '
LingiUstiea General, Santiago de Compostela, 3- 7 Mayo 2004, edited
by Pablo Cano Lopez, vol. 2-2, 201 5 -2030. Madrid: Arco Libros,
2007 .
Blumenthal, Meter, and Giovanni Rovere. Worterbueh der italienisehen
Verben / Dizionario dei verbi italiani. Stuttgart: Klett, 1 998.
B orba, Francisco da Silva. Dieionario gramatieal de verbos do Portugues
Contemporiineo do Brasil. Sao Paulo: UNESP, 1 990.

Lingiiistica de Corpus y Valencia Verbal

53

B osqu e, Ignacio . REDES. Diccionario combinatorio del espafiol


co ntemp oraneo . Madrid: Editorial SM, 2004 .
"S obre el concepto de 'colocaci6n ' y sus llmite s." LingiUstica
Espafiola Actual 23/1 (200 1 ) : 9-40.
B urchardt, Alj o scha, Katrin Erk, Anette Frank, Andrea Kowalski,
Sebastian Pad6, and Manfred Pinkal. "The SALSA Corpus : a German
Corpus Res ource for Lexical Semantics." Proceedings of LREC 2006
(2006 ) : 969 - 974.
B us se, Winfried, and Jean-Pierre Dubost. Franzosisches Verblexikon. Die
Ko nstruktion der Verben im Franzosischen. Stuttgart: Klett, 1 977 .
B usse , Wi nfried. Dicionario sintactico de verbos portugueses. Coimbra:
Almedin a, 1 994 .
Butler, Christopher S . "A matter of GIVE and TAKE: corpus linguistics
and the predicate frame." Revista Canaria de Estudios Ingleses 42
(2 00 1 ) : 55 -7 8.
Chomsky, Noam. Aspects of the Theory of Syntax. Cambridge: The MIT
Press, 1 965 .
Croft, William. "Le xical rules vs. constructions: a false dichotomy. " In
Motivation in Language. Studies in honor of Giinter Radden, edited by
Hubert Cuyckens, Thomas Berg, Rene Dirven, and Klaus-Uwe
Panther, 49-68. Amsterdam: John Benj amins, 2003 .
Cuervo, Rufino J. Dicdonario de construcci6n y regimen de la lengua
castellana (8 vol.). Santa Fe de Bogota: Instituto Caro y Cuervo, 1 9871 994.
Dik, Simon C. The Theory of Functional Grammar (Part I: The Structure
of the clause). Dordrecht: Foris, 1 989.
Domfnguez, M. J. , Barbara Liibke, Meike Meliss, Ge mma Paredes, Pia
Poulsen, and Victoria Vazquez. "Presentaci6n del Diccionario
contrastivo de valeneias verbales espanol-aleman. " In La lexicografta
bilingiie y didactica: ayer y hoy , edited by Mar Campos, Eva M.
Gonzalez, J. Ignacio Perez, 5 1 -6 1 . A Coruna: Universidade da Corona,
2008.
Engel, Ulrich, and Helmut Schumacher. Kleines Valenzlexikon deutscher
Verben. Tiibingen: Narr , 1 976.
Fillmore, Charles J. "Corpus linguistics'" or "Computer-aided armchair
linguistics". In Directions in Corpus Linguistics, edited by Jan
Svartvik, 35-60. B erlin: Mouton de Gruyter, 1 992.
-. "Valency issues in FrameNet." In Valency. Theoretical, Descriptive
and Cognitive Issues, edited by Thomas Herbst, and Katrin Gotz
Votteler, 1 29- 1 60. B erlin: Mouton de Gruyter, 2007 .

_.

54

Chapter Two

Fill more Charles J., Christopher Johnson, and Miriam Petruck.


"Background to FrameNet." International Journal of Lexicography
1 6/3 (2003) : 235-250.
Garcfa-Miguel, Jose M. , and Gael Vaamonde. "Semantic role annotation:
From verb-specific roles to generalized semantic roles". Interdisciplinary
Workshop on verbs. The Identification and Representation of Verbs
Features, November 4-5 , 20 10.
http://linguistica. sns.itIWorkshop verb/papers/GarciaMigueCverb20 1 0_submission_2 6 .pdf
Garrudo, Francisco. Diccionario sintdctico del verbo ingIes. Barcelona:
Arie1, 1 99 1 .
Goldberg, Adele E. Constructions: A Construction Grammar Approach to
Argument Structure. ChicagolLondon: University of Chicago Press,
1 995 .
-. "Surface generalizations: An alternative to alternations." Cognitive
Linguistics 1 3.14 (2002) : 327-35 6 .
-. "Constructions: a new theoretical approach to language." Trends in
Cognitive Sciences 7/5 (2003) : 2 1 9-224.
Gries, Stefan T. "Introduction" . In Corpora in Cognitive Linguistics.
Corpus-Based Approaches to Syntax and Lexis, edited by Stefan T.
Gries, and Anatol Stefanowitsch, 1 - 1 8 . Berlin: Mouton de Gruyter,
2006.
Haji, J an. "Complex Corpus Annotation: The Prague Dependency
Treebank" . Jazykovedny ustav E. Stura, SA V, 2004.
http://ufal.mff.cuni.cz/pdt2.0/publications/Haj ic2004.pdf
Halliday, Michael A. K. An Introduction to Functional Grammar. London:
Edward Arnold, 1 985 .
Hanks, Patrick. "Contextual dependency and lexical sets." International
. Journal of Corpus Linguistics 1 1 1 ( 1 99 6 ) : 75-98.
Hanks, Patrick, and James Pustej ovsky. "A Pattern Dictionary for Natural
Language Processing." Revue Franaise de Linguistique Appliquee
1 012 (2005) : 63-82.
Helbig, Gerard. Probleme der Valenz- und Kasustheorie. Tiibingen:
Niemeyer, 1 992.
Helbig, Gerard, and Wolfgang Schenkel. Worterbuch zur Valenz und
Distribution deutscher Verben. Leipzig: Bibliographisches Institut,
1 969 .
Herbst, Thomas. "Valency complements of valency patterns?" I n Valency:
Theoretical, Descriptive and Cognitive Issues, edited by Thomas
Herbst, and Katrin Gotz-Votteler, 1 5 -35 . Berlin: Mouton de Gruyter,
2007 .

'

'.

".

Lingiiistica de Corpus y Valencia Verbal

55

Herbst, Thomas, David Heath, Ian Roe, and Dieter Gotz. A Valency
D ictio na ry of English. A Corpus-Based Dictionary of the
Co mp le mentation Patterns of English Verbs, Nouns and Adjectives.
Berlin/New York: Mouton de Gruyter, 2004 .
Hu n ston, Susan, and Gill Francis. Pattern grammar: a corpus-driven
app roa ch to the lexical " grammar of English. Amsterdam: John
Benj amins, 2000.
Kil garriff, Adam, Pavel Rychly, PaveI Smrz, and David Tugwell. "The
S ke tch Engine. " In Proceedings of the EURALEX Conference, 1 0S1 1 6. Lorient, France: Universite de Bretagne- Sud, 2004 .
Korh onen, Anna, Yuval Krymolowski, and Ted Briscoe. "A Large
S ubc ategorization Lexicon for Natural Language Processing
Applic ations ." Proceedings of the 5th Language Resources and
Evaluation Conference (LREC), May 22-28, 2006, http://www.lrec
conf.org/proceedingsflrec2006/.
Leech, Geoffrey. "Corpora and theories of linguistic performance." In
Directions in corpus linguistics, edited by Jan Svartvik, 1 0S - 1 22.
Berlin and New York: Mouton de Gruyter, 1 992.
Levin, Beth. English Verb Classes and Alternations: a Preliminary
Investigation. Chicago/London: University of Chicago Press, 1 993 .
Luft, Celso P. Dicionario pratico de regencia verbal. Sao PauIo: Editora
Atica, 1 995 .
Manning, Christopher. "Probabilistic Syntax." In Probabilistic Linguistics,
edited by Rens B od, Jennifer Hay, and Stefanie Jannedy, 289 - 34 1 .
Cambridge, MA: MIT Press, 2003 .
Mel' cuk, Igor. Dictionnaire explicatif et combinatoire du franfais
contemporain. Recherches lexico-semantiques I-IV. Montreal: Les
Presses de I 'Universite de Montreal, 1 984- 1 999.
Niznikova, J olana, and Miloslava Sokolova. Valencny slovnfk slovenskjch
slovies (The Valency Dictionary of the Slovak Verbs). Presov:
Filozoficka faculta Presovskej univerzity, 1 998.
Palmer, Martha, Paul Kingsbury, and Dan Gildea. "The Proposition B ank:
An Annotated Corpus of Semantic Roles." Computational Linguistics
3 111 (200S ) : 7 1 - 1 0S .
Polanski, Kazimierz et al. Slownik syntaktyczno-generatywny czasownik6w
polskich. Wroc1aw: Wydawnictwo Polskiej Akademii Nauk, 1 9 801 992.
Roj o, Guillermo. "La explotaci6n de la B ase de Datos Sintcicticos del
espafiol actual." In Lingufstica con corpus, edited by Josse De Kock,
2SS-286. Salamanca: Universidad de Salamanca, 200 1 .

56

, I

Chapter Two

Schulte im Walde, Sabine. "The induction of verb frames and verb classe s
from corpora.." In Corpus Linguistics. An International Handbook.,
edited by Anke Liideling, and Merja KytO, vol. 2, 952-972 . Berlin:
Walter de Gruyter, 2009.
Schumacher, Helmut, Jacqueline Kubczak, Renate Schmidt, and Vera De
Ruiter. VALB U-Valenzworterbuch deutscher Verben. Tiibingen: Narr,
2004.
Sinclair, John. Corpus, concordance, collocation. Oxford: Oxford
University Press, 1 99 1 .
Stefanowitsch, Anatol, and Stefan T. Gries. "Collostructions: Investigating
the interaction of words and constructions." International Journal of
Corpus Linguistics 8/2 (2003) : 209-243 .
-. "Corpora and Grammar." In Corpus Linguistics. An International
Handbook, edited by Anke Liideling, and Merj a KytO, (2) 933-952.
Berlin: Walter de Gruyter, 2009.
Stubbs, Michael. "Collocations and semantic profiles. On the cause of
trouble with quantitative studies." Functions of Language 211 ( 1 995):
23-5 5 .
Subirats, Carlos. "Spanish Framenet: A frame-semantic analysis o f the
Spanish lexicon." In Multilingual FrameNets in Computational
Lexicography. Methods and Applications., edited by Hans B oas, 1 351 62. BerlinlNew York: Mouton de Gruyter, 2009 .
Taule, Mariona" M. Antonia Martf, and Marta Recasens. "Ancora:
Multilevel Annotated Corpora for Catalan and Spanish." Proceedings
of 6th International Conference on Language Resources and
Evaluation (2008) : 96- 1 0 1 .
Tesniere, Lucien. Elements de syntaxe structurale. Paris: Klincksieck,
1 959.
Teubert, Wolfgang. " Sinclair, pattern grammar and the question of
hatred. " International Journal of Corpus Linguistics 1 212 (2007) : 223248 .
Thompson, Sandra A. , and Paul J. Hopper. "Transitivity, clause structure,
and argument structure: evidence from conversation." In Frequency
and the emergence of linguistic structure., edited by Joan Bybee, and
Paul J. Hopper, 27-60. Amsterdam: John Benj amins, 200 1 .
Tognini-Bonelli, Elena. Corpus Linguistics at Work. Amsterdam: John
Benj amins, 200 1 .
Vazquez, Gloria, Laura Alonso, J .A. Capilla, Irene Caste1l6n, and Ana
Fernandez. " SenSem: sentidos verbales, semantica oracional y
anotaci6n de corpus. " Procesamiento del Lenguaje Natural 37 (2006):
1 1 3- 1 20.

'

'

;
,

I:
Lingtii s tica de Corpus y Valencia Verbal

57

e1ke , Kl aus. "Vale nztheorie und Konstruktionsgrarnmatik." ZeitschriJt

fur g e rmanistische Linguistik 37/1 (2009) : 8 1-1 24 .

and Marketa Lopatkova. "Valency Information in


Zabokrts ky , Zdenek,
VALLEX 2.0: Logical Structure of the Lexicon." The Prague Bulletin
of Mathematical Linguistics 87/June (2007) : 4 1 -60.

Encoding the Past, Decoding the Future:


Corpora in the 21 st Century

Edited by

Isabel Moskowich and Begofia Crespo

CAMBRIDGE

SCHOLARS
PUBLISHING

Encoding the Past, Decoding the Future:


Corpora in the 21st Century,
Edited by Isabel Moskowich and Begoiia Crespo
This book fIrst published 2012
Cambridge Scholars Publishing

12 Back Chapman Street, Newcastle upon Tyne, NE6 2XX, UK


British Library Cataloguing in Publication Data
A catalogue record for this book is available from the British Library

Copyright 2012 by Isabel Moskowich and Begoiia Crespo and contributors


All rights for this book reserved. No part of this book may be reproduced, stored in a retrieval system,
or transmitted, in any form or by any means, electronic, mechanical, photocopying, recording or
otherwise, without the prior permission of the copyright owner.
ISBN (10): 1-4438-3581-1, ISBN (13): 978-1-4438-3581-7

Potrebbero piacerti anche