Sei sulla pagina 1di 7

Jeffrey L.

Elman – Sistematicity in the Lexicon


L’ipotesi ‘words-as-cues’ come modello dinamico
(The Architecture of cognition: rethinking Fodor and Pylyshyn’s Sistematicity
challenge.)

Tradizionalmente, le parole sono considerate, se non proprio atomi semantici, nuclei di significato. Il loro alto
grado di dipendenza dal contesto rappresenta una sfida per le visioni classiche di sistematicità.

Elman propone una visione alternativa al modello di Fodor e Pylyshyn (1988), in cui gli elementi
lessicali sono considerati SEGNALI (words-as-cues) di significato, piuttosto che elementi contenenti essi
stessi un significato intrinseco. Con questo suo modello, Elman intende dimostrare che la conoscenza
lessicale (lexical knowledge) senza un lessico è possibile.

Il lavoro di F&P è un importante passo avanti nel dibattito su quale tipo di architettura è necessaria per la
cognizione umana. Si concentrano sui concetti di ‘sistematicità’, ‘simbolico’ e ‘composizionalità’.

‘Sistematico’ può riferirsi a molte cose diverse. Per F&P, un’architettura cognitiva deve essere capace di
sistematicità per poter spiegare la cognizione umana. Ma così la cognizione umana sarebbe qualcosa di
‘algebrico’, e i suoi simboli sarebbero astratti e indipendenti dal contesto.

Loro si focalizzano sulla sistematicità delle regole, ma non indagano le rappresentazioni lessicali. (questo si
spiega perché in quel periodo il dibattito si incentrava sulle regole, considerate il principale motore
generativo del linguaggio, e il lessico era visto come un inventario relativamente stabile di entità con un
significato e una pronuncia fissi… quindi il contributo del lessico come elemento produttivo del linguaggio
non era di particolare interesse).

Oggi invece il lessico è visto come una ricca risorsa di produttività linguistica; adesso, il confine tra lessico e
regole è diventato più nebuloso.

Dati empirici dimostrano la problematicità di una visione del lessico come un database enumerativo (tipo
quello di F&P). La metafora del lessico come dizionario mentale è pervasiva e invitante, ma….

Jackendoff, 2002 (descrizione del lessico): “in una prima approssimazione, il lessico è formato dalle parole
immagazzinate nella memoria a lungo termine, a partire delle quali la grammatica costruisce sintagmi e frasi.
Un’entrata lessicale contiene un piccolo pezzo (chunk) di fonologia, un piccolo pezzo di sintassi e un piccolo
pezzo di semantica”.  MA QUANTO PICCOLO? Come si può determinare quale e quanto carico informativo
è contenuto nella rappresentazione lessicale, e quanto e quale risiede altrove? Non c’è una risposta unanime,
ma sembra esserci un tacito consenso sul fatto che il carico informativo è dato da un criterio di ‘parsimonia’,
ovvero solo l’informazione ‘nucleare’ sarebbe contenuta nelle entrate lessicali. ‘Nucleare’ è l’informazione
stabile e attendibile indipendentemente dal contesto, e necessaria e sufficiente a distinguere un’entrata da
un’altra ad essa simile.

Ma ecco che sorge il problema della polisemia. Molte parole hanno molteplici sensi, e in alcuni casi questi
sensi condividono uno stesso significato di base [v. ammettere: consentire / riconoscere  i due significati si
sovrappongono in qualche modo, quindi possono figurare come sensi diversi della stessa parola; vs. (EN.)
bank: banca, panchina, riva  suggeriscono una classificazione come parole diverse che condividono la
stessa forma fonologica  POLISEMIA // OMONIMIA]
VERBI: usi diversi di uno stesso verbo sono associati con diverse preferenze di selezione del ruolo PAZIENTE
ma i significati sono simili (il giornalista controlla i fatti; il meccanico controlla i freni). Ma ci sono molti casi
in cui il nucleo di significato di un’entrata lessicale non è sufficiente a spiegare le preferenze di selezione.

In psicolinguistica, è emersa un’importante ipotesi sul processing che suggerisce quali test si possono fare
per determinare quale e quanta informazione sia contenuta o meno nel lessico: l’accesso all’informazione
lessicale è più rapida e precede l’accesso all’informazione sopralessicale (e.g. sintattica, pragmatica):

l’accesso al lessico è un sottosistema autonomo nel processo di comprensione della frase, in cui tutti i
significati di una parola sono colti contemporaneamente, indipendentemente da fattori di distorsione dovuti
al contesto o associati alla frequenza d’uso.

Secondo questa hp, la disambiguazione avverrebbe DOPO il recupero iniziale di tutti i significati;
l’informazione extralessicale interverrebbe in un secondo momento (modello bifase). Un importante
corollario di questa hp è che l’immediato accesso all’info lessicale è un buon test per dire se l’info è contenuta
nel lessico. Il resto rimane fuori dal dominio del lessico. Ciò sarebbe compatibile con il modello di F&P che
definisce la composizionalità del significato come la composizione molecolare degli atomi di significato
indicizzati/repertoriati nel lessico.

PROBLEMI DI QUESTA VISIONE DEL LESSICO – quale test possiamo fare per determinare l’info
contenuta nella parola?; la vaghezza del termine ‘nucleo’; la difficoltà di distinzione tra sinonimi e omofoni,
dovuta alle gradazioni di significato delle parole.

Analizzare il processing può fornire indizi su quali sono le info lessicali e quelle extralessicali. Dato che queste
info sono spesso idiosincratiche, si crea una tensione tra l’info che è generale e astratta e quella che è lessico-
specifica.

Anche se molte teorie sul lessico partono dai nomi, lavoriamo sui verbi: i verbi sono cruciali perché collegano
i vari elementi della frase e molti di noi sentono il verbo come elemento indispensabile nel sistema
comunicativo.

Conoscenza lessico-specifica (la relazione tra il significato e le preferenze della


struttura dei complementi).
Come viene compresa una frase che contiene un’ambiguità temporanea? Come si risolve l’ambiguità? Quali
informazioni sono subito disponibili e quali strategie di processing vengono attivate?

Un tipo di ambiguità lessicale molto studiata è la NP post-verbale nelle frasi con subordinata oggettiva (The
boy heard the story was interesting)  fino a ‘the story’ ho due possibilità: complemento oggetto o soggetto
dell’oggettiva. Se assumiamo la teoria del modello bifase (two-stage model), allora l’hp del C.Ogg sarebbe
quella attivata inizialmente (e poi disambiguata in un secondo momento). Questa interpretazione potrebbe
essere motivata in altri 3 modi:

1- La frequenza relativa con cui un dato verbo occorre con un C.Ogg o con una Sub.Ogg (i destinatari di
un enunciato sarebbero sensibili all’uso statistico di verbi diversi. Il verbo ha sì una sua importanza
nel determinare l’interpretazione della frase in sequenze temporaneamente ambigue, ma allora
questi dettagliati schemi statistici di sottocategorizzazione dovrebbero entrare a far parte della
rappresentazione lessicale del verbo);
2- La frequenza relativa con cui il verbo prende la Sub.Ogg senza il che (that) potrebbe indirizzare verso
l’interpretazione come C.Ogg;
3- La plausibilità della posizione post-verbale della NP come C.Ogg di un particolare verbo.

Una spiegazione ai dati empirici discrepanti può essere che molti dei verbi che mostrano questa alternanza
C.Ogg/Sub.Ogg hanno più significati e questi significati potrebbero avere diverse preferenze di
sottocategorizzazione. Allora il destinatario potrebbe disambiguare lo stesso frammento di frase
temporaneamente ambiguo in modi diversi, a seconda del significato inferito dal verbo. Questo significato
potrebbe a sua volta derivare dal contesto che precede la frase. Allora, un contesto che attiva il senso di un
verbo che cooccorre più frequentemente con un C.Ogg dovrebbe generare diverse aspettative rispetto a un
contesto che attiva un verbo con Sub.Ogg.

(…) v. p. 5

Le aspettative del destinatario di una frase sono effettivamente sensibili ai modelli statistici d’uso associati
non con il verbo in generale, ma con l’uso senso-specifico di quel verbo. (v. anche esempio collect).

Allora la rappresentazione lessicale dei verbi dovrebbe includere non solo le informazioni sui modelli generali
d’uso e strutturali, ma anche il fatto che queste info sulle strutture sintattiche associate ad un verbo sono
senso-specifiche, e che le aspettative del destinatario del messaggio si modulano sul significato del verbo che
viene inferito all’interno di un contesto. Questa sarebbe quindi una rappresentazione lessicale molto più ricca
e articolata.

Preferenze verbo-specifiche sui Ruoli Tematici. Verbi come arrest  the man arrested… (the
man who was arrested by the police was innocent o The man arrested the burglar?) l’ambiguità risiede nella
struttura delle frasi relative in inglese.

RUOLO STRUMENTO: il custode pulì la stanza con la scopa vs. con il solvente. I tempi di lettura sono più
veloci nelle frasi in cui il ruolo di strumento è svolto da elementi più tipici. È stato poi osservato che simili
preferenze compaiono nel caso di verbi che possono presentarsi in voce attiva o passiva: ci sono nomi ‘fillers’
che svolgono meglio il ruolo di agente e altri che svolgono meglio quello di paziente.

(…) p. 6

La specificazione dei ruoli tematici per i verbi va oltre la semplice informazione di categoria (agente, paziente,
strumento, beneficiario, ecc). dati sperimentali dimostrano che i ruoli contengono informazioni davvero
molto dettagliate sulle preferenze di selezione per i ruoli stessi, e queste preferenze sono verbo-specifiche.

Questa visione dei ruoli tematici può sembrare simile a quella di Dowty (1991); anche lui suggerisce che i
ruoli tematici hanno una loro struttura interna. Ma in realtà occorre andare oltre la gamma limitata di proto-
ruoli di Dowty. Le preferenze di selezione coinvolgono anche la specifica conoscenza che il parlante ha sulla
struttura dell’evento associato ad un verbo (knowledge of the event structure).

Le preferenze verbo-specifiche per i ruoli tematici emergono durante il processing della frase. Ma queste
preferenze possono emergere anche in un sistema di attivazione parola-per-parola? (word-word priming)?
Cioè, qual è l’abilità di una parola di attivarne altre? La risposta è sì, questa attivazione avviene davvero. I
verbi attivano/innescano sostantivi che sono buoni candidati per i ruoli di agente, paziente, e strumento.
L’attivazione funziona anche nella direzione inversa (se trovo un nome, attivo la mia conoscenza e immagino
in quale evento potrebbe essere coinvolto e quindi attivo un verbo che descriva l’attività in quell’evento).
Quindi, l’entrata lessicale di un verbo deve codificare anche informazioni verbo-specifiche riguardo le
caratteristiche dei sostantivi che meglio ricoprono i ruoli tematici del verbo stesso. Si arriverebbe a pacchetti
di info molto dettagliati e altamente idiosincratici (specifici) del verbo.

ASPETTO & EVENT KNOWLEDGE – abbiamo detto che i verbi innescano la selezione dei loro
agenti, pazienti e strumenti preferiti. Questione dell’aspetto verbale: aspetto perfettivo (evento concluso) e
aspetto imperfettivo  i verbi imperfettivi attivano il ruolo location perché sono in svolgimento e il luogo,
negli eventi progressivi, è più saliente (p.8); nei verbi perfettivi questo non accade.

Esperimento con ERP (Event-Related Potential): la tipicità del luogo risulta determinante per le aspettative
che genere nel destinatario del messaggio.

Il nuotatore si è immerso nell’oceano vs. il nuotatore si è immerso nello stagno.

N400, interpretato come indice di aspettativa semantica; il fatto che la tipicità della combinazione agente-
verbo-location influisca sul processing della location ci dice che anche questa info è disponibile nelle prime
fasi del processing. Quindi possiamo dire che l’aspetto verbale condiziona il processing e quindi
l’interpretazione della frase, cambiando il focus sulla descrizione dell’evento. Ma allora, come si fa a
rappresentare le preferenze di selezione argomentale del verbo? E quali altri elementi sono in grado di
alterare gli argomenti attesi per un verbo? Il concetto di rappresentazione dell’evento (event representation)
emerge come utile strumento per capire casi in cui l’aspetto verbale svolge un ruolo. Se il verbo è in grado di
fornire solo alcuni, sebbene molto potenti, dei segnali (cues) che attingono alla conoscenza dell’evento (event
knowledge), allora ci saranno altri elementi candidati a contribuire e a cambiare la natura dell’evento o
dell0attività associata al verbo.

Per esempio, la scelta dell’Agente (The surgeon…) a volte è abbastanza per generare aspettative che limitano
il range di eventi possibili. Da solo, l’Agente può essere un indizio debole, ma le combinazioni verbo-agente
possono avere ripercussioni ben più importanti. Agenti diversi possono combinarsi con uno stesso verbo e
dare luogo a eventi differenti.

CUT. Le nostre aspettative di fronte a The surgeon cut… sono diverse rispetto a The lumberjack cut… (v. p.
9), perché pure le conseguenze dell’evento innescato da verbo-agente sono ben diverse. Questo dipende
dalle nostre conoscenze sull’evento di tagliare. Ma dove risiede questa conoscenza?

Il punto cruciale: decidere quali info sono incluse nell’entrata lessicale e quali emergono da altre fonti di
conoscenza; questa conoscenza entra nel processo di comprensione… ma quando? E come?  criterio del
timing (scansione temporale del processing): se questa conoscenza è disponibile molto presto, allora è
candidata ad essere inclusa nella rappresentazione lessicale.

Se diverse combinazioni agente-verbo implicano diversi tipi di eventi, allora i destinatari del messaggio
saranno portati ad aspettarsi diversi pazienti per i diversi eventi. (v. p. 9 esperimenti eye-tracking + self-paced
reading)  negli esperimenti, il tempo di lettura aumentava per le frasi in cui l’agent-verb combination era
seguita da un Paziente incongruente (benché plausibile grammaticalmente). Un successivo esperimento con
ERP ha dato risultati ancora più precisi, con l’N400 più alto per Pazienti incongruenti.

Ciò che è significativo è che tutto questo avviene molto presto, il prima possibile nel processing, per il
Paziente che segue immediatamente il verbo. L’immediatezza di questo meccanismo ci suggerisce che non è
verosimile la visione ‘bifasica’ del processing; piuttosto, si può ipotizzare che questo tipo di info sia già
inglobata nel lessico, oppure che la conoscenza del mondo interagisca con la conoscenza lessicale e lo faccia
molto prima di quanto si è sempre pensato in precedenza.
EVENT TYPES: (p.10) tipi di eventi che un verbo può descrivere (v. esempio CUT). Lo Strumento può essere
considerato un vincolo molto potente sul tipo di evento rappresentato. Con i test di eye-tracking si è provato
a verificare la possibilità che lo strumento usato con un verbo possa segnalare/innescare diversi schemi
eventivi (event schemas), che porterebbero quindi a diverse aspettative riguardo al Paziente più probabile.
Non è stata evidenziata nessuna particolare attivazione (priming) tra Strumenti e Pazienti tipici e Strumenti
e Pazienti atipici; come previsto, il tempo di lettura è aumentato nel caso di paziente atipico. L’effetto si è
avuto proprio nel momento in cui compare il Paziente; quindi dimostra che la selezione dello Strumento per
un verbo specifico altera le restrizioni sulla selezione del ruolo Paziente.

Conoscenza Lessicale senza un Lessico – Dove risiede la conoscenza lessicale??


Ciò che è stato detto finora avvalora la tesi che la conoscenza lessicale sia molto dettagliata, spesso
idiosincratica e verbo-specifica, e coinvolta nel processing incrementale della frase nella fase più precoce
possibile.

Ma non è solo questione di fornire descrizioni più dettagliate per le entrate lessicali del lessico mentale; il
vero problema sorge quando consideriamo l’abilità dei fattori dinamici di modulare significativamente le
aspettative del lettore/ascoltatore/destinatario. Questi fattori includono: agente e strumento coinvolti
nell’azione; e il contesto generale della conversazione. Che questi elementi giochino un ruolo primario
nell’interpretazione della frase non è poi sorprendente. Tuttavia, l’idea è sempre stata che questi elementi
dinamici risiedessero fuori dal lessico (per esempio in Fodor, 1995: “…assumiamo che esiste un modulo di
processamento sintattico, che alimenta, ma non è alimentato da, i processi semantici e pragmatici… l’analisi
sintattica è seriale, con conferme e revisioni se le prime ipotesi del processore si rivelano sbagliate”).

Ma invece, quel che abbiamo rilevato finora è che l’influenza di tutti questi fattori interviene allo stesso
tempo in cui viene coinvolta e identificata l’info che risiede nel lessico. Come decidere cosa è compreso nel
lessico e cosa non lo è? 3 ipotesi:

1. Abbandonare ogni speranza di trovare una qualche prova empirica per determinare il contenuto del
lessico mentale. Si potrebbe semplicemente decidere che alcune classi di info sono contenute nel
lessico e altre no. Non è la migliore delle soluzioni. (p.11 alla fine)
2. Incrementare enormemente il pacchetto di entrate lessicali, così da poter collocare tutte le
informazioni. Sarebbe una conseguenza logica; il lessico è diventato sempre più ricco e dettagliato
con gli anni, perché imporre limiti arbitrari al suo contenuto? Il problema sarebbe un’esplosione
incontrollabile di combinazioni possibili, data anche la natura illimitata di contesti discorsivi 
proposta impraticabile. Inoltre, se tutta questa info risiede nel lessico, che differenza c’è tra il lessico
e gli altri moduli linguistici?
3. La proposta più radicale: è possibile che la conoscenza lessicale possa essere istanziata in
un modo assolutamente differente dalla classica lista enumerativa da dizionario?

L’ALTERNATIVA AL LESSICO MENTALE COME DIZIONARIO.


Negli studi descritti finora, l’elemento comune è l’abilità degli elementi della frase di interagire in tempo reale
e produrre un’interpretazione progressiva/incrementale capace di guidare le aspettative sugli elementi
successivi. Questi possono essere considerati come effetti contestuali estremamente potenti che modulano
il significato delle parole.

Ma immaginiamo di vedere le parole non come elementi di un database che devono essere estratti dalla
memoria, ma come stimoli che alterano gli stati mentali secondo modalità regolari. In questa visione, le
parole non sono oggetti mentali che risiedono nel lessico mentale; sono operatori sugli stati mentali. Da
questa prospettiva, le parole non hanno significato, ma sono segnali di significato.

Questo può essere inserito in un modello di sistema dinamico. Il sistema riceve gli input (le parole). Le parole
condizionano lo stato interno del sistema (mental state) mentre vengono processate, e ogni parola altera in
qualche modo lo stato mentale. Possiamo allora ripensare la conoscenza lessicale (lexical kn.) come la
conoscenza codificata nelle connessioni che esistono tra le unità che vengono processate e che fa sì che ogni
parola abbia l’effetto appropriato sul processing. Non vogliamo rimuovere il bisogno di una conoscenza
lessicale, ma invece che enumerativa e dichiarativa, l’abbiamo resa un sistema di elementi responsabili del
processing.

Il modello di Elman: è ispirato da e incorpora elementi di diversi modelli precedenti (language


processing, schemas e sequential thought processes, semantic cognition, action planning). Il tentativo è
quello che costruire un’architettura computazionale che consenta un processing più ricco.

L’obiettivo del modello è conoscere le relazioni contingenti tra attività e partecipanti coinvolti negli eventi
che si svolgono nel tempo. Il modello comprende entità, attività, ed eventi (composti da sequenze di
attività collegate insieme). Il compito del modello è individuare i vincoli reciproci tra entità e azioni
cooccorrenti, e generare aspettative riguardo ad attività successive che insieme compongono l’evento. (v. p.
14)

Un’attività consiste in un insieme di entità, azioni e contesto, tutti presenti simultaneamente come input dal
mondo.

v. current activities

v. recurrent connections

v. predicted next activity

Le singole entità, o le singole azioni, o le singole sequenze di attività possono, nel tempo, essere
implementate con l’esperienza accumulata, per creare quelle reti (networks) che consentono di accedere alle
generalizzazioni che esistono tra e attraverso gli eventi, e di riempire gli eventuali vuoti informativi.

Caratteristiche:
1. Completamento dello schema tra attività e tra eventi
2. Tipicità ed effetti prototipici
3. Vincoli leggeri e graduati tra ruoli, partecipanti, attività locations e così via
4. Abilità di combinare e unire con flessibilità nuove combinazioni di eventi
5. Abilità di supportare le inferenze – dietro appropriate condizioni
6. Abilità di cogliere gli effetti della prospettiva sulla rappresentazione dell’evento.

Centrale a tutto questo è che il modello implica/prevede/implementa una rete di soddisfazione di vincoli. I
vincoli operano in momenti puntuali, ma anche trasversalmente al tempo… (v. p. 14-15)
DISCUSSIONE FINALE
a) Il significato di una parola è radicato nella nostra conoscenza sia del mondo materiale, sia del mondo
sociale. Mondo materiale = il mondo intorno a noi così come ne facciamo esperienza (embodied);
mondo sociale = abitudini culturali e artefatti, che hanno valore su base di accordo sociale
(convenzionalizzati).
b) Il contesto è sempre con noi. Il significato di una parola non esiste mai fuori contesto – anche se non
sempre sappiamo definire che cosa sia contesto. L’approccio dinamico, inoltre, enfatizza la
temporalità del processing, dovuta al carattere incrementale dell’input linguistico.
c) Gli eventi hanno un ruolo primario nell’organizzare la nostra esperienza. L’Event Knowledge serve a
guidare le inferenze e ad accedere alla memoria, e condiziona le categorie che costruiamo. Un evento
può essere definito come un set di partecipanti, attività e risultati/conseguenze uniti insieme da nessi
causali.
d) I sistemi dinamici forniscono un quadro efficace per comprendere i comportamenti biologicamente
determinati. Il processing è graduale, non binario.

La dinamicità del sistema della conoscenza è risultato dell’intervento della conoscenza del mondo durante il
processing.

(v. p. 17)

Limiti del modello: è incompleto, perché manca di una conoscenza concettuale degli eventi che venga
da un’esperienza diretta; assume una previa identificazione di alcune entità come Agenti, altre come Pazienti,
Strumenti e così via.

Un’architettura parallela come quella descritta da Jackendoff (2002) per esempio, se permettesse
un’interazione diretta e immediata tra le componenti sintattica, semantica e pragmatica della grammatica,
potrebbe essere la cornice ideale per dare conto dei dati descritti fin qui.

Conseguenze positive del modello dinamico words-as-cues:


1. Il fatto che le restrizioni di selezione siano dinamiche e sensibili al contesto (cosa inammissibile ad
esempio nel modello del 1963 di Katz&Fodor, v.); il modello prevede che le interazioni tra il lessico
e altre fonti di conoscenza ci siano sempre e avvengono in stadi moto precoci del processing.
2. Questa prospettiva incoraggia una visione più unitaria di fenomeni che normalmente sono
considerati indipendenti gli uni dagli altri. La risoluzione di ambiguità sintattiche e di ambiguità
semantiche, l’interpretazione di pronomi, le inferenze testuali, la memoria semantica sono
normalmente studiate da gruppi che non sempre comunicano tra loro. Eppure, si tratta di
domini/temi che avrebbero molto da condividere. Si può accedere alla conoscenza in molti modi
differenti, e questo, a sua volta, influenza ciò a cui si accede. (v. p. 18: priming paradygm vs.
sentence-processing paradygm)

Questi 2 risultati dimostrano che, anche se le parole isolate possono servire come chiavi/SEGNALI per la
conoscenza dell’evento (event kn.), esse sono solo uno dei segnali. Le costruzioni grammaticali in cui esse
compaiono forniscono prove/info indipendenti sui ruoli ricoperti dai vari partecipanti all’evento (Goldberg
2003). E, ovviamente, il contesto discorsivo può fornire ulteriori vincoli per la costruzione dell’evento.

Eliminare il lessico è un’operazione molto rischiosa, ma la conoscenza lessicale senza lessico – dice Elman –
è possibile. (?)