Sei sulla pagina 1di 34

PARTE I: Il linguaggio naturale PARTE II: L'Agente

Introduzione generale |

Il linguaggio come "Veicolo"


Il problema "Significato"
Il problema "Significato in informatica"
Il problema della classificazione automatica
Sintesi e considerazioni

Il linguaggio naturale è lo strumento comunicativo che normalmente viene usato


nella vita di tutti i giorni, in forma scritta ed in forma parlata. Nonostante
ciascuno di noi sia un veterano del suo utilizzo, rimane ancora avvolta da una
spessa coltre di nebbia la sua essenza profonda.
Fin dall'antichità è stata riconosciuta al linguaggio questa fama di Dr Jekill.
Platone, Aristotele, Socrate, per citare alcuni grandi pensatori, si sono
cimentati nei labirinti delle sue stanze, ma ancora oggi il linguaggio fa
discutere.
Effettivamente molti passi avanti sono stati fatti con il trascorrere degli
anni, al punto da far passare il linguaggio da elemento di speculazione
meramente filosofica a branca autonoma della scienza: la LINGUISTICA. In realtà
l'ambito di studio che tale disciplina circoscrive è solo una parte di ciò che
il linguaggio offre come campo studio. Per essa sono stati identificati tre
obiettivi di studio1:
a) specificare la natura del linguaggio mettendo in luce le potenzialità e le
limitazioni che esso possiede;
b) identificare le regole che i parlanti di una lingua applicano nel produrre e
ricevere un messaggio linguistico;
c) descrivere e spiegare i cambiamenti che si attuano nel tempo,
nell'organizzazione e nella struttura delle lingue.
La linguistica si occupa pertanto dello studio della forma del linguaggio, cioè
descrive e analizza la meccanica di questo articolato sistema.
Manca all'appello una scienza che tenti di descrivere una parte essenziale del
linguaggio: come esso sia in grado di svolgere così bene il ruolo di strumento
comunicativo. Il nome proprio di tale disciplina è SEMANTICA. L'idea di
semantica è anch'essa antica, forse più di quella di linguistica, ma il suo
definirsi come scienza è nettamente più recente.
Il motivo di un tale ritardo è da imputare alla difficoltà che si trova
nell'identificare, definire, descrivere, catturare, enumerare il significato.
Nessuno ha mai visto il significato nonostante tutti ne facciamo continuamente
esperienza.
Intorno agli anni '50, di fronte al crescente entusiasmo per il fenomeno
INFORMATICA, anche la linguistica ha cominciato a fare i conti con il computer.
Il primo problema che si tentò di risolvere fu quello della traduzione
meccanica. In poco tempo il fervore dei ricercatori andò deluso. Si resero conto
che l'impresa era notevolmente più difficile del previsto. Tra alti e bassi,
oggi, il connubio tra informatica e linguaggio è divenuto inscindibile, anzi la
soluzione di alcuni problemi trasversali ai due campi, uno per tutti
l'interazione in lingua corrente con la macchina, è divenuta un imperativo
categorico.
Un'altra disciplina scientifica che ha a cuore il problema del linguaggio è la
PSICOLOGIA. In realtà il linguaggio non è il cardine della ricerca psicologica,
ma certamente per essa assume un ruolo fondamentale in quanto è l'unico
strumento che permette di sondare la psiche umana, suo vero soggetto d'indagine.
Inoltre il linguaggio ha grande importanza per la psicologia poiché le sue
patologie condizionano profondamente la persona e segnalano molte disfunzioni
mentali.

Il Linguaggio come Veicolo

Iniziamo con il dare una definizione corretta di linguaggio traendola dalla


linguistica:
Il linguaggio può essere inteso come la facoltà di associare due diversi ordini
di entità2:
1- l'ordine dei contenuti mentali, che di per sé solo non ha alcun mezzo per
manifestarsi agli altri, essendo per sua natura interno (ordine del contenuto o
semplicemente contenuto);
2- l'ordine delle realtà sensoriali che permette ai contenuti mentali di
manifestarsi all'esterno (ordine dell' espressione o semplicemente espressione).
In questi termini possiamo dire che il linguaggio è la facoltà di associare il
contenuto all'espressione allo scopo di manifestarlo.
Con parole meno specialistiche e più intuitive il linguaggio è il veicolo che
trasporta il significato.
Di questi suoi due aspetti il primo, quello di veicolo o più propriamente di
espressione, è soggetto specifico della linguistica. Le conoscenze, per quel che
riguarda l'espressione, sono a buon punto. Ne è testimonianza il fatto che sono
disponibili una terminologia ed una serie di strumenti di analisi comuni e
specifici per ogni livello, a partire dallo studente fino ad arrivare al
ricercatore.
Quando entriamo nel campo del secondo, quello di trasporto del significato o più
propriamente piano del contenuto, non troviamo, ancora, quell'ordine e quel
rigore tipico delle discipline ben formate. Esistono molti punti di vista e
nessuno che riesca a prevalere. D'altronde gli elementi del piano del contenuto,
o più semplicemente del trasportato dal linguaggio, non sono facilmente
oggettivabili. Non si è ancora riusciti a darne una rappresentazione tangibile,
sensorialmente evidente. Eppure una tale rappresentazione deve esistere dato che
viene usata dal nostro cervello per produrre ed interpretare il linguaggio, più
in generale per comunicare con altri esseri, e per manipolare e conoscere la
realtà.
Per riuscire a fare un vero salto di qualità nello sviluppo di applicazioni
informatiche è necessario tentare di sollevare il velo di mistero che ammanta il
contenuto, più comunemente noto con il nome di significato. Come dicevamo, il
significato esiste, dato che si manifesta attraverso il linguaggio che è in
grado di trasportarlo, ma nessuno lo ha mai visto.
Data la molteplicità e non univocità delle voci che convivono a proposito
dell'essenza del significato ritengo necessario proporre un percorso storico e
multidisciplinare che consenta di cogliere l'origine delle diverse correnti di
pensiero e di discernere quelle che meglio possono portare alla meta.

Il Problema "Significato"

Senso, contenuto, significato, signifié, signified, meaning, bedeutung,


denotazione, connotazione, intensione, referenza, sense, sinn, denotatum,
significatum sono tutti termini che riportano alla mente con diverse sfumature
il concetto di "significato". Nei prossimi paragrafi tenteremo di cogliere
l'essenza di questo concetto analizzando il punto di vista di quelle discipline
di pensiero che sostanzialmente dalle loro origini hanno avuto a che fare con
questo rompicapo.

Il Significato in Filosofia

Il dibattito sul significato ha sempre avuto grande importanza nell'arena della


filosofia, fin dalla nascita della stessa. Iniziamo ad affrontare il problema
dalle origini ripercorrendo il pensiero filosofico moderno e contemporaneo e
cercando di concentrarci su "che cosa è il significato" (o contenuto).
Partiamo esaminando il punto di vista fenomenologico: i suoi esponenti tentano
di condurre l'analisi della coscienza nella sua intenzionalità esercitando
l'Epoché, ossia la sospensione dell'affermazione della realtà del mondo
spostando l'attenzione dal mondo stesso, dalla sua realtà, ai fenomeni con cui
il mondo si annunzia e si presenta nella coscienza stessa (Nicola Abbagnano
"Storia della Filosofia" volume III). Sotto tale prospettiva la coscienza è
sempre "coscienza di qualcosa" pertanto la sua analisi non può prescindere dal
considerare i "fenomeni" cui essa assiste.
Edmund Husserl (1859-1938) massimo esponente della fenomenologia, definisce la
coscienza come una corrente di esperienze vissute, in cui ciascuna esperienza
possiede una sua "essenza".
Secondo questa idea il significato sembra nascere quale frutto dell'esperienza
fatta del "mondo". In base a questa interpretazione, attraverso le sensazioni,
la coscienza costruisce (e non semplicemente conosce) il suo mondo. Il
significato emerge, appunto, come frutto dell'esperienza fatta del mondo: l'idea
del mondo che ognuno di noi ha cambia in funzione delle proprie esperienze.
Conseguentemente i significati posseduti da ciascuno cambiano a seconda del
mondo considerato.
Il modello di pensiero fenomenologico ci permette di riconoscere l'esperienza
come elemento necessario all'essere: l'esperienza conquista il ruolo di "cava di
significati".
Maurice Merleau-Ponty (1908-1961), quale esponente della corrente
esistenzialista capeggiata da Martin Heidegger (1889-____), ha rivolto le sue
indagini al rapporto tra l'uomo e il mondo, inteso come rapporto tra coscienza e
natura. In particolare ci interessa vedere come egli corregge in senso
esistenzialista la fenomenologia di Husserl.
La coscienza non è per Merleau-Ponty il colpo d'occhio gettato sul mondo da uno
spettatore disinteressato ma è sempre la coscienza di un io "votato al mondo".
Scrive Merleau-Ponty: "io sono a me stesso in quanto io sono al mondo; io sono
tutto ciò che vedo, io sono un campo intersoggettivo, non a dispetto del mio
corpo e della mia situazione storica, ma al contrario, in quanto sono questo
corpo e questa situazione e tutto il resto attraverso di essi"3.
Il pensiero di Merleau-Ponty ci suggerisce quanto sia importante considerare il
corpo come elemento di intersezione tra la coscienza ed il mondo: "il corpo è il
nostro mezzo generale di avere un mondo".
Per completare l'excursus filosofico segue una panoramica di definizioni di
significato redatte nel corso degli ultimi 200 anni.

PRAGMATISMO
Charles Sanders Peirce (1839-1914): il significato di una cosa è dato
dall'insieme delle disposizioni ad agire che tale cosa produce. Ogni significato
anche il più astratto è una regola di azione per l'uomo: "Non esiste distinzione
di significato così sottile che non consista in una possibile differenza
pratica"; se due conoscenze diverse danno luogo ad azioni dello stesso tipo
allora la distinzione è apparente, e se due conoscenze apparentemente identiche
producono azioni distinte allora la loro identità è apparente4.
John Dewey (1859-1952): i significati di tutti gli aspetti del mondo si formano
all'interno dell'indagine, anzi ne sono condizione imprescindibile: essi sono
gli strumenti fondamentali che consentono all'uomo di agire nella realtà e di
dominarla5.

NEOPOSITIVISMO
Ernst Mach (1838-1916): un concetto (significato) non rappresenta un'essenza
della realtà ma è un simbolo per indicare riassuntivamente grandi classi di
sensazioni che altrimenti resterebbero incontrollabili6.
Ludwig Wittgenstein (1889-1951): una proposizione intorno alla realtà ha senso
solo se esiste la possibilità di accertare se essa è vera o falsa, cioè solo se
essa è verificabile o falsificabile attraverso l'esperienza: se non si può, ne
si potrà, stabilire se tale proposizione è vera o falsa allora essa è una
proposizione solo in apparenza, cioè le parole che la compongono legate in
questa proposizione non producono alcun senso. Il senso di una proposizione è
dato dal modo in cui questa è verificata.
Gottlob Frege (1848-1925): Il significato (Bedeutung) di un concetto e in
generale di un segno è l'oggetto (tutto ciò che per relazione non invertibile
cade sotto un concetto; in generale qualsiasi soggetto di giudizio[Eco
"Semiotica..." p61]) designato dal segno stesso; il senso (Sinn) è il modo con
cui l'oggetto ci viene dato o una qualunque indicazione che compia l'ufficio di
nome proprio. La relazione tra senso e significato consiste nel fatto che un
senso ha un unico significato, mentre un significato può avere più sensi. Per
ciò che riguarda la proposizione il suo significato è dato dal suo valore di
verità che a sua volta dipende dalla corrispondenza all'oggetto8.

NEO-EMPIRISMO LOGICO
Rudolf Carnap (1891-1970): il senso è dato come contenuto degli asserti
intensionali (l'Intensione è l'insieme delle proprietà definitorie che
permettono di dire quali oggetti fanno parte di una certa Estensione) e il
significato è dato come contenuto degli asserti estensionali (l'Estensione di
una parola è l'insieme di quegli oggetti ai quali può essere attribuita quella
parola)9.
Karl Popper (1902-____): una proposizione ha senso se non esiste prova empirica
diretta o indiretta in grado di confutarla10.
C.G. Hempel (1905-____): nessun enunciato singolo di una teoria scientifica è
riducibile ad enunciati di osservazione e ciò che una espressione significa
rispetto a dati empirici potenziali dipende da due fattori:
1- dall'Impalcatura Linguistica alla quale l'espressione appartiene e che
determina le regole di inferenza degli enunciati;
2- dal Contesto Teoretico nel quale l'espressione ricorre, cioè dalla classe
delle ipotesi sussidiarie disponibili11.
Willard Van Orman Quine (____-____): l'unità minima che può ritenersi dotata di
significato empirico è la totalità della scienza12.

FENOMENOLOGIA
Edmund Husserl (1859-1938): l'oggetto è per così dire un polo di identità dotato
sempre di un senso preconcepito e da realizzare in ciascun momento della
coscienza esso è l'indice di una intenzionalità noetica... Bisogna distingue tra
un aspetto soggettivo, costituito dagli atti che mirano ad afferrare l'oggetto
(percepire, ricordare immaginare...) che è detto noesis, ed uno oggettivo (il
percepito, il ricordato, l'immaginato...) che è detto noema. Il noema non è
l'oggetto, è il complesso dei predicati o dei modi d'essere dati all'esperienza.
L'oggetto costituisce il polo attorno a cui vengono a orientarsi e a
raggrupparsi i noemi dell'esperienza vissuta. Il senso di un noema può rimanere
vuoto cioè non realizzato, privo dell'oggetto corrispondente. Quando l'oggetto
di presenta si ha l'intuizione in cui la cosa è data adeguatamente cioè è
presente "in persona"13.
ESISTENZIALISMO
Maurice Merleau-Ponty (1908-1961): "Ogni percezione di una cosa, d'una forma o
d'una grandezza come reale, ogni costanza percettiva, rinvia alla posizione di
un mondo e di un sistema dell'esperienza in cui il mio corpo ed i fenomeni sono
strettamente legati"14.
FILOSOFIA DEL LINGUAGGIO
Umberto Eco (____-____): il significato è il vertice del sottostante triangolo
semiotico:
X
/\
Y-Z
Dove Y è una espressione e Z è una cosa o Stato di cose15.
Scorrendo la lista, che non ha la pretesa di essere esaustiva, si notano diverse
posizioni ma per tutte vale l'idea che il significato è una "essenza
trasportata". Il Significato è un ente che si manifesta esclusivamente durante
l'atto comunicativo.
Il significato, da un punto di vista generale, è la materia prima del pensare, è
quell'insieme di oggetti ci permette di pensare, far pensare, agire e far agire.
Infatti nel momento in cui penso comunico con me stesso ed il risultato di
questa operazione sarà o una azione o una "modifica interna" che in potenza
determina una azione futura (comunicazione interna); quando poi parlo con
qualcuno, produco nel mio interlocutore delle "modifiche interne" che lo
porteranno a pensare e pertanto a vivere le conseguenze proprie di tale
operazione (comunicazione esterna).
La natura del significato è indubbiamente legata alla esperienza, al punto che
esperienze diverse relative ad uno stesso oggetto, quando poi si comunicherà a
proposito di tale oggetto, richiameranno significati diversi. Fortunatamente
nella vita di tutti i giorni le esperienze che viviamo si somigliano
notevolmente. Più è ristretta la comunità linguistica e più è facile che i
significati legati alle esperienze siano prossimi e di conseguenza è più facile
che la comunicazione avvenga in modo corretto ed efficace. Il linguaggio
permette di potenziare le facoltà percettive, di sopperire ai limiti fisici del
fare esperienza. Laddove non sussiste comunicazione la sopravvivenza si riduce
notevolmente.
Gli elementi che terremo maggiormente in considerazione nel proseguimento
dell'esposizione sono i seguenti:
il modello fenomenologico di Husserl e poi riveduto da Merleau-Ponty;
la definizione di significato proposta da Umberto Eco;

Il Significato in Linguistica

Ripercorriamo in questa sezione le idee sulle quali si fonda il modello di


significato proposto dalla linguistica.
Scrive Raffaele Simone (R.S.) nel suo libro "Fondamenti di linguistica":
La lingua (ogni lingua) è un grande apparato di primordiale semanticità, la cui
funzione originaria è quella di trasmettere e scambiare significati 16
Le lingue verbali si distinguono rispetto agli altri codici per la proprietà di
permettere di esprimere qualsivoglia significato (onnipotenza semantica)17 -.
Se ne evince che la comunicazione verbale è uno strumento di eccezionale
efficacia per condividere significati (potenzialmente tutti).
La linguistica separa il significato in due componenti:
il Significato Strutturale
il Significato Lessicale
La prima componente rappresenta l'insieme dei morfemi lessicali estratti; la
seconda componente invece individua quella parte di significato che sopravvive
all'estrazione dei morfemi lessicali.
Ad esempio la frase "il presentatore ha annunciato il cantante" può essere
scomposta in:
1. il ...tore ha ...to il ...ante
2. presenta... annuncia... cant...
Nonostante nell'esempio riportato al punto 1 non siano presenti elementi dotati
di significato a se stante, il loro insieme,che forma una struttura, permette di
ricavare informazioni importanti per quel che riguarda il significato
dell'intera frase; d'altro canto al punto 2 abbiamo dei morfemi che, nel loro
complesso, contribuiscono a costruire significato alla frase.
Nell'approccio allo studio del significato, dal punto di vista linguistico,
R.Simone propone di considerare tre correnti specifiche:

1. La semantica referenzialista
1. Secondo Aristotele nel linguaggio entrano in gioco tre ordini di entità:
2. le cose,
3. le immagini mentali delle cose,
le parole foniche con le quali denominiamo le immagini mentali.
Tra questi tre ordini sussistono differenze importanti:
* le cose sono uguali per tutti,
* le imagini mentali sono 'fotografie' delle cose racchiuse nella mente
anch'esse uguali per tutti,
* le parole foniche sono come etichette attaccate alle immagini mentali in modo
arbitrario, nel senso che popoli diversi assegnano alle stesse cose parole
foniche diverse.
Il linguista Ferdinand de Saussure ha definito questo orientamento "lingua come
nomenclatura". L'inadeguatezza di tale modello è evidente. Essa infatti non
tiene conto che le lingue cambiano nel tempo, nello spazio e che da una lingua
all'altra il passaggio non è una pura sostituzione di termini.
2. Il significato come costrutto mentale
Questa concezione è stata elaborata da John Locke e corregge radicalmente il
punto di vista referenzialista. Locke distingue i significati in due grandi
categorie:
1. Significati Semplici: propri delle parole che si riferiscono a percezioni
sensoriali immediate oppure ad enti puramente razionali;
2. Significati complessi: propri di parole che si riferiscono a combinazioni di
percezioni.
Mentre i significati semplici possono essere considerati uguali per tutti, dato
che derivano direttamente da modelli presenti in natura, i significati complessi
sono frutto di una operazione arbitraria della mente che unisce idee diverse.
Qui con 'mente' Locke intende la collettività, e sostiene che tale mente generi
combinazioni di significati semplici ogni volta che sente il bisogno di farlo,
producendo un nome specifico per ogni combinazione. Tale interpretazione del
significato prevede che le combinazioni di idee possano dissolversi, così come
sono state create: quando non se ne avverte più la necessità sociale le idee
semplici, che componevano il costrutto complesso, tornano a ad essere l'una
separata dall'altra.
Tale modello spiega bene le seguenti evidenze semantiche:
lingue diverse possono dare espressione a significati diversi;
i significati di una stessa lingua possono cambiare nel tempo a seconda delle
necessità che la società presenta;
la traduzione da una lingua all'altra è difficile a causa della differenza di
combinazioni di idee.
3. Significato come sistema di relazioni
Questo modello si deve a Ferdinand de Saussure. Egli aggiunge alcuni gradi di
libertà alla arbitrarietà della lingua: mentre normalmente veniva considerata
solo la relazione verticale significante-significato mentre De Saussure afferma
che è arbitraria anche la relazione tra significante e significante e tra
significato e significato. Questo nuovo piano considerato è detto orizzontale. I
significati nelle diverse lingue si toccano l'un con l'altro, come confini di
una cartina geografica: modificandone uno necessariamente se ne modificano
altri. Se ne deduce che i confini tra i significati sono instabili: chi decide
della loro posizione, in linea di massima, è la società con la sua storia e la
sua evoluzione.
Anche attraverso questo modello è possibile produrre una giustificazione per la
variabilità del significato nel tempo e per le differenza esistenti tra una
lingua e l'altra. Tuttavia non si riesce a dare spiegazione alla regionalità
delle lingue. Per modellare anche il fenomeno della regionalità è necessario
condiderare la lingua come sistema di sottosistemi più piccoli e localizzati.
Vediamo ora quali sono gli strumenti che la linguistica moderna propone per
l'analisi del significato18.
Partiamo con l'elencare le unità di misura utili per questo arduo compito:
1A- INTENSIONE = Insieme degli oggetti a cui una particolare parola può essere
attribuita, si riferisce a quella "parte di mondo" extra-linguistico che viene
designata da essa.
1B- ESTENSIONE = Insieme delle proprietà definitorie che permettono di stabilire
quali oggetti fanno parte di una certa estensione e quali no.
2A- SENSO = Insieme delle associazioni personali ed irripetibili che si legano
inestricabilmente agli enunciati e sono dovute all'esperienza personale di chi è
coinvolto in una comunicazione.
2B- SIGNIFICATO = Elemento che 'dice' delle cose che sono uguali per tutti
coloro che condividono il codice del quale ci si sta' servendo.
3A- DENOTAZIONE = Significato 'primario' (originario) di un dato enunciato.
3B- CONNOTAZIONE = Significato 'spostato' di un dato enunciato.
Veniamo ora a mostrare il metodo che prende il nome di analisi componenziale.
Essa poggia sull'ipotesi che il significato delle parole possa essere
disaggregato in elementi di significato più piccoli detti Componenti Semantici.
L'insieme dei componenti semantici di una parola prende il nome di Matrice
Semantica. Sono formulate le seguenti ipotesi:
I- I componenti semantici sono in numero finito.
II- La natura dei componenti semantici è binaria (+ -, 0 1, A B...).
III- Il significato di una parola può essere descritto come somma di componenti
semantici;
IV- I componenti semantici di ogni parola sono tra loro simultanei.
V- I componenti semantici di ogni parola possono variare di numero via via che
si espande la comparazione a coppie tra le parole.
VI- Esiste la possibilità di guardare al significato in due direzioni: dalla
parola ai componenti e dai componenti alla parola (possono pertanto esistere
parole senza significato e significati senza parole).
VII- Parole con maggior numero di componenti in comune sono semanticamente più
affini.
Non tutto però è così chiaro come sembra, infatti:
1- Non è stata ancora codificata la procedura attraverso cui i componenti
semantici vengono estratti dal significato delle parole; persone diverse di
fronte ad una medesima lista di componenti semantici tra i quali scegliere
genera differenti matrici semantiche.
2- Tale tipo di analisi non sembra effettivamente praticabile a causa delle
enormi dimensioni dello spazio dei campioni costituito dal vocabolario.
3- I componenti semantici di cui parliamo, con grande probabilità, non hanno
carattere universale.
Analizziamo in dettaglio le caratteristiche dei componenti semantici e le
relazioni esistenti tra essi:
1- Componenti Assoluti ( come p(X) ).
2- Componenti Relazionali (come p(X,Y,...,Z) ).
3- Rapporti gerarchici tra componenti semantici.
Oltre ai componenti semantici si possono individuare:
1- i Componenti Pragmatici che si riferiscono alla speciale tonalità
dell'interazione che ha luogo tra i parlanti oppure al tipo di contesto nel
quale le parole considerate vengono adoperate.
2- i Componenti Proposizionali costituiti da combinazioni di elementi in
relazione tra loro ( ad esempio p(q(X,Y),Z) ).
3- le Restrizioni che specificano le limitazioni di applicazione delle parole.
Definiamo ora alcune Relazioni Semantiche:
A- Gradazione = alcuni gruppi di parole possono essere disposti in scala secondo
il grado di presenza di una particolare proprietà ( ex. nessuno, uno, qualcuno,
parecchi molti, infiniti). Non tutti i posti della gradazione sono
necessariamente occupati;
B- Iponimia // Iperonimia = Una parola X è Iponima di Y quando il suo
significato è incluso in quello di Y (ex. automobile è iponimo di veicolo). Se è
vero un enunciato contenete un iperonimo lo stesso enunciato deve
necessariamente essere vero anche dopo la sostituzione dell'iperonimo con un
iponimo nella stessa posizione. Due parole Iponime di uno stesso iperonimo
vengono dette Co-Iponime. Una definizione di iponimia che sfrutta la matrice
semantica è la seguente: X è iponima di Y se quando nella sua matrice semantica
occorrono almeno tutti i componenti intensionali di Y più altri specifici. Ne
deriva che gli Iperonimi sono intensionalmente più poveri degli iponimi ma
estensionalmente più ricchi. Non sono infrequenti parole che pur essendo
co-iponime non abbiano un corrispondente iperonimo che le comprenda
intensionalemnte tutte, esse sono raggruppate da un Iperonimo Virtuale che può
essere uno dei due co-iponimi.Il Lessico è organizzato iponimicamente per
favorire una risorsa enunciativa essenziale agli utenti linguistici, detta
"mobilità semantica". Questa permette al parlante di produrre enunciati con
diverso grado di ricchezza intensionale, spostandosi con una sorta di effetto
zoom lungo una scala ai cui estremi stanno la massima generalità e la massima
specificità.
C- Sinonimia, Antonimia, Complementarità, Simmetria: Due parole si dicono
sinonime se hanno esattamente la stessa matrice semantica. La sinonimia completa
è un evento estremamente raro per cui ci si deve accontentare spesso e
volentieri della quasi-sinonimia nel senso che due parole possono avere in
comune uno o più pacchetti di componenti semantici (a partire da quelli
intensionali), ma difficilmente li condivideranno tutti. L'antonimia è il nome
che si dà alla relazione per la quale il significato di una parola è il
contrario (o l'opposto) di quello di un'altra. Spesso la relazione di antonimia
include una gradazione proprio per come è stata definita. La complementarità è
una relazione che si istituisce tra co-iponimi che si presentano in coppia. La
simmetria è quel tipo di relazione che sussiste tra X e Y quando si può dire A
=> X => B e anche B => Y => A; esistono anche parole che sono implicitamente
simmetriche.
Torniamo ora ad un discorso più generale che mostri il perché dell'esistenza di
tali principi di ordinamento. Da un punto di vista puramente astratto essi
servono a non lasciare che il lessico sia una massa disordinata di parole e a
far si che le parole si possano classificare secondo qualche principio. C'è però
una ragione più profonda e più strettamente legata all'utente che giustifica
l'esistenza dei principi di ordinamento. Infatti essi favoriscono:
1. la memorizzazione del lessico da parte dell'utente, offrendogli delle piste
per associare le parole tra loro e per ricercarle quando occorrono;
2. l'Attivazione nell'utente di un complesso sistema di meccanismi di attesa che
gli è indispensabile sia per produrre che per interpretare gli enunciati.
Specifichiamo meglio il punto 2. I meccanismi di attesa predispongono l'utente
alla ricezione di un certo tipo di informazione, generano una aspettativa, che
frequentemente risulta corretta soprattutto in contesti estremamente familiari,
quotidiani. Essi permettono inoltre di circoscrivere il campo di ricerca delle
successive possibili parole. Infatti, una volta individuato il campo semantico
di riferimento, la comprensione di un testo o di un discorso avviane in modo
molto più efficace.
Ad esempio sentendo parlare di ruote, di motore, di sportello, di volante
veniamo indotti ad attendere in modo esplicito od implicito che si parli di una
automobile di un qualche modello. Tale tipo di relazione è chiamata meronimia
(relazione Tutto <=> Parti).
In conclusione i principi di ordinamento semantico risultano essere al servizio
della coesione e della coerenza dei testi in quanto offrono all'utente piste
preferenziali per la loro produzione e interpretazione.
Un altro fenomeno importante della lingua è quello delle famiglie semantiche.
con questo termine si intendono gruppi di parole di significato affine tra loro.
Su questa semplice intuizione poggiano diversi fenomeni:
1. La percezione che esistano gruppi di parole talmente correlate dal punto di
vista semantico da formare terminologie compatte;
2. Nell'apprendimento della lingua alcune famiglie devono avere precedenza su
altre.
3. La percezione che una parola può migrare da una famiglia all'altra estendendo
il suo significato.
Per avere una famiglia semantica è necessario che le parole siano correlate
attraverso uno o più dei principi di ordinamento ora descritti. In altri
termini, una famiglia semantica è costituita da tutte le parole le cui matrici
semantiche condividono almeno una componente intensionale. Tanto più alta è la
cardinalità di questa intersezione tanto più densa è la famiglia.
E' bene chiarire cosa intendiamo per campo semantico. Esso è una raggruppamento
di parole in opposizione paradigmatica reciproca, che possono cioè occupare lo
stesso posto in un enunciato. l'appartenenza ad un dato campo semantico non è
esclusiva, anzi una stessa parola può appartenere a più campi semantici
differenti. Anche per i campi semantici è possibile definire una quantificazione
per l'appartenenza. Aggiustiamo pertanto la definizione di famiglia semantica
"densa" introducendo l'idea di campo semantico. Una famiglia semantica per
essere tale deve:
a- verificare le proprietà di campo semantico.
b- essere organizzata in base ad uno o più principi di ordinamento semantico.
A loro volta anche tra i campi "densi" è possibile definire una gradazione che
considera più densi quelli che sono correlati da un maggior numero di principi
di ordinamento. Se ne può dedurre che una stessa parola può figurare in più
campi semantici, che l'intero lessico di una lingua sia composto da un insieme
illimitatamente esteso di campi di dimensioni e densità diverse.
Tutte le considerazioni sin qui presentate fanno pensare che il lessico di una
lingua sia interamente rappresentabile come una struttura ordinata, in cui non
ci siano elementi isolati, in cui ogni posto immaginabile sia riempito da una
parola. Tale punto di vista è però scorretto in quanto è praticamente
impossibile dimostrare che l'organizzazione strutturale presentata valga su
tutta una lingua. In realtà è più opportuno vedere il lessico come un sistema
sparso, ricco di vuoti e di asimmetrie, incongruenze, ambiguità, vaghezze.
Per superare i limiti di una struttura così inconsistente, nel nostro comunicare
quotidiano, facciamo riferimento a quattro risorse non strettamente
linguistiche:
* la capacità metalinguistica: che consiste nella possibilità di spiegare la
lingua attraverso la lingua stessa.
* la contestualità interna (che designa il mondo esterno): che permette di
restringere lo spazio dei significati cui si sta facendo riferimento
considerando ad esempio il significato generale del discorso che si sta
ascoltando.
* la contestualità esterna (che evoca il mondo esterno): che ha anch'essa la
funzione di restringere lo spazio dei significati, questa volta guardando alla
situazione in cui avviene una certa comunicazione (in treno, a casa, con un
amico, con il datore di lavoro...)
* la mobilità lessicale: che consiste nell'usare parole in molteplici modi e
posizioni trasmettendo particolari sfumature di significato.
Per concludere, grazie alla linguistica sappiamo che è possibile gestire in modo
egregio la sintassi e la morfologia delle parole e del testo. Il suo contributo
alla comprensione del problema del significato è fondamentale in quanto le
soluzioni proposte trovano fondamento nella indiscutibile familiarità di questa
disciplina con il fatto linguistico. Il limite che si può individuare in questo
approccio è una non completa formalizzazione dal punto di vista matematico del
problema che non permette immediate applicazioni nel campo della automazione
informatica.
In generale però possiamo dire che il numero di spunti sui quali avviare
approfondimenti sistematici non mancano. Per il proseguimento del discorso è
importante tenere presente i seguenti aspetti:
* la due componenti che caratterizzano il significato.
* le unità di misura dell'analisi semantica.
* l'idea di componente semantico e di matrice semantica
* le ipotesi sottostanti l'analisi componenziale
* l'idea di famiglia semantica
* le quattro risorse semiotiche.
Il Significato in Psicologia

Per proseguire il discorso sul significato è importante considerare anche il


punto di vista della psicologia, la quale studia in modo scientifico e
sperimentale la realtà "uomo". Per questa sua peculiare caratteristica si
possono attingere da essa importanti informazioni a proposito del significato
che, come abbiamo visto fino a questo punto, è un componente centrale per la
sopravvivenza e il progresso dell'umanità.
Partiamo introducendo gli elementi chiave della psicologia generale19:
La Percezione: consiste nella valutazione della realtà; è difatti attraverso la
percezione che noi estraiamo e organizziamo tutte le informazioni che ci
provengono dal mondo in cui siamo inseriti ed in cui agiamo; la psicologia tenta
in questo campo non solo di studiare il ruolo delle informazioni che riceviamo
attraverso i cinque sensi ma anche quello delle informazioni che ci vengono
fornite dai sensi interni, dell'equilibrio etc.
L'Intelligenza: la sua principale caratteristica è la capacità di trovare
soluzioni originali a problemi che si pongono per la prima volta; essa ha
permesso all'uomo di superare le difficoltà che ha incontrato e che incontra nel
corso della sua evoluzione, traendo profitto dall'esperienza accumulata. Il suo
grado più alto è il pensiero espresso che è proprio ed esclusivo dell'uomo. Ciò
consente di distinguere l'intelligenza dall'istinto e dal semplice
apprendimento, dote quest'ultima, che si può constatare anche nel mondo animale.
Il Linguaggio: strumento che permette di trasmettere da società a società e da
generazione a generazione la somma delle esperienze acquisite arricchendole con
nuove ed incessanti scoperte.Il linguaggio umano, a differenza di quello animale
fatto esclusivamente di segni, è caratterizzato dal processo di simbolizzazione
che si accompagna all'evoluzione del pensiero. Privato del linguaggio,
l'individuo presenta difatti gravi ritardi mentali.
Le Motivazioni: I nostri comportamenti non sono mai determinati dal caso bensì
sempre da una ragione, sia essa cosciente o meno. Le motivazioni entrano in
gioco quando decidiamo di fare o non fare una certa azione.
La Personalità: è considerata in psicologia come una sorta di abito non fisso
che si modella giorno per giorno, secondo il vario gioco delle esperienze da
ciascuno vissute.
Il Comportamento Sociale: è il comportamento di un individuo all'interno di una
comunità di suoi simili; tale comportamento risente degli influssi che "gli
altri" esercitano sul modo di pensare, di sentire e di agire dei singoli, nonché
delle interazioni tra gli individui e i gruppi sociali stessi, come pure del
gioco di forze all'interno dei gruppi. L'evoluzione psicofisica,
l'apprendimento, lo sviluppo della personalità ed ogni altro aspetto psicologico
dell'individuo sono strettamente correlati al gruppo sociale di appartenenza.
Conflitti e Disturbi del Comportamento: Il comportamento umano si caratterizza
essenzialmente dal modo in cui un individuo agisce nell'ambiente in cui vive e
come ad esso reagisce. Il comportamento è espressione di una attività "totale"
della persona considerata nelle sue componenti somatiche e psichiche. Un buon
"adattamento" di tali componenti all'ambiente determina da un lato un armonioso
equilibrio del soggetto con la realtà e dall'altro un ordinato svolgersi della
vita sociale. Quando perciò conflitti interiori o situazioni esterne di disagio
alterano tale equilibrio si ha il "disadattamento", cioè condizioni in tutto o
in parte incompatibili con la vita sociale.
Cerchiamo di approfondire i seguenti tre punti: la percezione, il linguaggio e
le motivazioni. Tali elementi sono in stretto rapporto con il problema del
significato in quanto la percezione abbiamo visto essere la prima fonte di
significati, il linguaggio rappresenta lo strumento che permette lo scambio di
significati e le motivazioni sono il motore che attiva l'uso del linguaggio e
l'elaborazione dei significati.
LA PERCEZIONE
Nella nostra comune attività quotidiana abbiamo continuamente a che fare con la
percezione anche se ci sembra naturale che un tale fenomeno non presenti nulla
di straordinario, visto che esso avviene e ce ne serviamo per lo più senza
accorgercene, come un fatto del tutto spontaneo ed ovvio. La percezione è
infatti il mezzo attraverso il quale ci colleghiamo alla realtà. In altre
parole, è il mezzo con cui noi riceviamo le infinite informazioni che ci
provengono dal mondo e che, spesso inconsapevolmente, usiamo per regolarci ed
adattarci alla realtà presente. Senza tali informazioni agiremmo in modo del
tutto assurdo con conseguenze facilmente intuibili. Per valutare l'importanza
del fatto percettivo basta che ci riferiamo, come semplice esempio, alla
circolazione stradale: se il nostro meccanismo della percezione fosse alterato
non saremmo più in grado di stimare la distanza del nostro veicolo da quello che
ci precede, la larghezza della carreggiata sulla quale stiamo transitando,
l'avvertimento derivante da un colpo di clacson e così via.
Volendo definire l'idea di percezione si può dire che consta di un processo di
selezione e di organizzazione. Noi siamo costantemente bombardati da
innumerevoli messaggi provenienti dalla realtà e di cui facciamo uso per
svolgere la nostra attività. Ebbene se tutti questi messaggi fossero recepiti ci
troveremmo nel caos più completo. Diventa perciò naturale pensare che esista un
meccanismo di selezione che ci consenta di scegliere tra questi messaggi, quelli
che, in un determinato momento, ci interessano maggiormente ai fini del compito
che ci proponiamo di eseguire. Organizziamo le informazioni filtrate attraverso
il processo percettivo in modo da tradurle a nostro vantaggio per raggiungere
quello scopo e non un altro.
La percezione in definitiva altro non è che il primo anello della catena che
unisce quanto si trova nel mondo esterno con la nostra azione: apprendere,
ricordare, immaginare, raccontare e così via risulterebbero impossibili se prima
non avessimo immagazzinato tutti questi dati con la nostra esperienza
percettiva.
Dal punto di vista fisico la percezione consiste nella decodificazione e quindi
nell'interpretazione delle stimolazioni esterne che in un primo momento vengono
in contatto con i nostri organi di senso (vista, udito, olfatto, gusto e tatto).
Esse vengono immediatamente trasmesse ai centri nervosi superiori e sono
interpretate in base all'istinto e alle esperienze precedenti. Solo a questo
punto lo stimolo produce la risposta considerata adeguata. Bisogna puntualizzare
che gli organi di senso in realtà sono più di quelli che normalmente siamo
abituati a riconoscere: ricordiamo gli organi sensoriali somatici, quelli
cutanei, il senso labirintico e quello cinestetico. Studi sulla deprivazione
sensoriale hanno mostrato che questa provoca gravi scompensi organici
(temporanei) che si manifestano attraverso disturbi nella organizzazione
percettiva, del comportamento e del pensiero. Anche la sovrabbondanza di stimoli
provoca disfunzioni non trascurabili quali irascibilità, stress, nervosismo,
disturbi del sonno etc.
Approfondiamo ora il discorso relativo alla struttura della percezione.
Proponiamo di seguito una serie di punti importanti che riassumono il
funzionamento percettivo:
- non sempre uno stimolo è in grado di suscitare una percezione nella persona;
- lo stimolo esiste solo quando è presente una risposta;
- gli stimoli non si presentano isolati: i singoli eventi percettivi sono
organizzati in gruppi significativi cioè in un contesto;
- tali gruppi si formano secondo alcune regole:
a) Vicinanza: tendiamo a cogliere come un tutto le parti percepite più vicine
tra loro;
b) Uguaglianza: tendiamo a raggruppare stimoli simili tra loro;
c) Forma Chiusa: siamo indotti a percepire come unità superfici delimitate da
linee chiuse anziché aperte.
d) Esperienza: condiziona le nostre percezioni proponendo soluzioni già
incrociate.
...
- l'informazione viene percepita quando supera una soglia assoluta provocando
una risposta nel soggetto; per la precisione si possono identificare tre
tipolgie di soglia:
a) Minima: definita per stimoli appena percettibili;
b) Massima: oltre la quale si manifesta il dolore;
c) Differenziale: minimo oltre il quale siamo in grado di classificare come
diverse due sensazioni.
Grande importanza nel processo percettivo svolge l'attenzione. L'attenzione è
quel meccanismo attraverso il quale focalizziamo, isoliamo, soltanto un
particolare aspetto della percezione. Molti psicologi ritengono che l'attenzione
sia l'aspetto direttivo della percezione. Tale strumento permette di esaminare
con maggiore precisione solo quelle porzioni di realtà che vengono ritenute
importanti accentrando le risorse fisiche e mentali e distogliendole da altro.
Il processo della focalizzazione dell'attenzione fa parte di una risposta
generalizzata cosiddetta di "allarme" (o riflesso di orientamento) che viene
evocata in qualunque individuo per far aumentare l'intensità e la chiarezza
della percezione. In questo processo assumono grande importanza due tipi di
fattori:
- Interni: l'interesse...
- Esterni: la novità, la ripetizione,l'intensità...
IL LINGUAGGIO
La peculiarità del linguaggio umano è descritta dalle seguenti caratteristiche:
- Spostamento: capacità di potersi riferire ad avvenimenti lontani nello spazio
e nel tempo.
- Produttività: capacità digenerare e comprendere espressioni mai incontrate o
prodotte.
- Combinazione: capacità di collegare suoni distinti.
- Dipendenza: necessità di dipendere da processi di insegnamento ed
apprendimento.
- Simbolicità: si caratterizza come insieme di simboli legati a significati, a
segni e a comportamenti.
Il linguaggio ha subito lungo i millenni stupefacenti mutazioni; si è passati
dalla produzione delle prime fonazioni gutturali emesse dall'uomo preistorico
alle complesse combinazioni di suoni che costituiscono a tutt'oggi il panorama
linguistico mondiale. Pur esistendo una miriade di lingue differenti, è
possibile inquadrare una serie di caratteristiche comuni alla lingua:
- Il Canale vocale-auditivo;
- La Specializzazione: il linguaggio ha come obiettivo fondamentale la
comunicazione;
- L'Arbitrarietà: il rapporto tra suoni e cose non è univoco;
- Lo Spostamento (vedi sopra);
- La Produttività (vedi sopra);
Il linguaggio si sviluppa nell'uomo seguendo una serie di passi, identificati
attraverso esperimenti e studi scientifici dalla psicolinguistica. Grosso modo
si possono stabilire quattro fasi importanti:
1. 0-3 settimane: Passaggio dal vagito neonatale, al pianto, ai gorgoglii;
2. 3-16 settimane: Vocalizzazioni che variano in tono, in lunghezza ed
articolazione;
3. 16 settimane - 8 mesi: Lallazione, ovvero articolazione di suoni simili a
parole privi però di contenuto semantico
4. 8-14 mesi: Strutturazione del discorso che consiste nella produzione di
singole parole usate consapevolmente e pertanto aventi un senso.
Alla fase quattro segue una accelerazione impressionante per quel che riguarda
l'apprendimento di nuove parole che porta il bambino, in soli due anni, alla
centuplicazione del suo lessico primordiale. Segue poi la fase
dell'apprendimento di combinazioni sintattiche ed infine, grazie alla scuola, si
ha un raffinamento delle capacità linguistiche. Grande importanza assume
l'ambiente linguistico per lo sviluppo corretto del linguaggio nel bambino.
Veniamo ora a parlare della funzione del linguaggio. Abbiamo già accennato che
il linguaggio ha specializzato la sua funzione nello svolgimento del compito
comunicativo, ma non sono da dimenticare altri aspetti importanti quali il
valore espressivo e la capacità di regolare il comportamento etc. di cui esso
dispone.
Molti studi sono stati fatti a proposito della funzione del linguaggio, in
particolare però si sono affermate due teorie in particolare:
A. per la prima il bambino piccolo apprende in un primo tempo soltanto risposte
a stimoli specifici indipendentemente dal linguaggio e in seguito l'acquisizione
del linguaggio avviene per semplice associazione di uno stimolo condizionato ad
una determinata risposta (psicologi sovietici tra i quali un grande esponente è
Lura);
B. per la seconda l'origine delle operazioni intellettive giace nella fase
pre-verbale, mentre la formazione del linguaggio è contemporanea a quella del
pensiero rappresentativo (J. Piaget).
La seconda teoria è quella più accreditata e prevede quattro stadi di sviluppo
logico:
I) 0 - 2 Anni [fase pre-logica]: Il bambino agisce concretamente cosicché
l'azione precede la verbalizzazione logica del linguaggio.
II) 2 - 8 Anni [fase pre-logica]: Il bambino sa rappresentare mentalmente
oggetti, situazioni e relazioni; predomina ancora il dato percettivo.
III) 8 - 12 Anni [fase logica-concreta]: si assiste alla costruzione di una vera
e propria logica anche se ancora è mantenuta su un piano di concretezza.
IV) 12 - 15 Anni [fase logica-formale]: il ragazzo sa operare logicamente senza
ricorso ad oggetti concreti.
In sintesi, dagli studi di Piaget, emerge che il linguaggio non è una condizione
sufficiente a spiegare la costituzione del pensiero; al massimo potrebbe essere
solo necessaria. Difatti al di la di tutto risulta evidente che tra pensiero e
linguaggio esiste una stretta connessione. Ogni nuova acquisizione del
linguaggio implica anche una nuova conquista del pensiero e conseguentemente una
nuova opportunità di esperienza e di attività. E' stato d'altra parte dimostrato
che nei casi in cui non vi sia la possibilità di apprendere il linguaggio si
hanno profondi ritardi nello sviluppo mentale.

LA MOTIVAZIONE
La motivazione è quel fattore psichico sia esso conscio od inconscio, che spinge
l'individuo a compiere certe azioni o a tendere verso certi scopi. Una cosa
risulta subito evidente: la motivazione è necessaria all'azione. L'uomo è dotato
di due categorie di bisogni:
I. Primari: in comune con tutti gli organismi viventi legati all'ambito
fisiologico come nutrirsi, riprodursi, sopravvivere...
II. Secondari: frutto della cultura, chiamati anche bisogni psicologici o
sociali.
Spesso i bisogni secondari sono così intensi da soverchiare i primari. Questa
distinzione non è così netta come la si può esporre, poiché le diverse
dimensioni, psicologica, sociale, biologica sono strettamente correlate al punto
da risultare inseparabili. L'uomo difatti si sviluppa all'interno di una certa
società, in cui agisce e della quale accetta le regole, anche se talvolta
ritiene di doversi impegnare a correggerle o a modificarle. Ogni azione dunque è
promossa da bisogni che, in definitiva rappresentano l'essenza stessa della
motivazione. Si può completare la definizione di motivazione aggiungendo che
essa è quel fattore che potenziando un bisogno stimola l'individuo ad impegnarsi
a soddisfarlo.
Presentiamo ora il punto di vista della psicologia moderna rappresentato dal
pensiero di Sigmund Freud. Nella sua teoria della motivazione egli suddivide la
personalità in tre regioni adiacenti:
1- Es: il suo bisogno è quello di far prevalere gli impulsi istintivi (neonato)
2- Io: parte della personalità che va costruendosi nell'incontro-scontro
(conflitto) con la realtà nell'esperienza durante il primo anno di età (il
frutto della evoluzione dell'Io è la coscienza)
3- Super-Io: rappresentazione dei desideri degli altri, delle regole imposte
dalla società.
Poiché certi bisogni sono così intensi da non poterci rinunciare a cuor leggero,
ecco che fa la sua comparsa un meccanismo in grado di porre rimedio e che aiuta
ad accettare ciò che viene imposto dall'esterno: la rimozione. Tale meccanismo
permette di trasferire dal conscio all'inconscio i desideri che non vengono
accettati dal mondo esterno. E' dunque il ruolo dell'inconscio ad agire sulle
nostre motivazioni e sul nostro comportamento.
Oltre ai bisogni primari e secondari esiste un terzo tipo di bisogno che si
proietta nel futuro ed è la realizzazione del sé o "autorealizzazione" che
consiste nell'attuazione delle nostre migliori potenzialità attraverso le quali
noi esprimiamo più compiutamente il nostro Io. In questa prospettiva risulta
fondamentale credere in uno scopo.
Abbinata alla motivazione troviamo l'Emozione che è il prodotto dell'azione
motivata, azione che genera una percezione. Tale emozione ha differenti
coloriture più o meno piacevoli e più o meno intense. In definitiva si può
affermare che non esiste comportamento motivato che non produca un qualche stato
emotivo.
Tirando le fila si nota come anche il punto di vista della psicologia, a
proposito di significato, dia grande peso al fatto percettivo, alla esperienza
come chiave dell'essere e dell'agire di ogni persona. A queste conferme si
aggiunge l'idea che esiste sempre una motivazione che spinge la persona ad
interagire con il mondo e contemporaneamente a ricavare, ricercare significati.
Gli elementi chiave da considerare per ampliare il quadro sul significato sono i
seguenti:
* l'idea di selezione ed organizzazione per la percezione;
* le ipotesi sul funzionamento percettivo;
* l'idea di apprendibilità delle facoltà linguistiche;
* l'importanza del linguaggio nello sviluppo intellettivo
* l'idea di motivazione che porta a soddisfare bisogni (primari e secondari)
Il Problema "Significato" in Informatica

Iniziamo con il proporre un breve excursus storico che riassume i passi compiuti
in campo di elaborazione del linguaggio naturale, fino ad arrivare ad inquadrare
le tendenze degli ultimi anni.
Le origini dell'interesse per il linguaggio da parte degli informatici risale al
secondo dopoguerra in corrispondenza con lo sviluppo dei calcolatori stessi.
Tale periodo ha avuto come punti cardine di studio due sistemi fondamentali: gli
automi e i modelli probabilistici.
Gli automi a stati finiti prendono piede negli anni '50 in scia a tre modelli
precedenti:
1.[1936] La Macchina di Turing (Alan Turing è considerato da molti il padre
della informatica moderna): è una macchina astratta costituita da un controllo a
stati finiti e da un nastro sul quale essa può scrivere e leggere in dipendenza
della transizione in cui il controllo si trova a passare.
2.[1948] Teoria dell'informazione di Shannon: egli usa una macchina a stati per
modellare le proprietà di un canale per la trasmissione di informazioni discreto
(un esempio è il telegrafo). Shannon applica anche il lavoro di Markov sui
processi stocastici discreti al problema dell'informazione. Un Discrete Markov
Process può essere visto come una macchina dotata di un numero finito di stati
ed un numero finito di collegamenti tra tutti gli stati. Ad ogni collegamento è
assegnata una probabilità. La modifica di Shannon consistette nell'aggiungere ad
ogni collegamento un simbolo che veiene generato in seguito alla transizione tra
i due stati collegati.
3. [1943] Neurone di McCulloch-Pitts: è un modello semplificato di neurone
biologico usato come elemento di calcolo che può essere descritto mediante la
logica preposizionale. Tale neurone è un dispositivo binario che può assumere i
due stati Attivo o Inattivo, in seguito ad eccitamento o inibizione da parte di
altri neuroni ad esso collegati. Tale elemento, pur essendo poco credibile dal
punto di vista biologico, ha una enorme importanza come modello di calcolo.
(basti pensare che le più moderne teorie sulle reti neurali e connessioniste
hanno preso il via da questa idea).
Ma veniamo ai contributi specifici che questi diversi modelli di calcolo hanno
apportato allo sviluppo delle teorie degli automi e dei modelli probabilistici
nel campo della elaborazione del linguaggio naturale.
Noam Chomsky (uno dei più autorevoli linguisti del nostro tempo), partendo
dall'idea di Finite State Markov Process rivisitata da Shannon, riuscì nel 1956
a descrivere una grammatica e a codificare l'idea di linguaggio a stati finiti
come di un linguaggio prodotto da una grammatica a stati finiti. Da queste prime
intuizioni si è sviluppata la teoria dei linguaggi formali, che usa l'algebra e
la teoria degli insiemi per definire linguaggi formali come sequenze di simboli.
Uno dei prodotti di tale teoria è il concetto di grammatica libera dal contesto
derivato autonomamente da Chomsky (1956) da Backus e Naur (1959) e da altri, in
grado di produrre e descrivere il linguaggio naturale.
Lo sviluppo di algoritmi probabilistici per l'elaborazione del linguaggio trova
le sue basi in un altro contributo di Shannon: la metafora del canale-rumoroso e
la decodifica della trasmissione di informazioni attraverso canali di
comunicazione. Shannon utilizzò l'idea di entropia, presa in prestito dalla
termodinamica, quale elemento per la misura della capacità trasmissiva di un
canale e per la misura del contenuto informativo di un linguaggio.
Tra la fine degli anni '50 e i primi anni '60 ci fu la scissione netta in due
correnti a proposito dell'elaborazione del linguaggio: simbolica e
probabilistica.
La corrente simbolica prese il via da due linee di ricerca. La prima fu quella
legata al lavoro svolto da Chomsky a proposito di linguaggi formali e dei
compilatori, che in breve tempo portò a produrre i moderni sistemi di parsing.
La seconda era costituita dalla nascente idea di intelligenza artificiale
fondata durante l'estate del 1956 da John McCarthy, Marvin Minsky, Claude
Shannon e Nathaniel Rochester. Il cuore della ricerca portata avanti da questa
nuova disciplina era l'idea di ragionamento e di logica definiti da Newell e
Simon per i progetti "The Logic Theorist"20 e "The General Problem Solver"21.
Nacquero così i primi sistemi per l'elaborazione del linguaggio naturale (tra i
quali possiamo citare BASEBALL, STUDENT, ELIZA etc.) applicati a domini
linguistici ristretti utilizzando una combinazione di algoritmi di
pattern-matching e keyword-searching abbinati a semplici algoritmi euristici per
il ragionamento e la risposta a domande.
La corrente probabilistica ebbe come suo naturale habitat di sviluppo in
particolar modo all'interno dei dipartimenti di statistica e di ingegneria
elettronica. Verso la fine degli anni 50 il metodo Bayesiano iniziò a trovare
applicazione nei problemi di OCR (Optical Character Recognition) grazie al
contributo di Bledsoe e Browning (1959) che crearono un sistema per il
riconoscimento elettronico di testi in grado di sfruttare le informazione
statistico-linguistiche contenute all'interno di un dizionario, e di analisi
della autenticità di testi scritti (Mosteller e Wallace 1964). Alla fine degli
anni 60 i lavori di Shanon e Markov vennero integrati dalla teoria dell'Hidden
Marcov-Model e trovarono applicazione nel riconoscimento del linguaggio parlato.
Tali teorie furono poi approfondite e perfezionate dai ricercatori della IBM.
Risale a questo periodo, primi anni '70, la nascita di tutti gli algoritmi alla
base degli attuali sistemi di Speech-Recognition, Spell-Checking e Natural
Language Processing.
Il decennio racchiuso tra i primi anni settanta e i primi ottanta vide lo
sviluppo specifico di molti algoritmi chiave usati nell'elaborazione del
linguaggio naturale (NLP), che è nel frattempo divenuta un campo di studio a sé
stante. Nel 1972 Terry Winograd costruì il famoso SHRLDU che simulava un robot
immerso in un mondo di cubi colorati e di diverse dimensioni. Il programma era
in grado di accettare comandi in linguaggio naturale del tipo "Sposta il blocco
rosso sopra a quello verde più piccolo".
Il modello di Winograd fu la prova tangibile che il problema del parsing era
stato compreso sufficientemente a fondo e che era giunto il momento di dedicarsi
alla semantica e ai modelli di discorso. Gli anni 70 hanno visto nascere diversi
modelli semantici. Tra i tanti ricercatori che si sono dedicati a questa nuova
sfida va citato sicuramente il lavoro di Roger C. Shank e dei suoi colleghi e
studenti alla Yale School. Essi produssero una serie di programmi per computer
con l'obiettivo di modellare la comprensione umana descrivendone la capacità
semantica e la facoltà di conoscenza concettuale mediante le idee di "Scripts"
di "Plans" e di "Goals", e studiandone l'organizzazione della memoria. Durante
questo periodo sono stati prodotti altri modelli formali per la semantica basati
sulla logica dei predicati, ad esempio il programma LUNAR in grado di rispondere
a semplici domande (Woods 1978).
Anche per quel che riguarda l'elaborazione del discorso (discourse processing)
sono stati proposti diversi modelli. Tra questi si può citare l'idea di Grosz a
proposito di focalizzazione del discorso (discourse focus). Infine tra il '79 e
l'82 presso Palo Alto si assiste all'unificazione di alcune correnti di pensiero
tra le quali possiamo citare la definite clause grammar, la functional grammar e
la LFG.
Tra i primi anni 80 e i primi 90 si ha lo sviluppo di diversi progetti e modelli
per la generazione del linguaggio naturale (Appelt 1985; McKeown 1985) e altri
progetti, basati su sistemi a stati finiti, per l'analisi morfologica e la
fonologica.
Durante gli ultimi cinque anni i cambiamenti sono stati radicali. Innanzitutto
il modello statistico, che prima era utilizzato esclusivamente nel
riconoscimento del linguaggio parlato, ora trova molto spazio in applicazioni di
NLP. L'idea di probabilità va diffondendosi anche tra gli algoritmi di parsing,
Part of Speech Tagging, Pronominal anafora Resolution e Discoruse Processing.
Poi con l'aumento della velocità e della memoria dei computer c'è stata una vera
e propria esplosione demografica di sotto-aree collegate all'elaborazione del
linguaggio, in particolare per i campi di Speech-Recognition, Spelling e Grammar
Checking. Infine con l'avvento del World Wide Web si sono venute a creare
esigenze di sistemi Information-Retrieval e Information-Extraction .
In sintesi pare che molte delle soluzioni classicamente ritenute corrette ora
siano tornate in discussione, soprattutto a causa della loro rigidità e della
loro incapacità di adattarsi a situazioni nuove e impreviste, capacità che
peraltro è tipica degli esseri umani.
Le linee storiche precedentemente tracciate lasciano intendere che anche per la
computer-science, così come per la linguistica, per la filosofia e per la
psicologia, la questione sul significato è ancora decisamente aperta.
Consideriamo ora qual è, nello specifico dell'informatica, l'idea si significato
e quali sono i modelli cui attualmente si fa riferimento per creare programmi e
applicativi in grado di tenerne conto.
Attualmente, l'idea sottostante l'approccio informatico alla semantica formula
l'ipotesi che la conoscenza del significato di una frase equivale alla
conoscenza delle condizioni per cui essa risulta vera. In altre parole, la
conoscenza del significato equivale alla conoscenza di come il mondo sarebbe se
la frase fosse vera. Con ciò non si intende asserire che il significato della
frase consiste nell'essere in grado di stabilire se essa è vera o falsa, che è
una questione prettamente empirica, ma si afferma piuttosto che la conoscenza
delle condizioni di verificabilità (truth conditions) è un pre-requisito
necessario affinché una tale risposta sia possibile22.
Il concetto di significato come "insieme di condizioni di verificabilità"
(meaning as truth conditions) attraversa orizzontalmente, in forme diverse,
praticamente tutte le teorie semantiche contemporanee e trova una sua
giustificazione filosofica, ad esempio, in Davidson (1973).
Uno dei più importanti strumenti matematici cui ha fatto (e ancora fa)
riferimento la semantica informatica è la logica dei predicati o "First order
logic". Tale strumento funge da modello per sviluppare in modo rigoroso la
semantica di un linguaggio.
Sul piano pratico risulta facile comprendere perché la questione sul significato
fino ad oggi non è stata obiettivo primario di ricerca. La causa risiede nel
fatto che alcune elaborazioni a proposito di linguaggio naturale (tipo lo
smistamento di messaggi, il reperimento di informazioni testuali, la traduzione)
possono essere eseguite con risultati discreti anche applicando semplici metodi
statistici o di pattern matching, che non fanno uso della semantica intesa così
come è stata sopra descritta.
Resta il fatto che tali elaborazioni producono sensibili miglioramenti quando
sfruttano elementi di semantica. D'altro canto alcuni problemi non possono
essere risolti senza l'utilizzo di strumenti semantici di qualche genere. Uno
esempio tra i tanti è quello della interrogazione di basi di dati in linguaggio
naturale sviluppata per la "Air Travel Information Service" (DARPA 1989).
Si consideri la seguente domanda posta da un utente a tale servizio informativo:
"La sosta a Reykiavik è prevista per tutti i voli da Londra a San Francisco?"
Il sistema deve essere in grado di trasformare la domanda in una query
consistente e valida per il database relazionale dal quale deve essere estratta
la risposta.
Anche il problema della generazione di testi non può prescindere dal considerare
la questione del significato. Tale compito necessita innanzitutto della
costruzione di un appropriato modello del significato di ciò che deve essere
espresso, poi della conversione di tale modello in una forma comprensibile
all'utente finale: la lingua naturale.
Sia gli studi teorici che le applicazioni pratiche mostrano come e quanto sia
intrattabile, dal punto di vista computazionale elaborare il linguaggio naturale
sfruttando un approccio basato esclusivamente sulla logica dei predicati (si
pensi ad esempio al problema della ambiguità semantica e sintattica di un numero
considerevole di frasi).
Per questo motivo sono state sviluppate metodologie che permettono di
interpretare le frasi in modo indiretto. In altre parole la frase da analizzare
viene prima accettata solo se è in una forma compatibile con una grammatica
ristretta definita a priori, in seguito viene trasformata in una espressione
appartenente ad un linguaggio logico artificiale, infine il prodotto di tale
elaborazione viene interpretato facendo capo agli strumenti forniti dalla logica
dei predicati. Possiamo, riassumendo, vedere il processo di interpretazione come
legato a due fasi sequenziali:
- la prima riduce le variazioni sintattiche ad un numero finito di costrutti
(restrizione del linguaggio);
- la seconda chiede che venga generato uno schema di regole semantiche che
permettano di interpretare le frasi sintatticamente corrette rispetto alla
grammatica definita nella prima fase.
Vediamo alcuni esempi di teorie per la semantica proposte di recente in campo
informatico.

DISCOURSE REPRESENTATION THEORY


La Discourse Representation Theory (DRT) vede come un costrutto teorico
indispensabile il passaggio attraverso una rappresentazione intermedia
interposto fra lingua naturale e interpretazione semantica. Inoltre considera
come unità descrittiva fondamentale il discorso nella sua globalità, piuttosto
che le singole frasi isolate. Per discorso si intende un insieme di frasi legate
una all'altra da pronomi, congiunzioni, ellissi o altri connettivi grammaticali.
Tale connettività viene resa visibile grazie alla rappresentazione intermedia,
senza la quale essa resterebbe inesprimibile. Consideriamo il seguente esempio:
il computer ha fatto un errore.
una traduzione naif nella logica del prim'ordine di questa asserzione potrebbe
essere:
esiste(X,computer(X) and ha_fatto_un_errore(X))
che è logicamente equivalente a:
not(per_ogni(X,not(computer(X)andha_fatto_un_errore(X))))
che tradotto in lingua corrente diventa:
non tutti i computer non hanno fatto errori.
Ora, nonostante la frase iniziale possa essere completata come segue:
il computer ha fatto un errore. Esso è stato corretto in fretta.
sostituendo la prima frase con quella derivata per equivalenza dalla logica dei
predicati, non si ottiene un discorso sematicamene equivalente:
non tutti i computer non hanno fatto errori. Esso è stato corretto in fretta.
Se ne ricava che la forma della rappresentazione ha conseguenze linguistiche ben
precise. La DRT ha sviluppato una estesa descrizione formale per una quantità di
situazioni del tipo esemplificato poc'anzi, avendo cura di preservare
l'interpretazione logica e computazionale della rappresentazione intermedia.
DYNAMIC SEMANTICS
La Dynamic Semantics asserisce che il modo di considerare le condizioni di
verità associate al significato di frasi, derivato dal modello della logica dei
predicati, non giustifica il fatto che pronunciando una frase, si influisce sul
contesto in cui questa frase viene detta. L'idea trae spunto in parte dai lavori
svolti intorno alla semantica dei linguaggi di programmazione e si sviluppa
secondo diverse linee di ricerca basate sull'idea che il significato di una
frase è dato dalle modifiche che essa apporta ad un contesto.
Un esempio di applicazione di tale idea è l'Update Semantics, metodo che è stato
sviluppato per modellare gli effetti derivati dall'esprimere più frasi una di
seguito all'altra, in un determinato contesto.
Normalmente l'ordine associato ad una serie di frasi che compongono un discorso,
ha un significato ben preciso. Ad esempio, una frase del tipo:
Qualcuno bussa alla porta. Forse è John. Ma, è Mary!
ha una sua coerenza, ma non tutte le permutazioni associate alle varie frasi la
mantengono:
Qualcuno bussa alla porta. Ma, è Mary. Forse è John.
Un altro metodo degno di nota è il Dynamic Predicate Logic che riesce ad
estendere l'interpretazione delle clausole della logica dei predicati con
l'assegnazione di un valore a sottoespressioni. Tale tecnica permette di
considerare i passaggi da una frase all'altra come sequenza. In questo modo si
riesce a tenere conto delle dipendenze tra le successioni di frasi che vengono
ignorate dalla logica dei predicati. Ad esempio si riesce a descrivere il
rapporto che sussiste tra "qualcuno" e "lei" nella frase seguente:
Qualcuno bussa alla porta. Lei è Mary.

SITUATION THEORY
Questa teoria ha tentato di ristrutturare i fondamenti della semantica
tradizionale, per riuscire a produrre una formulazione soddisfacente del
concetto di stato parziale del mondo (partial state of the world), con
l'obiettivo di formulare una definizione migliore di proposizione. Si è tentato
di colmare le lacune descrittive della logica tradizionale quali l'impossibilità
di considerare insiemi contenenti se stessi. In questo modo si rendono
esplorabili le possibilità offerte dai linguaggi che descrivono se stessi,
dettagli che fino ad ora sono sfuggiti ad una codifica coerente e formale.
Le attuali linee guida per la semantica contemporanea nel campo dell'informatica
possono essere riassunte nei seguenti punti:
1. Ulteriore esplorazione dell'uso di rappresentazioni incomplete al fine di
poter applicare un qualche tipo di elaborazione semantica anche quando
rappresentazioni complete del significato non sono disponibili.
2. Maggiore attenzione al problema della costruzione del lessico e quindi una
più intensa collaborazione tra esperti di semantica e lessicografia
computazionale. Tradizionalmente per la semantica il significato delle parole è
stato un accessorio da appoggiare sopra alle strutture semantiche. Un tale punto
di vista è certamente corretto quando si ha a che fare con strutture del tipo
"per ogni X vale P", ma la questione diventa meno chiara quando si trattano
fenomeni estremamente complessi.
3. Maggiore integrazione tra semantica delle frasi e teoria della struttura del
testo. Diversi lavori in campo semantico hanno posto l'attenzione sul fatto che
il testo, nel suo complesso, possa influire sull'interpretazione semantica delle
singole frasi.
Il Problema della Classificazione Automatica

Con il termine classificazione intendiamo il procedimento attraverso il quale,


dato un insieme eterogeneo di oggetti, si procede ad un raggruppamento degli
stessi in base ad un qualche criterio guida, in sottoinsiemi ciascuno
caratterizzato da una qualche proprietà.
L'idea di classificare la realtà non è affatto nuova, anzi possiamo dire che è
una delle caratteristiche peculiari degli esseri animati ed in particolare
dell'uomo. Classificare in senso lato vuole dire saper distinguere e tale
operazione è una costante nella vita di tutti i giorni, a partire dalle cose più
banali come distinguere l'acqua dal vino o la destra dalla sinistra, fino ad
arrivare a dover distinguere tra bene e male, tra bello e brutto.
L'operazione di classificazione ha una sua motivazione: permette di ordinare la
realtà e di ridurne la vastità. Infatti, legato al processo di classificazione,
troviamo la capacità di generalizzare e di specializzare tanto cara alle
discipline scientifiche, le quali nel loro progredire producono, raffinano
classificazioni e tentano di estenderle attraverso ragionamenti logici formali
(deduttivi, induttivi,...).
Abbiamo visto che anche il linguaggio è caratterizzato da una struttura
gerarchica ordinata per poter ridurre la sua complessità, e trasformarsi in uno
strumento flessibile, maneggevole e di indiscutibile utilità.
Tuttavia per poter classificare un oggetto è prima necessario avere informazioni
a proposito di questo oggetto. Nella vita di tutti i giorni queste informazioni
vengono raccolte attraverso i sensi di cui il nostro corpo è dotato. Se pensiamo
ad uno sperimentatore in fisica, egli per poter classificare utilizza strumenti
di misura (amplificatori di sensazioni). Qualora non sia possibile ricavare
nessun tipo di informazioni su un oggetto allora tale oggetto è come se non
esistesse e pertanto la classificazione non sarà possibile.
Se ci caliamo nel campo dei testi abbiamo a disposizione informazioni le
seguenti:
* Quali parole compongono il testo e con quale frequenza;
* Quali sono le posizioni reciproche delle parole nel testo e con quale
frequenza occorrono l'una accanto al'altra;
* Quali sono le posizioni assolute delle parole all'interno del testo;
* Quali sono le frequenze tipiche delle parole all'interno del lessico di una
data lingua...
Una volta verificato che esistono delle informazioni, è necessario discernere
quali di queste usare per strutturare la classificazione. Infatti, a seconda
delle decisioni che si prendono in proposito, si produrranno classificazioni
anche notevolmente diverse. Ad esempio se sono dati dei bastoncini di diversa
lunghezza, colorati con tinte diverse e fatti di materiali diversi, a seconda
che si scelga di classificare in base al colore, o in base alla dimensione o in
base al materiale si otterranno classi diverse.
Tali criteri poi a loro volta devono essere affiancati da una metrica che
permetta di decidere quanto due oggetti si somigliano tra loro. Torniamo
all'esempio dei bastoncini: ammettendo che sia stato scelto come criterio guida
il colore e assumendo che i bastoncini sono colorati con sfumature tutte
leggermente diverse, per poter produrre delle classi è necessario giudicare se
un colore è più o meno simile ad un altro e decidere così dell'appartenenza di
un oggetto ad un insieme.
Nel campo dell'analisi dei testi sono state sperimentate numerose tecniche per
misurare la somiglianza. Si possono individuare tre grandi categorie:
1. Insiemistica: applicabile quando come risultato dell'analisi del testo si
hanno liste non ordinate di parole.
2. Geometrica: applicabile quando si considerano come risultati dell'analisi dei
testi liste ordinate di parole alle quali è associato il valore 0,1.
3. Statistica: applicabile quando dal testo vengono estratte informazioni
statistiche quali, ad esempio la frequenza di occorrenza dei termini.
Tra le tecniche insiemistiche possiamo citare i seguenti coefficienti di
somiglianza:
Siano X, Y due liste non ordinate di parole chiave,
Sia | | l'operatore unario che restituisce la lunghezza di una lista
Sia uni(x,y) l'operatore binario che restituisce l'unione di due liste
Sia int(x,y) l'operatore binario che restituisce l'intersezione di due liste
Sia min(x,y) l'operatore binario che restituisce il minimo di due numeri
Sia rq(x) l'operatore unario che restituisce la radice quadrata di un numero
DICE'S
2*|int(X,Y)| / |X|+|Y|
JACCARD'S
|int(X,Y)| / |uni(X,Y)|
COSINE
|int(X,Y)| / rq(|X|)*rq(|Y|)
OVERLAP
|int(X,Y)| / min(|X|,|Y|)
Un esempio di metodo geometrico è il seguente:
Siano X e Y due vettori del tipo
casa
gatto
amico
gioco
...
X
0
1
0
1
...
Y
1
1
1
0
...

Sia <X,Y> il prodotto interno dei due vettori


Sia || || l'operatore unario che restituisce la norma del vettore
SALTON'S
< X,Y > / ||X||*||Y||
Oss: Il coefficiente quì presentato non indica una somiglianza, ma una
divergenza. Può essere convertito in somiglianza applicando la seguente
equivalenza: S= 1/(1+D) dove D è il coefficiente di divergenza e S è il
coefficiente di somiglianza derivato23.
Ricapitolando, una volta che:
si è verificato che gli oggetti da classificare forniscono delle informazioni e
si è deciso come codificare tali informazioni;
sono state scelte, tra le tante possibili informazioni, quelle che si vogliono
come caratterizzanti la classificazione,
si è decisa la metrica che guiderà il calcolo della somiglianza o della
differenza tra gli oggetti
non resta che decidere quale criterio usare per produrre la classificazione.
Per generare le classi, cioè gli insiemi omogenei di cui la classificazione è
costituita, esistono diversi approcci possibili (alcuni degli algoritmi storici
più famosi sono [cap3 p10 Van Rijsbergen]:Single Link, Rocchio, Single Pass,
Dattola, Litofsky, Bonner) consideriamo le due categorie seguenti:
Top-Down: si parte considerando la collezione di oggetti da classificare come
un'unica grande classe e poi, in fasi successive, essa viene suddivisa in classi
via via più piccole e caratterizzate.
Bottom-Up: si parte considerando ogni singolo oggetto come classe, poi, in fasi
successive, si cercano di accorpare le classi simili Il procedimento viene
ripetuto finchè non sono più possibili fusioni.
Si è scelto di fare riferimento a questa suddivisione perché ciascun metodo
parte da un elemento che per l'altro è finale e viceversa. In questo modo il
problema può essere attaccato dai due fronti che lo confinano ed implementando
ambedue i metodi e confrontando i risultati si può apprezzare la convergenza del
metodo di classificazione.
Esiste un ulteriore parametro importante da valutare, ossia se l'appartenenza di
un oggetto ad una classe deve essere esclusiva o no. Si pensi ad una
classificazione che usa due parametri per valutare l'appartenenza ad una classe:
potrebbe esistere un oggetto che, secondo il primo parametro appartiene ad una
classe, secondo l'altro ad una classe diversa. In questo caso o si istituisce
una gerarchia sull'importanza dei parametri e si assegna l'oggetto alla classe
che ha come riferimento il parametro più importante o si assegna ad ogni classe
che lo conterrebbe l'oggetto conteso.
Il prodotto finale di entrambe gli schemi proposti è un insieme di classi. In
realtà, se si tiene traccia dei differenti passaggi di raffinamento, ci si trova
di fronte ad una struttura gerarchica di classificazioni via via più fini nel
primo caso, via via più generali nel secondo.
Tra i diversi metodi allo studio per classificare automaticamente documenti vano
ricordati per la loro originalità anche i seguenti metodi:
* Logical Imaging24
* Latent Semantic Indexing25
* Dempster-Shafer's Theory of Evidence26
* Neural Networks27
Una volta decise le regole per sviluppare le applicazioni è necessario trovare
delle condizioni che permettano di verificare la bontà di un metodo. Un primo
elemento lo abbiamo già introdotto e consiste nel confrontare i risultati delle
classificazioni con tecnica Top Down w Bottom Up, esitono però altre condizioni
che usualmente permettono di giudicare questi sistemi:
Stabilità = Il metodo produce classi che all'inserimento di nuovi elementi non
subiscono drastiche modifiche.
Tolleranza agli errori = Di fronte a lievi modifiche nella descrizione
dell'oggetto da classificare si devono poter verificare solo lievi modifiche
alla classificazione
Indipendenza dall'ordine dei dati = Le classi prodotte dal metodo non dipendono
dall'ordine con cui vengono processati gli oggetti in input
Facilità di aggiornamento = data una classificazione deve essere possibile
aggiornarla con nuovi oggetti in modo semplice e senza dover rimaneggiare tutta
la struttura creata.

Sintesi e Considerazioni

Arrivati a questo punto si intuisce facilmente perché fior di pensatori si sono


guardati bene dall'affrontare il problema del significato e si intuisce
altrettanto bene perché taluni altri hanno sentenziato che il significato è un
falso problema dicendo che non ha senso parlarne e ricercarlo. Ora, al di là di
tutto ciò che si può pensare in merito al fatto se sia giusto o meno affrontare
il problema a livello filosofico, dal punto di vista pratico la questione è
divenuta assai urgente.
Fare il solito discorso sulla sovrabbondanza d'informazione e sulla necessità di
trovare un sistema per navigare nel modo più efficace ed efficiente possibile in
questo mare decisamente inquinato di dati non è più necessario dato che ormai
tutti siamo, volenti o nolenti, convinti dall'evidenza dei fatti.
Tenteremo invece di proporre un ragionamento intorno alla possibilità di
imbrigliare in modo automatico l'impalpabilità del significato e, se questo
risulterà ottenibile, considereremo il come affrontare la questione della
classificazione automatica e del reperimento automatico di testi.
Parlare di significato quando si lavora con i calcolatori effettivamente fa un
certo effetto. Dire che un computer comprende il significato di una parola è una
affermazione quantomeno bizzarra (al momento). L'attività della percezione dei
significati fino ad oggi è sempre stata prerogativa delle persone in carne ed
ossa. Pertanto è naturale provare un certo disagio nel considerare il problema.
Consideriamo l'idea di produrre una macchina in grado di acquisire significati.
Tenendo presente le indicazioni scaturite dall'analisi del problema significato,
ne deriva che non si può certo prescindere dal fatto percettivo. La percezione
della realtà, lo ricordiamo, è la "cava dei significati" a cui noi attingiamo a
piene mani. Così, per poter permettere ad un computer di acquisire realmente i
significati del mondo, così come ciascuno di noi li conosce, è necessario
dotarlo di apparati sensoriali, possibilmente compatibili con quelli di cui noi
siamo naturalmente dotati, quantomeno dei più importanti: vista, udito e tatto.
Ma questo non sarebbe sufficiente. Infatti come abbiamo visto, ad esempio in
Merleu-Ponty, la questione corpo è fortemente implicata nel processo di
interazione con il mondo. Il computer dovrebbe poter interagire con il mondo
come noi interagiamo con esso. Infatti se noi persone avessimo al posto delle
gambe un set di quattro ruote, concepiremmo certamente in modo diverso l'idea o
meglio il senso della parola "spostamento".
Non basta ancora: se anche il computer fosse dotato di vista, udito, tatto (e a
pensarci bene scartare l'olfatto ed il gusto farebbe perdere al computer una
grande quantità di informazioni per quel che riguarda parecchi significati: si
pensi ad una pasticceria, il suo significato è dato anche dai sapori e dagli
odori che ci ritornano in bocca e nel naso) e potesse camminare su due gambe e
fosse in grado di usare un paio di braccia, ancora gli mancherebbero i bisogni,
l' istinto, quella parte di noi che ci spinge ad andare avanti, che ci dice di
mangiare, che ci porta ad esplorare, a conoscere.
E ancora il discorso potrebbe andare avanti per molto fino a giungere alla
conclusione che il significato è patrimonio "naturale" solo di un gruppo di
agenti "simili" che interagiscono con il loro "mondo" avendo potenzialità simili
e motivazioni confrontabili.
Da questo punto di vista la partita contro il significato pare chiudersi con una
netta sconfitta. In effetti la strada da percorrere non può essere quella di
costruire uomini fatti di silicio, in quanto, essendo da sempre in grado di
generare persone, lo sforzo darebbe vita ad un puro esercizio di stile (peraltro
estremamente complesso... anche se affascinante).
Visto che attaccando frontalmente il problema (dotare un calcolatore di un
sistema che acquisisca naturalmente significati) non è possibile (sempre
attualmente) ottenere vittorie, non ci resta che trovare il modo di ricavare i
significati passando per la porta di servizio: analizzando il mezzo di trasporto
da essi prediletto, il linguaggio.
Prima di tutto occorre ragionare sulla possibilità o meno di una simile
operazione.
La lingua è un sistema di segni che, a partire da un gruppo finito di lettere,
attraverso una serie di regole di concatenamento sempre più complesse a mano a
mano che si sale di livello linguistico (fonetico, morfologico, sintattico,
grammaticale, semantico), è in grado di mappare un insieme potenzialmente
infinito di significati. Ogni parola, frase, testo, discorso che produciamo, di
solito indica un significato che sarà recepito e riconosciuto dal nostro
interlocutore e perché no, anche da noi stessi. Come abbiamo visto il pensiero
può essere considerato una sorta di discorso interiore, anche se non sempre ha
uno svolgimento legato alla lingua in senso stretto.
Nonostante la vastità delle infinite possibilità linguistiche, la lingua tende a
condensare solo attorno ad una parte di esse. Questo principalmente per motivi
di efficienza. Il linguaggio ha come funzione fondamentale di aumentare le
possibilità di sopravvivenza della specie umana, e tende quindi a strutturarsi
in modo ottimale rispetto al suo scopo. Di qui la complessità delle regole che
lo governano e delle eccezioni che l'affollano. Va notato però che
l'acquisizione e la gestione della lingua avviene con estrema immediatezza
grazie al lavoro e alla struttura del nostro cervello che è geneticamente
predisposto a tale compito: si pensi alla lingua parlata, che già raggiunge un
buono stadio di maturazione già intorno ai 5-6 anni di età
Vediamo di giustificare la seguente affermazione: la struttura della lingua
riflette la struttura della percezione. Se proviamo a mettere a confronto le
ipotesi dell'analisi componenziale e le ipotesi che riassumono il funzionamento
percettivo non sarà difficile riscontrare numerose assonanze.
Rivediamo rapidamente quali sono queste ipotesi e mettiamole l'una di fronte
all'altra.
Cerchiamo di rendere più esplicite le somiglianze a cui abbiamo accennato.
Partiamo innanzitutto con il constatare che sia la percezione che l'elaborazione
di un significato necessitano di un evento scatenante per poter essere rilevati.
Nel caso della percezione tale evento consiste nella stimolazione di alcuni
recettori nervosi, nel secondo consiste nella ricezione di elementi linguistici.
Per entrambe si parla di gruppi di significato: nella percezione abbiamo
combinazioni di stimoli su differenti elementi sensoriali che insieme
determinano la sensazione, nell'analisi semantica vi sono gruppi di elementi
linguistici che, combinati insieme, trasportano un significato nuovo, derivato,
ma non in essi contenuto. Poi ancora per entrambe i modelli vale il principio di
vicinanza che nel caso della percezione è ben spiegato dalla definizione, mentre
per l'analisi semantica il fenomeno può essere rilevato sperimentalmente. Si
pensi a quando leggiamo una frase o un paragrafo: il contenuto è ritenuto
omogeneo, i suoi elementi sono visti come correlati (è poi in base a questo
fatto che apprendiamo). Anche il principio di uguaglianza vale per entrambe i
modelli a confronto: si pensi per il linguaggio alle relazioni di
iponimia/iperonimia o a quella di meronimia.
Riassumendo possiamo affermare che l'apparato preposto alla gestione del
linguaggio somiglia fortemente ad un "sensore", come il naso per l'olfatto o la
lingua per il gusto. Da questo punto di vista il significato va considerato alla
stregua di una percezione, la qual cosa non appare affatto strana se pensiamo a
quanto siano simili le reazioni di fronte ad un evento o al racconto ben fatto
di un evento.
Per capire come compiere una analisi efficace del significato, poniamoci di
fronte alla lingua come un bambino di fronte ad una fila di scatole nere
sigillate ed inattaccabili. Tali scatole devono essere esplorate e la loro forma
esteriore non ci aiuta affatto a indovinarne il contenuto. Il contenuto delle
scatole è diverso e la loro disposizione non è casuale, bensì causale. Si prende
la prima scatola, la si "scuote", la si gira, la si rigira, poi si prende la
seconda, la si "scuote", la si gira e la si rigira, e così via finché, a mano a
mano che l'esperienza si accumula, si trovano delle somiglianze tra alcune
scatole, tra alcune sequenze di scatole.
In questo modo non saremo mai in grado di conoscere il contenuto esatto di
ciascuna scatola, ma ci costruiremo in compenso un modello "compatibile" con il
loro contenuto. I problemi che si incontrano adottando un approccio (from
outside) di questo tipo non sono banali. Per prima cosa lo spazio di analisi è
grande, la frequenza assoluta dei singoli eventi è bassissima, la fequenza di
co-occorrenza è altrettanto bassa e lo spazio delle co-occorrenze è vasto e
sparso.
Per toccare con mano il problema è sufficiente fare il seguente esperimento:
Si prenda un paragrafo di un testo, si dispongano come ingressi verticale ed
orizzontale le parole che da esso vengono estratte eliminando le parole
grammaticali (congiunzioni, articoli, preposizioni...) e trasformate nella loro
forma base (ad esempio "cossi" va inserita nella tabella come "cuocere"). Si
barrino quelle caselle che corrispondono a coppie di parole vicine nel testo. Il
risultato dovrebbe somigliare al seguente:
immagine
Torniamo per un attimo a considerare il problema delle scatole nere. Abbiamo
detto che dobbiamo scuotere le scatole, girarle e rigirarle per poter fare
ipotesi sul loro contenuto. Tuttavia, considerando questa azione, si è dato per
scontato di essere in grado di "riconoscere" il suono che l'oggetto all'interno
produce, di avere nozioni sul "come" questo suono viene prodotto. Se non siamo
in grado di "interpretare" le informazione provenienti dall'interno della
scatola l'azione di analisi perde ogni valore.
Diventa fondamentale individuare "cosa" considerare nell'analisi delle scatole e
"come" interpretare le informazioni raccolte.
Abbiamo visto che il significato si lega alle parole attraverso l'esperienza.
Infatti nessuno di noi ne può conoscere a priori il significato. Per riuscire a
conoscere una parola sono disponibili solo due modalità:
1. Diretta;
2. Indiretta;
La modalità Diretta consiste nella indicazione da parte di qualcuno che funge da
insegnante, dell'oggetto o della situazione che una parola dovrà poi significare
(è l'esperienza diretta che crea il significato). La modalità Indiretta invece
permette di costruire il significato di una parola attraverso una descrizione
linguistica che si basa sulla proposta di collegamenti tra significati già noti
al soggetto che deve apprendere.
Prendiamo l'esempio della parola "albero". Per poter trasmettere il significato
di questa parola io posso usare la modalità diretta, portando il soggetto che
deve apprendere in un parco per indicargli un certo numero di alberi. Oppure
posso fare riferimento alla modalità indiretta improvvisando la descrizione di
un albero. Ammettiamo ora che il soggetto cui ci stiamo rivolgendo sia un
bambino che vive in una grande metropoli dove non esistono alberi e neppure la
televisione e che nessuna immagine di albero o di una sua componente sia
disponibile. Ecco un esempio di descrizione potrebbe comunicare l'idea di albero
a questo (sfortunato) bambino:
"Per sapere cosa è un "albero" Immagina una persona con decine e decine di
braccia aperte, sparse per tutto il corpo, alcune più lunghe, altre più corte;
immagina che questa persona abbia una pelle ruvida e di colore marrone; immagina
che le mani siano di colore verde e che i piedi siano nascosti sottoterra"
La descrizione esplicita di un significato non è l'unico tipo di modalità
indiretta disponibile. Si pensi alla estrapolazione di un significato, per una
parola sconosciuta, dal contesto. Restringendo l'analisi al campo della lingua
scritta per contesto (in realtà co-testo sarebbe il nome tecnico) di una parola,
definiamo l'insieme delle parole che la circondano. Se anche non conosciamo
assolutamente cosa si intenda con una data parola, siamo comunque in grado di
intuire il significato ad essa associato, analizzando il contesto in cui esse si
trova. Facciamo un esempio:
"Mercoledì scorso, tornando dalla farmacia, a Gino è caduto un TRASUVIANTE e non
si è rotto, sarebbe stato un disastro, con quel che costa!"
Nessuno conosce la parola TRASUVIANTE perché non esiste, ma tutti dopo aver
letto questa frase, potrebbero fare supposizioni su cosa possa indicare questa
parola. Anzi possiamo dire che si tratta di una operazione talmente naturale,
che diviene necessaria.
La caratteristica peculiare di questo tipo di apprendimento indiretto di
significato è che esso non necessita di un insegnante. Non c'è necessità di
avere qualcuno che indichi o descriva nulla, anche se un feedback potrebbe
rendere l'apprendimento più robusto.
Dunque per apprendere significati abbiamo individuato, in pratica, tre modalità:
1. Diretta
2. Indiretta-Descrittiva
3. Indiretta-Contestuale
Le prime due modalità necessitano di un insegnante che notifichi il collegamento
tra parola (segno più in generale) e situazione, oggetto o descrizione. L'ultima
modalità può essere applicata senza la supervisione necessaria di terzi.
Si potrebbe obbiettare che l'affidabilità di un significato derivato per
deduzione contestuale sia minore di quella che si potrebbe ottenere da una
acquisizione diretta o indiretta-descrittiva. In realtà la validità di tale
affermazione dipende dal grado di affidabilità dell'istruttore che guida la fase
di apprendimento. Se questi deliberatamente propone associazioni errate, allora
la qualità dell'apprendimento supervisionato sarà peggiore di quello non
supervisionato contestuale.
In ogni modo il livello di certezza relativo alla validità delle conoscenze
acquisite dipende da un fattore esterno cioè da un coefficiente di affidabilità
che implicitamente ciascuno di noi assegna all'informazione che recepisce. Tale
coefficiente permette di discriminare tra informazioni da ritenere valide, ai
fini di un ampliamento delle conoscenze attraverso il confronto con una soglia
interna che ci permette di accettare o scartare una informazione.
Facciamo un esempio.
Siano il Sig. A e il Sig. B due agenti di borsa: il primo è diffidente, il
secondo è più fiducioso. Entrambi vengono a conoscenza delle seguenti
informazioni:
1.Un noto esperto di borsa, famoso per le sue intuizioni, afferma che il titolo
XYZ salirà nei prossimi giorni di 5 punti percentuale;
2.Si viene a sapere da un mago che ha letto nella sua sfera di cristallo che il
titolo XYZ crollerà nei prossimi giorni di 10 punti percentuale.
Il Sig. A da credito solo alla prima informazione, ritenendo la seconda poco
attendibile ed investe K milioni sulle azioni XYZ. Il Sig B invece tiene conto
di entrambe le informazioni e ritenendole entrambe attendibili decide di non
acquistare nessun titolo. Chi avrà fatto bene? la risposta la può dare solo una
verifica empirica dell'indice della borsa.
Ci si può chiedere perché queste due persone hanno valori diversi per le soglie
di affidabilità e una delle risposte più plausibili vede nell'esperienza vissuta
da questi signori la motivazione principale.
Sintetizziamo, prima di concludere, alcuni punti essenziali del discorso:
Acquisire significati attraverso l'esperienza è una prerogativa essenzialmente
umana.
La struttura delle produzioni linguistiche fornisce indizi sui rapporti tra i
vari significati.
Lo spazio delle produzioni linguistiche è sparso e vastissimo.
Per poter eseguire una analisi corretta del significato è indispensabile
decidere quali dati considerare nell'analisi delle produzioni e come elaborarli.
E' possibile indovinare il significato di una parola tenendo conto del contesto
in cui essa è immersa.
L' attendibilità di una affermazione è un fattore soggettivo.
Dall'analisi proposta emerge che l'impresa di risalire al significato in modo
indiretto è possibile e le strade che si possono percorrere sono molte.
Nella seconda parte di questa dissertazione proponiamo un prototipo di motore
per l'acquisizione di significati che si basa sull'apprendimento indiretto
contestuale non supervisionato.