Sei sulla pagina 1di 28

Analisi del discorso

Maria Teresa PAZIENZA a.a. 2007-08

Analisi del discorso


Il discorso consiste di pi frasi tra loro coerentemente correlate in uno schema di comunicazione. Lanalisi del discorso consiste nel riconoscimento di eventi descritti in pi segmenti di frase.
Monologo (la comunicazione fluisce in una sola direzione) Dialogo (comunicazione bidirezionale con frasi con direzione di comunicazione alternata: domande, risposte...) Human Computer Interaction (HCI dialogo limitato dalle capacit del sistema di sostenere una conversazione; strategia per limitare la conversazione e permettere di capire le espressioni dellutente in un contesto limitato di interpretazioni )

Dialogo vs. Monologo


Monologo e dialogo richiedono la risoluzione di alcuni fenomeni: Stato dellinformazione (precedentemente fornita o meno) Problemi di coerenza Risoluzione dei riferimenti Implicazioni sottintese, intenzioni
Dialogo richiede la gestione del riconoscimento di Alternanza del parlante Conoscenze di base (eventualmente condivisa) Riconoscimento e correzione di interpretazioni erronee Strategie nellinterazione Modello mentale di ciascun parlante (modello del discorso)

Dialogo (Messaggio pubblicitario)

Desidera? Un biglietto per Milano A partire da A partire da 12 euro, come dite voi nella pubblicit

Analisi del discorso Il discorso consiste di pi frasi tra loro coerentemente correlate in uno schema di comunicazione, ma Cosa (quali fenomeni) rende coerente un discorso? Come riconoscerne i fenomeni? Come analizzarli?

Cosa rende coerente un testo? Un uso appropriato di relazioni di coerenza tra parti del discorso - strutture retoriche Una sequenza appropriata di parti del discorso - struttura del discorso, articolazione degli argomenti Un uso appropriato di espressioni referenziali

Teoria delle strutture retoriche


Teoria della struttura del discorso basata sullidentificazione di relazioni tra parti di testo
Si considerino due frasi il cui significato sia espresso da S1 ed S2, alcune relazioni retoriche sono:
Elaborazione (set/member, class/instance, whole/part) inferire la stessa proposizione P dalle asserzioni S1 ed S2 (in particolare, in aggiunta,..) Risultato: inferire che lo stato o levento asserito da S1 causi o potrebbe causare lo stato o levento asserito da S2 Spiegazione: inferire che lo stato o levento asserito da S2 causi o potrebbe aver causato lo stato o levento asserito da S1

Identificazione automatica di relazioni retoriche


Applicazione di approcci di ML noti
Identificazione di un gruppo di annotatori per assegnare un set di relazioni retoriche ad un testo Estrazione dal testo di un set di features superficiali che possa indicare la presenza di relazioni retoriche in quello specifico testo Addestramento di un sistema di ML supervisionato basato sul training set

Quali feature?

Marcatori espliciti quali: perch, per, quindi, allora, etc. Tendenza di certe strutture sintattiche a segnalare alcune relazioni: le infinitive spesso sono usate per indicare relazioni di scopo: Usa rm per cancellare files. Ordinamento Uso dei tempi Intonazione (nel dialogo)

Alcuni problemi con le relazioni retoriche Quante relazioni retoriche esistono? Sono indipendenti dal linguaggio? Possiamo usare le stesse relazioni retoriche nel dialogo e nel monologo? Le relazioni retoriche non modellano completamente la struttura del discorso. Difficolt nel trovare annotatori che siano concordi nellannotare lo stesso testo

Espressioni di riferimento

Le espressioni di riferimento sono parole o frasi la cui interpretazione semantica una entit del discorso (detta anche referente)
Le entit del discorso sono oggetti semantici e possono avere pi espressioni sintattiche allinterno di un testo

Le espressioni di riferimento forniscono un collante ulteriore che rende il testo coeso.

Espressioni di riferimento

A pretty woman entered the restaurant. She sat at the table next to mine and only then I recognized her. This was Amy Garcia, my next door neighbor from 10 years ago. The woman has totally changed! Amy was at the time shy

Pronomi vs. Full NP

A pretty woman entered the restaurant. She sat at the table next to mine and only then I recognized her. This was Amy Garcia, my next door neighbor from 10 years ago. The woman has totally changed! Amy was at the time shy

Definite vs. Indefinite NPs

A pretty woman entered the restaurant. She sat at the table next to mine and only then I recognized her. This was Amy Garcia, my next door neighbor from 10 years ago. The woman has totally changed! Amy was at the time shy

Common Noun vs. Proper Noun

A pretty woman entered the restaurant. She sat at the table next to mine and only then I recognized her. This was Amy Garcia, my next door neighbor from 10 years ago. The woman has totally changed! Amy was at the time shy

Modified vs. head NP

A pretty woman entered the restaurant. She sat at the table next to mine and only then I recognized her. This was Amy Garcia, my next door neighbor from 10 years ago. The woman has totally changed! Amy was at the time shy

Premodified vs. postmodified

A pretty woman entered the restaurant. She sat at the table next to mine and only then I recognized her. This was Amy Garcia, my next door neighbor from 10 years ago. The woman has totally changed! Amy was at the time shy

Altri tipi di NP

Capaci di generare inferenze


Sally ha comprato unauto usata. Le gomme devono essere cambiate.

Con discontinuit
John ha conosciuto Bill molti anni fa. Loro fanno spesso insieme delle escursioni in montagna.

Anafora
Lanafora il riferimento ad una entit che appare precedentemente nel discorso Lespressione di riferimento usata si dice espressione anaforica Le espressioni anaforiche possono essere di diversa tipologia e dipendono dal contesto del discorso (articoli, pronomi, espressioni nominali,)

Risoluzione dellanafora
Trovare in un testo tutte le espressioni di riferimento che hanno la stessa denotazione
Risoluzione dellanafora pronominale Risoluzione dellanafora tra entit nominali Risoluzione di frasi nominali anaforiche

Risoluzione dellanafora

I sistemi possono mantenere una sorta di history list delle entit presenti nel discorso. Per risolvere una anafora, cercare lhistory list dellentit pi vicina che soddisfa i vincoli.

Conoscenza di supporto Per lanalisi del discorso necessario utilizzare anche conoscenza di supporto del tipo: Obiettivi e piani Esistenza di eventuali frame o script Presupposizioni Regole del discorso

Obiettivi e piani
Se si conoscono quali sono gli obiettivi della comunicazione, cos come il piano del comunicatore, possibile limitare il numero di interpretazioni possibili
Es. se in una e-mail si richiede un incontro, la risposta potrebbe accettare, modificare, rifiutare la richiesta.

Esistenza di eventuali frame o script Qualora si possa descrivere luso del linguaggio in termini di frames (ovvero la descrizione di un oggetto) o con degli scripts (come il canovaccio di unopera teatrale) che noi possiamo utilizzare, allora potremmo confrontare il linguaggio naturale con questi oggetti cognitivi e quindi gestire anche le aspettative in un discorso

Presupposizioni
Il linguaggio naturale fa riferimento spesso ad informazioni comunemente note e non espresse Si pu usare linferenza per identificare linformazione sottaciuta.

Es. oggi la temperatura ha superato i 37 gradi. Nei giornali radio si raccomanda agli anziani di andare almeno per un paio dore in un supermercato ogni giorno.

Regole del discorso


Si pu ottenere informazione sapendo che, a meno di essere in situazioni facete, in genere si usa il linguaggio naturale in alcuni modi predefiniti. Per esempio a meno che si voglia mentire, si dice la verit.

Queste regole ci permettono di verificare se le regole sono state seguite, oppure determinare le situazioni di discontinuit.

Argomenti trattati in questa lezione


Tipologie di comunicazione nel discorso Teoria delle strutture retoriche Espressioni di riferimento Anafora Conoscenza di supporto Obiettivi e piani Presupposizioni

Elaborazione del linguaggio naturale

Le presentazioni sugli argomenti di elaborazione del linguaggio naturale fanno in alcuni passi riferimento ad alcune presentazioni dei colleghi prof. Fabio Massimo Zanzotto e dottor Marco Pennacchiotti, del dottor Patrick Pantel (ISI-USC), oltre che ad alcune parti del libro: Speech and Language Processing, Prentice Hall, 2000, autori D.Jurafsky, J. H. Martin.